Заказать статобработку 
Онлайн-курсы
Мастер-классы
Магазин
@medstatistic
medstatistic_chat
теория
калькуляторы
форум
литература
алгоритмы
презентации
методы
авторы

Статистический
словарь

Учёные-
статистики

Общие вопросы
статистики

Алгоритмы
и схемы

Описательная
статистика

Критерии
и методы

Диаграммы
и графики

Мнение
автора

Библиотека постов MEDSTATISTIC об анализе медицинских данных

Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic


Словарь статистических терминов


АБСОЛЮТНОЕ ЧИСЛО, АБСОЛЮТНАЯ ВЕЛИЧИНА     (absolute number) – объем и размер события, фундамент статистического анализа, результат статистического наблюдения имеет значение для характеристики изучаемого объекта. Это простое число без учета знака (всегда с плюсом). Абсолютные величины могут быть моментными или интервальными. Моментные абсолютные величины показывают уровень изучаемого явления на определенный момент времени или дату (например: численности контингентов онкологических больных, численность врачей, среднего персонала или коек на 31 декабря). Интервальные абсолютные величины – это итоговый накопленный результат за определенный период (например: число заболевших, умерших за месяц, квартал, год). Интервальные абсолютные величины суммируются.

АБСОЛЮТНЫЙ РИСК     (absolute risk, excess risk) – безусловное развитие события в исследуемой популяции при заданных условиях, понятие противоположное относительному риску.

АКТУАРИАЛЬНЫЙ ПОКАЗАТЕЛЬ     (actuarial rate, actuarial death rate, force of mortality) – показатель вероятности смерти, исчисляемый в таблицах дожития (life table, actuarial table) – при расчетах вероятности умереть за определенный период времени. Используется для расчета кумулятивного показателя смертности, средней продолжительности предстоящей жизни для лиц в любом возрасте.

АЛЬТЕРНАТИВНЫЕ ПРИЗНАКИ     (alternative data) – взаимоисключающие, контрастные, качественные признаки, которыми обладают одни объекты наблюдения и не обладают другие. Каждая единица наблюдения может обладать только одним из двух возможных признаков (например либо мужчина, либо женщина).

АЛЬФА-ОШИБКА     (α-error), или ошибка I рода (type I error) – вероятность ошибочного отклонения нулевой гипотезы, т.е. вероятность того, что будет найдено различие в сравниваемых группах, тогда как в действительности его не было.

АНАЛИЗ ВЫЖИВАЕМОСТИ     (survival analysis, time-to-event analysis) – статистический метод анализа времени, прошедшего от заданного начального момента до момента наступления определенного исхода (например, смерти). Метод позволяет описать любой исход, имеющий место лишь однажды в процессе наблюдения (например время до рецидива злокачественного новообразования). Преимущество метода заключается в том, что в расчетах используются сведения обо всех пациентах, в том числе еще не умерших к моменту проведения анализа или утерянных в процессе наблюдения, что позволяет оценить среднее время проживания более точно.

АПОСТЕРИОРНАЯ (ПОСЛЕОПЫТНАЯ) ВЕРОЯТНОСТЬ     (probability a posteriori) – вероятность события, исчисленная после опыта, приведшего к определенному результату. Соотношение априорных и апостериорных вероятностей рассматривается в теореме Байеса. Так, вероятность гипотезы А до проведения испытания называется априорной, а вероятность этой же гипотезы после испытания – апостериорной.

АПРИОРНАЯ ВЕРОЯТНОСТЬ     (probability a priory) – вероятность случайного события, определенная до испытания, приводящая к данному исходу. Численное значение такой вероятности называют априорным (доопытным).

БАЗА ДАННЫХ     (database) – набор логически связанных данных, используемых для выявления определенных закономерностей, в том числе с использованием средст статистического анализа.

БЕТА-ОШИБКА     (β-error), или ошибка II рода (type II error) – вероятность ошибочного принятия нулевой гипотезы, когда в действительности, например, метод лечения А лучше метода В.

БИМОДАЛЬНОЕ РАСПРЕДЕЛЕНИЕ     (bimodal distribution) – распределение величин вариационного ряда, при котором четко прослеживаются два подъема, два пика, в каждом из которых концентрируются наиболее типичные варианты. Такое положение часто встречается в нерандомизированных исследованиях. При более тщательной разработке данных может быть установлено, что резкое нарастание кривой в первом случае связано со спецификой возрастного распределения заболеваний у женщин, а во втором – у мужчин. Оно свидетельствует на возможное присутствие двух кластеров в выборке.

БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ     (binomial distribution) – дискретное распределение вероятностей случайной величины (Я. Бернулли, ок. 1700 г.); получается в том случае, когда для каждого испытания существует лишь два возможных несовместимых метода. Биномиальное распределение относится к признакам, варьирующим дискретно, прерывисто.

ВАРИАНТА     (variable) – любое число вариационного ряда. Варианта изображается дискретным числом или интервалом.

ВАРИАЦИОННАЯ СТАТИСТИКА     (variability statistics) – величина, математическими способами изучающая закономерности, проявляющиеся в массовых явлениях. Приемы вариационной статистики позволяют проводить количественный анализ значительного числа отдельных изменяющихся величин. Вариационная статистика широко применяется в медицине и здравоохранении для обработки количественно выраженных данных в пределах качественно однородных групп. Математической основой вариационной статистики является теория вероятностей. В общей форме смысл этих теорем сводится к доказательству того, что точность результатов статистического измерения зависит от числа наблюдений при условии минимального различия варьирующих признаков в сравниваемых группах.

ВАРИАЦИЯ     (изменчивость) (variability) – различие между единицами совокупности в величине отдельных признаков.

ВЕЛИЧИНА (в статистике)     (value) – конкретное количественное выражение каких-либо статистических показателей (признаков).

ВЕРОЯТНОСТЬ     (probability) – мера объективной оценки случайного события. Определяется всегда при некоторых условиях данного «опыта». Если эти условия полностью определяют результат, то рассматриваемое событие должно либо обязательно осуществиться (событие достоверно), либо обязательно не осуществиться (событие невозможно). Вероятность достоверного события принимается равной 1 (или 100 %), а вероятность невозможного – 0.

ВМЕШИВАЮЩИЙСЯ ФАКТОР     (intervening factor) – независимый признак, связанный с другим исследуемым независимым признаком и влияющий на исследуемый зависимый признак (исход). Например, известно, что мужчины чаще, чем женщины, болеют раком легкого. Однако это может быть связано не с исследуемым фактором (пол), а с тем, допустим, что мужчины чаще курят, больше подвергаются воздействию неблагоприятных производственных факторов. Влияние вмешивающихся факторов приводит к возникновению систематической ошибки.

ВОЗРАСТНАЯ ПИРАМИДА     (age-sex pyramid, population pyramid) – графическое изображение возрастно-полового состава населения. Профиль пирамиды в значительной степени отражает социально-экономическое состояние общества, уровень общественного здравоохранения и стоящие перед ним проблемы.

ВОСПРОИЗВОДИМОСТЬ     (reproducibility) – степень, до которой совпадают повторные измерения того же наблюдения в идентичных условиях.

ВРЕМЯ НАБЛЮДЕНИЯ     (time of observation) – время, к которому относятся регистрируемые в процессе статистического наблюдения факты. В зависимости от характера изучаемого объекта и определяемого показателя, сведения могут собираться либо за определенный срок, либо за определенный интервал времени (число новых случаев заболеваний за месяц, квартал, год и т.д.), либо по состоянию на определенную дату (например, число больных, состоящих на диспансерном наблюдении на 1 января).

ВЫБОРКА, ВЫБОРОЧНАЯ СОВОКУПНОСТЬ     (sample) – сумма единиц наблюдения, отобранных из генеральной совокупности. Важнейшее свойство выборки - репрезентативность.

ВЫБОРОЧНЫЙ МЕТОД     (sample method) – метод статистического исследования, с помощью которого устанавливаются оценки показателей генеральной совокупности на основе обследования только некоторой ее части. Выборочный метод при правильном его использовании обеспечивает получение репрезентативных данных.

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ     (general totality) — объектами генеральной совокупности могут быть люди, животные, изделия и любые другие объекты, относительно которых осуществляется наблюдение или элементы которых подвергаются экспериментальному воздействию. Генеральная совокупность – это совокупность всех единиц изучаемого объекта. Зависит от цели исследования. Теоретически считается, что объем генеральной совокупности неограничен. Фактически он ограничен задачами исследования. Сплошное исследование генеральной совокупности затруднено, поэтому, как правило, изучается небольшая часть генеральной совокупности, т.е. осуществляются выборочные исследования (выборочный метод).

ГИСТОГРАММА     (histogram) – (греч. – histos – столб) – структурная диаграмма, представляющая распределение переменной величины непрерывных данных, построена в формате столбиковой диаграммы.

ДАННЫЕ     (data) – зарегистрированные случаи наблюдения, пригодные для анализа и последующей математической обработки.

ДИСКРИМИНАНТНЫЙ АНА- ЛИЗ     (discriminant analysis) – определение принадлежности изучаемого объекта к той или иной совокупности.

ДИСПЕРСИЯ     (лат. – dispersio – рассеяние) – отклонение случайных значений от средней величины, мера разброса данных.

ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ     (confidence limits) – верхняя и нижняя величины доверительного интервала.

ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ     (confidence interval) – диапазон значений среднего или относительного параметра, рассчитанного для выборочной совокупности, внутри которого, как мы полагаем, с определенной вероятностью находится значение данного параметра, рассчитанного для генеральной совокупности.

ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА     (evidence-based medicine) – медицина, основанная на доказанных в научных исследованиях методах диагностики и лечения больных, строго соблюдающих эффективность и безопасность используемых методов. В основе доказательной медицины лежит проверка эффективности и безопасности используемых методов профилактики, диагностики и лечения, установленных в клинических исследованиях, на строго научной основе.

ЕДИНИЦА НАБЛЮДЕНИЯ     (observed number) – первичный элемент исследуемой совокупности. Это та единица, о которой должны быть получены сведения в ходе наблюдения. Выбор единицы наблюдения – один из важнейших элементов подготовительной работы при планировании исследования.

ИНФОРМАТИКА     (informatics) – наука о методах сбора, накопления, хранения, обработки, анализа и оценки информации с применением компьютерных технологий, обеспечивающая получение объективных данных о состоянии объекта исследования для принятия необходимых решений в соответствии с поставленной задачей.

ИССЛЕДОВАНИЕ «СЛУЧАЙ– КОНТРОЛЬ»     (case control study) – ретроспективное исследование, в котором проводят сравнение двух групп: исследуемой и контрольной. Вначале формируют исследуемую группу с каким-либо заболеванием, затем контрольную, сходную по основным признакам с исследуемой.

КАЧЕСТВЕННЫЕ ДАННЫЕ     (nominal data) – признаки, которые нельзя выразить количественно. Например диагноз, группа крови, пол.

КВАРТИЛИ     (quartiles) – варианты ряда распределения, расположенные ниже и выше медианы и делящие каждую из двух половин, разделенных медианой, пополам. Как и медиана, квартили применяются в тех случаях, когда неизвестен тип распределения, вариант исследуемой совокупности или когда это распределение значительно отклоняется от нормального.

КЛАСТЕРНЫЙ АНАЛИЗ     (cluster analysis) – математические методы, предназначенные для выявления единых закономерностей в отдаленных друг от друга совокупностях (кластерах). Кластерный анализ – статистическая многомерная процедура, которая выполняет сбор данных, а затем распределяет объекты в однородные для проведения сравнительного анализа группы.

КОНТРОЛИРУЕМОЕ ИССЛЕДОВАНИЕ     (controlled trail) – исследование, в котором сравниваются основная (экспериментальная) и контрольная группы.

КОНТРОЛЬНАЯ ГРУППА     (control group) – группа наблюдения, близкая по основным параметрам опытной группе, кроме изучаемого фактора (например метода лечения, лекарственного препарата или любого внешнего фактора воздействия). Результаты измерений в контрольной группе сравнивают с экспериментальной для оценки исследуемого явления.

КОРРЕЛЯЦИОННАЯ СВЯЗЬ     (correlation) – статистическая взаимосвязь двух количественных показателей. Заключается в предположении о направленном изменении одной величины при изменении другой.

КОЭФФИЦИЕНТ ВАРИАЦИИ     (coefficient of variance) – один из показателей дисперсии выборки, представляющий собой отношение стандартного отклонения к средней арифметической. Чем выше коэффициент вариации, тем больше вариабельность, колеблемость изучаемой статистической совокупности.

КОЭФФИЦИЕНТЫ ИНТЕНСИВНЫЕ     характеризуют частоту (интенсивность) изучаемого явления в среде, в которой оно происходит и с которой органически связано. В медицинской и демографической статистике в качестве среды чаще всего рассматривается население.

КОЭФФИЦИЕНТЫ ЭКСТЕНСИВНЫЕ     показатели структуры, характеризуют распределение явления на его составные части, его внутреннюю структуру или отношение частей к целому. Выражаются в долях единицы или в процентах.

КРИВАЯ ВЫЖИВАЕМОСТИ Каплана-Мейера     (Kaplan-Meier survival curve) – кривая, в которой вероятность выживаемости определяется относительно срока наблюдения.

ЛОЖНООТРИЦАТЕЛЬНЫЙ РЕЗУЛЬТАТ     (false negative) – пациент, который имеет изучаемый признак, но диагностируется или прогнозируется как не имеющий его.

ЛОЖНОПОЛОЖИТЕЛЬНЫЙ РЕЗУЛЬТАТ     (false positive) – пациент, который не имеет изучаемого признака, но диагностируется или прогнозируется как имеющий его.

МЕДИАНА     (median) (50-й процентиль) – варианта, которая находится в середине вариационного ряда и делит его пополам. По обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.

МЕДИЦИНСКАЯ СТАТИСТИКА     (medical statistics) – один из разделов биостатистики, изучающий основные закономерности и тенденции здоровья населения и здравоохранения с использованием методов математической статистики.

МЕТА-АНАЛИЗ     (meta-analysis) – количественный анализ объединенных результатов нескольких клинических испытаний одного и того же вмешательства. Такой подход обеспечивает большую статистическую мощность, чем в каждом отдельном испытании, – за счет увеличения размеров выборки.

МНОГОФАКТОРНЫЙ АНАЛИЗ     (multifactorial analysis) – совокупность статистических методов, которые одновременно рассматривают влияние многих предикторов на какой-либо один признак.

МОДА     (mode) – величина признака, которая чаще всего встречается в данной совокупности. Один из показателей центра распределения. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ     (normal distribution) – теоретическое симметричное распределение количественного показателя, при котором с наибольшей частотой встречаются его средние значения, а крайние значения имеют незначительную частоту. В нормальном распределении средняя арифметическая, медиана и мода имеют одно и то же значение, а также соблюдается правило "трех сигм".

НУЛЕВАЯ ГИПОТЕЗА     (null hypothesis) – это теоретические рассуждения о том, что взятые для исследования две совокупности не различаются между собой, т.е. их сходство равно нулю. Нулевая гипотеза отвергается, если показано, что расхождения в двух выборках не случайны и закономерны.

ОБЪЕМ ВЫБОРКИ     (number needed to study) – число единиц, образующих выборочную совокупность. От объема выборки зависит точность результатов: по мере увеличения выборки возрастает точность. Объем выборки связан со способом отбора единиц наблюдения для выборочного исследования.

ОТНОСИТЕЛЬНЫЕ ВЕЛИЧИНЫ     (relative indicators) – результат определенного вычисления: отношения одной величины к другой. Относительные величины имеют значительно большее познавательное значение, так как позволяют сделать объективный вывод при сравнении.

ОТНОСИТЕЛЬНЫЙ РИСК     (relative risk), или отношение рисков (risk ratio) – отношение частоты исходов среди лиц, подвергшихся и не подвергшихся воздействию изучаемого фактора. Относительный риск не несет информации о величине абсолютного риска (заболеваемости).

ОТНОШЕНИЕ ШАНСОВ     (odds ratio) - статистический показатель, характеризующий отношение шансов наступления исхода при наличии изучаемого воздействия к шансам наступления исхода при отсутствии воздействия.

РАНДОМИЗАЦИЯ     (randomization) – случайный отбор единиц наблюдения в сравниваемые группы, снижающий вероятность систематической ошибки в клинических исследованиях. Эта процедура устраняет различие основных признаков в сравниваемых исследовательских группах.

РЕГРЕССИОННЫЙ АНАЛИЗ     (regression analysis) – статистический метод, позволяющий определить зависимость какой-либо одной величины от совокупности других.

РЕПРЕЗЕНТАТИВНОСТЬ     (representation) – важнейшее свойство выборочной совокупности, характеризующее степень ее соответствия генеральной совокупности.

СИСТЕМАТИЧЕСКАЯ ОШИБКА     (systematic bias) – это неслучайное однонаправленное отклонение результатов от истинных значений. Систематическая ошибка может возникать вследствие неполноты учета, нарушения правил формирования выборочной совокупности, вследствие некорректных измерений, при воздействии вмешивающихся факторов и во многих других случаях.

СИСТЕМНЫЙ АНАЛИЗ     (system analysis) – совокупность методов научного познания, путем последовательности действий по установлению структурных связей между изучаемыми явлениями с использованием комплекса общенаучных экспериментальных, естественнонаучных, статистических и математических методов.

СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ     (mean) – обобщающий показатель, сумма значений количественного признака, измеренного у каждого пациента изучаемой совокупности, деленная на их число.

СТАТИСТИКА     Наука, изучающая закономерности массовых явлений методом обобщающих показателей

СТАТИСТИЧЕСКАЯ ЗНАЧИМОСТЬ     (statistical significance) – мера оценки различий, связи или зависимости изучаемых показателей.

СТРАТИФИКАЦИЯ     (stratification) – деление изучаемых данных на подгруппы (страты).

ТЕМП ПРИРОСТА или УБЫЛИ     (rate of increase or decrease) – отношение прироста или убыли каждого последующего члена ряда к уровню предыдущего, выраженное в процентах.

ТОЧЕЧНЫЙ ГРАФИК     (scatterplot) – диаграмма, в которой каждое наблюдение за переменной представлено одной точкой на горизонтальной (или вертикальной) линии.

УРОВЕНЬ ЗНАЧИМОСТИ     (significance level) – обозначает вероятность получения случайного отклонения от полученных результатов.

ФУНКЦИОНАЛЬНАЯ СВЯЗЬ     (association) – отражает строгую зависимость процессов или явлений. При функциональной связи каждому значению одной переменной величины соответствует одно вполне определенное значение другой переменной. Такие зависимости наблюдаются в математике и физике: функциональная зависимость между радиусом окружности и ее длиной, высотой ртутного столбика в термометре и уровнем температуры и т.п. В медико-биологических исследованиях большее применение имеет изучение корреляционных связей.


©Д.Марапов,2013
damirov@list.ru
Яндекс.Метрика