сайт для аспирантов и молодых учёных, врачей-специалистов и организаторов, студентов и преподавателей

Статистика - это очень просто!

теория
калькуляторы
форум
литература
алгоритмы
презентации
задания
авторы
Заказать статобработку
Курсы по статанализу

Общие вопросы медицинской статистики

Медицинская статистика Базы данных в MS Excel Определение размера выборки Какой метод статанализа выбрать? Медицинская демография

Статистические величины

Абсолютные величины Относительные величины Графические изображения Вариационные ряды Стандартизация Динамические ряды

Сравнение количественных показателей

t-критерий Стьюдента U-критерий Манна-Уитни Критерий Уилкоксона Парный t-критерий Стьюдента Q-критерий Розенбаума G-критерий знаков Однофакторный дисперсионный анализ (ANOVA) Критерий Фридмана Критерий Краскелла-Уоллиса

Сравнение относительных показателей

Критерий χ2 Пирсона Относительный риск Отношение шансов Точный критерий Фишера Q-критерий Кохрена Тест Мак-Немара

Методы оценки связи

Корреляционный анализ (общие сведения) Критерий корреляции Пирсона Парная линейная регрессия Критерий Спирмена Коэффициент Фехнера Коэффициент корреляции Кендалла Коэффициент конкордации Кендалла

Методы оценки распределения

F-критерий Фишера Критерий Колмогорова-Смирнова Метод Шапиро-Уилка

СОЗДАНИЕ БАЗЫ ДАННЫХ В MS EXCEL

Для того, чтобы база данных была удобна для последующей обработки, следует придерживаться нехитрых принципов:

1) Оптимальной программой для создания базы данных является MS Excel. Данные из Excel в последующем могут без проблем переноситься в другие, специализированные статистические пакеты, такие как Statistica, SPSS и др. для более сложных манипуляций. Однако до 80-90% расчетов могут удобнейшим образом производиться в самой Excel с использованием надстройки "Анализ данных".

2) Верхняя строчка таблицы с базой данных оформляется как шапка, куда заносятся наименования тех показателей, которые учитываются в данном столбце. Нежелательно использовать слияние ячеек (это требование относится вообще ко всей базе), так как при этом многие операции станут недопустимы. Также не стоит создавать "двухэтажную" шапку, в которой верхняя строчка обозначает название группы однородных показателей, а нижняя - конкретные показатели. Для группировки однородных показателей лучше отметить их одноцветной заливкой или включить в их наименование группирующий признак в скобках.

Например, не так:

ОБЩИЙ АНАЛИЗ КРОВИ
ERLEUTR

а так:

ER(ОАК) LEU(ОАК) TR(ОАК)

в последнем варианте обеспечена и "одноэтажность" шапки, 6и наглядная однородность данных (все они относятся к показателям ОАК).

3) В первом столбце следует размещать порядковый номер пациента в данной базе, не привязывая его ни к одному из исследуемых показателей. Это позволит в последующем обеспечить легкий откат к исходному порядку пациентов на любом этапе, даже после многочисленных сортировок списка.

4) Второй столбец обычно заполняется фамилиями (или Ф.И.О.) пациентов.

5) Количественные показатели (те, которые измеряются числами, например - рост, вес, артериальное давление, ЧСС и т.п.) вписываются в таблицу в числовом формате. Казалось бы это и так понятно, однако следует помнить, что в Excel, начиная с 2007 версии, дробные величины обозначаются через точку: 4.5. Если записать число через запятую, то оно будет воспринято как текст, и эти столбцы придется переписывать.

6) С качественными показателями сложнее. Те из них, которые имеют два варианта значения (так называемые, бинарные величины: Да-Нет, Имеется-Отсутствует, Мужской-Женский), лучше переводить в двоичную систему: 0 и 1. Значение 1 обычно присваивается положительному значению (Да, Имеется), 0 - отрицательному (Нет, Отсутствует).

7) Качественные показатели, имеющие несколько значений, различающихся по степени выраженности , уровню явления (Слабый-Средний-Сильный; Холодный-Теплый-Горячий) могут быть ранжированы и, соответственно, также переведены в числа. Наименьшему уровню явления присваивается наименьший ранг - 0 или 1, следующие степени обозначаются значениями рангов по порядку. Например: Заболевание отсутствует - 0, легкой степени тяжести -1, средней степени - 2, тяжелой степени - 3.

8) Иногда одному качественному показателю соответствуют несколько значений. Например, в графе "Сопутствующий диагноз" при наличии нескольких заболеваний мы хотим указать их через запятую. Делать так не следует, поскольку обработка таких данных весьма затруднена и не может быть автоматизирована. Поэтому лучше сделать несколько столбцов с конкретными группами заболеваний ("заболевания ССС", "заболевания ЖКТ" и т.д.) или определенными нозологиями ("хр.гастрит", "ИБС" и т.д.), в которые данные заносим в бинарном, двоичном виде: 1 (что означает "Есть данное заболевание") - 0 ("Нет данного заболевания").

9) Для разграничения отдельных групп показателей можно активно пользоваться цветом: например столбцы с показателями ОАК выделяем красным цветом, данные ОАМ - желтым и т.д.

10) Каждому пациенту должна соответствовать одна строка таблицы.

Подобное оформление базы данных позволяет не только значительно упростить процесс ее статистической обработки, но и облегчить ее заполнение на этапе сбора материала.


©Д.Марапов,2013
damirov@list.ru
Яндекс.Метрика Рейтинг@Mail.ru