Заказать статобработку 
Онлайн-курсы
Мастер-классы
Магазин
@medstatistic
medstatistic_chat
теория
калькуляторы
форум
литература
алгоритмы
презентации
методы
авторы

Статистический
словарь

Учёные-
статистики

Общие вопросы
статистики


Алгоритмы
и схемы

Описательная
статистика

Критерии
и методы

Диаграммы
и графики

Мнение
автора

Библиотека постов MEDSTATISTIC об анализе медицинских данных

Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic


Общие вопросы статистики


СОЗДАНИЕ БАЗЫ ДАННЫХ В MS EXCEL

Для того, чтобы база данных была удобна для последующей обработки, следует придерживаться нехитрых принципов:

1) Оптимальной программой для создания базы данных является MS Excel. Данные из Excel в последующем могут без проблем переноситься в другие, специализированные статистические пакеты, такие как Statistica, SPSS и др. для более сложных манипуляций. Однако до 80-90% расчетов могут удобнейшим образом производиться в самой Excel с использованием надстройки "Анализ данных".

2) Верхняя строчка таблицы с базой данных оформляется как шапка, куда заносятся наименования тех показателей, которые учитываются в данном столбце. Нежелательно использовать слияние ячеек (это требование относится вообще ко всей базе), так как при этом многие операции станут недопустимы. Также не стоит создавать "двухэтажную" шапку, в которой верхняя строчка обозначает название группы однородных показателей, а нижняя - конкретные показатели. Для группировки однородных показателей лучше отметить их одноцветной заливкой или включить в их наименование группирующий признак в скобках.

Например, не так:

ОБЩИЙ АНАЛИЗ КРОВИ
ER LEU TR

а так:

ER(ОАК) LEU(ОАК) TR(ОАК)

в последнем варианте обеспечена и "одноэтажность" шапки, и наглядная однородность данных (все они относятся к показателям ОАК).

3) В первом столбце следует размещать порядковый номер пациента в данной базе, не привязывая его ни к одному из исследуемых показателей. Это позволит в последующем обеспечить легкий откат к исходному порядку пациентов на любом этапе, даже после многочисленных сортировок списка.

4) Второй столбец обычно заполняется фамилиями (или Ф.И.О.) пациентов.

5) Количественные показатели (те, которые измеряются числами, например - рост, вес, артериальное давление, ЧСС и т.п.) вписываются в таблицу в числовом формате. Казалось бы это и так понятно, однако следует помнить, что в Excel, начиная с 2007 версии, дробные величины обозначаются через точку: 4.5. Если записать число через запятую, то оно будет воспринято как текст, и эти столбцы придется переписывать.

6) С качественными показателями сложнее. Те из них, которые имеют два варианта значения (так называемые, бинарные величины: Да-Нет, Имеется-Отсутствует, Мужской-Женский), лучше переводить в двоичную систему: 0 и 1. Значение 1 обычно присваивается положительному значению (Да, Имеется), 0 - отрицательному (Нет, Отсутствует).

7) Качественные показатели, имеющие несколько значений, различающихся по степени выраженности , уровню явления (Слабый-Средний-Сильный; Холодный-Теплый-Горячий) могут быть ранжированы и, соответственно, также переведены в числа. Наименьшему уровню явления присваивается наименьший ранг - 0 или 1, следующие степени обозначаются значениями рангов по порядку. Например: Заболевание отсутствует - 0, легкой степени тяжести -1, средней степени - 2, тяжелой степени - 3.

8) Иногда одному качественному показателю соответствуют несколько значений. Например, в графе "Сопутствующий диагноз" при наличии нескольких заболеваний мы хотим указать их через запятую. Делать так не следует, поскольку обработка таких данных весьма затруднена и не может быть автоматизирована. Поэтому лучше сделать несколько столбцов с конкретными группами заболеваний ("заболевания ССС", "заболевания ЖКТ" и т.д.) или определенными нозологиями ("хр.гастрит", "ИБС" и т.д.), в которые данные заносим в бинарном, двоичном виде: 1 (что означает "Есть данное заболевание") - 0 ("Нет данного заболевания").

9) Для разграничения отдельных групп показателей можно активно пользоваться цветом: например столбцы с показателями ОАК выделяем красным цветом, данные ОАМ - желтым и т.д.

10) Каждому пациенту должна соответствовать одна строка таблицы.

Подобное оформление базы данных позволяет не только значительно упростить процесс ее статистической обработки, но и облегчить ее заполнение на этапе сбора материала.




©Д.Марапов,2013
damirov@list.ru
Яндекс.Метрика