Для того, чтобы база данных была удобна для последующей обработки, следует придерживаться нехитрых принципов:
1) Оптимальной программой для создания базы данных является MS Excel. Данные из Excel в последующем могут без проблем переноситься в другие, специализированные статистические пакеты, такие как Statistica, SPSS и др. для более сложных манипуляций. Однако до 80-90% расчетов могут удобнейшим образом производиться в самой Excel с использованием надстройки "Анализ данных".
2) Верхняя строчка таблицы с базой данных оформляется как шапка, куда заносятся наименования тех показателей, которые учитываются в данном столбце. Нежелательно использовать слияние ячеек (это требование относится вообще ко всей базе), так как при этом многие операции станут недопустимы. Также не стоит создавать "двухэтажную" шапку, в которой верхняя строчка обозначает название группы однородных показателей, а нижняя - конкретные показатели. Для группировки однородных показателей лучше отметить их одноцветной заливкой или включить в их наименование группирующий признак в скобках.
Например, не так:
ОБЩИЙ АНАЛИЗ КРОВИ | ||
ER | LEU | TR |
а так:
ER(ОАК) | LEU(ОАК) | TR(ОАК) |
в последнем варианте обеспечена и "одноэтажность" шапки, и наглядная однородность данных (все они относятся к показателям ОАК).
3) В первом столбце следует размещать порядковый номер пациента в данной базе, не привязывая его ни к одному из исследуемых показателей. Это позволит в последующем обеспечить легкий откат к исходному порядку пациентов на любом этапе, даже после многочисленных сортировок списка.
4) Второй столбец обычно заполняется фамилиями (или Ф.И.О.) пациентов.
5) Количественные показатели (те, которые измеряются числами, например - рост, вес, артериальное давление, ЧСС и т.п.) вписываются в таблицу в числовом формате. Казалось бы это и так понятно, однако следует помнить, что в Excel, начиная с 2007 версии, дробные величины обозначаются через точку: 4.5. Если записать число через запятую, то оно будет воспринято как текст, и эти столбцы придется переписывать.
6) С качественными показателями сложнее. Те из них, которые имеют два варианта значения (так называемые, бинарные величины: Да-Нет, Имеется-Отсутствует, Мужской-Женский), лучше переводить в двоичную систему: 0 и 1. Значение 1 обычно присваивается положительному значению (Да, Имеется), 0 - отрицательному (Нет, Отсутствует).
7) Качественные показатели, имеющие несколько значений, различающихся по степени выраженности , уровню явления (Слабый-Средний-Сильный; Холодный-Теплый-Горячий) могут быть ранжированы и, соответственно, также переведены в числа. Наименьшему уровню явления присваивается наименьший ранг - 0 или 1, следующие степени обозначаются значениями рангов по порядку. Например: Заболевание отсутствует - 0, легкой степени тяжести -1, средней степени - 2, тяжелой степени - 3.
8) Иногда одному качественному показателю соответствуют несколько значений. Например, в графе "Сопутствующий диагноз" при наличии нескольких заболеваний мы хотим указать их через запятую. Делать так не следует, поскольку обработка таких данных весьма затруднена и не может быть автоматизирована. Поэтому лучше сделать несколько столбцов с конкретными группами заболеваний ("заболевания ССС", "заболевания ЖКТ" и т.д.) или определенными нозологиями ("хр.гастрит", "ИБС" и т.д.), в которые данные заносим в бинарном, двоичном виде: 1 (что означает "Есть данное заболевание") - 0 ("Нет данного заболевания").
9) Для разграничения отдельных групп показателей можно активно пользоваться цветом: например столбцы с показателями ОАК выделяем красным цветом, данные ОАМ - желтым и т.д.
10) Каждому пациенту должна соответствовать одна строка таблицы.
Подобное оформление базы данных позволяет не только значительно упростить процесс ее статистической обработки, но и облегчить ее заполнение на этапе сбора материала.