Абсолютний розмір середовища, яке продукує явище
Деякі середні характеристики вибірки:
ü середнє значення (Хс, М) — центр вибірки, навколо якого групуються елементи вибірки;
ü середнє квадратичне або стандартне відхилення (δ) – міра відхилення елементів вибірки щодо середнього значення;
ü дисперсія — параметр, що характеризує ступінь відхилення елементів вибірки щодо середнього значення. Чим більша дисперсія, тим більші відхилення значень елементів вибірки від середнього значення;
ü мода — елемент вибірки з найпоширенішим значенням;
ü медіана — середня величина ознаки, що змінюється перебуває в середині ряду, розташованого в порядку зростання або зменшення значень ознаки. Медіана — значення ознаки, що змінюється, ділячи безліч даних навпіл так, що одна половина більша за медіану, а інша — менша.
Методи аналізу даних у медицині та охороні здоров'я:
ü графічний метод (для візуального подання даних та результатів аналізу);
ü метод визначення взаємозв'язку між вибірками знаходження коефіцієнта кореляції (r), що визначає ступінь лінійного взаємозв'язку. Значення коефіцієнта кореляції залежить від масштабу вимірювання. Наприклад, кореляція між зростом та масою тіла буде однаковою, незалежно від того, проводилися вимірювання в дюймах і фунтах чи в сантиметр та кілограмах. Пропорційність означає просто лінійну залежність.
Емпіричні знання для інтерпретації результатів
Коефіцієнт кореляції змінюється від -1 (сувора зворотна лінійна залежність) до +1 (сувора пряма пропорційна залежність). При значенні r = 0 залежності між вибірками немає. Більш детально: на практиці коефіцієнт кореляції набуває деяких проміжних значень:
ü якщо r > 0,95 за абсолютною величиною (без урахування знака), то між параметрами існує практично лінійна залежність (пряма при позитивному знаку, зворотна — при негативному);
ü при 0,8 < r < 0,95 між параметрами існує сильний ступінь лінійного зв'язку;
ü при 0,6 < r < 0,8 між параметрами існує певна міра лінійного зв'язку;
ü при r < 0,4 між параметрами лінійна залежність відcутня.
Метод визначення значущості результату застосовують для порівняння та визначення достовірності відмінності двох та більше вибірок. Для оцінки достовірності використовують критерій відмінності Ст'юдента (t). Критерій порівнює середні величини досліджуваної та контрольної груп і може довести, що вони не тільки різні, а і що відмінності достовірні. У разі кількості спостережень понад 30 можна користуватися наступною закономірністю: якщо критерій t= 2, то він достовірний, оскільки відповідає р = 0,95 або р = 0,05. При цьому його слід порівнювати з рівнем значущості.
Рі вень значущості (р) — максимальне значення імовірності появи події, при якому подія вважається практично неможливою. У медицині найбільшого поширення набув рівень значущості 0,05. Тому якщо імовірність, з якою подія, що нас цікавить може статися випадковим чином, р <0,05, то прийнято вважати цю подію малоймовірною, а якщо вона відбулася, то це не було випадковістю.
Емпіричні знання для інтерпретації результатів
Імовірність достовірності виражається не критерієм t, а рівнем значущості (Р), який є доповненням імовірності до 100 % (або до 1,0). Так, імовірності 95 % (0,95) відповідає рівень значущості 0,05 (1,0-0,95 = 0,05), імовірності 99 % — 0,01 (1,0- 0,99= 0,01), імовірності 99,9% — 0,001 (1,0-0,999 = 0,001). Для порівняння проводять перевірку нульової гіпотези (Но): середні двох вибірок належать до однієї і тієї самої сукупності. Тобто згідно з цією гіпотезою відмінності, отримані в результаті дослідження, випадкові (не достовірні), тобто обидві групи становлять один і той самий однорідний матеріал, одну сукупність. Статистичний аналіз має привести або до заперечення Но-гіпотези, якщо доведено достовірність отриманих відмінностей, або до її підтвердження, якщо достовірність відмінностей не доведено, тобто відмінності визнано випадковими. Оскільки відмінності завжди характеризуються певним рівнем значущості, то ухвалення рішення щодо заперечення чи підтвердження Но-гіпотези пов'язане з оцінкою рівня значущості, отже:
ü якщо при порівнянні сукупностей рівень значущості, отриманий у ході дослідження, нижчий ніж 0,05 (р < 0,05), то Но-гіпотеза відкидається і відмінності в сукупностях визначаються достовірними, події не випадковими, вибірки належать до двох різних сукупностей;
ü якщо при порівнянні сукупностей рівень значущості отриманий у ході дослідження, перевищує 0,05 (р > 0,05), Но-гіпотеза визнається правильною (підтверджується), тоді події випадкові, вибірки належать до однієї сукупності.
Запропонований опис методів аналізу даних та основних статистичних характеристик є надзвичайно коротким і не охоплює всебічно об'єкт обговорення.
Приклади розв'язання демонстраційних статистичних задач, виконаних за допомогою Microsoft Excel
Усі вищеперераховані характеристики та методи аналізу реалізуються за допомогою пакету Excel.
Задача на визначення відносної частоти у варіаційному ряду
У результаті вимірювання артеріального тиску у хворих було отримано значення систолічного тиску (мм рт. ст.), становлять статистичний розподіл вибірки. Знайдіть відносну частоту до кожного значення варіанти:
Алгоритм обчислення за допомогою Microsoft Excel
1. Увести дані в таблицю.
2. Для знаходження загальної кількості спостережень (n) встановити курсор у клітинку К2, натиснути лівою клавішею миші (ЛКМ) на піктограму автосуми на стандартній панелі інструментів. Підтвердити діапазон чисел B2:J2 (натиснути Enter), у клітинці з'явиться число 257.
3. Встановити курсор у клітинку ВЗ та ввести вручну формулу: =В2:К2. Оскільки адреса клітинки К2 матиме абсолютне посилання на всі подальші значення, то перетворимо її з відносного посилання шляхом натиснення клавіші F4. При цьому адреса набуде вигляду: $К$2. Натиснути Enter. У клітинці з'явиться число 0,0156.
4. Встановити курсор у клітинку ВЗ у вигляді товстого хрестика в нижній правий маркер так, щоб він перетворився на тонкий хрестик, а потім протягнути його горизонтально по рядку діапазону C3:J3. У клітинках з'являться значення відносних частот.
0,0156
| 0,0506
| 0,1051
| 0,2101
| 0,2568
| 0,1907
| 0,1167
| 0,0428
| 0,0117
| 5. Перевірити формулу
Встановити курсор у клітинку КЗ та натиснути ЛКМ на піктограму автосуми на стандартній панелі інструментів. Підтвердити діапазон чисел В3:J3. У клітинці з'явиться число 1.
Задача на визначення показників відносних величин
І. Знаходження екстенсивних показників.
Задача 1. У клінічній лікарні 950 ліжок, у тому числі неврологічних ліжок 135. Обчислити екстенсивний показник.
135х100
ЕП= ------------------ = 14,2%
Таким чином, неврологічних ліжок у клінічній лікарні всього 14,2 % ліжкового фонду.
Задача 2. Визначення екстенсивних показників неправильних діагнозів при їх порівнянні.
Діагнози, що порівнюються
| Кількість випадків
| Кількість помилкових діагнозів
| Екстенсивні показники
| Клінічні з патолого-анатомічними
|
|
|
|
Діагнози, що порівнюються
| Кількість випадків
| Кількість помилкових діагнозів
| Екстенсивні показники
| Поліклінічні з патолого-анатомічними
|
|
|
| Поліклінічні з клінічними
|
|
|
|
Алгоритм обчислення за допомогою Microsoft Excel
1. Внести дані в таблицю.
2. Встановити курсор у D2 та ввести вручну формулу екстенсивного показника: = С2:В2. Натиснути Enter. У клітинці D2 з'являється результат 0,041.
- Повернути курсор у клітинку D2 (натиснути ЛКМ). Встановити курсор у вигляді товстого хрестика в нижній правий маркер так, щоб він перетворився на тонкий хрестик, а потім протягнути його вниз по стовпчику. У клітинках з'являться дані екстенсивних показників.
- Виділяємо стовпчик отриманих даних (D2:D4), натискуємо ЛКМ на інструмент Процентный формат на панелі інструменті Форматирование. Дані набудуть формату відсотків.
Діагнози, що порівнюються
| Кількість випадків
| Кількість помилкових діагнозів
| Екстенсивні показники,
%
| Клінічні з патолого-анатомічними
| 17345
| 719
| 4
| Поліклінічні з патолого-анатомічними
| 16387
| 2004
| 12
| Поліклінічні з клінічними
| 19465
| 1176
| 6
|
II. Знаходження інтенсивних показників.
Задача 1. На підприємстві, що налічує 1200 робітників, було виявлено 10 випадків гострих шлунково-кишкових захворювань (середовище — 1200 робітників, явище — 10 хворих на гострі шлунково-кишкові захворювання). Обчислити інтенсивний показник.
Захворюваність на гострі шлунково-кишкові захворювання робітників підприємства становить:
10x1000
ІП= --------------- = 8,3%.
Інтенсивні показники, як правило, обчислюють на 1000 обстежуваних, проте їх можна обчислювати і на 100, і на 10 000 і т. д., залежно від поширеності явища (чим явище рідкісніше, тим множник більший). Інтенсивний показник (син.: інтенсивний коефіцієнт) — величина, що вказує, як часто дане явище виявляється в певному середовищі. Виражається у відсотках.
Задача 2. Обчислити інтенсивні показники захворюваності дітей молодшого шкільного віку на окремі патології в районі, де зафіксовано забруднення повітря сірчистим газом, парами сульфатної кислоти та в контрольному районі. Проаналізувати вплив забруднення повітря на захворюваність дітей (табл. 2).
Таблиця 2. Показники захворюваності дітей
Нозологічні форми
| Райони із забрудненим повітрям
| Контрольний районн
| Кількість обстежених
| Кількість хворих
| Кількість обстежених
| Кількість хворих
| Тонзиліт
|
|
|
|
| Кон’юктивіт
|
|
|
|
| Карієс зубів
|
|
|
|
| Шкірні хвороби
|
|
|
|
| Усього:
| | | | |
Алгоритм обчислення за допомогою Microsoft Excel
1.Внести дані в таблицю.
2.Підрахувати загальну кількість обстежених і хворих у двох групах. Для цього треба встановити курсор у клітинку В7 та натиснути на автосуму. При цьому висвітиться діапазон чисел ВЗ:В6. Натиснути Enter.
3. Встановити курсор у клітинку В7 та навести товстий хрестик у нижній правий маркер так, щоб він перетворився на тонкий хрестик, а потім протягнути його горизонтально по рядку В7:Е7 при натиснутій ЛКМ. У клітинках з'являться суми чотирьох стовпчиків.
4. Встановити курсор у клітинку F3 та ввести вручну формулу інтенсивного показника: = СЗ:ВЗ для району із забрудненим повітрям. Натиснути Enter.
5. Встановити курсор у клітинку F3 та навести товстий хрестик у нижній правий маркер так, щоб він перетворився на тонкий хрестик, а потім протягнути його вниз по стовпчику F3:F7. У клітинках з'являться дані інтенсивного показника захворюваності дітей у забрудненому районі.
6. Виділити стовпчик отриманих даних (F3:F7), натиснути ЛКМ на інструмент процентный формат на панелі інструментів Форматирование. Дані набудуть формату відсотків.
7. Встановити курсор у клітинку G3 та ввести вручну формулу інтенсивного показника захворюваності дітей у чистому районі: =E3/D3. Натиснути Enter.
8. Встановити курсор у клітинку G3 і навести товстий хрестик у нижній правий маркер так, щоб він перетворився на тонкий, а потім протягнути його вниз по стовпчику. У клітинках з'являться дані інтенсивного показника захворюваності дітей у чистому районі.
9. Виділити стовпчик отриманих даних (G3:G7), натиснути ЛКМ на інструмент Процентный формат на панелі інструментів Форматирование. Дані інтенсивних показників набудуть формату відсотків.
50%
| 12%
| 32%
| 6%
| 42%
| 9%
| 10%
| 1 %
| 33%
| 7%
|
При порівнянні показників можна зробити висновок про те, що в забрудненому районі захворюваність дітей на різні нозологічні форми вища в середньому в 6,5 разів, ніж у контрольному районі.
Задача на визначення середніх вибірки
Результати вимірювання частоти пульсу у студентів-медиків, які не палять, віком 20 років: 68, 65, 70, 65, 62, 70, 68, 65, 65, 70,58,70, 58, 65,65, 68,65, 68,70, 65.
1. Сформуйте варіаційний ряд із запропонованих даних.
2. Обчисліть середню величину, стандартне відхилення, моду, медіану.
Дата добавления: 2015-09-27 | Просмотры: 661 | Нарушение авторских прав
|