Проверка на нормальность распределения
Картина поля заземлителя показана на рис. 13.15. Сопротивление растеканию [12]
Ом.
III. Проверка статистических гипотез
Тема 6. Критерии согласия распределений
Проверка на нормальность распределения
Во многих ситуациях необходимо выполнять проверку распределения полученной по экспериментальным данным случайной величины на соответствие нормальному закону. В частности, от этого зависит корректность применения параметрических критериев проверки статистических гипотез и некоторых многомерных методов анализа данных (например, дискриминантного или факторного анализа).
Методы проверки на нормальность можно разделить на две группы, основанные, соответственно:
· на описательной статистике и визуализации,
· на критериях согласия распределений.
Методы, основанные на описательной статистике и визуализации
1. Визуальный метод включает построение гистограммы эмпирического распределения (такая возможность реализована во всех популярных статистических пакетах) и ее визуальное сравнение с теоретической кривой нормального распределения..
2. Оценка показателей асимметрии и эксцесса.
Асимметрией (Skewness), или выборочным коэффициентом скошенности, называют меру отклонения эмпирического распределения частот от распределения, симметричного относительно максимальной ординаты [3. С.22; 18. C.11]:
. (6.1-1)
Для симметричных распределений показатель асимметрии равен нулю. Отрицательный показатель асимметрии означает, что кривая распределения скошена влево, положительный – вправо от теоретической симметричной кривой распределения.
Стандартная ошибка асимметрии (Standard error of skewness ), или просто - ошибка асимметрии, - это отклонение показателя асимметрии от нуля, которое находится по формуле [10. С.44; 12. C.53]:
. (6.1-2)
Другая характеристика степени отклонения эмпирической кривой распределения от теоретической кривой нормального распределения, - это показатель эксцесса (Kurtosis ), или выборочный коэффициент островершинности [3. С.23; 18. C.11]:
. (6.1-3)
Стандартная ошибка эксцесса (Standard error of kurtosis) может быть вычислена по формуле [10. С.45; 12. C.57]:
. (6.1-4)
Для нормального распределения показатели асимметрии и эксцесса равны нулю:
. (6.1-5)
Для проверки на нормальность иногда применяют следующие соотношения для выборочных коэффициентов асимметрии и эксцесса [13. C.59; 15. C.213]:
· распределение считается симметричным, если , и сильно асимметричным, если ;
· распределение считается близким к нормальному, если , и значительно отклоняющимся от нормального при .
Кроме того, некоторые авторы рекомендуют следующий прием проверки на нормальность [6. С.132]:
· распределение считается близким к нормальному, если вычисленные значения асимметрии и эксцесса имеют тот же порядок, что и их вычисленные ошибки.
Методы, основанные на критериях согласия распределений
Для проверки на нормальность распределения наиболее часто применяют следующие статистические критерии:
1. Хи-квадрат (Chi-square test, test), или Хи-квадрат Пирсона [1-4; 6; 7; 9-11];
2. Омега-квадрат ( -test), или тест Крамера-Мизеса, Смирнова-Крамера-Мизеса [4; 10; 16; 19];
3. Колмогорова-Смирнова (Kolmogorov-Smirnov test) [1-4; 18; 20; 21];
4. -критерий Шапиро-Уилка (Shapiro-Wilks' test) [14; 17; 22].
Объединяет все эти критерии общий подход к проверке гипотезы нормальности (нулевой гипотезы):
а) рассчитывается уровень значимости , соответствующий полученному значению статистики критерия;
б) если > 0,05, то нулевая гипотеза принимается и, соответственно, гипотеза о наличии отличий от нормального распределения отклоняется. В статистических пакетах в таких случаях иногда выводится сообщение = n.s. (от слова «незначим»);
в) если 0,05, то гипотеза о нормальности распределения отклоняется, соответственно принимается гипотеза о наличии значимых отличий от нормальности.
Наиболее популярен критерий Хи-квадрат, статистика которого для случая сравнения эмпирического распределения с теоретическим вычисляется по формуле [1. C.126; 3. C.124]:
, (6.1-6)
где: - количество разрядов признака (интервалов, на которые разбивают вариационный ряд; - порядковый номер разряда признака; - эмпирическая частота по -тому разряду признака; - теоретическая частота по -тому разряду признака.
Критерии согласия распределений имеют существенные ограничения по объему выборки:
· для критерия Хи-квадрат - [3. C.117],
· для критерия Колмогорова-Смирнова - [3. C.143],
· для критерия Омега-квадрат - [10. C.157].
Если эти условия не выполняются, следует применять -критерий Шапиро-Уилка, предназначенный для выборок с численностью от 3 до 50 [10. С.161; 14. C.618].
Далее приводятся задачи, иллюстрирующие применение методов проверки распределения на нормальность.
Задача 6.1-1. Проверка на нормальность распределения (случай подтверждения нормальности для большой выборки)
Условие: при приеме на работу сотрудников страховой компании проведено исследование уровня профессиональной пригодности (УПП) на выборке из 90 человек (табл. 6.1-1).
Найти: соответствуют ли полученные эмпирические данные нормальному закону распределения.
Таблица 6.1-1
Дата добавления: 2015-01-18 | Просмотры: 2980 | Нарушение авторских прав
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 |
|