Сравнение двух выборок. Основным параметрическим критерием для сравнения двух выборок является -критерий Стьюдента для независимых выборок (t-test for Independent Samples)
Основным параметрическим критерием для сравнения двух выборок является - критерий Стьюдента для независимых выборок (t-test for Independent Samples). Вариант критерия, предназначенный для сравнения средних величин выборок, ориентирован на проверку гипотезы однородности, т.е. гипотезы о том, что обе выборки извлечены из одной и той же генеральной совокупности. Обычно при применении критерия Стьюдента предполагается, что обе выборки извлечены из генеральных совокупностей, имеющих нормальные распределения. Однако специальные исследования показали, что этот критерий, особенно при больших объемах выборок, является устойчивым к отклонениям исследуемых генеральных совокупностей от нормальных, следовательно, вообще говоря, он может применяться и к выборкам из негауссовских генеральных совокупностей, но при этом истинные значения уровня значимости и мощности критерия будут незначительно отличаться от заданных [4. C.395] и, строго говоря, должны оцениваться с помощью специальных приемов. Поэтому в «чистом виде» критерий Стьюдента все же требует нормальности распределений выборок.
Для вычисления статистики критерия существует ряд различных формул, учитывающих особенности ситуации его применения и, в частности, характер предположений о дисперсиях генеральных совокупностей, из которых извлечены выборки [1. С.169-172; 4. C.395-399; 14. С.83-85; 22. С.204-206]:
· дисперсии известны и равны между собой;
· дисперсии известны, но неравны между собой;
· дисперсии неизвестны, но предполагается их равенство;
· дисперсии неизвестны, их равенство не предполагается.
Кроме того, существуют варианты критерия для случаев равных и неравных выборок (см., напр., [1. C.170], а также для связных и несвязных выборок (вариант для связных выборок будет рассмотрен в теме 8.1). Для психологических исследований наиболее обычной является ситуация, когда дисперсии генеральных совокупностей неизвестны, но предполагается их равенство между собой; при этом исследуемые выборки могут иметь различные объемы. В этом случае статистика критерия Стьюдента вычисляется по формуле [4. С.395; 7. C.72; 22. С.205]:
, (7.1-1)
где - средние значения для первой и второй выборки соответственно; - объемы выборок; - объединенная оценка выборочной дисперсии которая вычисляется по следующей формуле:
, (7.1-2)
где и - оценки дисперсий для соответствующих выборок, вычисляемые, в свою очередь, по формулам:
(7.1-3)
Критерий Стьюдента обсуждается во многих работах:
· его непосредственное применение в психологических исследованиях рассмотрено в [1. C.169-174; 5; 13; 29];
· разнообразные примеры использования критерия приведены в [6-8; 15; 17; 18; 20];
· использование критерия в статистическом пакете SPSS обсуждается в [2; 35], в пакете Statistica for Windows – в [9-11], а в пакете Stadia – в [19];
· математико-статистические основания критерия рассмотрены в [4; 14; 16; 21-25; 28; 30; 31; 33].
Другим популярным параметрическим критерием является - критерий Фишера ( test), основанный на анализе дисперсий выборок. Он рассчитывается в дисперсионном анализе, который будет рассмотрен нами в теме 10.
Из непараметрических критериев для сравнения двух выборок наиболее популярен - критерий Манна-Уитни (Mann-Whitney U test), так как он имеет весьма слабые ограничения на объемы выборок (в каждой выборке должно быть не менее трех измерений), а кроме этого позволяет сравнивать между собой выборки разного объема [3. C.50]. Критерий предназначен, в частности, для проверки нулевой гипотезы о том, что средние значения двух выборок не отличаются друг от друга. Иногда эту гипотезу формулируют так: предполагается, что обе независимые выборки взяты из одной и той же генеральной совокупности.
Критерий Манна-Уитни является непараметрическим аналогом -критерия Стьюдента для независимых выборок. Он основан не на параметрах нормального распределения, а на рангах наблюдений, и, поэтому, применим к выборкам, имеющим любой характер распределения. Для применения критерия Манна-Уитни данные выборок временно объединяют и выполняют их ранжирование, а затем подсчитывают суммы рангов, полученные для данных из каждой выборки. Статистика критерия вычисляется по следующим формулам [1. С.109; 3. С.53]:
, (7.1-4)
, (7.1-5)
где , - объемы, соответственно, первой и второй выборки; и - суммы рангов, соответственно, по первой и по второй выборке; - наибольшая из двух ранговых сумм; - объем выборки, имеющей наибольшую сумму рангов.
Критерий Манна-Уитни рассматриваются в многочисленных литературных источниках:
· методика его применения в психологических исследованиях обсуждается в [1. C.101-110; 3. С.49-55];
· разнообразные примеры применения критерия приведены в [8; 15; 17; 27];
· использование критерия в статистическом пакете SPSS обсуждается в [2; 35], в пакете Statistica for Windows – в [9-11], а в пакете Stadia – в [19];
· математико-статистические основания критерия рассмотрены в [4; 14; 16; 21-25; 28; 31-33].
Далее рассмативаются решения задач, встречающихся при анализе психологических данных, в которых применяются критерии выявления различий в уровне признака для двух выборок.
Задача 7.1-1. Применение критерия Манна-Уитни для выявления различий в уровне исследуемого признака
Условие: с помощью методики «Личностный дифференциал» обследованы студенты психологического факультета (выборка A) и других факультетов (выборка B). Результаты, полученные по фактору «Сила Я», приведены в табл. 7.1-1.
Найти: можно ли утверждать, что выборки отличаются друг от друга по показателю фактора «Сила Я»?
Таблица 7.1-1
Дата добавления: 2015-01-18 | Просмотры: 1832 | Нарушение авторских прав
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 |
|