Учебная работа. Реферат: Однофакторный дисперсионный анализ

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...
Контрольные рефераты

Учебная работа. Реферат: Однофакторный дисперсионный анализ

анализ

В общем виде эту задачку можно поставить последующим образом: пусть мы смотрим m независящих нормально распределенных случайных величин (1) предполагая, что они все имеют схожую дисперсию (эту догадку можно проверить при помощи F-критерия). Средние значения случайных величин (2) совершенно говоря, различны. Пусть в схожих экспериментальных критериях над каждой из переменных (1) делается некая серия наблюдений (для простоты ограничимся случаем равночисленных наблюдений, хотя это событие несущественно для теории). Данные k-й серии пусть будут (k=1,2,…..,m) (3).

Делая упор на эти статистические данные, мы желаем проверить догадку, согласно которой средние значения (2) равны, т.е. a1
=a2
=…..=am
(4)

Если проверяемая догадка, именуемая нулевой догадкой, верна. поставив средние в каждой серии, мы не должны получить ш расхождения меж ними; если такое расхождение найдено то догадку (3) приходится откинуть.

Примером схожей ситуации может служить статистическое исследование урожайности сельскохозяйственной культуры зависимо от 1 из m видов земли при неком методе ее обработки. Настоящее 1-го фактора сорта земли — на урожайность .сельскохозяйственной культуры. В иной постановке та же задачка возникает, если мы желаем проверить, как влияют и влияют ли совершенно на плодородие земли источники загрязнения. В этом случае сорт земли может изменяться и давать разную урожайность зависимо от удаленности обрабатываемого участка земли от источника загрязнения.

Таблица результатов измерений будет иметь последующий вид (табл. 1):

Результаты измерений урожайности


Номер сорта земли



Номер опыта

1
2
3

n

1
x11

X12

X13


X1n


2
X21

X22

X23


X2n


3
X31

X32

X33


X3n









m
Xm1

Xm2

Xm3


xnm


Обозначим через среднее арифметическое из n наблюдаемых урожайностей на почве первого сорта, через — среднее из урожайностей в почве второго сорта и т. д., так, что

, …,

Периодические ошибки наблюдений урожайностей на различных почвах неодинаковы, то мы должны ждать завышенного рассеивания выборочных средних.

Обозначим через общее среднее арифметическое всех nm измерений так, что .(5)

Суммирование по k при неизменном i дает сумму по всем наблюдениям i-той серии (т.е. по i-му сорту земли). Предстоящее суммирование по i дает результат по всем сортам земли. Потому что

, то .

В то же время

,(6)

при этом

.

Но , потому что представляет собой сумму отклонений наблюдений i-й серии от средней данной же серии и поэтому S=0. (7)

По этому приняв во внимание, что

,(8)

мы можем основное тождество (6) записать в последующем виде

, (9) либо в сокращенном виде ,(10)

где , ,

Таковым образом, общая сумма квадратов ‚ распадается на две составные части, 1-ая из которых связана с оценкой дисперсии урожайности меж сортами земли, а 2-ая — с оценкой дисперсии снутри всех сор земли.

Представим сейчас, что догадка (4) верна, и поэтому обычные распределения всех величин (урожайностей) тождественны. имеют однообразные среднее .Тогда же nm наблюдений можно разглядывать как подборку из одной и той же обычной совокупы .

Можно показать, что при данной догадке статистики , и распределены по закону соответственно с ,, степенями свободы, а по тому Q, Q1
, Q2
могут быть применены в этом случае для оценки . Эта оценка быть может поведена при помощи несокращенных черт

, , .

При наиболее детализированном исследование указывает, что Q1
и Q2
при нашей догадке независимы друг от друга. Заметим, этот вывод справедлив при всех догадках относительно ai
.

Из произнесенного вытекает, что аспект

(11) в догадке (4) будет следовать F-распределению с и степенями свободы. Выбирая q%-й уровень значимости при узнаваемых , , найдем по таблице 20 в приложение соответственный q% предел так, что



Fq


.

Пусть с иной стороны наша догадка неверна и средние значения (2) не равны друг дружке, но параметр во всехm совокупностях один и этот же, когда сумма Q2
, не изменяющаяся при подмене на , имеет, как можно обосновать. Как и раньше распределение и степенями свободы, .

Как и раньше является несмещенной оценкой для . В то же время числитель F в (7,14) учитывает периодические расхождения меж средними значениями ai
, и имеет тенденцию расти и становится тем больше, чем больше отличия от предполагаемого равенства значений ai
. Потому правила проверки догадки дается в последующем виде: a1
=a2
=…..=am
принимается, если ; в этом случае и несмещенными оценками характеристик a и нормально распределенных случайных величин (1).

Если ,то нулевая догадка отклоняется, и следует считать, что посреди значений имеются хотя бы два не равных друг другу.

Схема однофакторного дисперсионного анализа


Компонента дисперсии
Сумма квадратов
Число степеней свободы
Выборочная дисперсия

Меж сортами земли




Снутри видов земли




Полная (общая)




Сравнивая дисперсию меж сортами земли с дисперсией «снутри» земли, по величине их дела (11) судят, как рельефно проявляется воздействие такового фактора, как сорт земли; в этом сопоставлении как раз и заключается основная мысль дисперсионного анализа. Схему однофакторного дисперсионного анализа можно представить в , табл. 2.

В качестве числового примера разглядим данные пятикратного (n=5) измерения урожайности на 3-х (т =3) сортах земли. В таблице приведены данные не фактического, а условного опыта;

Результаты измерения урожайности в относительных единицах

Номер

Сорта земли



Номер опыта
Выборочное среднее

1
2
3
4
N=5

i







1
12
15
17
13
16
14.6

2
20
17
16
25
14
18.4

m=3
10
12
11
13
8
10.8

Из таблицы имеем:

;

;

; ; ; .

Для нашего примера таблица однофакторного анализа будет иметь последующий вид

дисперсионный анализ урожайности на разных сортах земли


Компонента дисперсии
Сумма квадратов
Число степеней свободы
Выборочная дисперсия

Меж сортами

земли



Q1
=137
2


Снутри видов земли
Q2=102.2
12


Полная (общая)
Q3
=239.2
14


Произведя сейчас проверку нулевой догадки (4) при помощи распределения, находим

При 2-ух степенях свободы большей дисперсии (k1
= 2) и 12 е свободы наименьшей дисперсии (k2
= 12) по табл. в приложении II находим критичные границы для F, равные при 5%-м уровне pзначимости и 3.88 и 1%-м уровне — 6.93. Приобретенное нами из наблюдений превосходит обозначенные границы, и поэтому нулевая догадка обязана быть отвергнута, т.е. урожайность на рассматриваемых сортах земли неодинакова.

]]>