Vyberte možnost Stránka

Testování hypotézy o rovnosti prostředků. Testování statistických hypotéz o rovnosti průměrů

8.1. Pojem závislých a nezávislých vzorků.

Výběr kritéria pro testování hypotézy

je primárně určeno tím, zda jsou uvažované vzorky závislé nebo nezávislé. Uveďme si odpovídající definice.

Def. Vzorky se nazývají nezávislý, pokud postup výběru jednotek v prvním vzorku nijak nesouvisí s postupem výběru jednotek ve druhém vzorku.

Příkladem dvou nezávislých vzorků jsou výše diskutované vzorky mužů a žen pracujících ve stejném podniku (ve stejném odvětví apod.).

Všimněte si, že nezávislost dvou vzorků neznamená, že neexistuje požadavek na určitý druh podobnosti těchto vzorků (jejich homogenitu). Při studiu úrovně příjmu mužů a žen je nepravděpodobné, že bychom dopustili takovou situaci, kdy jsou muži vybíráni z prostředí moskevských podnikatelů a ženy z australských domorodců. Ženy by také měly být Moskvanky a navíc „podnikatelky“. Zde však nehovoříme o závislosti vzorků, ale o požadavku homogenity studovaného souboru objektů, který musí být splněn jak při sběru, tak při analýze sociologických dat.

Def. Vzorky se nazývají závislé nebo spárované, pokud je každá jednotka jednoho vzorku "svázána" s konkrétní jednotkou druhého vzorku.

Poslední definice bude pravděpodobně jasnější, pokud uvedeme příklad závislých vzorků.

Předpokládejme, že chceme zjistit, zda je sociální postavení otce v průměru nižší než sociální status syn (domníváme se, že tuto komplexní a nejednoznačnou sociální charakteristiku člověka dokážeme změřit). Zdá se zřejmé, že v takové situaci je účelné vybrat dvojice respondentů (otec, syn) a předpokládat, že každý prvek prvního vzorku (jeden z otců) je „vázán“ na určitý prvek druhého vzorku (jeho syn). Tyto dva vzorky se budou nazývat závislé.

8.2. Testování hypotéz pro nezávislé vzorky

Pro nezávislý výběr kritéria závisí na tom, zda známe obecné rozptyly s 1 2 a s 2 2 uvažovaného znaku pro studované vzorky. Tento problém budeme považovat za vyřešený za předpokladu, že se výběrové rozptyly shodují s obecnými. V tomto případě je kritériem hodnota:

Než přistoupíme k diskusi o situaci, kdy nám obecné odchylky (nebo alespoň jedna z nich) nejsou známy, poznamenáváme následující.

Logika použití kritéria (8.1) je podobná té, kterou jsme popsali u kritéria „Chí-kvadrát“ (7.2). Je zde pouze jeden zásadní rozdíl. Když už mluvíme o významu kritéria (7.2), uvažovali jsme o nekonečném počtu vzorků velikosti n, „nahrabaných“ z naší obecné populace. Zde při analýze významu kritéria (8.1) přejdeme k úvaze o nekonečném počtu parní vzorky o velikosti n 1 an 2 . Pro každý pár a je vypočítána statistika formuláře (8.1). Soubor získaných hodnot takové statistiky v souladu s naším zápisem odpovídá normálnímu rozdělení (jak jsme se shodli, pro označení takového kritéria, které odpovídá normálnímu rozdělení, se používá písmeno z).

Pokud nám tedy obecné rozptyly nejsou známy, pak jsme nuceni místo nich použít jejich výběrové odhady s 1 2 a s 2 2. V tomto případě by však mělo být normální rozdělení nahrazeno Studentovým rozdělením - z by mělo být nahrazeno t (jako tomu bylo v podobné situaci při konstrukci intervalu spolehlivosti pro matematické očekávání). Avšak pro dostatečně velké velikosti vzorků (n 1 , n 2 ³ 30), jak již víme, se Studentovo rozdělení prakticky shoduje s normálním. Jinými slovy, u velkých vzorků můžeme i nadále používat kritérium:

Situace je složitější, když oba rozptyly nejsou známy a velikost alespoň jednoho vzorku je malá. Pak do hry vstupuje další faktor. Typ kritéria závisí na tom, zda můžeme považovat neznámé rozptyly uvažovaného znaku ve dvou analyzovaných vzorcích za stejné. Abychom to zjistili, musíme otestovat hypotézu:

H0: s12 = s22. (8.3)

K ověření této hypotézy se používá kritérium

Specifika použití tohoto kritéria budou diskutována níže a nyní budeme pokračovat v diskusi o algoritmu pro výběr kritéria, které využívá matematická očekávání k testování hypotéz o rovnosti.

Pokud je hypotéza (8.3) zamítnuta, pak kritérium, které nás zajímá, má podobu:

(8.5)

(tj. liší se od testu (8.2) používaného pro velké vzorky tím, že odpovídající statistika nemá normální rozdělení, ale Studentovo rozdělení). Pokud je hypotéza (8.3) přijata, změní se typ použitého kritéria:

(8.6)

Shrňme si, jak je zvoleno kritérium pro testování hypotézy rovnosti obecných matematických očekávání na základě analýzy dvou nezávislých vzorků.

známý

neznámý

velikost vzorku je velká

H 0: s 1 = s 2 je zamítnuto

přijato

8.3. Testování hypotéz pro závislé vzorky

Pojďme k uvažování závislých vzorků. Nechť posloupnosti čísel

Xi, X2, …, Xn;

Y 1 , Y 2 , … , Y n –

to jsou hodnoty uvažované náhodnosti pro prvky dvou závislých vzorků. Představme si notaci:

Di = Xi - Yi, i = 1, ..., n.

Pro závislý vzorkovací kritérium, které vám umožní testovat hypotézu

jak následuje:

Všimněte si, že právě daný výraz pro s D není nic jiného než nový výraz pro známý vzorec vyjadřující směrodatnou odchylku. V tomto případě mluvíme o směrodatné odchylce hodnot D i. Takový vzorec se v praxi často používá jako jednodušší (ve srovnání s „frontálním“ výpočtem součtu čtverců odchylek hodnot uvažované hodnoty od odpovídajícího aritmetického průměru) metoda pro výpočet rozptylu.

Porovnáme-li výše uvedené vzorce s těmi, které jsme použili při diskusi o principech konstrukce intervalu spolehlivosti, snadno zjistíme, že testování hypotézy o rovnosti průměrů pro případ závislých vzorků je v podstatě testem rovnosti k nule. matematického očekávání hodnot D i . Hodnota

je směrodatná odchylka pro D i. Proto je hodnota právě popsaného kritéria t n -1 v podstatě rovna hodnotě D i vyjádřené ve zlomcích směrodatné odchylky. Jak jsme uvedli výše (když diskutujeme o metodách konstrukce intervalů spolehlivosti), tento indikátor lze použít k posouzení pravděpodobnosti uvažované hodnoty D i. Rozdíl je v tom, že výše jsme mluvili o jednoduchém aritmetickém průměru, normálně rozděleném, a tady mluvíme o průměrných rozdílech, takové průměry mají Studentovo rozdělení. Ale argumenty o vztahu mezi pravděpodobností odchylky výběrového aritmetického průměru od nuly (s matematickým očekáváním rovným nule) a počtem jednotek s tato odchylka zůstávají platné.

Příklad. Příjmy drogerií jednoho z městských městských obvodů za určité období činily 128; 192; 223; 398; 205; 266; 219; 260; 264; 98 (konvenční jednotky). V sousedním mikrookresu se za stejnou dobu rovnaly 286; 240; 263; 266; 484; 223; 335.
Pro oba vzorky vypočítejte průměr, korigovaný rozptyl a směrodatnou odchylku. Najděte variační rozsah, střední absolutní (lineární) odchylku, variační koeficient, lineární koeficient variace, koeficient kmitání.
Za předpokladu, že daná náhodná veličina má normální rozdělení, určete interval spolehlivosti pro obecný průměr (v obou případech).
Pomocí Fisherova kritéria ověřte hypotézu o rovnosti obecných rozptylů. Pomocí Studentova kritéria ověřte hypotézu o rovnosti obecných průměrů (alternativní hypotéza je o jejich nerovnosti).
Ve všech výpočtech byla hladina významnosti α = 0,05.

Řešení se provádí pomocí kalkulačky Testování hypotézy rovnosti rozptylů.
1. Najděte variační indikátory pro první vzorek.

X|x - x cf |(x - x sr) 2
98 127.3 16205.29
128 97.3 9467.29
192 33.3 1108.89
205 20.3 412.09
219 6.3 39.69
223 2.3 5.29
260 34.7 1204.09
264 38.7 1497.69
266 40.7 1656.49
398 172.7 29825.29
2253 573.6 61422.1


.



Variační indikátory.
.

R = X max - X min
R = 398 - 98 = 300
Průměrná lineární odchylka


Každá hodnota řady se od druhé liší v průměru o 57,36
Disperze


Nestranný odhad rozptylu


.

Každá hodnota řady se liší od průměrné hodnoty 225,3 v průměru o 78,37
.

.

Variační koeficient

Protože v>30%, ale v nebo

Oscilační faktor

.
.


Podle Studentovy tabulky zjistíme:
T tabulka (n-1; α / 2) \u003d T tabulka (9; 0,025) \u003d 2,262

(225.3 - 59.09;225.3 + 59.09) = (166.21;284.39)

2. Najděte variační indikátory pro druhý vzorek.
Posuneme řádek. Chcete-li to provést, seřaďte jeho hodnoty vzestupně.
Tabulka pro výpočet ukazatelů.

X|x - x cf |(x - x sr) 2
223 76.57 5863.18
240 59.57 3548.76
263 36.57 1337.47
266 33.57 1127.04
286 13.57 184.18
335 35.43 1255.18
484 184.43 34013.9
2097 439.71 47329.71

Pro vyhodnocení distribuční řady najdeme následující ukazatele:
Metriky distribučního centra.
jednoduchý aritmetický průměr


Variační indikátory.
Absolutní míra variace.
Rozsah variace je rozdíl mezi maximální a minimální hodnotou atributu primární řady.
R = X max - X min
R = 484 - 223 = 261
Průměrná lineární odchylka- vypočítané tak, aby byly zohledněny rozdíly všech jednotek studované populace.


Každá hodnota řady se od druhé liší v průměru o 62,82
Disperze- charakterizuje míru rozptylu kolem své střední hodnoty (míru rozptylu, tj. odchylku od průměru).


Nestranný odhad rozptylu- konzistentní odhad rozptylu (opravený rozptyl).


Standardní odchylka.

Každá hodnota řady se liší od průměrné hodnoty 299,57 v průměru o 82,23
Odhad směrodatné odchylky.

Relativní míry variace.
Mezi relativní variační ukazatele patří: oscilační koeficient, lineární variační koeficient, relativní lineární odchylka.
Variační koeficient- míra relativního rozptylu populačních hodnot: ukazuje, jaký podíl na průměrné hodnotě této veličiny tvoří její průměrné rozpětí.

Protože v ≤ 30 %, populace je homogenní a variace je slabá. Získaným výsledkům lze věřit.
Lineární variační koeficient nebo Relativní lineární odchylka- charakterizuje podíl průměrné hodnoty znaménka absolutních odchylek od průměrné hodnoty.

Oscilační faktor- odráží relativní kolísání extrémních hodnot atributu kolem průměru.

Intervalový odhad populačního centra.
Interval spolehlivosti pro obecný průměr.

Hodnotu t kp určete podle Studentovy tabulky rozdělení
Podle Studentovy tabulky zjistíme:
T tabulka (n-1; α / 2) \u003d T tabulka (6; 0,025) \u003d 2,447

(299.57 - 82.14;299.57 + 82.14) = (217.43;381.71)
S pravděpodobností 0,95 lze tvrdit, že průměrná hodnota u většího vzorku nepřekročí hranice zjištěného intervalu.
Testujeme hypotézu rovnosti rozptylů:
H°: Dx = Dy;
H 1: D x Najděte pozorovanou hodnotu Fisherova kritéria:

Protože s y 2 > s x 2, pak s b 2 = s y 2, s m 2 = s x 2
Počty stupňů volnosti:
f 1 \u003d n y - 1 \u003d 7 - 1 \u003d 6
f 2 \u003d n x - 1 \u003d 10 - 1 \u003d 9
Podle tabulky kritických bodů Fisher-Snedekorova rozdělení na hladině významnosti α = 0,05 a daných počtech stupňů volnosti zjistíme Fcr (6;9) = 3,37
Protože F obl Testujeme hypotézu o rovnosti obecných průměrů:


Pojďme najít experimentální hodnotu Studentova kritéria:


Počet stupňů volnosti f \u003d n x + n y - 2 \u003d 10 + 7 - 2 \u003d 15
Hodnotu t kp určete podle Studentovy tabulky rozdělení
Podle Studentovy tabulky zjistíme:
T tabulka (f; α / 2) \u003d T tabulka (15; 0,025) \u003d 2,131
Podle tabulky kritických bodů Studentova rozdělení na hladině významnosti α = 0,05 a daném počtu stupňů volnosti zjistíme t cr = 2,131
Protože t obs

Mezi nejdůležitější zobecňující charakteristiky, ohledně kterých se nejčastěji předkládají hypotézy, patří průměrná hodnota. Abychom mohli otestovat hypotézu o rovnosti průměrů v obecné populaci, je nutné formulovat nulovou hypotézu. V tomto případě se zpravidla předpokládá, že oba vzorky jsou odebrány z normálně rozdělené obecné populace s matematické očekávání rovná X a s rozptylem rovným c0 . Pokud je tento předpoklad správný, pak x1 - x2 ~ x. Ve skutečnosti výběrové prostředky X1 a X2 nebudou stejné kvůli náhodnosti vzorku. Proto je nutné zjistit význam rozdílů mezi x1 x2 - zda je jejich rozdíl v mezích možné náhodné variace nebo zda tyto meze přesahuje. Poté je úloha testování hypotézy redukována na testování významnosti rozdílu

Každý průměr vzorku má svou vlastní chybu. /A:

Po určení rozptylů a průměrná chyba průměry vzorku, můžete vypočítat skutečnou hodnotu I-testu a porovnat ji s kritickou (tabulkovou) hodnotou na příslušné hladině významnosti a počtu stupňů volnosti variace (u vzorků s n > 30 je U- používá se test normální distribuce a pro vzorky s číslem n< 30 - и-критерий Стьюдента).

Skutečná hodnota i-kritéria je určena vzorcem

Pokud výběrová hodnota kritéria spadá do kritické oblasti (їfakі> O), je nulová hypotéza o rovnosti průměru zamítnuta; pokud výběrová hodnota kritéria spadá do oblasti přijatelných hodnot (Іfaq< їа), нулевая гипотеза принимается.

Nulová hypotéza, že průměry ve dvou populacích jsou stejné, může být také testována porovnáním skutečného středního rozdílu [єFa,.t = ~~2 ) s omezující náhodnou chybou na dané hladině významnosti (ea). Pokud je skutečný rozdíl mezi průměrem vzorku v rámci náhodné chyby< еа), нулевая гипотеза принимается. Если же фактическая разница между средними выходит за пределы случайной ошибки (еф^т >ea), nulová hypotéza je zamítnuta.

Při řešení konkrétních problémů testování statistických hypotéz ohledně průměrů je nutné vzít v úvahu následující body: 1) schéma výběru (vzorky jsou nezávislé a závislé); 2) rovnost nebo nerovnost velikostí vzorků; 3) rovnost nebo nerovnost rozptylů obecných populací.

Algoritmus pro testování hypotézy týkající se dvou průměrů se poněkud změní, pokud jsou rozptyly pro vzorky (512 a 522) výrazně odlišné. V tomto případě se při určování počtu stupňů volnosti zavádí změna:

Pokud při nestejných rozptylech mezi vzorky jsou jejich počty také nerovnoměrné (n1 a n2), měla by se tabulková hodnota Studentova t-testu vypočítat pomocí vzorce

kde u1 a u2 jsou tabulkové hodnoty Studentova t-testu, které jsou brány v souladu s n1- 1 a n2 - 1 stupeň volnosti.

Zvažte příklad testování statistické hypotézy o rovnosti dvou průměrných nezávislých vzorků stejné velikosti (n1=n2) a stejné disperze (SG;2 =).

Ano, existují údaje o živé hmotnosti telat při narození pro dvě skupiny černobílých krav (krávy stejného věku). První skupina krav měla normální délku laktace (305 dní) a druhá skupina byla dojena 320 dní. Každá skupina zahrnovala 5 krav. Tato pozorování jsou uvedena v tabulce. 7.2.

Tabulka 7.2. Živá hmotnost telat při narození u skupin krav s různou délkou laktace

Porovnání živé hmotnosti telat ve dvou skupinách krav ukazuje, že vyšší živá hmotnost telat je pozorována u krav I. skupiny, které měly normální délku laktace. Vzhledem k tomu, že počet vzorků je malý (n = 5), není vyloučena možnost, že neshody mezi živými hmotnostmi byly získány v důsledku náhodných příčin.

Je nutné statisticky vyhodnotit rozdíl mezi průměry pro obě skupiny krav.

Na základě výsledků testování hypotézy usuzujte, že rozdíl mezi průměry leží v mezích náhodných fluktuací, nebo je tento rozdíl natolik významný, že není v souladu s nulovou hypotézou o náhodné povaze rozdílů mezi průměry.

V případě prokázání druhé polohy a zamítnutí první lze tvrdit, že délka laktace ovlivňuje živou hmotnost telat.

Podmínka problému předpokládá, že oba vzorky jsou odebrány z normálně rozložené obecné populace. Vytváření skupin je náhodné (nezávislé), proto by měl být hodnocen rozdíl mezi průměry.

Stanovme průměrnou živou hmotnost telat pro dvě skupiny krav:

Skutečný rozdíl mezi prostředky je:

Je třeba posoudit významnost tohoto rozdílu. K tomu je nutné otestovat hypotézu, že dva průměry jsou stejné.

Podívejme se podrobně na všechny fáze schématu testování hypotéz. 1. Formulujme nulové alternativní hypotézy But a Na:

2. Vezměme hladinu významnosti a = 0,05, zaručující přijetí hypotézy nebo její zamítnutí s pravděpodobností chyby pouze v 5 případech ze 100.

3. Nejúčinnějším kritériem pro testování tohoto typu hypotézy H0 je Studentův u-test.

4. Formulujme pravidlo pro rozhodování na základě výsledků

kontrola H0. Protože podle alternativní hypotézy x1 může být méně nebo více x2, pak musí být kritická oblast stanovena ze dvou

strany: a - ~ ia a a - ia, nebo zkráceně: ia.

Tato forma nastavení kritéria se nazývá bilaterální kritická oblast. Kritická oblast při a = 0,05 bude obsažena v - všech hodnotách vyšších než horních 2,5 % a nižších než 2,5 % distribučního bodu Studentova u-testu.

S ohledem na výše uvedené lze závěry o kontrole H0 formulovat následovně: hypotéza H0 bude zamítnuta, pokud se ukáže, že skutečná hodnota Γ-kritéria je

více tabulkovou hodnotu, tedy pokud je-li > ia. Jinak Ka musí být přijata.

5. Pro kontrolu H0 je třeba určit skutečnou hodnotu Studentova G-testu a porovnat ji s tabulkovou hodnotou.

Pro určení skutečné hodnoty Studentova t-testu provedeme následující výpočty.

6. Pro každý vzorek vypočítejte variace rozptylu korigované na ztrátu stupňů volnosti. Za tímto účelem nejprve odmocníme hodnoty хц a х2і:

7. Vypočítejte druhou mocninu středních chyb pro každý vzorek a zobecněnou střední chybu středního rozdílu:

8. Vypočítejte skutečnou hodnotu Studentova G-testu:

9. Určete tabulkovou hodnotu G-Student testu na základě hladiny významnosti a = 0,05 a počtu stupňů volnosti pro dva vzorky:

Podle tabulky "Kritické body Studentova rozdělení" (doplňkové 3) zjistíme a při a = 0,05 ak = 8: i005 = 2,31.

10. Porovnejme skutečnou a tabulkovou hodnotu - Studentovo kritérium:

Protože ifakkg< и^05 (выборочное значение критерия находится в области допустимых значений), нулевая гипотеза о равенстве средних генеральных совокупностях принимается.

Vliv délky laktace na živou hmotnost telat při narození je tedy podceňován.

Je však třeba věnovat pozornost jednomu zásadnímu bodu: živá hmotnost telat při narození ve všech pozorováních experimentu je vyšší u první skupiny krav, které mají normální délku laktace. Proto místo alternativní hypotézy Na x1 F x2 lze vzít další. Protože není důvod se domnívat, že při normální délce laktace bude živá hmotnost telat nižší, je zřejmé, že vhodnější forma alternativní hypotézy je: Ha: x1 > x2.

Potom bude kritická oblast, která je 0,05 z celé plochy pod distribuční křivkou, umístěna pouze na jedné (pravé) straně, protože záporné hodnoty živé hmotnosti jsou považovány za neslučitelné s podmínkami problému. V tomto ohledu by mělo být kritérium tabulkové hodnoty stanoveno na dvojnásobné hodnotě hladiny významnosti (tj. na 2a; ia = 2 o 0,05 = 0,10). Kritérium pro testování hypotézy je formulováno následovně: nulová hypotéza je zamítnuta, pokud > і2а.

Tato forma problému kritické oblasti se nazývá jednostranný. Jednostranný test je citlivější na chyby druhého druhu, ale jeho aplikace je přípustná pouze v případě, že je prokázána platnost této alternativní hypotézy.

Stanovme podle tabulek (Příloha 3) tabulkové kritérium hodnoty při a = 0,10 ak = 8, i0D0 = 1,86.

Takže při použití jednostranného testu je nulová hypotéza zamítnuta, tzn. kritérium bude v kritické oblasti (ifakg > i0d0; 2,14 > 1,86). Živá hmotnost telat při narození ve skupině krav s normální dobou laktace je tedy výrazně vyšší. Tento závěr je přesnější než závěr získaný na základě dvoustranného testu, protože zde jsou použity dodatečné informace k odůvodnění správnosti použití jednostranného testu.

Stejný závěr lze získat porovnáním možné mezní chyby dvou vzorků ea se skutečným rozdílem mezi průměry.

Vypočítejme možnou mezní chybu rozdílu mezi průměry pro dva vzorky:

Porovnáním mezní možné chyby se skutečným rozdílem v průměrech můžeme vyvodit podobný závěr, že předložená hypotéza o rovnosti průměrů nesouhlasí se získanými výsledky.

Budeme zvažovat testování hypotézy pro případ závislých vzorků se stejným počtem a stejnými rozptyly pomocí následujícího příkladu.

Ano, existují výběrová data o užitkovosti krav matek a dcer (tabulka 7.3).

Tabulka 7.3. Produktivita krav matky a dcery

Je nutné otestovat statistickou hypotézu týkající se středního rozdílu mezi páry souvisejících pozorování v populaci.

Vzhledem k tomu, že pozorování dvou vzorků jsou párově propojena (závislé vzorky), je nutné porovnávat nikoli rozdíl mezi průměry, ale průměrnou hodnotu rozdílů mezi dvojicemi pozorování (u). Podívejme se na všechny fáze postupu testování hypotéz. 1. Formulujme nulovou a alternativní hypotézu:

U této alternativy je nutné použít dvoustranný test.

2. Hladinu významnosti bereme rovnou a = 0,05.

3. Nejvýkonnějším testem pro H0 je Studentův u-test.

4. Vypočítejte průměrný rozdíl

5. Vypočítejte upravený rozptyl středního rozdílu:

6. Určete střední chybu středního rozdílu:

7. Vypočítejte skutečnou hodnotu – studentské kritérium:

8. Nastavte počet stupňů volnosti na základě počtu párů vzájemně souvisejících rozdílů:

9. Najděte tabulkovou hodnotu Studentova G-testu pro Na= 4 a a = 0,05; V. = 2,78 (cca 3).

10. Porovnejme skutečnou a tabulkovou hodnotu kritéria:

Skutečná hodnota kritéria je nad tabulkou. Proto je hodnota průměrného rozdílu mezi dojivostí obou vzorků významná a nulová hypotéza je zamítnuta.

Stejné závěry získáme porovnáním možné mezní chyby se skutečným průměrným rozdílem:

Mezní chyba ukazuje, že v důsledku náhodné variace může průměrný rozdíl dosáhnout 2,4 c. Skutečný průměrný rozdíl je vyšší:

Podle výsledků studie lze tedy s vysokou mírou pravděpodobnosti tvrdit, že rozdíly v hodnotách průměrné dojivosti matek a dcer jsou pravděpodobné.

Někdy se ukáže, že průměrný výsledek z hlavní série experimentů se liší od průměrného výsledku jiné série experimentů. Je třeba určit náhodou nebo ne, tento rozdíl tzn. můžeme předpokládat, že výsledkem experimentu je vzorek dvou nezávislých populace se stejnými prostředky, nebo si prostředky těchto populací nejsou rovné.

Formální vyjádření tohoto problému je následující: studujeme dva náhodné proměnné rozděleno podle normálního zákona:

, Kde σ je směrodatná odchylka.

Předpokládá se, že rozptyly a jsou známy, ale nejsou známa matematická očekávání.

Nechť existují dvě řady pozorování x a y.

Χ: x 1, x 2, ..., x n 1.

Υ: y1, y2, …, yn2.

Předkládáme následující hypotézu, že m x = m y. Na základě pozorování je nutné tuto hypotézu potvrdit nebo vyvrátit. Pokud se potvrdí nulová hypotéza, pak můžeme říci, že rozdíly mezi průměry v obou výběrech jsou statisticky nevýznamné, tzn. vysvětleno jako náhodná chyba.

K testování této hypotézy se používá z-test. K tomu se počítá

z-score (z-statistic), které je definováno takto:

Aritmetický průměr řady n pozorování.

Z-test je normálně rozdělen s nulovým průměrem a jednotkovým rozptylem.

H 1: m x ≠ m y

Nulová hypotéza, že průměry jsou stejné: H0: =

Alternativní hypotéza, že prostředky nejsou stejné, je následující :H1:≠.

Podle alternativní hypotézy jsou možné následující možnosti: buď< , либо >. V souladu s tím musíme použít dvoustranný test. Existují tedy dva kritické body: a .

Tyto body se vybírají z podmínky:

(1) Р(-∞

(2) P(

Podle hodnoty určíme levý a pravý kritický bod.

,

kde F(z) je integrální distribuční funkce náhodné veličiny Z a F -1 (…) je inverzní funkce.

Definice: Nechť je na segmentu definována funkce y = f(x) a segment [α, β] je množinou hodnot této funkce. Nechť dále každé y ze segmentu [α, β] odpovídá pouze jedné hodnotě x ze segmentu , pro kterou f(x) = y. Pak na segmentu [α, β] lze definovat funkci x = f -1 (y), přiřadit každému y z [α, β] hodnotu x, pro kterou f(x) = y. Funkce x = f -1 (y) se nazývá inverzní funkce y = f(x).

Hodnoty kritických bodů lze zjistit pomocí funkce: =NORMSINV, zadáním hodnoty pravděpodobnosti v dialogovém okně () - vyhledání hodnoty , nebo hodnoty (1 - ) - vyhledání hodnoty ).

Hodnota Z, normálně rozdělená s parametry Z=N(0;1), je rozdělena symetricky:

0,05

Geometrická interpretace: Pravděpodobnost zasažení oblastí odmítnutí hypotézy se rovná součtu stínovaných oblastí.

Pořadí testování:

1. Vypočítejte statistiku Z.

2. Nastavte hladinu významnosti .

3. Kritické body určíme na základě podmínek (1) a (2).

4. Porovnejte hodnotu vypočítanou v kroku 1 Z s hodnotou kritických bodů:

Pokud je hodnota Z- statistika bude v absolutní hodnotě větší než hodnota kritického bodu, pak je nulová hypotéza na dané hladině významnosti zamítnuta. To znamená, že dvě populace, ze kterých je vzorek vyroben, jsou různé, a proto nejsou průměry a matematická očekávání pro tyto vzorky stejné. V opačném případě je hypotéza o rovnosti průměrů přijata a tyto dvě populace lze považovat za jednu společnou se stejnou matematickou hodnotou.

V balíku EXCEL je analytický nástroj s názvem "two-sample Z-test na průměry" (Služba - analýza dat - dvouvzorkový Z- průměrný test). Slouží k testování hypotézy o rozdílu mezi průměry (očekáváními) dvou normálních rozdělení se známými rozptyly.

Po vyvolání tohoto nástroje se zobrazí dialogové okno, ve kterém se nastavují následující parametry:

* Hypotetický průměrný rozdíl: zadá se číslo, očekávaný rozdíl mezi průměry pro studovanou obecnou sekvenci. Chcete-li otestovat hypotézu o rovnosti průměrů, musíte zadat hodnotu nula.

* Rozptyl proměnné 1 (známý): je zavedena známá hodnota rozptylu náhodné veličiny X.

* Rozptyl proměnné 2 (známý): je zavedena známá hodnota rozptylu náhodné veličiny Y.

* Tagy: pokud je povoleno, první řádek je považován za nadpis a nepočítá se.

*Alfa: hladina významnosti je nastavena rovna pravděpodobnosti chyby I. typu.

CVIČENÍ 1:

Selektivní údaje o průměru válců v milimetrech vyrobených strojem 1 a 2 jsou známy.

Rozptyl pro stroj 1: = 5 mm 2 .

Disperze pro stroj 2: =7 mm2.

Úroveň významnosti = 0,05.

1. Použití dvou vzorků Z- test na prostředky pro test vaší varianty hypotézu o rovnosti prostředků.

2. Ověřte stejnou hypotézu pomocí výpočtových vzorců.

Zvažte stejný problém jako v předchozím odstavci 3.4, ale pouze za podmínky, že velikost vzorku je malá (méně než 30). V tomto případě nahrazení obecných odchylek a v (3.15) opravenými odchylkami vzorku a může vést k velké chybě v hodnotě a následně k velké chybě při stanovení oblasti přijetí hypotéza H0. Pokud však existuje důvěra, že neznámý generál a jsou stejní(pokud se například porovnávají průměrné velikosti dvou šarží dílů vyrobených na stejném stroji), pak je možné pomocí Studentova rozdělení v tomto případě sestavit kritérium pro testování hypotézy H0 X A Y. Chcete-li to provést, zaveďte náhodnou proměnnou

, (3.16)

(3.17)

Průměr korigovaných výběrových rozptylů a , který slouží jako bodový odhad obou identických neznámých obecných rozptylů a . Jak se ukazuje (viz , str. 180), je-li nulová hypotéza pravdivá, H0 náhodná hodnota T má studentskou distribuci s stupně volnosti, bez ohledu na hodnoty a velikosti vzorků. Pokud hypotéza H0 pravda, rozdíl by měl být malý. Tedy experimentální hodnotu T Exp. množství T by měl být malý. Totiž, musí to být v nějakých mezích. Pokud překročí tyto meze, budeme to považovat za vyvrácení hypotézy H0, a to umožníme s pravděpodobností rovnou dané hladině významnosti α .

Tedy oblast přijetí hypotézy H0 bude nějaký interval, ve kterém budou hodnoty náhodné proměnné T musí zasáhnout s pravděpodobností 1- α :

Hodnota definovaná rovností (3.18) pro různé úrovně významnosti α a různá čísla K stupně svobody T naleznete v tabulce kritických bodů Studentova rozdělení (Tabulka 4 v příloze). Tím se najde interval pro přijetí hypotézy H0. A pokud experimentální hodnota T Exp hodnota T spadá do tohoto intervalu – hypotéza H0 akceptovat. Nespadne - nepřijmout.

Poznámka 1. Pokud není důvod považovat obecné rozptyly a veličiny za stejné X A Y, pak v tomto případě otestovat hypotézu H0 o rovnosti matematických očekávání veličin X A Y použití výše uvedeného Studentova t-testu je povoleno. Teprve teď ta velikost Tčíslo K stupně volnosti by měly být považovány za rovné nikoli , ale rovné (viz )

(3.19)

Pokud se korigovaný výběrový rozptyl liší a významně se liší, pak je druhý člen v poslední závorce (3.19) malý ve srovnání s 0,5, takže výraz (3.19) ve srovnání s výrazem snižuje počet stupňů volnosti náhodné veličiny T téměř dvojnásobek. A to vede k výraznému rozšíření intervalu pro přijetí hypotézy H0 a v důsledku toho k výraznému zúžení kritické oblasti zamítnutí této hypotézy. A to je docela spravedlivé, protože stupeň rozptylu možných hodnot rozdílu bude určen hlavně rozptylem hodnot jedné z veličin X A Y, který má velký rozptyl. To znamená, že informace ze vzorku s menším rozptylem jakoby zmizí, což vede k větší nejistotě v závěrech o hypotéze. H0 .

Příklad 4. Podle údajů v tabulce porovnejte průměrnou dojivost krav krmených různými dietami. Při testování nulové hypotézy H0 o rovnosti průměrných dojnic, akceptovat hladinu významnosti α =0,05.

Počet krav krmených dietou

(Cíle)

Průměrná denní dojivost z hlediska obsahu základního tuku

(kg/hlavu)

Směrodatná odchylka denní produkce mléka krav

(kg/hlavu)

. Vzhledem k tomu, že uvedená tabulková data byla získána na základě malých vzorků o objemech = 10 a = 8, pak pro srovnání matematických očekávání průměrné denní dojivosti krav, které dostávaly jednu a druhou krmnou dávku, musíme použít nastíněnou teorii v tomto odstavci. K tomu nejprve zjistíme, zda nalezené korigované výběrové rozptyly =(3,8)2=14,44 a =(4,2)2=17,64 umožňují uvažovat obecné rozptyly a rovny. K tomu používáme Fisherovo-Snedekorovo kritérium (viz odstavec 3.3). My máme:

Podle tabulky kritických bodů Fischer-Snedekorova rozdělení pro α =0,05; K1 = 8-1 = 7 a K2 =10-1=9 najít

A od té doby nemáme na této úrovni významnosti žádný důvod α =0,05 zamítnout hypotézu H0 o rovnosti obecných rozptylů a .

Nyní v souladu s (3.17) a (3.16) vypočteme experimentální hodnotu veličiny T:

Dále podle vzorce najít číslo K stupně svobody T: K=10+8-2=16. Poté pro n0+8-2=16. ódy (3.16) vypočítáme experimentální hodnotu T: α = 0,05 a K\u003d 16 podle tabulky kritických bodů Studentova rozdělení (tabulka 4 v příloze) zjistíme: \u003d 2.12. Tedy interval pro přijetí hypotézy H0 o rovnosti průměrné dojivosti krav přijímajících diety č. 1 a č. 2 je interval = (-2,12; 2,12). A protože do tohoto intervalu spadá = - 0,79, nemáme důvod hypotézu zamítat H0 . Čili máme právo předpokládat, že rozdíl v krmných dávkách neovlivňuje průměrnou denní dojivost krav.

Poznámka 2. V odstavcích 3.4 a 3.5 diskutovaných výše byla uvažována nulová hypotéza H0 o rovnosti M(X)=M(Y) podle alternativní hypotézy H1 o jejich nerovnosti: M(X)≠M(Y). Ale alternativní hypotéza H1 mohou existovat i jiné, např. M(Y)>M(X). V praxi k tomuto případu dojde, když se zavede nějaké zlepšení (pozitivní faktor), které nám umožní počítat se zvýšením průměrných hodnot normálně rozdělené náhodné veličiny. Y ve srovnání s hodnotami normálně rozdělené veličiny X. Do jídelníčku krav byla například zavedena nová krmná přísada, která umožňuje počítat se zvýšením průměrné dojivosti krav; pod plodinu byl zaveden přídavný hnojení, které umožňuje počítat se zvýšením průměrného výnosu plodiny atd. A chtěl bych zjistit, zda je tento zavedený faktor významný (významný) nebo nevýznamný. Pak v případě velkých objemů a vzorků (viz odstavec 3.4) jako kritérium platnosti hypotézy H0 uvažujme normálně rozloženou náhodnou veličinu

Na dané hladině významnosti α Hypotéza H0 o rovnosti M(X) A M(Y) bude odmítnut, pokud je experimentální hodnota množství kladná a větší, kde

Jelikož za platnosti hypotézy H0 M(Z)= 0, tedy



chyba: Obsah je chráněn!!