Válassza az Oldal lehetőséget

Diszperziós elemzés. Egyirányú varianciaanalízis

Minden ember természetesen keresi a tudást. (Arisztotelész. Metafizika)

Varianciaanalízis

Bevezető áttekintés

Ebben a részben áttekintjük az ANOVA alapvető módszereit, feltételezéseit és terminológiáját.

Vegye figyelembe, hogy az angol irodalomban varianciaanalízis variációanalízisnek nevezik. Ezért a rövidség kedvéért az alábbiakban néha ezt a kifejezést fogjuk használni ANOVA (An elemzés o f va riációt) a hagyományos ANOVA-ra és a kifejezésre MANOVA többváltozós varianciaanalízishez. Ebben a részben egymás után megvizsgáljuk a varianciaanalízis főbb gondolatait ( ANOVA), kovariancia analízis ( ANCOVA), többváltozós varianciaanalízis ( MANOVA) és többváltozós kovarianciaanalízis ( MANCOVA). A kontrasztelemzés és a post hoc tesztek érdemeinek rövid tárgyalása után nézzük meg azokat a feltételezéseket, amelyeken az ANOVA módszerek alapulnak. Ennek a szakasznak a vége felé a többváltozós megközelítés előnyeit ismertetjük az ismételt mérések elemzésénél a hagyományos egydimenziós megközelítéssel szemben.

Kulcs ötletek

A varianciaanalízis célja. A varianciaanalízis fő célja az átlagok közötti különbség jelentőségének vizsgálata. Fejezet (8. fejezet) röviden bevezeti a tanulmányt statisztikai jelentőség. Ha csak két minta átlagait hasonlítja össze, a varianciaanalízis ugyanazt az eredményt adja, mint a normál analízis. t- független minták kritériuma (ha objektumok vagy megfigyelések két független csoportját hasonlítjuk össze), vagy t- a függő minták kritériuma (ha két változót hasonlítanak össze ugyanazon az objektum- vagy megfigyelési halmazon). Ha nem ismeri ezeket a kritériumokat, javasoljuk, hogy tekintse át a fejezet bevezető áttekintését (9. fejezet).

Honnan jött a név Varianciaanalízis? Furcsának tűnhet, hogy az átlagok összehasonlítására szolgáló eljárást varianciaanalízisnek nevezik. Valójában ez annak a ténynek köszönhető, hogy amikor az átlagok közötti különbség statisztikai szignifikanciáját vizsgáljuk, valójában az eltéréseket elemezzük.

Négyzetösszeg felosztása

n mintaméret esetén a minta variancia kiszámítása a minta átlagától való eltérés négyzetes összege, osztva n-1-gyel (mintanagyság mínusz egy). Így egy rögzített n mintaméret esetén a variancia a négyzetek (eltérések) összegének függvénye, amelyet rövidség kedvéért jelölünk, SS(az angol Sum of Squares - Sum of Squares szóból). A varianciaanalízis a variancia részekre osztásán (vagy felosztásán) alapul. Vegye figyelembe a következő adatkészletet:

A két csoport átlaga szignifikánsan különbözik (2, illetve 6). Az eltérések négyzetes összege belül minden csoportból 2. Ezeket összeadva 4-et kapunk. Ha most megismételjük ezeket a számításokat kizárás csoporttagság, vagyis ha kiszámoljuk SS a két minta összesített átlaga alapján 28-at kapunk. Vagyis a csoporton belüli variabilitáson alapuló variancia (négyzetösszeg) sokkal kisebb értékeket eredményez, mint a teljes variabilitás alapján számítva (a teljes variabilitáshoz képest). átlagos). Ennek oka nyilvánvalóan az átlagok közötti jelentős különbség, és ez az átlagok közötti különbség magyarázza a négyzetösszegek közötti különbséget. Valóban, ha a modult használjuk Varianciaanalízis, akkor a következő eredmények születnek:

Amint az a táblázatból látható, a négyzetek teljes összege SS=28 osztva a miatti négyzetek összegével csoporton belüli változékonyság ( 2+2=4 ; lásd a táblázat második sorát) és az átlagértékek különbségéből adódó négyzetösszeg. (28-(2+2)=24; lásd a táblázat első sorát).

SS hibák ésSS hatás. Csoporton belüli változékonyság ( SS) általában varianciának nevezik hibákat. Ez azt jelenti, hogy általában nem lehet megjósolni vagy megmagyarázni, amikor egy kísérletet végeznek. A másik oldalon, SS hatás(vagy csoportközi variabilitás) a vizsgált csoportok átlagai közötti különbséggel magyarázható. Más szóval egy bizonyos csoporthoz való tartozás magyarázza csoportközi változékonyság, mert tudjuk, hogy ezek a csoportok különböző eszközökkel rendelkeznek.

Jelentőség ellenőrzése. A statisztikai szignifikancia tesztelésének főbb gondolatait a fejezet tárgyalja A statisztika elemi fogalmai(8. fejezet). Ugyanez a fejezet ismerteti azokat az okokat, amelyek miatt sok teszt a magyarázott és megmagyarázhatatlan variancia arányát használja. Példa erre a felhasználásra maga a varianciaanalízis. A szignifikanciavizsgálat az ANOVA-ban a csoportok közötti variáció miatti variancia összehasonlításán alapul (ún. átlagos négyzethatás vagy KISASSZONYHatás) és a csoporton belüli terjedés miatti diszperzió (ún átlagos négyzetes hiba vagy KISASSZONYhiba). Ha igaz a nullhipotézis (az átlagok egyenlősége a két populációban), akkor a véletlen variabilitás miatt viszonylag kis eltérésre számíthatunk a mintaátlagokban. Ezért a nullhipotézis szerint a csoporton belüli variancia gyakorlatilag egybeesik a csoporttagság figyelembevétele nélkül számított teljes variancia értékével. Az így kapott csoporton belüli varianciákat a segítségével lehet összehasonlítani F- teszt, amely ellenőrzi, hogy a szórások aránya szignifikánsan nagyobb-e, mint 1. A fenti példában F- A teszt azt mutatja, hogy az átlagok közötti különbség statisztikailag szignifikáns.

Az ANOVA alapvető logikája.Összegezve elmondható, hogy a varianciaanalízis célja az átlagok közötti különbség statisztikai szignifikanciájának tesztelése (csoportokra vagy változókra). Ezt az ellenőrzést varianciaanalízissel hajtják végre, pl. a teljes variancia (variáció) részekre bontásával, amelyek közül az egyik véletlen hiba (vagyis a csoporton belüli variabilitás) következménye, a második pedig az átlagértékek különbségéhez kapcsolódik. A variancia utolsó komponensét ezután az átlagok közötti különbség statisztikai szignifikanciájának elemzésére használjuk. Ha ez a különbség szignifikáns, akkor a nullhipotézist elvetjük, és az alternatív hipotézist, miszerint az átlagok között különbség van, elfogadjuk.

Függő és független változók. Azokat a változókat, amelyek értékét a kísérlet során végzett mérések határozzák meg (például egy teszten elért pontszám) ún. függő változók. A kísérletben manipulálható változókat (például képzési módszereket vagy egyéb kritériumokat, amelyek lehetővé teszik a megfigyelések csoportokra bontását) ún. tényezőket vagy független változók. Ezeket a fogalmakat a fejezetben ismertetjük részletesebben A statisztika elemi fogalmai(8. fejezet).

Többváltozós varianciaanalízis

A fenti egyszerű példában azonnal kiszámolhatja a független minta t-próbáját a megfelelő modulopció segítségével Alapstatisztika és táblázatok. A kapott eredmények természetesen egybeesnek a varianciaanalízis eredményeivel. A varianciaanalízis azonban rugalmas és hatékony technikai eszközökkel, amely sokkal összetettebb vizsgálatokhoz használható.

Sok tényező. A világ eleve összetett és többdimenziós. Rendkívül ritkák az olyan helyzetek, amikor valamely jelenséget egy változó teljesen leír. Például, ha nagy paradicsom termesztését próbáljuk megtanulni, figyelembe kell venni a növények genetikai szerkezetével, a talajtípussal, a fényviszonyokkal, a hőmérséklettel stb. kapcsolatos tényezőket. Így egy tipikus kísérlet elvégzésekor számos tényezővel kell számolnia. A fő ok, amiért az ANOVA használata előnyösebb, mint két minta összehasonlítása különböző faktorszinteken t- kritérium, hogy a varianciaanalízis több hatékony kis minták esetén pedig informatívabb.

Tényezőkezelés. Tegyük fel, hogy a fent tárgyalt kétmintás elemzés példájában még egy tényezőt adunk hozzá, pl. Padló- Nem. Minden csoport 3 férfiból és 3 nőből álljon. Ennek a kísérletnek a terve egy 2:2 táblázat formájában is bemutatható:

Kísérlet. 1. csoport Kísérlet. 2. csoport
Férfiak2 6
3 7
1 5
Átlagos2 6
Nők4 8
5 9
3 7
Átlagos4 8

A számítások elvégzése előtt láthatja, hogy ebben a példában a teljes variancia legalább három forrásból áll:

(1) véletlenszerű hiba (a csoportvariancián belül),

(2) a kísérleti csoporthoz való tartozáshoz kapcsolódó változékonyság, és

(3) a megfigyelt objektumok neme miatti változékonyság.

(Megjegyzendő, hogy a változékonyságnak van egy másik lehetséges forrása is - tényezők kölcsönhatása, amelyet később tárgyalunk). Mi történik, ha nem vesszük figyelembe padlóneme tényezőként az elemzésben és számítsuk ki a szokásos t-kritérium? Ha négyzetösszegeket számolunk, figyelmen kívül hagyva padló -neme(azaz a különböző nemű objektumok egy csoportba való egyesítése a csoporton belüli variancia kiszámításakor, miközben megkapjuk az egyes csoportok négyzetösszegét, amely egyenlő SS=10, és a négyzetek teljes összege SS= 10+10 = 20), akkor nagyobb csoporton belüli szóródást kapunk, mint egy pontosabb elemzésnél további alcsoportokra bontással. félig- neme(ebben az esetben a csoporton belüli átlag 2 lesz, és a teljes csoporton belüli négyzetösszeg egyenlő lesz SS = 2+2+2+2 = 8). Ez a különbség abból adódik, hogy az átlagérték a férfiak - hímek kevesebb az átlagosnál nők -női, és ez az átlagkülönbség növeli a teljes csoporton belüli variabilitást, ha a nemet nem vesszük figyelembe. A hibavariancia szabályozása növeli a teszt érzékenységét (teljesítményét).

Ez a példa a varianciaanalízis másik előnyét mutatja be a hagyományos analízissel szemben. t-kritérium két mintára. A varianciaanalízis lehetővé teszi az egyes tényezők tanulmányozását más tényezők értékeinek szabályozásával. Valójában ez a fő oka annak, hogy nagyobb statisztikai ereje van (kisebb mintaméretre van szükség az értelmes eredmények eléréséhez). Emiatt a varianciaanalízis még kis mintákon is statisztikailag szignifikánsabb eredményt ad, mint egy egyszerű. t- kritérium.

Interakciós hatások

Van egy másik előnye az ANOVA használatának a hagyományos elemzéssel szemben. t- kritérium: a varianciaanalízis lehetővé teszi a kimutatást kölcsönhatás a tényezők között, és ezért lehetővé teszi összetettebb modellek tanulmányozását. Szemléltetésképpen vegyünk egy másik példát.

Fő hatások, páronkénti (kéttényezős) kölcsönhatások. Tételezzük fel, hogy két tanulócsoport van, és pszichológiailag az első csoport tanulói ráhangolódtak a kiosztott feladatok teljesítésére, céltudatosabbak, mint a lustább tanulókból álló második csoport tanulói. Osszuk véletlenszerűen ketté az egyes csoportokat, és ajánljunk fel mindegyik csoport egyik felét egy nehéz, a másiknak pedig egy könnyű feladatot. Ezt követően mérjük, hogy a tanulók milyen keményen dolgoznak ezeken a feladatokon. Ennek a (fiktív) vizsgálatnak az átlagait a táblázat tartalmazza:

Milyen következtetést lehet levonni ezekből az eredményekből? Megállapítható-e, hogy: (1) a tanulók keményebben dolgoznak egy nehéz feladaton; (2) A motivált tanulók keményebben dolgoznak, mint a lusták? Ezen állítások egyike sem tükrözi a táblázatban megadott átlagok szisztematikus jellegének lényegét. Az eredményeket elemezve helyesebb lenne azt mondani, hogy csak a motivált tanulók dolgoznak keményebben az összetett feladatokon, míg a könnyű feladatokon csak a lusta tanulók dolgoznak keményebben. Vagyis a tanulók természete és a feladat összetettsége interakcióba lépve egymás befolyásolják a szükséges erőfeszítés mértékét. Ez egy példa párkapcsolat a tanulók természete és a feladat összetettsége között. Vegye figyelembe, hogy az 1. és 2. állítás leírja főbb hatások.

Magasabb rendek kölcsönhatásai. Míg a páronkénti kölcsönhatásokat viszonylag könnyű megmagyarázni, a magasabb rendű interakciókat sokkal nehezebb megmagyarázni. Képzeljük el, hogy a fenti példában még egy tényezőt vezetünk be padló -Nemés a következő átlagtáblázatot kaptuk:

Milyen következtetéseket lehet most levonni a kapott eredményekből? Az átlagos ábrázolások megkönnyítik az összetett hatások értelmezését. A varianciaanalízis modul lehetővé teszi, hogy ezeket a grafikonokat szinte egyetlen kattintással összeállítsa.

Az alábbi grafikonokon látható kép a vizsgált háromirányú interakciót mutatja.

A grafikonokat tekintve megállapítható, hogy a nők esetében a teszt jellege és nehézsége között kölcsönhatás van: a motivált nők többet dolgoznak egy nehéz feladaton, mint egy könnyű feladaton. A férfiaknál ugyanez a kölcsönhatás fordított. Látható, hogy a tényezők közötti kölcsönhatás leírása egyre zavarosabbá válik.

Általános módszer interakciók leírásai. BAN BEN általános eset a tényezők közötti kölcsönhatást úgy írják le, mint az egyik hatás változását egy másik hatás hatására. A fent tárgyalt példában a kéttényezős interakció úgy írható le, mint a feladat összetettségét jellemző tényező fő hatásának megváltozása, a tanuló jellemét leíró tényező hatására. Az előző bekezdésben szereplő három tényező kölcsönhatására azt mondhatjuk, hogy két tényező (a feladat összetettsége és a tanuló karaktere) kölcsönhatása megváltozik a nemeNem. Ha négy tényező kölcsönhatását vizsgáljuk, akkor azt mondhatjuk, hogy három tényező kölcsönhatása megváltozik a negyedik faktor hatására, azaz. a negyedik faktor különböző szintjein különböző típusú kölcsönhatások léteznek. Kiderült, hogy sok területen nem szokatlan öt vagy akár több tényező kölcsönhatása.

Összetett tervek

Csoportközi és csoporton belüli tervek (újramérési tervek)

Két különböző csoport összehasonlításakor általában azt használjuk t- a független minták kritériuma (a modulból Alapstatisztika és táblázatok). Ha két változót hasonlítanak össze ugyanazon az objektumhalmazon (megfigyelések), akkor azt használják t-a függő minták kritériuma. A varianciaanalízishez az is fontos, hogy a minták függőek-e vagy sem. Ha ugyanazon változók ismételt mérése történik (at különböző feltételek vagy be más idő) ugyanazokra a tárgyakra, akkor azt mondják a jelenlétről ismételt mérési tényező(más néven csoporton belüli tényező mivel a csoporton belüli négyzetösszeg kiszámítása a szignifikancia értékelésére szolgál). Ha különböző tárgycsoportokat hasonlítunk össze (például férfiak és nők, három baktériumtörzs stb.), akkor a csoportok közötti különbséget leírjuk. csoportközi tényező. A leírt két típusú tényező szignifikanciakritériumának kiszámításának módszerei eltérőek, de általános logikájuk és értelmezésük megegyezik.

Csoportközi és csoporton belüli tervek. A kísérlet sok esetben megköveteli a csoportközi tényező és egy ismételt mérési tényező beépítését a tervezésbe. Például női és férfi tanulók matematikai készségeit mérik (ahol padló -Nem-csoportközi faktor) a félév elején és végén. Az egyes tanulók képességeinek két dimenziója alkotja a csoporton belüli faktort (ismételt mérési faktor). A főbb hatások és interakciók értelmezése a csoportközi és az ismételt mérési faktorok esetében megegyezik, és nyilvánvalóan mindkét típusú tényező kölcsönhatásba léphet egymással (például a nők a félév során készségeket szereznek, a férfiak pedig elveszítik).

Hiányos (beágyazott) tervek

Az interakciós hatás sok esetben elhanyagolható. Ez akkor fordul elő, ha ismert, hogy nincs interakciós hatás a populációban, vagy amikor a teljes megvalósítást faktoriális terv lehetetlen. Például négy üzemanyag-adaléknak az üzemanyag-fogyasztásra gyakorolt ​​hatását tanulmányozzák. Négy autó és négy sofőr van kiválasztva. Teljes faktoriális a kísérlet megköveteli, hogy minden kombináció: kiegészítő, vezető, autó legalább egyszer megjelenjen. Ehhez legalább 4 x 4 x 4 = 64 tesztcsoportra van szükség, ami túl időigényes. Ráadásul alig van kölcsönhatás a vezető és az üzemanyag-adalék között. Ezt szem előtt tartva használhatja a tervet latin négyzetek, amely mindössze 16 tesztcsoportot tartalmaz (négy adalékanyagot A, B, C és D betűk jelölnek):

A latin négyzeteket a legtöbb kísérleti tervezési könyv leírja (pl. Hays, 1988; Lindman, 1974; Milliken és Johnson, 1984; Winer, 1962), és itt nem tárgyaljuk részletesen. Vegye figyelembe, hogy a latin négyzetek Nemnteljes olyan terveket, amelyek nem tartalmazzák a faktorszintek összes kombinációját. Például az 1. sofőr az 1. autót csak A adalékanyaggal, a 3. sofőr az 1. autót csak C adalékkal vezeti. Tényezőszintek adalékanyagok ( A, B, C és D) táblázatcellákba ágyazva autó x sofőr - mint a tojás a fészekben. Ez az emlékező szabály hasznos a természet megértéséhez beágyazott vagy beágyazott terveket. Modul Varianciaanalízis biztosítja egyszerű módokon az ilyen típusú tervek elemzése.

Kovariancia-elemzés

fő gondolat

fejezetben Kulcs ötletek röviden tárgyalta a szabályozó tényezők gondolatát, és azt, hogy az additív tényezők beépítése hogyan csökkentheti a négyzetes hibák összegét és növelheti a tervezés statisztikai erejét. Mindez kiterjeszthető a folytonos értékkészletű változókra. Ha az ilyen folytonos változókat tényezőként szerepeltetjük a tervezésben, akkor ún kovariánsok.

Rögzített kovariánsok

Tegyük fel, hogy két tanulócsoport matematikai készségeit hasonlítjuk össze, akiket két különböző tankönyvből tanítottak. Tegyük fel azt is, hogy minden tanulóra rendelkezünk intelligenciahányados (IQ) adatokkal. Feltételezhetjük, hogy az IQ összefügg a matematikai készségekkel, és felhasználhatjuk ezt az információt. Mind a két tanulócsoport esetében kiszámítható az IQ és a matematikai készségek közötti korrelációs együttható. Ezzel a korrelációs együtthatóval különbséget lehet tenni az IQ befolyásával magyarázható csoportokban a varianciahányad és a megmagyarázhatatlan varianciarész között (lásd még A statisztika elemi fogalmai(8. fejezet) és Alapstatisztika és táblázatok(9. fejezet)). A variancia fennmaradó hányadát hibavarianciaként használjuk az elemzésben. Ha van összefüggés az IQ és a matematikai készségek között, akkor a hibavarianciák jelentősen csökkenthetők. SS/(n-1) .

Kovariánsok hatása aF- kritérium. F- a kritérium a csoportok átlagértékei közötti különbség statisztikai szignifikanciáját értékeli, míg a csoportközi variancia arányát kiszámítjuk ( KISASSZONYhatás) a hibavarianciához ( KISASSZONYhiba) . Ha KISASSZONYhiba csökken például az IQ-tényező, az érték figyelembe vételekor F növeli.

Sok kovariáns. A fentebb egy kovariánsra (IQ) használt érvelés könnyen kiterjeszthető több kovariánsra is. Például az IQ mellett a motiváció mérését, a térbeli gondolkodást stb. A szokásos korrelációs együttható helyett használja többszörös tényezőösszefüggések.

Amikor az értékF -kritériumok csökkennek. Néha a kovariánsok bevezetése a kísérleti tervbe csökkenti az értéket F- kritériumok . Ez általában azt jelzi, hogy a kovariánsok nemcsak a függő változóval (például matematikai készségek) állnak összefüggésben, hanem tényezőkkel is (például különböző tankönyvek). Tegyük fel, hogy az IQ-t a félév végén mérik, miután két diákcsoport majdnem egy évet töltött két különböző tankönyv tanulmányozásával. Bár a tanulókat véletlenszerűen osztották csoportokba, kiderülhet, hogy a tankönyvek között akkora a különbség, hogy mind az IQ, mind a matematikai készségek különböző csoportok nagymértékben változni fog. Ebben az esetben a kovariánsok nemcsak a hibavarianciát csökkentik, hanem a csoportok közötti varianciát is. Más szóval, miután ellenőriztük a csoportok közötti IQ különbséget, a matematikai készségek különbsége már nem lesz szignifikáns. Lehet másképp is mondani. Az IQ befolyásának „kiküszöbölése” után a tankönyv matematikai készségek fejlesztésére gyakorolt ​​hatása akaratlanul is kizárt.

Korrigált átlagok. Ha a kovariáns befolyásolja a csoportközi tényezőt, akkor számolni kell korrigált átlagok, azaz olyan átlagokat, amelyeket a kovariánsok összes becslésének eltávolítása után kapunk.

A kovariánsok és a tényezők közötti kölcsönhatás. Csakúgy, mint a tényezők közötti kölcsönhatások feltárása, a kovariánsok és a tényezők csoportjai közötti kölcsönhatások is feltárhatók. Tegyük fel, hogy az egyik tankönyv különösen alkalmas okos tanulók számára. A második tankönyv unalmas az okos tanulóknak, és ugyanaz a tankönyv a kevésbé okos tanulóknak nehéz. Ennek eredményeként az első csoportban pozitív korreláció van az IQ és a tanulási eredmények között (okosabb tanulók, jobb eredmények), a második csoportban pedig nulla vagy csekély negatív korreláció (minél okosabb a tanuló, annál kisebb a valószínűsége a matematikai készségek elsajátításának). a második tankönyvből). Egyes tanulmányok ezt a helyzetet a kovarianciaanalízis feltételezéseinek megsértésének példájaként tárgyalják. Mivel azonban a Varianciaanalízis modul a legelterjedtebb kovarianciaelemzési módszereket használja, lehetőség nyílik különösen a tényezők és a kovariánsok közötti interakció statisztikai szignifikanciájának értékelésére.

Változó kovariánsok

Míg a fix kovariánsokról meglehetősen gyakran esik szó a tankönyvekben, addig a változó kovariánsokat sokkal ritkábban említik. Az ismételt mérésekkel végzett kísérletek során általában arra vagyunk kíváncsiak, hogy különböző időpontokban ugyanazon mennyiségek mérése különbözik. Nevezetesen ezeknek a különbségeknek a jelentősége érdekel bennünket. Ha a függő változó mérésével egyidejűleg kovariáns mérést is végzünk, akkor kiszámítható a kovariáns és a függő változó közötti korreláció.

Például a félév elején és végén tanulmányozhatja a matematika és a matematikai készségek iránti érdeklődést. Érdekes lenne megvizsgálni, hogy a matematika iránti érdeklődés változásai összefüggésben állnak-e a matematikai készségek változásaival.

Modul Varianciaanalízis V STATISZTIKA lehetőség szerint automatikusan értékeli a kovariánsok változásainak statisztikai szignifikanciáját ezekben a tervekben.

Többváltozós tervek: többváltozós ANOVA és kovariancia-analízis

Csoportközi tervek

Az összes korábban vizsgált példa csak egy függő változót tartalmazott. Ha egyszerre több függő változó van, akkor csak a számítások összetettsége nő, a tartalom és az alapelvek nem változnak.

Például két különböző tankönyvről készül egy tanulmány. Ugyanakkor tanulmányozzák a hallgatók sikerességét a fizika és a matematika tanulmányozásában. Ebben az esetben két függő változóról van szó, és meg kell találni, hogy két különböző tankönyv hogyan befolyásolja őket egyszerre. Ehhez használhatja a többváltozós varianciaanalízist (MANOVA). Egydimenziós helyett F kritérium, többdimenziós F teszt (Wilks l-teszt) a hiba kovariancia mátrix és a csoportközi kovariancia mátrix összehasonlításán alapul.

Ha a függő változók korrelálnak egymással, akkor ezt a korrelációt kell figyelembe venni a szignifikanciapróba számításakor. Nyilvánvalóan, ha ugyanazt a mérést kétszer megismételjük, akkor ebben az esetben semmi újat nem lehet kapni. Ha egy vele korrelált dimenziót hozzáadunk egy meglévő dimenzióhoz, akkor néhányat új információ, de az új változó redundáns információt tartalmaz, ami a változók közötti kovarianciában is megmutatkozik.

Az eredmények értelmezése. Ha az összesített többváltozós kritérium szignifikáns, akkor azt a következtetést vonhatjuk le, hogy a megfelelő hatás (pl. tankönyvtípus) szignifikáns. Felmerülnek azonban a következő kérdések. A tankönyv típusa csak a matematikai készségek, csak a fizikai készségek, vagy mindkettő fejlesztését befolyásolja? Valójában egy értelmes többváltozós kritérium megszerzése után egyetlen fő hatás vagy interakció esetén egydimenziós F kritérium. Más szóval, külön vizsgáljuk azokat a függő változókat, amelyek hozzájárulnak a többváltozós teszt szignifikanciájához.

Tervek ismételt mérésekkel

Ha a hallgatók matematikai és fizikai képességeit a félév elején és a végén mérik, akkor ismételt mérésekről van szó. Az ilyen tervekben a jelentőség kritériumának vizsgálata az egydimenziós eset logikus továbbfejlesztése. Megjegyzendő, hogy a többváltozós ANOVA-módszereket is gyakran használják a kettőnél több szinttel rendelkező egyváltozós ismételt mérési tényezők jelentőségének vizsgálatára. A megfelelő alkalmazásokról ebben a részben később lesz szó.

Változóértékek összegzése és többváltozós varianciaanalízis

Még az egyváltozós és többváltozós ANOVA gyakorlott használói is gyakran összezavarodnak attól, hogy eltérő eredményeket kapnak, amikor többváltozós ANOVA-t alkalmaznak, mondjuk, három változóra, és ha egyváltozós ANOVA-t alkalmaznak a három változó összegére egyetlen változóként.

Ötlet összegzés változók esetén minden változó tartalmaz egy valódi változót, amelyet megvizsgálunk, valamint egy véletlenszerű mérési hibát. Ezért a változók értékeinek átlagolásakor a mérési hiba minden mérésnél közelebb lesz a 0-hoz, és az átlagolt értékek megbízhatóbbak lesznek. Valójában ebben az esetben az ANOVA alkalmazása a változók összegére ésszerű és hatékony technika. Ha azonban a függő változók többváltozós jellegűek, a változók értékeinek összegzése nem megfelelő.

Például álljon a függő változó négy mértékből siker a társadalomban. Mindegyik mutató az emberi tevékenység egy teljesen független oldalát jellemzi (például szakmai siker, üzleti siker, családi jólét stb.). E változók összeadása olyan, mintha egy almát és egy narancsot adnánk hozzá. Ezeknek a változóknak az összege nem lenne megfelelő egyváltozós mérték. Ezért az ilyen adatokat többdimenziós mutatóként kell kezelni többváltozós varianciaanalízis.

Kontrasztelemzés és post hoc tesztek

Miért hasonlítják össze az egyes eszközöket?

Általában a kísérleti adatokkal kapcsolatos hipotéziseket nem egyszerűen a fő hatások vagy kölcsönhatások alapján fogalmazzák meg. Példa erre a következő hipotézis: egy bizonyos tankönyv csak a fiú tanulók matematikai készségeit fejleszti, míg egy másik tankönyv mindkét nemnél megközelítőleg egyformán hatékony, de a férfiaknál még kevésbé hatékony. Megjósolható, hogy a tankönyvi teljesítmény kölcsönhatásban van a tanulók nemével. Azonban ez a jóslat is érvényes természet interakciók. Az egyik könyvben a nemek közötti jelentős különbség, a másik könyvben pedig gyakorlatilag nemtől független eredmény várható. Az ilyen típusú hipotéziseket általában kontrasztanalízissel vizsgálják.

Kontrasztelemzés

Röviden, a kontrasztelemzés lehetővé teszi, hogy értékeljük összetett hatások néhány lineáris kombinációjának statisztikai szignifikanciáját. A kontrasztelemzés minden összetett ANOVA terv fő és nélkülözhetetlen eleme. Modul Varianciaanalízis meglehetősen sokféle kontrasztelemző képességgel rendelkezik, amelyek lehetővé teszik az átlagok bármilyen típusú összehasonlításának kiválasztását és elemzését.

a posterioriösszehasonlítások

Néha egy kísérlet feldolgozása eredményeként váratlan hatást fedeznek fel. Bár a legtöbb esetben a kreatív kutató bármilyen eredményt meg tud magyarázni, ez nem ad lehetőséget az előrejelzés további elemzésére és becslésére. Ez a probléma egyike azoknak, amelyeknél post hoc kritériumok, vagyis olyan kritériumok, amelyek nem használnak eleve hipotéziseket. Szemléltetésül vegye figyelembe a következő kísérletet. Tegyük fel, hogy 100 kártya 1-től 10-ig terjedő számokat tartalmaz. Miután ezeket a kártyákat bedobtuk a fejlécbe, véletlenszerűen kiválasztunk 20-szor 5 kártyát, és kiszámítjuk az egyes minták átlagértékét (a kártyákra írt számok átlagát). Számíthatunk arra, hogy két olyan minta van, amelyek átlagai jelentősen eltérnek egymástól? Ez nagyon hihető! Ha két mintát választunk a maximális és a minimális átlaggal, akkor olyan különbséget kaphatunk az átlagok között, amely nagyon eltér például az első két minta átlagának különbségétől. Ez a különbség például kontrasztanalízissel vizsgálható. Anélkül, hogy részleteznénk, több ún a posteriori olyan kritériumok, amelyek pontosan az első forgatókönyvön alapulnak (20 mintából szélsőséges átlagokat veszünk), azaz ezek a kritériumok a legkülönbözőbb eszközök kiválasztásán alapulnak az összes eszköz összehasonlításához a tervezésben. Ezeket a kritériumokat azért alkalmazzák, hogy ne pusztán véletlenül kapjunk mesterséges hatást, például, hogy szignifikáns különbséget találjunk az eszközök között, amikor nincs. Modul Varianciaanalízis ajánlatokat széles választék ilyen kritériumok. Ha egy több csoportot érintő kísérletben váratlan eredmények születnek, a a posteriori a kapott eredmények statisztikai szignifikanciájának vizsgálatára szolgáló eljárások.

I., II., III. és IV. típusú négyzetösszeg

Többváltozós regresszió és varianciaanalízis

Szoros kapcsolat van a többváltozós regresszió módszere és a varianciaanalízis (varianciaanalízis) között. Mindkét módszernél lineáris modellt vizsgálunk. Röviden, szinte minden kísérleti terv feltárható többváltozós regresszióval. Tekintsük a következő egyszerű keresztcsoportos 2 x 2 tervet.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Az A és B oszlop az A és B faktor szintjeit jellemzõ kódokat tartalmazza, az AxB oszlop pedig két A és B oszlop szorzatát tartalmazza. Ezeket az adatokat többváltozós regresszióval elemezhetjük. Változó DV függő változóként definiálva, változók innen A előtt AxB mint független változók. A regressziós együtthatók szignifikancia vizsgálata egybe fog esni a faktorok főbb hatásainak szignifikancia szignifikancia elemzésében végzett számításokkal. AÉs Bés interakciós hatás AxB.

Kiegyensúlyozatlan és kiegyensúlyozott tervek

Az összes változóra vonatkozó korrelációs mátrix kiszámításakor, például a fentebb ábrázolt adatokra, látható, hogy a tényezők fő hatásai AÉs Bés interakciós hatás AxB nem korrelált. Az effektusoknak ezt a tulajdonságát ortogonalitásnak is nevezik. Azt mondják, hogy a hatások AÉs B - ortogonális vagy független egymástól. Ha a terv összes effektusa egymásra merőleges, mint a fenti példában, akkor a tervről azt mondjuk, hogy kiegyensúlyozott.

A kiegyensúlyozott terveknek megvan a „jó tulajdonságuk”. Az ilyen tervek elemzése során a számítások nagyon egyszerűek. Minden számítás a hatások és a függő változók közötti korreláció kiszámítására korlátozódik. Mivel a hatások ortogonálisak, részleges korrelációk (mint a teljes többdimenziós regressziók) nem számítanak ki. Azonban in való élet a tervek nem mindig kiegyensúlyozottak.

Tekintsünk valós adatokat egyenlőtlen számú megfigyeléssel a cellákban.

A faktor B faktor
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ha ezeket az adatokat a fentiek szerint kódoljuk, és minden változóra kiszámítjuk a korrelációs mátrixot, akkor kiderül, hogy a tervezési tényezők korrelálnak egymással. A tervben szereplő tényezők most nem merőlegesek, és az ilyen terveket ún kiegyensúlyozatlan. Megjegyezzük, hogy ebben a példában a tényezők közötti korreláció teljes mértékben az adatmátrix oszlopaiban lévő 1 és -1 gyakoriságok különbségével függ össze. Más szóval, az egyenlőtlen cellatérfogatú (pontosabban aránytalan térfogatú) kísérleti tervek kiegyensúlyozatlanok lesznek, ami azt jelenti, hogy a fő hatások és kölcsönhatások keverednek. Ebben az esetben a hatások statisztikai szignifikanciájának kiszámításához teljes mértékben ki kell számítani a többváltozós regressziót. Itt több stratégia is létezik.

I., II., III. és IV. típusú négyzetösszeg

Négyzetösszeg típusaénÉsIII. Egy többváltozós modellben az egyes faktorok szignifikanciájának tanulmányozásához ki lehet számítani az egyes tényezők részleges korrelációját, feltéve, hogy az összes többi tényezőt már figyelembe vettük a modellben. A faktorokat lépésről lépésre is beviheti a modellbe, rögzítve a modellbe már bevitt tényezőket, és figyelmen kívül hagyva az összes többi tényezőt. Általában ez a különbség aközött típus IIIÉs típusén négyzetösszegek (ezt a terminológiát a SAS-ban vezették be, lásd például SAS, 1982; részletes tárgyalás található még: Searle, 1987, 461. o.; Woodward, Bonett és Brecht, 1990, 216. o.; vagy Milliken és Johnson, 1984, 138. o.).

Négyzetösszeg típusaII. A következő „köztes” modellalkotási stratégia a következő: az összes fő hatás ellenőrzése egyetlen főhatás jelentőségének vizsgálatában; az összes főhatás és az összes páronkénti kölcsönhatás vezérlésében, amikor egyetlen páronkénti kölcsönhatás jelentőségét vizsgáljuk; az összes páronkénti kölcsönhatás és három tényező összes kölcsönhatásának minden fő hatásának szabályozásában; három tényező külön kölcsönhatásának vizsgálatában stb. Az így kiszámított hatások négyzetösszegeit ún típusII négyzetösszegek. Így, típusII A négyzetösszegek szabályozza az azonos sorrendű és az alatti effekteket, figyelmen kívül hagyva a magasabb rendű hatásokat.

Négyzetösszeg típusaIV. Végül egyes hiányzó cellákkal rendelkező speciális tervek (hiányos tervek) esetében lehetséges az ún típus IV négyzetösszegek. Erről a módszerről a későbbiekben a hiányos (hiányzó cellákkal rendelkező) tervek kapcsán lesz szó.

Az I., II. és III. típusú négyzetösszeg sejtés értelmezése

négyzetek összege típusIII legkönnyebben értelmezhető. Emlékezzünk vissza, hogy a négyzetek összege típusIII vizsgálja meg a hatásokat az összes többi hatás ellenőrzése után. Például miután talált egy statisztikailag szignifikáns típusIII hatás a faktorra A a modulban Varianciaanalízis, azt mondhatjuk, hogy a faktornak egyetlen szignifikáns hatása van A, az összes többi hatás (tényező) bevezetése után, és ennek megfelelően értelmezze ezt a hatást. Valószínűleg a varianciaanalízis összes alkalmazásának 99%-ában ez a fajta kritérium érdekli a kutatót. Az ilyen típusú négyzetösszegeket általában a modul számítja ki Varianciaanalízis alapértelmezés szerint, függetlenül attól, hogy az opció ki van-e választva Regressziós megközelítés vagy sem (a modulban elfogadott standard megközelítések Varianciaanalízis alább tárgyaljuk).

Négyzetösszegekkel kapott jelentős hatások típus vagy típusII a négyzetösszegeket nem olyan könnyű értelmezni. Legjobban a lépésenkénti többváltozós regresszió keretében értelmezhetők. Ha a négyzetek összegét használjuk típusén a B faktor fő hatása szignifikánsnak bizonyult (miután az A faktort bevontuk a modellbe, de mielőtt az A és B kölcsönhatást hozzáadtuk volna), megállapítható, hogy a B faktornak jelentős fő hatása van, feltéve, hogy nincs kölcsönhatás az A és B faktor között. (Ha a kritériumot alkalmazzuk típusIII, a B faktor is szignifikánsnak bizonyult, akkor azt a következtetést vonhatjuk le, hogy a B faktornak szignifikáns fő hatása van, miután az összes többi tényezőt és azok kölcsönhatásait beemeljük a modellbe).

A hipotézis határátlagait tekintve típusénÉs típusIIáltalában nincs egyszerű értelmezésük. Ezekben az esetekben azt mondják, hogy a hatások jelentőségét nem lehet csak a marginális eszközök figyelembevételével értelmezni. inkább bemutatott p Az átlagértékek egy összetett hipotézishez kapcsolódnak, amely egyesíti az átlagokat és a mintanagyságot. Például, típusII az A faktor hipotézisei a korábban tárgyalt egyszerű 2 x 2 tervezési példában a következők lennének (lásd Woodward, Bonett és Brecht, 1990, 219. o.):

nij- megfigyelések száma egy cellában

uij- átlagos érték egy cellában

n. j- marginális átlag

Anélkül, hogy belemennénk a részletekbe (további részletekért lásd Milliken és Johnson, 1984, 10. fejezet), világos, hogy ezek nem egyszerű hipotézisek, és a legtöbb esetben egyik sem érdekli különösebben a kutatót. Vannak azonban olyan esetek, amikor a hipotézisek típusénérdekes lehet.

Az alapértelmezett számítási megközelítés a modulban Varianciaanalízis

Alapértelmezett, ha az opció nincs bejelölve Regressziós megközelítés, modul Varianciaanalízis használ sejt átlag modell. Erre a modellre jellemző, hogy a különböző hatások négyzetösszegeit a cellaátlagok lineáris kombinációira számítjuk. Egy teljes faktoriális kísérletben ez olyan négyzetösszegeket eredményez, amelyek megegyeznek a korábban tárgyalt négyzetösszegekkel. típus III. Az opcióban azonban Ütemezett összehasonlítások(az ablakban Variancia-eredmények elemzése), a felhasználó feltételezheti a súlyozott vagy súlyozatlan cellaértékek bármilyen lineáris kombinációját. Így a felhasználó nem csak hipotéziseket tesztelhet típusIII, de bármilyen típusú hipotézis (beleértve típusIV). Ez az általános megközelítés különösen hasznos a hiányzó cellákat tartalmazó tervek (úgynevezett hiányos tervek) vizsgálatakor.

Teljes faktoriális tervezéseknél ez a megközelítés akkor is hasznos, ha a súlyozott határátlagokat akarjuk elemezni. Tegyük fel például, hogy a korábban vizsgált egyszerű 2 x 2-es tervezésben a súlyozottakat (tényezőszintek szerint) szeretnénk összehasonlítani B) az A faktor határátlagait. Ez akkor hasznos, ha a megfigyelések cellák közötti eloszlását nem a kísérletező készítette, hanem véletlenszerűen építette fel, és ez a véletlenszerűség tükröződik a megfigyelések számának a B faktor szintjei szerinti eloszlásában az aggregátumban. .

Például van egy tényező - az özvegyek kora. A válaszadók lehetséges mintáját két csoportra osztják: 40 évnél fiatalabbak és 40 évnél idősebbek (B faktor). A második tényező (A faktor) a tervben az, hogy az özvegyek részesültek-e szociális támogatásban valamilyen ügynökségtől (míg néhány özvegyet véletlenszerűen választottak ki, mások kontrollként szolgáltak). Ebben az esetben a mintában szereplő özvegyek életkor szerinti megoszlása ​​tükrözi az özvegyek tényleges kormegoszlását a populációban. Az özvegyek szociális támogató csoportjának hatékonyságának felmérése minden korosztály a kettő súlyozott átlagának felel meg korcsoportok(a csoportban végzett megfigyelések számának megfelelő súlyokkal).

Ütemezett összehasonlítások

Vegye figyelembe, hogy a beírt kontrasztarányok összege nem feltétlenül egyenlő 0-val (nulla). Ehelyett a program automatikusan elvégzi a módosításokat, hogy a megfelelő hipotézisek ne keveredjenek az általános átlaggal.

Ennek illusztrálására térjünk vissza a korábban tárgyalt egyszerű 2 x 2 tervhez. Emlékezzünk vissza, hogy ennek a kiegyensúlyozatlan tervezésnek a cellaszáma -1, 2, 3 és 1. Tegyük fel, hogy össze akarjuk hasonlítani az A faktor súlyozott határátlagait (a B faktor szintjének gyakoriságával súlyozva). A kontrasztarányokat megadhatja:

Vegye figyelembe, hogy ezek az együtthatók nem adnak össze 0-t. A program úgy állítja be az együtthatókat, hogy azok összeadják 0-t, miközben megtartja relatív értékeiket, azaz:

1/3 2/3 -3/4 -1/4

Ezek a kontrasztok összehasonlítják az A faktor súlyozott átlagait.

Hipotézisek a fő átlagról. Az a hipotézis, hogy a súlyozatlan főátlag 0, együtthatók segítségével vizsgálható:

Azt a hipotézist, hogy a súlyozott főátlag 0, teszteljük:

A program semmilyen esetben sem korrigálja a kontrasztarányokat.

Hiányzó cellákkal rendelkező tervek elemzése (hiányos tervek)

Az üres cellákat tartalmazó faktorterveket (a cellák olyan kombinációinak feldolgozása, amelyekben nincsenek megfigyelések) hiányosnak nevezzük. Az ilyen tervekben néhány tényező általában nem merőleges, és egyes kölcsönhatások nem számíthatók ki. Egyáltalán nem létezik legjobb módszer az ilyen tervek elemzése.

Regressziós megközelítés

Egyes régebbi programokban, amelyek az ANOVA-tervek többváltozós regressziós elemzésén alapulnak, a hiányos tervek faktorai alapértelmezés szerint a szokásos módon vannak beállítva (mintha a terv teljes lenne). Aztán egy többváltozós regresszió analízis ezekre a fiktívan kódolt tényezőkre. Sajnos ez a módszer olyan eredményekhez vezet, amelyeket nagyon nehéz, ha nem lehetetlen értelmezni, mert nem világos, hogy az egyes hatások hogyan járulnak hozzá az eszközök lineáris kombinációjához. Tekintsük a következő egyszerű példát.

A faktor B faktor
B1 B2
A1 3 4, 5
A2 6, 6, 7 Nem fogadott

Ha a forma többváltozós regressziója Függő változó = állandó + A tényező + B faktor, akkor az A és B faktorok jelentőségére vonatkozó hipotézis az átlagok lineáris kombinációi szempontjából így néz ki:

A faktor: A1,B1 sejt = A2,B1 sejt

B faktor: A1,B1 sejt = A1,B2 sejt

Ez az eset egyszerű. Bonyolultabb tervekben nem lehet ténylegesen meghatározni, hogy pontosan mit is fognak vizsgálni.

Átlagcellák, varianciaanalízis megközelítés , típusú hipotézisek

A szakirodalomban javasolt és előnyösnek tűnő megközelítés az értelmes (kutatási feladatok szempontjából) tanulmányozása. eleve hipotézisek a terv celláiban megfigyelt eszközökről. Ennek a megközelítésnek részletes tárgyalása megtalálható: Dodge (1985), Heiberger (1989), Milliken és Johnson (1984), Searle (1987), vagy Woodward, Bonett és Brecht (1990). Az átlagok lineáris kombinációjával kapcsolatos hipotézisekhez kapcsolódó négyzetösszegeket a hiányos tervekben, amelyek a hatások egy részének becslését vizsgálják, négyzetösszegeknek is nevezik. IV.

Típushipotézisek automatikus generálásaIV. Ha a többváltozós terveknek összetett hiányzó sejtmintázata van, kívánatos ortogonális (független) hipotézisek meghatározása, amelyek vizsgálata egyenértékű a fő hatások vagy kölcsönhatások vizsgálatával. Algoritmikus (számítási) stratégiákat (pszeudo-inverz tervezési mátrixon alapuló) fejlesztettek ki, hogy megfelelő súlyokat állítsanak elő az ilyen összehasonlításokhoz. Sajnos a végső hipotézisek nem egyértelműen meghatározottak. Természetesen ezek attól függnek, hogy milyen sorrendben határozták meg a hatásokat, és ritkán könnyen értelmezhetők. Ezért ajánlatos alaposan tanulmányozni a hiányzó sejtek természetét, majd hipotéziseket megfogalmazni típusIV, amelyek a leginkább relevánsak a tanulmány céljai szempontjából. Ezután fedezze fel ezeket a hipotéziseket az opció segítségével Ütemezett összehasonlítások az ablakban eredmények. A legtöbb egyszerű módja ebben az esetben adja meg az összehasonlításokat - megköveteli az összes tényező kontrasztvektorának bevezetését együtt az ablakban Ütemezett összehasonlítások. A párbeszédpanel felhívása után Ütemezett összehasonlítások az aktuális terv összes csoportja megjelenik, a kihagyottak pedig meg lesznek jelölve.

Kihagyott cellák és specifikus hatások ellenőrzése

Többféle terv létezik, amelyekben a hiányzó cellák elhelyezkedése nem véletlenszerű, hanem gondosan megtervezett, ami lehetővé teszi a főbb hatások egyszerű elemzését anélkül, hogy más hatásokat befolyásolna. Például, ha egy tervben nem áll rendelkezésre a szükséges számú cella, gyakran terveket használnak. latin négyzetek hogy több tényező főbb hatását nagyszámú szinten megbecsüljük. Például egy 4 x 4 x 4 x 4 faktoros kialakításhoz 256 cellára van szükség. Ugyanakkor használhatja Görög-latin tér a fő hatások becsléséhez, mivel csak 16 cella van a tervben (fej. Kísérleti tervezés, IV. kötet, tartalmazza Részletes leírás ilyen tervek). Azokat a hiányos terveket, amelyekben a fő hatások (és egyes kölcsönhatások) egyszerű lineáris átlagkombinációk segítségével megbecsülhetők, ún. kiegyensúlyozott hiányos tervek.

A kiegyensúlyozott tervekben a fő hatások és kölcsönhatások kontrasztjának (súlyozásának) generálására szolgáló standard (alapértelmezett) módszer egy varianciatáblázat-elemzést készít, amelyben a megfelelő hatások négyzetösszegei nem keverednek egymással. választási lehetőség Specifikus hatások ablak eredmények hiányzó kontrasztokat generál úgy, hogy nullát ír a hiányzó tervcellákba. Közvetlenül az opció kérése után Specifikus hatások egy hipotézist tanulmányozó felhasználó számára megjelenik az eredmények táblázata a tényleges súlyokkal. Vegye figyelembe, hogy egy kiegyensúlyozott tervezésben a megfelelő hatások négyzetösszegei csak akkor számíthatók ki, ha ezek a hatások merőlegesek (függetlenek) az összes többi főhatásra és kölcsönhatásra. Ellenkező esetben használja az opciót Ütemezett összehasonlítások az eszközök közötti értelmes összehasonlítások feltárására.

Hiányzó cellák és kombinált hibahatások/tagok

Ha opció Regressziós megközelítés a modul indítópultján Varianciaanalízis nincs kiválasztva, a cellaátlagmodell kerül felhasználásra az effektusok négyzetösszegének kiszámításakor (alapértelmezett beállítás). Ha a tervezés nem kiegyensúlyozott, akkor a nem ortogonális hatások kombinálásakor (lásd a fenti opciót Hiányzó sejtek és specifikus hatás) kaphatunk nem merőleges (vagy átfedő) komponensekből álló négyzetösszeget. Az így kapott eredmények általában nem értelmezhetők. Ezért nagyon körültekintően kell eljárni az összetett, hiányos kísérleti tervek kiválasztása és megvalósítása során.

Számos könyv található, amelyek részletesen tárgyalják a különböző típusú terveket. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken és Johnson, 1984; Searle, 1987; Woodward és Bonett, 1990), de ez a fajta információ kívül esik ennek a tankönyvnek a hatókörén. Ebben a részben azonban a különböző típusú tervek elemzését bemutatjuk.

Feltételezések és feltételezések megsértésének hatásai

Eltérés a normális eloszlások feltételezésétől

Tegyük fel, hogy a függő változót numerikus skálán mérjük. Tegyük fel azt is, hogy a függő változó minden csoporton belül normális eloszlású. Varianciaanalízis grafikonok és statisztikák széles skáláját tartalmazza, amelyek alátámasztják ezt a feltételezést.

Szabálysértési hatások. Egyáltalán F a kritérium nagyon ellenáll a normalitástól való eltérésnek (részletes eredményekért lásd Lindman, 1974). Ha a kurtózis nagyobb, mint 0, akkor a statisztika értéke F nagyon kicsivé válhat. A nullhipotézist elfogadjuk, bár lehet, hogy nem igaz. A helyzet fordított, ha a körtózis kisebb, mint 0. Az eloszlás ferdesége általában kevéssé befolyásolja F statisztika. Ha egy cellában elég nagy a megfigyelések száma, akkor a normalitástól való eltérés nem sokat számít központi határérték tétel, mely szerint az átlagérték eloszlása ​​a kezdeti eloszlástól függetlenül a normálishoz közeli. A fenntarthatóság részletes tárgyalása F statisztika megtalálható Box és Anderson (1955), vagy Lindman (1974).

A diszperzió homogenitása

Feltételezések. Feltételezzük, hogy a terv különböző csoportjainak eltérései azonosak. Ezt a feltevést nevezzük feltevésnek diszperzió homogenitás. Emlékezzünk vissza, hogy ennek a szakasznak az elején, amikor a hibák négyzetes összegének kiszámítását írtuk le, minden csoporton belül összegzést végeztünk. Ha két csoport eltérései eltérnek egymástól, akkor ezek összeadása nem túl természetes, és nem ad becslést a teljes csoporton belüli variancia mértékére (hiszen ebben az esetben egyáltalán nincs általános szórás). Modul Diszperziós elemzés -ANOVA/MANOVA statisztikai kritériumok széles készletét tartalmazza a varianciahomogenitás feltevéseitől való eltérés kimutatására.

Szabálysértési hatások. Lindman (1974, 33. o.) azt mutatja be F a kritérium meglehetősen stabil a variancia homogenitási feltevésének megsértését illetően ( heterogenitás diszperzió, lásd még Box, 1954a, 1954b; Hsu, 1938).

Speciális eset: átlagok és szórások korrelációja. Van amikor F statisztika lehet félrevezetni. Ez akkor történik, ha a tervezési cellák átlagértékei korrelálnak a szórással. Modul Varianciaanalízis lehetővé teszi a variancia vagy a szórás szórásdiagramok ábrázolását az ilyen korreláció kimutatására szolgáló eszközök függvényében. Az ok, amiért egy ilyen korreláció veszélyes, a következő. Képzeljük el, hogy a tervben 8 cella van, ebből 7-nek közel azonos az átlaga, és egy cellában az átlag jóval nagyobb, mint a többi. Akkor F a teszt statisztikailag szignifikáns hatást tud kimutatni. De tegyük fel, hogy egy nagy átlagértékkel rendelkező cellában a szórás sokkal nagyobb, mint a többinél, pl. az átlag és a variancia a cellákban függ (minél nagyobb az átlag, annál nagyobb a szórás). Ebben az esetben a nagy átlag megbízhatatlan, mivel ezt az adatok nagy eltérése okozhatja. azonban F statisztika alapján egyesült A cellákon belüli variancia nagy átlagot fog felfogni, bár az egyes cellák varianciáján alapuló kritériumok nem tekintik az átlagok összes különbségét szignifikánsnak.

Az adatok ilyen jellegével (nagy átlag és nagy szórás) gyakran találkozunk kiugró megfigyelések esetén. Egy-két kiugró megfigyelés erősen eltolja az átlagot és nagymértékben növeli a szórást.

Variancia és kovariancia homogenitása

Feltételezések. A többváltozós tervezésekben, többváltozós függő mértékekkel, a korábban leírt variancia-homogenitási feltételezések is érvényesek. Mivel azonban vannak többváltozós függő változók, az is szükséges, hogy ezek keresztkorrelációi (kovarianciai) egységesek legyenek az összes tervcellában. Modul Varianciaanalízis különböző módokat kínál ezeknek a feltételezéseknek a tesztelésére.

Szabálysértési hatások. Többdimenziós analóg F- kritérium - Wilks λ-tesztje. A Wilks λ-teszt stabilitásáról (robusztusságáról) nem sokat tudunk a fenti feltevések megsértésére tekintettel. Mivel azonban a modul eredményeinek értelmezése Varianciaanalízisáltalában az egydimenziós hatások jelentőségén alapul (a szignifikancia megállapítása után általános kritérium), a robusztusság tárgyalása főként az egydimenziós varianciaanalízist érinti. Ezért alaposan meg kell vizsgálni az egydimenziós hatások jelentőségét.

Speciális eset: kovariancia analízis. A variancia/kovariancia homogenitásának különösen súlyos megsértése fordulhat elő, ha kovariánsokat is tartalmaznak a tervezésben. Különösen, ha a kovariánsok és a függő mértékek közötti korreláció eltérő a tervezés különböző celláiban, az eredmények félreértelmezése következhet. Emlékeztetni kell arra, hogy a kovarianciaanalízis során lényegében minden sejten belül regressziós elemzést végeznek, hogy elkülönítsék a variancia azon részét, amely megfelel a kovariánsnak. A variancia/kovariancia homogenitás feltételezése azt feltételezi, hogy ezt a regressziós analízist a következő megkötéssel hajtjuk végre: az összes regressziós egyenlet (meredekség) minden sejtre azonos. Ha ez nem szándékos, akkor nagy hibák léphetnek fel. Modul Varianciaanalízis számos speciális kritériummal rendelkezik ennek a feltételezésnek a tesztelésére. Célszerű lehet ezeket a kritériumokat használni annak biztosítására, hogy a különböző cellák regressziós egyenlete megközelítőleg azonos legyen.

Szférikusság és komplex szimmetria: okai a többváltozós ismételt mérési megközelítés használatának a varianciaanalízisben

A kettőnél több szinttel rendelkező ismételt mérési faktorokat tartalmazó tervekben az egyváltozós varianciaanalízis alkalmazása további feltevéseket igényel: összetett szimmetria-feltevéseket és szférikussági feltételezéseket. Ezek a feltételezések ritkán teljesülnek (lásd alább). Ezért be utóbbi évek A többváltozós varianciaanalízis népszerűvé vált az ilyen tervekben (a modulban mindkét megközelítést kombináljuk Varianciaanalízis).

Komplex szimmetria feltételezés Az összetett szimmetriafeltevés az, hogy a különböző ismétlődő mérőszámok varianciái (csoporton belüli összesség) és kovariancia (csoportonként) egységesek (ugyanazok). Ez elegendő feltétele annak, hogy az egyváltozós F-teszt érvényes legyen az ismételt mérésekhez (azaz a közölt F-értékek átlagosan összhangban vannak az F-eloszlással). Ebben az esetben azonban ez a feltétel nem szükséges.

A szférikusság feltételezése. A szférikusság feltételezése szükséges és elégséges feltétele az F-kritérium igazolásának. Abból áll, hogy a csoportokon belül minden megfigyelés független és egyenlő eloszlású. Ezeknek a feltételezéseknek a természetét, valamint megsértésének hatását általában nem írják le jól a varianciaanalízissel foglalkozó könyvek – ezt a következő bekezdésekben ismertetjük. Azt is megmutatja, hogy az egyváltozós megközelítés eredményei eltérhetnek a többváltozós megközelítés eredményeitől, és megmagyarázza, hogy ez mit jelent.

A hipotézisek függetlenségének igénye. Az adatok elemzésének általános módja a varianciaanalízis során az modell illeszkedés. Ha az adatoknak megfelelő modell tekintetében vannak olyanok eleve hipotéziseket, majd a varianciát felosztjuk, hogy teszteljük ezeket a hipotéziseket (a fő hatások, kölcsönhatások kritériumai). Számítási szempontból ez a megközelítés bizonyos kontrasztokat generál (a tervezési eszközök összehasonlításának halmaza). Ha azonban a kontrasztok nem függetlenek egymástól, akkor az eltérések felosztása értelmetlenné válik. Például ha két kontraszt AÉs B azonosak, és a megfelelő rész kerül kiválasztásra az eltérésből, akkor ugyanaz a rész kétszer kerül kiválasztásra. Például ostoba és értelmetlen két hipotézist kiemelni: „az 1. cellában az átlag magasabb, mint a 2. cellában” és „az 1. cellában az átlag magasabb, mint a 2. cellában”. Tehát a hipotéziseknek függetlennek vagy ortogonálisnak kell lenniük.

Független hipotézisek ismételt mérésekben. A modulban megvalósított általános algoritmus Varianciaanalízis, megpróbál független (ortogonális) kontrasztot generálni az egyes hatásokhoz. Az ismételt mérési faktor esetében ezek az ellentétek számos hipotézist adnak okot különbségek a figyelembe vett tényező szintjei között. Ha azonban ezek a különbségek a csoportokon belül korrelálnak, akkor a kapott kontrasztok már nem függetlenek. Például egy olyan képzésben, ahol egy félévben háromszor mérik a tanulókat, előfordulhat, hogy az 1. és 2. dimenzió közötti változások negatívan korrelálnak a tantárgyak 2. és 3. dimenziója közötti változással. Azok, akik az 1. és 2. dimenzió közötti anyag nagy részét elsajátították, kisebb részt sajátítanak el a 2. és 3. dimenzió között eltelt idő alatt. Valójában a legtöbb esetben, amikor a varianciaanalízist ismételt méréseknél alkalmazzák, feltételezhető, hogy a szintek változásai az alanyok között korrelálnak. Ha azonban ez megtörténik, a komplex szimmetria és gömbiség feltételezései nem teljesülnek, és a független kontrasztok nem számíthatók ki.

A jogsértések hatásai és kijavításuk módjai. Ha az összetett szimmetria- vagy szférikussági feltételezések nem teljesülnek, a varianciaanalízis hibás eredményeket adhat. Mielőtt a többváltozós eljárásokat kellőképpen kidolgozták volna, számos feltevés született, hogy kompenzálja e feltételezések megsértését. (Lásd például: Greenhouse & Geisser, 1959 és Huynh & Feldt, 1970). Ezeket a módszereket ma is széles körben alkalmazzák (ezért mutatjuk be őket a modulban Varianciaanalízis).

Többváltozós varianciaanalízis megközelítés ismételt mérésekre.Általánosságban elmondható, hogy a komplex szimmetria és szférikusság problémái arra vonatkoznak, hogy az ismételt mérési tényezők hatásának vizsgálatában szereplő kontraszthalmazok (2-nél több szinttel) nem függetlenek egymástól. Azonban nem kell függetlennek lenniük, ha használják őket. többdimenziós két vagy több ismételt mérési faktorkontraszt statisztikai szignifikanciájának egyidejű tesztelésének kritériuma. Ez az oka annak, hogy a variancia-módszerek többváltozós elemzését egyre gyakrabban alkalmazzák az egyváltozós ismételt mérési tényezők szignifikanciájának tesztelésére több mint 2 szinten. Ezt a megközelítést széles körben használják, mert általában nem igényli a komplex szimmetria és a gömbszerűség feltételezését.

Olyan esetek, amikor a többváltozós varianciaanalízis megközelítés nem használható. Vannak olyan példák (tervek), amikor a többváltozós varianciaanalízis megközelítés nem alkalmazható. Általában ezek olyan esetek, amikor nincs nagyszámú tantárgyak a tervben és sok szinten az ismételt mérések faktorban. Ekkor előfordulhat, hogy túl kevés a megfigyelés a többváltozós elemzés elvégzéséhez. Például, ha 12 entitás van, p = 4 ismételt mérési tényező, és minden tényező rendelkezik k = 3 szinteket. Ekkor 4 tényező kölcsönhatása „kihasznál” (k-1)P = 2 4 = 16 szabadsági fokokat. Azonban csak 12 alany van, ezért ebben a példában nem végezhető többváltozós teszt. Modul Varianciaanalízisönállóan észleli ezeket a megfigyeléseket, és csak egydimenziós kritériumokat számít ki.

Az egy- és többváltozós eredmények különbségei. Ha a vizsgálat nagyszámú ismételt mérést tartalmaz, előfordulhatnak olyan esetek, amikor az ANOVA egyváltozós ismételt mérési megközelítése olyan eredményeket ad, amelyek nagyon eltérnek a többváltozós megközelítéssel kapott eredményektől. Ez azt jelenti, hogy a megfelelő ismételt mérések szintjei közötti különbségek az egyes alanyok között korrelálnak. Néha ez a tény valamilyen független érdek.

Többváltozós varianciaanalízis és egyenletek szerkezeti modellezése

Az elmúlt években a strukturális egyenletmodellezés népszerűvé vált a többváltozós diszperzióanalízis alternatívájaként (lásd például Bagozzi és Yi, 1989; Bagozzi, Yi és Singh, 1991; Cole, Maxwell, Arvey és Salas, 1993). Ezzel a megközelítéssel nemcsak a különböző csoportok átlagairól, hanem a függő változók korrelációs mátrixairól is tesztelhetünk hipotéziseket. Például enyhítheti a variancia és a kovariancia homogenitására vonatkozó feltevéseket, és kifejezetten beillesztheti a hibákat a modellbe az egyes variancia- és kovarianciacsoportokhoz. Modul STATISZTIKAStrukturális egyenletmodellezés (SEPATH) (lásd III. kötet) lehetővé teszi az ilyen elemzést.

Matematika tantárgy

Bevezetés

A varianciaanalízis fogalma

Egyirányú varianciaanalízis (gyakorlati megvalósítás az IBM SPSS Statistics 20-ban)

Egyirányú varianciaanalízis (gyakorlati megvalósítás a Microsoft Office 2013-ban)

Következtetés

A felhasznált források listája

Bevezetés

A téma relevanciája. A matematikai statisztika fejlődése a híres német matematikus, Carl Friedrich Gauss 1795-ös munkájával kezdődik, és még mindig fejlődik. A statisztikai elemzésben van parametrikus módszer"Egyirányú varianciaanalízis". Jelenleg a közgazdaságtanban alkalmazzák az eredmények összehasonlíthatósága érdekében végzett piackutatások során (például egy termék fogyasztásával kapcsolatos felmérések készítésekor az ország különböző régióiban szükséges következtetéseket levonni arra vonatkozóan, hogy a felmérés adatai mennyiben térnek el, ill. nem különböznek egymástól; pszichológiában, különféle típusú kutatások végzésekor), tudományos összehasonlító tesztek összeállításakor, vagy bármilyen kutatás során társadalmi csoportok, valamint a statisztikai problémák megoldására.

A munka célja. Ismerkedjen meg egy olyan statisztikai módszerrel, mint az egyirányú varianciaanalízis, valamint annak PC-n való megvalósítása különböző programokban, és hasonlítsa össze ezeket a programokat.

Tanulmányozni az egyirányú varianciaanalízis elméletét.

Tanulmányozni az egytényezős elemzéshez szükséges problémák megoldására szolgáló programokat.

Magatartás összehasonlító elemzés ezeket a programokat.

A munka eredményei: A munka gyakorlati részét teljes egészében a szerző készítette: programok kiválasztása, feladatok kiválasztása, PC-n történő megoldása, majd összehasonlító elemzésre került sor. Az elméleti részben az ANOVA csoportok osztályozását végeztük el. Ezt a munkát riportként tesztelték "A felsőbb matematika válogatott kérdései és a matematikatanítás módszerei" című tudományos diákköri foglalkozáson.

A munka felépítése és köre. A munka bevezetőből, befejezésből, tartalomból és bibliográfiából áll, amely 4 címet tartalmaz. A munka teljes terjedelme 25 nyomtatott oldal. A munka 1 példát tartalmaz 2 programmal megoldva.

A varianciaanalízis fogalma

Gyakran szükség van egy vagy több független változó (tényező) egy vagy több függő változóra (eredményes jellemzőkre) gyakorolt ​​hatásának vizsgálatára, az ilyen problémák megoldhatók R. Fisher által írt varianciaanalízis módszereivel.

Az ANOVA varianciaanalízis olyan statisztikai adatfeldolgozási módszerek összessége, amelyek lehetővé teszik egy vagy több hatékony jellemző változékonyságának elemzését ellenőrzött tényezők (független változók) hatására. Itt tényező alatt egy bizonyos értéket értünk, amely meghatározza a vizsgált objektum vagy rendszer tulajdonságait, pl. a végeredmény oka. A varianciaanalízis elvégzésekor fontos a megfelelő hatásforrás és tárgy kiválasztása, pl. a függő és független változók azonosítása.

Az osztályozás jeleitől függően a varianciaanalízis több osztályozási csoportját különítjük el (1. táblázat).

A figyelembe vett tényezők számával: Egyváltozós elemzés - egy tényező hatását vizsgálják Többváltozós elemzés - két vagy több tényező egyidejű hatását vizsgálják Értékminták közötti kapcsolat meglétével: Nem összefüggő (különböző) elemzése ) minták - akkor hajtják végre, ha a kutatási objektumok több csoportja található különböző körülmények között. (A H0 nullhipotézist ellenőrzik: a függő változó átlagértéke különböző mérési körülmények között azonos, azaz nem függ a vizsgált tényezőtől.); Kapcsolódó (azonos) minták elemzése - kettő vagy több esetében történik ugyanazon a vizsgált objektumcsoporton, különböző körülmények között végzett mérések. Itt lehetséges egy fel nem számolt faktor befolyása, ami tévesen a körülmények változásának tulajdonítható A tényezők által befolyásolt függő változók számával Egyváltozós elemzés (ANOVA vagy AMCOVA - kovarianciaanalízis) - egy függő változót befolyásolnak a tényezők ;Többváltozós analízis (MANOVA - többváltozós varianciaanalízis vagy MANSOVA - többváltozós kovarianciaanalízis) - több függő változót befolyásolnak a tényezők A vizsgálat céljának megfelelően Determinisztikus - minden tényező szintje előre rögzített és ez a befolyásuk amelyet ellenőriznek (a H0 hipotézist az átlagos szintek közötti különbségek hiányára ellenőrzik); Véletlen - az egyes faktorok szintjeit véletlenszerű mintaként kapjuk meg a faktorszintek általános sokaságából (a H0 hipotézist teszteljük, hogy a diszperzió a faktor különböző szintjeire számított átlagos válaszértékek értéke nem nulla);

Az egytényezős varianciaanalízis során ehhez két vagy több populáció mintaátlagai különbségeinek statisztikai szignifikanciáját ellenőrzik, előzetesen hipotéziseket állítanak fel.

H0 nullhipotézis: az effektív jellemző átlagértékei a faktorhatás (vagy faktorgradáció) minden körülménye esetén azonosak

Alternatív hipotézis H1: az effektív jellemző átlagértékei a faktor minden körülményei között eltérőek.

Az ANOVA módszerek alkalmazhatók normál eloszlású populációkra (paraméteres tesztek többváltozós analógjai) és olyan populációkra, amelyek nem rendelkeznek határozott eloszlással (nem paraméteres tesztek többváltozós analógjai). Az első esetben először meg kell állapítani, hogy a kapott jellemző eloszlása ​​normális-e. Egy jellemző eloszlásának normalitásának ellenőrzéséhez használhatja az A = aszimmetria indikátorokat , , és kurtosis E = , , Ahol , . - az effektív jellemző értéke és átlagértéke; - a kapott jellemző szórása; .

Megfigyelések száma;

Reprezentativitási hibák az A és E intézkedéseknél

Ha a ferdeségi és görbületi mutatók nem haladják meg a reprezentativitási hibáikat több mint 3-szorosával, pl. A<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

A faktor egy feltételére (egy fokozatra) vonatkozó adatokat diszperziós komplexnek nevezzük. A varianciaanalízis során ügyelni kell a komplexek közötti diszperziók egyenlőségére. Ebben az esetben az elemek kiválasztását véletlenszerűen kell elvégezni.

A második esetben, amikor a mintapopulációk tetszőleges eloszlásúak, az egyirányú varianciaanalízis nem paraméteres (rang) analógjait használják (Kruskal-Wallis kritériumok, Friedman).

Tekintsük grafikusan a részvények megtérülési rátája függését az ország gazdaságának állapotától (1. ábra, a). Itt a vizsgált tényező a gazdaság állapotának szintje (pontosabban állapotának három szintje), az effektív jellemző pedig a megtérülési ráta. A fenti eloszlás azt mutatja, hogy ez a tényező jelentősen befolyásolja a jövedelmezőséget, i. A gazdaság javulásával a részvények hozama is javul, ami nem mond ellent a józan észnek.

Figyeljük meg, hogy a választott tényezőnek vannak fokozatai, pl. értéke az egyik fokozatból a másikba (a gazdaság egyik állapotából a másikba) való átmenet során változott.

Rizs. 1. A faktor hatásának és a csoporton belüli szórás aránya: a - a faktor szignifikáns hatása; b - a tényező jelentéktelen befolyása

Egy tényező fokozatainak csoportja csak speciális eset, ráadásul egy faktornak lehetnek fokozatai akár nominális skálán is. Ezért gyakrabban nem egy tényező fokozatosságairól, hanem működésének különböző feltételeiről beszélnek.

Tekintsük most a varianciaanalízis gondolatát, amely a varianciaösszeadás szabályán alapul: a teljes variancia egyenlő a csoportközi és a csoporton belüli eltérések átlagával:

Az összes tényező hatásából adódó teljes variancia

Csoportközi szóródás az összes többi tényező hatására;

Az átlagos csoporton belüli variancia, amelyet a csoportosítási tulajdonság hatása okoz.

A csoportosított tulajdonság befolyása jól látható az 1a ábrán, mivel a faktor hatása szignifikáns a csoporton belüli szóráshoz képest, ezért a csoportok közötti variancia nagyobb lesz, mint a csoporton belüli ( > ), és az ábrán. Az 1., b ábrán az ellenkező kép látható: itt a csoporton belüli szórás érvényesül, és a faktor hatása gyakorlatilag hiányzik.

A varianciaanalízis ugyanezen az elven épül fel, csak nem szórásokat, hanem az eltérések négyzetes átlagát ( , , ), amelyek a megfelelő szórások elfogulatlan becslései. Ezeket úgy kapjuk meg, hogy az eltérések négyzetes összegét elosztjuk a megfelelő számú szabadságfokkal

Aggregátumok egésze;

Csoporton belüli átlagok;

Csoportközi átlagok;

Az összes mérés összátlaga (minden csoportra);

A faktor j-edik fokozatának csoportátlaga.

Az eltérések négyzetes összegére a csoporton belüli, illetve a csoportközi összegre vonatkozó matematikai elvárásokat a következő képletekkel számítjuk ki: (Fix faktoros modell),

.

E ( ) = E ( ) = , akkor a H0 nullhipotézis az átlagok közötti különbségek hiányáról beigazolódik, ezért a vizsgált faktornak nincs szignifikáns hatása (lásd 1. ábra, b). Ha a Fisher-féle F-próba tényleges értéke F= E ( ) /E ( ) nagyobb lesz, mint a kritikus majd a szignifikancia szinten a H0 nullhipotézist , a H1 alternatív hipotézist elvetjük és elfogadjuk - a faktor szignifikáns hatásáról. 1, a. .

Egyirányú varianciaanalízis

Egy olyan varianciaanalízist, amely csak egy változót vesz figyelembe, egyutas ANOVA-nak nevezzük.

Van egy n objektumból álló megfigyelési objektum, amely néhány vizsgált változó mért értékével rendelkezik . változónként valamilyen minőségi tényező befolyásolja Többekkel hatásszintek (gradációk). Mért változó értékek a faktor különböző szintjein táblázatban vannak megadva (mátrix formában is bemutathatók).

2. táblázat.

A kezdeti adatok beállításának táblázatos formája egyváltozós elemzés

Megfigyelési objektum száma ()Változó értékek faktor szintjén (gradációján). (legalacsonyabb) (rövid)… (legmagasabb)1 2 … n .Itt minden szint különböző számú választ tartalmazhat a faktor egy szintjén mérve, ekkor minden oszlopnak saját értéke lesz . Fel kell mérni ennek a tényezőnek a vizsgált változóra gyakorolt ​​hatásának jelentőségét. A probléma megoldására a varianciaanalízis egytényezős modellje használható. Egytényezős diszperziós modell.

A vizsgált változó értéke a -edik megfigyelési objektumhoz at -a faktor szintje;

A csoport átlaga -a faktor szintje;

A faktor -edik szintjének befolyásából adódó hatás;

Véletlenszerű komponens, vagy ellenőrizhetetlen tényezők hatása által okozott perturbáció. Tehát kiemeljük az ANOVA használatának fő korlátait:

Egy véletlen komponens matematikai elvárásának nullával való egyenlősége: = 0.

Véletlenszerű komponens , és ebből következően is normális eloszlásúak.

A faktorok fokozatainak számának legalább háromnak kell lennie.

Ez a modell a faktor szintjétől függően a Fisher F-teszt segítségével lehetővé teszi az egyik nullhipotézis tesztelését.

A rokon minták varianciaanalízise során lehetőség van egy másik H0(u) nullhipotézis tesztelésére is - a megfigyelési objektumok közötti egyéni különbségek nem fejeződnek ki jobban, mint a véletlenszerű okokból eredő különbségek.

Egyirányú varianciaanalízis

(Gyakorlati megvalósítás az IBM SPSS Statistics 20-ban)

A kutatót az a kérdés érdekli, hogy egy adott attribútum hogyan változik egy változó (tényező) működésének különböző feltételei között. Csak egy változó (tényező) hatását vizsgáljuk a vizsgált tulajdonságra. Már foglalkoztunk egy közgazdasági példával, most például a pszichológiából adunk példát arra, hogyan változik a problémamegoldás ideje az alanyok különböző motivációs körülményei között (alacsony, közepes, magas motiváció) vagy különböző módon. a feladat bemutatása (szóban, írásban vagy szöveges formában grafikonokkal, illusztrációkkal) , a feladattal való munkavégzés különböző körülményei között (egyedül, tanárral egy szobában, tanteremben). Az első esetben a motiváció a tényező, a másodikban a láthatóság mértéke, a harmadikban a nyilvánosság tényezője.

A módszer ezen változatában az alanyok különböző mintái vannak kitéve az egyes fokozatok hatásának. A faktornak legalább három fokozatának kell lennie.

1. példa Három különböző, hat alanyból álló csoport kapott tíz szóból álló listát. Az első csoportnak alacsony, 5 másodpercenkénti 1 szóval, a második csoportnak átlagosan 2 másodpercenként 1 szóval, a harmadik csoportnak pedig magas, másodpercenkénti 1 szóval mutatták be a szavakat. Azt jósolták, hogy a reprodukció teljesítménye a szavak bemutatásának sebességétől függ (3. táblázat).

3. táblázat

A reprodukált szavak száma

Tárgycsoport 1 alacsony sebesség 2. csoport közepes sebesség 3. csoport nagy sebesség

Fogalmazzunk meg hipotéziseket: a szóreprodukciós volumenbeli különbségek a csoportok között nem kifejezettebbek, mint az egyes csoportokon belüli véletlenszerű különbségek: A csoportok közötti szóreprodukciós volumenbeli különbségek hangsúlyosabbak, mint az egyes csoportokon belüli véletlenszerű különbségek.

A megoldást SPSS környezetben hajtjuk végre az alábbi algoritmus szerint

Futtassuk az SPSS programot

Írja be a számértékeket az ablakba adat

Rizs. 1. Értékek bevitele az SPSS-be

Az ablakban Változók minden kiindulási adatot leírunk, a feltételnek megfelelően

Feladatok

2. ábra Változók ablak

Az érthetőség kedvéért a címke oszlopban leírjuk a táblák nevét

A grafikonon Értékek írja le az egyes csoportok számát!

3. ábra Értékcímkék

Mindez az áttekinthetőség érdekében történik, i.e. ezeket a beállításokat figyelmen kívül lehet hagyni.

A grafikonon skála , a második oszlopba a névértéket kell beírni

Az ablakban adat rendeljen egyirányú varianciaanalízist az "Elemzés" menü segítségével Átlagos összehasonlítás

Egyirányú varianciaanalízis…

4. ábra Egyirányú ANOVA függvény

A megnyíló párbeszédpanelen Egyirányú varianciaanalízis válassza ki a függő változót, és adja hozzá eltartottak listája , és az ablaktényező változó tényezője

Az 5. ábra az eltartottak listáját és a tényezőt kiemelve

Állítson be néhány paramétert a kiváló minőségű adatkimenethez

6. ábra A kvalitatív adatkövetkeztetés paraméterei

A kiválasztott egyirányú ANOVA algoritmus számításai a kattintás után indulnak el rendben

A számítások végén a számítás eredménye megjelenik a megtekintő ablakban.

Leíró statisztikai csoport NAverage Std. Deviation Std. Hiba 95%-os konfidencia intervallum az átlagos Minimum Maximum 27.4544.826.7429 2. táblázat Leíró statisztikák

A Leíró statisztikák táblázat a sebességek főbb mutatóit mutatja csoportonként és azok összértékét.

A megfigyelések száma az egyes csoportokban és az összes

Átlag - a megfigyelések számtani átlaga minden csoportban és az összes csoportra együtt

Std. Eltérés, Std. Hiba - szórás és szórások

%-os konfidencia intervallum az átlaghoz – ezek az intervallumok pontosabbak minden csoportra és az összes csoportra együtt, ahelyett, hogy ezen határértékek alatti vagy feletti intervallumokat vennék.

Minimum, Maximum - az egyes csoportok minimális és maximális értékei, amelyeket az alanyok hallottak

egytényezős variancia véletlen

A varianciacsoport homogenitásának kritériuma Statisztika Livinast.st.1st.st.

A Livin-féle homogenitásteszt a diszperziók homogenitásának (homogenitásának) vizsgálatára szolgál. Ebben az esetben megerősíti az eltérések jelentéktelenségét, hiszen az érték = 0,915, azaz egyértelműen nagyobb, mint 0,05. Ezért a varianciaanalízissel kapott eredményeket helyesnek ismerjük el.

Az 1-utas varianciaanalízis táblázat az egyirányú DA eredményeit mutatja

A "csoportok közötti" négyzetösszeg a teljes átlag és az átlagok közötti különbségek négyzeteinek összege az egyes csoportokban, súlyozva a csoportban lévő objektumok számával.

A "csoportokon belül" az egyes csoportok átlaga és az adott csoport értékei közötti különbségek négyzetének összege

Oszlop "St. St." tartalmazza az V szabadsági fokok számát:

Csoportközi (v=csoportok száma - 1);

Intragroup (v=objektumok száma - csoportok száma - 1);

Az "átlag négyzet" a négyzetösszeg és a szabadságfokok számának arányát tartalmazza.

Az "F" oszlop a csoportok közötti átlagnégyzet és a csoportokon belüli átlagos négyzet arányát mutatja.

Az "érték" oszlop azt a valószínűségi értéket tartalmazza, hogy a megfigyelt eltérések véletlenszerűek.

4. táblázat Képletek

Átlagok grafikonjai

A grafikon azt mutatja, hogy csökken. Az Fk k1=2, k2=15 táblázatból is meghatározható a statisztika táblázatos értéke 3,68. Szabály szerint, ha , akkor a nullhipotézist elfogadjuk, ellenkező esetben az alternatív hipotézist. A mi példánkra (7,45>3,68), ezért az alternatív hipotézist elfogadjuk. Így visszatérve a probléma feltételéhez, levonhatjuk a nullhipotézist elutasítják és egy alternatívát elfogadnak. : a csoportok közötti szómennyiségbeli különbségek hangsúlyosabbak, mint az egyes csoportokon belüli véletlenszerű különbségek ). Hogy. a szavak előadásának sebessége befolyásolja reprodukciójuk mennyiségét.

Egyirányú varianciaanalízis

(Gyakorlati megvalósítás a Microsoft Office 2013-ban)

Ugyanebben a példában vegye figyelembe a Microsoft Office 2013 egyirányú varianciaanalízisét

Probléma megoldása Microsoft Excelben

Nyissuk meg a Microsoft Excelt.


1. ábra Adatok írása Excelbe

Alakítsuk át az adatokat számformátumba. Ehhez a fő lapon van egy elem Formátum és van egy albekezdése Cell formátum . A képernyőn megjelenik a Cellák formázása ablak. Rizs. 2 Válassza a Számformátum lehetőséget, és a bevitt adatok konvertálásra kerülnek. A 3. ábrán látható módon

2. ábra Konvertálás numerikus formátumba

3. ábra Eredmény átalakítás után

Az adatok lapon van egy elem adatelemzés kattintsunk rá.

Válasszuk az Egyirányú varianciaanalízist

6. ábra Adatelemzés

A képernyőn megjelenik az Egyirányú varianciaanalízis ablak az adatok diszperziós elemzéséhez (7. ábra). Állítsuk be a paramétereket

Rizs. 7 Paraméterek beállítása egyváltozós elemzéshez

Kattintson az egérrel a Beviteli intervallum mezőbe. Válassza ki a B2::F9 cellatartományt, az elemezni kívánt adatokat. A Bemenetek vezérlőcsoport Input Spacing mezőjében megjelenik a megadott tartomány.

Ha a Bemeneti adatok vezérlőcsoportban nincs beállítva a soronkénti kapcsoló, akkor válassza ki, hogy az Excel program soronként fogadja el az adatcsoportokat.

Választható Jelölje be a Címkék az első sorban jelölőnégyzetet a Bemeneti vezérlők csoportban, ha a kiválasztott adattartomány első oszlopa sorneveket tartalmaz.

A Bemeneti adatok vezérlőcsoport Alfa beviteli mezőjében alapértelmezés szerint a 0,05 érték jelenik meg, amely a varianciaanalízis hibájának valószínűségéhez kapcsolódik.

Ha a kimeneti intervallum kapcsoló nincs beállítva a Kimeneti paraméterek vezérlőcsoportban, akkor állítsa be, vagy válassza ki az új munkalap kapcsolót, hogy az adatok egy új lapra kerüljenek át.

Kattintson az OK gombra az Egyirányú ANOVA ablak bezárásához. Megjelennek a varianciaanalízis eredményei (8. ábra).

8. ábra Adatkimenet

Az A4:E7 cellatartomány a leíró statisztikák eredményeit tartalmazza. A 4. sor a paraméterek neveit tartalmazza, az 5-7. sorok - a kötegenként számított statisztikai értékeket. A "Score" oszlop a mérések számát, az "Összeg" oszlop az értékek összegét, az "Átlag" oszlop a számtani középértékeket, a "Szórás" oszlop pedig a diszperziókat tartalmazza.

A kapott eredmények azt mutatják, hogy a legnagyobb átlagos szakítóterhelés az 1. számú tételben, ill legnagyobb szórás törésterhelés - 2., 1. számú tételekben.

Az A10:G15 cellák tartománya információkat jelenít meg az adatcsoportok közötti eltérések jelentőségéről. A 11. sor tartalmazza a varianciaparaméterek elemzésének nevét, a 12. sor - a csoportközi feldolgozás eredményeit, a 13. sor - a csoporton belüli feldolgozás eredményeit, a 15. pedig - e két sor értékeinek összege.

Az SS oszlop a variációs értékeket tartalmazza, pl. az összes eltérés négyzetösszege. A variáció a szóráshoz hasonlóan az adatok terjedését jellemzi.

A df oszlop a szabadságfokok számainak értékeit tartalmazza. Ezek a számok a független eltérések számát jelzik, amelyekre vonatkozóan a variancia kiszámításra kerül. Például a szabadsági fokok csoportközi száma egyenlő az adatcsoportok száma és egy közötti különbséggel. Minél nagyobb a szabadságfok száma, annál nagyobb a diszperziós paraméterek megbízhatósága. A táblázatban szereplő szabadságfok-adatok azt mutatják, hogy a csoporton belüli eredmények megbízhatóbbak, mint a csoportok közötti paraméterek.

Az MS oszlop tartalmazza a diszperziós értékeket, amelyeket a variációs arány és a szabadsági fokok száma határoz meg. A diszperzió az adatok szórásának fokát jellemzi, de a variáció nagyságától eltérően nincs közvetlen tendenciája a szabadsági fokok számának növekedésével. A táblázat azt mutatja, hogy a csoportok közötti variancia sokkal nagyobb, mint a csoporton belüli variancia.

Az F oszlop az F-statisztika értékét tartalmazza, amelyet a csoportközi és a csoporton belüli varianciák arányával számolunk.

Az F-kritikus oszlop a szabadságfokok számából és az Alfa értékéből számított F-kritikus értéket tartalmazza. Az F-statisztika és az F-kritikus érték a Fisher-Snedekor tesztet használja.

Ha az F-statisztika nagyobb, mint az F-kritikus érték, akkor az adatcsoportok közötti különbségek nem véletlenszerűek. azok. a jelentőség szintjén α = 0 0,05 (0,95-ös megbízhatóság mellett), a nullhipotézist elvetjük, és elfogadjuk az alternatívát: azt, hogy a szavak megjelenítési sebessége befolyásolja reprodukciójuk mennyiségét. A P-érték oszlop azt a valószínűséget tartalmazza, hogy a csoportok közötti különbség véletlenszerű. Mivel ez a valószínűség nagyon kicsi a táblázatban, a csoportok közötti eltérés nem véletlen.

Az IBM SPSS Statistics 20 és a Microsoft Office 2013 összehasonlítása

egytényezős variancia véletlen program

Nézzük meg a programok kimeneteit, ehhez újra megnézzük a képernyőképeket.

Varianciacsoport egyirányú elemzése Négyzetösszeg St.Lm Mean Square FZn Csoportok között31.444215.7227.447.006 Csoportokon belül31.667152.111Összesen63.11117

Így az IBM SPSS Statistics 20 program jobb pontszámot produkál, tud számokat kerekíteni, vizuális grafikont építeni (lásd a teljes megoldást), amivel meghatározható a válasz, részletesebben leírja mind a probléma feltételeit, mind azok megoldását. A Microsoft Office 2013-nak megvannak az előnyei, egyrészt természetesen az elterjedtsége, hiszen a Microsoft Office 2013 szinte minden számítógépre telepítve van, megjeleníti az Fcritical-t, amit az SPSS Statistics nem tartalmaz, és ott is egyszerű és kényelmes a számítás. Mindazonáltal mindkét program kiválóan alkalmas az egyirányú ANOVA problémák megoldására, mindegyiknek megvannak a maga előnyei és hátrányai, de ha nagy problémákat vesz figyelembe nagy feltételek mellett, akkor az SPSS Statistics-ot ajánlom.

Következtetés

A varianciaanalízist minden területen alkalmazzák tudományos kutatás, ahol a hatás elemzésére van szükség különféle tényezők a vizsgált változóhoz. BAN BEN modern világ Az egytényezős varianciaanalízisre számos feladat vár a közgazdaságtanban, a pszichológiában és a biológiában. Az elméleti anyag tanulmányozása eredményeként kiderült, hogy a varianciaanalízis alapja a variancia-összeadás tétele, a számos szoftvercsomag közül, amelyekben a varianciaanalízis apparátusa megvalósul, a legjobbakat választották ki, és kerültek be a varianciaanalízisbe. a munka. Az új technológiák megjelenésének köszönhetően mindannyian végezhetünk kutatásokat (döntéseket), miközben kevesebb időt és energiát fordítunk a számításokra, számítógépek használatával. A munka során célokat tűztek ki, feladatokat sikerült elérni.

irodalomjegyzék

Sidorenko, E.V. Matematikai feldolgozás módszerei a pszichológiában [Szöveg] / Szentpétervár. 2011. - 256 p.

Matematikai statisztika pszichológusok számára Ermolaev O.Yu [Szöveg] / Moscow_2009 -336s

7. előadás Elemző statisztika [Elektronikus forrás]. , Hozzáférés dátuma: 05/14/14

Valószínűségszámítás és matematikai statisztika [Szöveg] / Gmurman V.E. 2010 -479s

Ebben a témakörben csak az egyirányú varianciaanalízist veszik figyelembe, amelyet nem kapcsolódó mintákhoz használnak. A variancia alapfogalmát tekintve ez az elemzés háromféle variancia számításon alapul:

A teljes kísérleti adatkészletre számított teljes variancia;

Csoporton belüli variancia, amely az egyes mintákban egy tulajdonság variabilitását jellemzi;

A csoportátlagok változékonyságát jellemző csoportközi diszperzió.

A varianciaanalízis fő álláspontja szerint a teljes variancia egyenlő a csoporton belüli és a csoportközi variancia összegével.

Ez a pozíció felírható egyenletként:

Ahol x ij- a kísérletben kapott összes változó értéke; míg az index j között változik 1 előtt R, Ahol R- az összehasonlított minták száma, lehet három vagy több is; index én megfelel a mintában lévő elemek számának (kettő vagy több is lehet);

A teljes elemzett adatsor általános átlaga;

Közepes j minták;

N- az elemzett kísérleti adathalmaz összes elemének száma;

R- kísérleti minták száma.

Elemezzük ezt az egyenletet részletesebben.

Hagyjuk R csoportok (minták). Az ANOVA-ban minden mintát egyetlen számoszlopként (vagy sorként) ábrázolnak. Ezután, hogy egy adott csoportra (mintára) tudjunk mutatni, bevezetünk egy indexet j, amely ennek megfelelően változik j= 1-től j= r. Például, ha van 5 csoportunk (mintánk), akkor p=5, és az index j től ennek megfelelően változik j= 1-től j= 5.

Nézzünk szembe azzal a feladattal, hogy egy minta adott elemét (mérési értékét) adjuk meg. Ehhez ismernünk kell ennek a mintának a számát, például 4-et, és az elem (mért érték) helyét ebben a mintában. Ez az elem a kijelölésben az első értéktől (első sor) az utolsóig (utolsó sor) található. A szükséges elemünk legyen az ötödik sorban. Ekkor a jelölése a következő lesz: x 54 . Ez azt jelenti, hogy a negyedik mintából a sor ötödik eleme kerül kiválasztásra.

Általános esetben minden csoportban (mintában) az alkotóelemeinek száma eltérő lehet - ezért az elemek számát jelöljük j csoport (minta) keresztül nj. A kísérletben kapott jellemző értékei a j-vel jelölt csoport xij, Ahol én= 1, 2, ... n a megfigyelés sorszáma in j csoport.

Célszerű a 35. táblázat alapján további érvelést végezni. Megjegyzendő azonban, hogy a további érvelés megkönnyítése érdekében a táblázatban szereplő mintákat nem oszlopokként, hanem sorokként jelenítjük meg (ami azonban nem fontos).

A táblázat utolsó, utolsó sorában a teljes minta teljes térfogata szerepel - N, a G összes kapott értékének összege és a teljes minta teljes átlaga. Ezt az általános átlagot úgy kapjuk meg, hogy az elemzett kísérleti adathalmaz összes elemének összegét, amelyet fent G-vel jelöltünk, osztva az összes N elem számával.


A táblázat jobb szélső oszlopa az összes minta átlagértékeit mutatja. Például be j minta (a táblázat j szimbólummal jelölt sora) az átlag értéke (a teljes j mintára) a következő:

A varianciaanalízis egy statisztikai módszer a faktor és a teljesítményjellemzők közötti kapcsolat értékelésére különféle csoportok, véletlenszerűen kiválasztott, a jellemzőértékek különbségeinek (diverzitásának) meghatározása alapján. A varianciaanalízis a vizsgált sokaság összes egységének a számtani átlagtól való eltérésének elemzésén alapul. Az eltérések mértékeként a diszperziót (B) veszik - az eltérések átlagos négyzetét. A faktorattribútum (faktor) hatása által okozott eltéréseket összehasonlítjuk a véletlenszerű körülmények okozta eltérések nagyságával. Ha a faktorattribútum okozta eltérések szignifikánsabbak, mint a véletlenszerű eltérések, akkor a faktor szignifikáns hatással van a kapott attribútumra.

Az egyes opciók eltérési értékének (az attribútum minden egyes regisztrált számértékének) a számtani átlagtól való eltérésének négyzetes kiszámításához. Ezzel megszabadul a negatív jelektől. Ezután ezeket az eltéréseket (különbségeket) összeadjuk és elosztjuk a megfigyelések számával, azaz. átlagos eltérések. Így megkapjuk a diszperziós értékeket.

A varianciaanalízis alkalmazásának fontos módszertani értéke a helyes mintaképzés. A céltól és célkitűzésektől függően véletlenszerűen, egymástól függetlenül is kialakíthatók szelektív csoportok (kontroll és kísérleti csoportok valamilyen indikátor, például a magas vérnyomás hatásának a stroke kialakulására vizsgálatára). Az ilyen mintákat függetlennek nevezzük.

A faktoroknak való kitettség eredményeit gyakran ugyanabban a mintacsoportban (például ugyanazon betegeknél) vizsgálják az expozíció előtt és után (kezelés, megelőzés, rehabilitációs intézkedések), az ilyen mintákat függőnek nevezik.

A varianciaanalízist, amelyben egy tényező hatását ellenőrzik, egytényezős elemzésnek (egyváltozós elemzésnek) nevezik. Egynél több tényező hatásának vizsgálatakor többváltozós varianciaanalízist (többváltozós elemzést) alkalmazunk.

A faktorjelek azok a jelek, amelyek befolyásolják a vizsgált jelenséget.

A hatásos jelek azok a jelek, amelyek a faktorjelek hatására megváltoznak.

A varianciaanalízis használatának feltételei:

A vizsgálat feladata egy (legfeljebb 3) tényező eredményre gyakorolt ​​hatásának erősségének meghatározása, vagy különböző tényezők (nem és életkor, fizikai aktivitás és táplálkozás stb.) együttes hatásának erősségének meghatározása.

A vizsgált tényezőknek függetlennek (nem rokonnak) kell lenniük egymástól. Például nem lehet tanulmányozni a munkatapasztalat és a gyermekek életkora, magassága és súlya stb. együttes hatását. a lakosság előfordulásáról.

A csoportok kiválasztása a vizsgálathoz véletlenszerűen történik (véletlenszerű kiválasztás). A diszperziós komplexum megszervezését az opciók véletlenszerű kiválasztásának elvének megvalósításával randomizációnak (angol fordításban - véletlenszerű) nevezik, azaz véletlenszerűnek. véletlenszerűen választották ki.

Mind mennyiségi, mind minőségi (attribútum) jellemzők használhatók.

Az egytényezős varianciaanalízis elvégzésekor ajánlott ( szükséges feltétel alkalmazások):

1. Az elemzett csoportok eloszlásának normalitása vagy a mintacsoportok megfeleltetése normál eloszlású általános sokaságokhoz.

2. A megfigyelések csoportonkénti eloszlásának függetlensége (nem összekapcsoltsága).

3. A megfigyelések gyakoriságának (ismétlődésének) jelenléte.

Először egy nullhipotézist fogalmazunk meg, azaz feltételezzük, hogy a vizsgált tényezőknek nincs hatása a kapott attribútum értékére, és az ebből eredő különbségek véletlenszerűek.

Ezután meghatározzuk, hogy mekkora valószínűséggel kapjuk meg a megfigyelt (vagy erősebb) különbségeket, feltéve, hogy a nullhipotézis igaz.

Ha ez a valószínűség kicsi, akkor elvetjük a nullhipotézist, és arra a következtetésre jutunk, hogy a vizsgálat eredményei statisztikailag szignifikánsak. Ez még nem jelenti azt, hogy a vizsgált tényezők hatása igazolódott (ez elsősorban kutatástervezés kérdése), de még mindig nem valószínű, hogy az eredmény a véletlennek köszönhető.

Ha a varianciaanalízis alkalmazásának minden feltétele teljesül, a teljes variancia dekompozíciója matematikailag így néz ki:

Dotot. = Tény + D pihenés,

Dotot. - a megfigyelt értékek teljes szórása (változat), amelyet a variáns teljes átlagtól való eloszlása ​​jellemez. Egy tulajdonság változását méri a teljes populációban az összes olyan tényező hatására, amely ezt a változást okozta. Az általános diverzitás csoportközi és csoporton belüli részekből áll;

Dfact - faktoriális (csoportközi) diszperzió, amelyet az egyes csoportok átlagainak különbsége jellemez, és a vizsgált tényező hatásától függ, amely szerint az egyes csoportokat megkülönböztetik. Például a tüdőgyulladás klinikai lefolyásának különböző etiológiai tényezőiből álló csoportokban az eltöltött ágynap átlagos szintje nem azonos - csoportok közötti diverzitás figyelhető meg.

D pihenés. - reziduális (csoporton belüli) variancia, amely a változat csoporton belüli szóródását jellemzi. Véletlenszerű variációt tükröz, pl. a variáció része, amely nem meghatározott tényezők hatására következik be, és nem függ a tulajdonságtól - a csoportosítás alapjául szolgáló tényezőtől. A vizsgált tulajdonság variációja néhány fel nem számolt véletlenszerű tényező befolyásának erősségétől függ, mind a szervezett (a kutató által megadott), mind a véletlenszerű (ismeretlen) tényezőkre.

Ezért a teljes variáció (szórás) a szervezett (adott) tényezők okozta variációból, úgynevezett faktorvariációból és szervezetlen tényezőkből tevődik össze, azaz. reziduális variáció (véletlenszerű, ismeretlen).

n mintaméret esetén a minta variancia kiszámítása a minta átlagától való eltérés négyzetes összege, osztva n-1-gyel (mintanagyság mínusz egy). Így fix n mintaméret esetén a variancia a négyzetösszeg (eltérés) függvénye, amelyet rövidség kedvéért SS-nek jelölünk (az angol Sum of Squares - Sum of Squares szóból). A következőkben gyakran kihagyjuk a "szelektív" szót, jól tudva, hogy mintavarianciát vagy az eltérés becslését mérlegeljük. A varianciaanalízis a variancia részekre vagy komponensekre való felosztásán alapul. Vegye figyelembe a következő adatkészletet:

A két csoport átlaga szignifikánsan különbözik (2, illetve 6). Az egyes csoportokon belüli eltérések négyzetes összege 2. Ezeket összeadva 4-et kapunk. Ha most megismételjük ezeket a számításokat a csoporttagság figyelembevétele nélkül, vagyis ha e két minta összátlaga alapján számítjuk ki az SS-t, 28-as értéket kapunk. Vagyis a csoporton belüli variabilitáson alapuló variancia (négyzetösszeg) sokkal alacsonyabb értékeket eredményez, mint a teljes variabilitás alapján számítottak (az összátlaghoz képest). Ennek oka nyilvánvalóan az átlagok közötti jelentős különbség, és ez az átlagok közötti különbség magyarázza a négyzetösszegek közötti különbséget.

SS St. St. KISASSZONY F p
Hatás 24.0 24.0 24.0 .008
Hiba 4.0 1.0

A táblázatból látható, hogy az SS = 28 négyzetösszeg komponensekre oszlik: a csoporton belüli változékonyság miatti négyzetösszeg (2+2=4; lásd a táblázat második sorát) és az négyzetek a csoportok közötti átlagok különbsége miatt (28-(2+ 2)=24; lásd a táblázat első sorát). Vegye figyelembe, hogy az MS ebben a táblázatban az átlagos négyzet, amely egyenlő az SS-vel osztva a szabadsági fokok számával (stdf).

A fenti egyszerű példában azonnal kiszámíthatja a független minták t-próbáját. A kapott eredmények természetesen egybeesnek a varianciaanalízis eredményeivel.

Azonban rendkívül ritkák az olyan helyzetek, amikor egy jelenséget teljesen leír egy változó. Például, ha nagy paradicsom termesztését próbáljuk megtanulni, figyelembe kell venni a növények genetikai szerkezetével, a talajtípussal, a fényviszonyokkal, a hőmérséklettel stb. kapcsolatos tényezőket. Így egy tipikus kísérlet elvégzésekor számos tényezővel kell számolnia. A fő ok, amiért az ANOVA használata előnyösebb, mint két különböző faktorszintű minta t-próbasorozatokkal történő összehasonlítása, az az, hogy az ANOVA lényegesen hatékonyabb, és kis minták esetén informatívabb.

Tegyük fel, hogy a fent tárgyalt kétmintás elemzési példában hozzáadunk egy másik tényezőt, például a nemet. Legyen most minden csoport 3 férfiból és 3 nőből. A kísérlet terve táblázat formájában is bemutatható:

A számítások elvégzése előtt láthatja, hogy ebben a példában a teljes variancia legalább három forrásból áll:

1) véletlenszerű hiba (csoporton belüli variancia),

2) a kísérleti csoporthoz tartozáshoz kapcsolódó változékonyság

3) a megfigyelt objektumok neme miatti változékonyság.

Vegye figyelembe, hogy a változékonyságnak van egy másik lehetséges forrása is - a tényezők kölcsönhatása, amelyet később tárgyalunk). Mi történik, ha nem vesszük figyelembe a nemet mint tényezőt az elemzésünkben, és kiszámítjuk a szokásos t-próbát? Ha a nemek figyelmen kívül hagyásával számítjuk ki a négyzetösszegeket (azaz a különböző nemű objektumokat egy csoportba egyesítjük a csoporton belüli variancia kiszámításakor, és így megkapjuk az egyes csoportok négyzetösszegét, amely egyenlő SS = 10 és a négyzetek teljes összege SS = 10+10 = 20) , akkor nagyobb értéket kapunk csoporton belüli variancia mint egy pontosabb elemzésben további nemek szerinti alcsoportosítással (a csoporton belüli átlag 2, a teljes csoporton belüli négyzetösszeg pedig SS = 2+2+2+2 = 8).

Tehát egy további tényező, a nem bevezetésével a reziduális variancia csökkent. Ennek az az oka, hogy a férfiak átlaga kisebb, mint a női átlag, és ez az átlagkülönbség növeli az általános csoporton belüli változékonyságot, ha a nemet nem vesszük figyelembe. A hibavariancia szabályozása növeli a teszt érzékenységét (teljesítményét).

Ez a példa a varianciaanalízis másik előnyét mutatja be a szokásos kétmintás t-próbához képest. A varianciaanalízis lehetővé teszi az egyes tényezők tanulmányozását más tényezők értékeinek szabályozásával. Valójában ez a fő oka annak, hogy nagyobb statisztikai ereje van (kisebb mintaméretre van szükség az értelmes eredmények eléréséhez). Emiatt a varianciaanalízis még kis mintákon is statisztikailag szignifikánsabb eredményt ad, mint egy egyszerű t-próba.

A varianciaanalízis olyan statisztikai módszerek összessége, amelyek az egyes jellemzők és a vizsgált tényezők közötti kapcsolatra vonatkozó, kvantitatív leírással nem rendelkező hipotézisek tesztelésére, valamint a tényezők befolyásának és kölcsönhatásuk mértékének megállapítására szolgálnak. A szakirodalomban gyakran ANOVA-nak nevezik (az angol Analysis of Variations névből). Ezt a módszert először R. Fischer dolgozta ki 1925-ben.

A varianciaanalízis típusai és kritériumai

Ezt a módszert a minőségi (nominális) jellemzők és a mennyiségi (folyamatos) változó közötti kapcsolat vizsgálatára használják. Valójában a több minta számtani átlagának egyenlőségére vonatkozó hipotézist teszteli. Így paraméteres kritériumnak tekinthető több minta középpontjainak egyidejű összehasonlítására. Ha ezt a módszert két mintára alkalmazzuk, akkor a varianciaanalízis eredménye megegyezik a Student-féle t-próba eredményeivel. Más kritériumoktól eltérően azonban ez a tanulmány lehetővé teszi a probléma részletesebb tanulmányozását.

A statisztika varianciaanalízise a törvényen alapul: az egyesített minta eltéréseinek négyzetösszege megegyezik a csoporton belüli eltérések négyzetösszegével és a csoportközi eltérések négyzetösszegével. A vizsgálathoz Fisher-tesztet használunk a különbség szignifikancia megállapítására csoportok közötti eltérések a csoporton belülről. Ehhez azonban szükséges az eloszlás normalitása és a minták homoszkedaszticitása (varianciaegyenlősége). Különbséget kell tenni az egydimenziós (egytényezős) varianciaanalízis és a többváltozós (többtényezős) között. Az első figyelembe veszi a vizsgált érték függőségét egy attribútumtól, a második - egyszerre többtől, és lehetővé teszi a köztük lévő kapcsolat azonosítását is.

Tényezők

A tényezőket kontrollált körülményeknek nevezzük, amelyek befolyásolják a végeredményt. Feldolgozási szintjét vagy módszerét annak az értéknek nevezzük, amely ennek az állapotnak a konkrét megnyilvánulását jellemzi. Ezeket az értékeket általában névleges vagy ordinális mérési skálán adják meg. A kimeneti értékeket gyakran mennyiségi vagy ordinális skálán mérik. Aztán ott van a probléma, hogy a kimeneti adatokat olyan megfigyelések sorozatába csoportosítsuk, amelyek megközelítőleg azonos számértékeknek felelnek meg. Ha a csoportok száma túl nagy, akkor előfordulhat, hogy a bennük lévő megfigyelések száma nem elegendő ahhoz, hogy megbízható eredményeket kapjunk. Ha a számot túl kicsire vesszük, az a rendszerre gyakorolt ​​befolyás alapvető jellemzőinek elvesztéséhez vezethet. Az adatok csoportosításának konkrét módja az értékek változásának mértékétől és természetétől függ. Az egyváltozós elemzésben az intervallumok számát és méretét leggyakrabban az egyenlő intervallumok elve vagy az egyenlő gyakoriság elve határozza meg.

A diszperzióanalízis feladatai

Tehát vannak esetek, amikor két vagy több mintát kell összehasonlítania. Ekkor célszerű a varianciaanalízist használni. A módszer neve arra utal, hogy a következtetések a variancia összetevőinek vizsgálata alapján készülnek. A vizsgálat lényege, hogy a mutató általános változását olyan komponensekre osztják, amelyek megfelelnek az egyes tényezők hatásának. Tekintsünk néhány olyan problémát, amelyeket egy tipikus varianciaanalízis megold.

1. példa

A műhelyben számos szerszámgép található - automata gépek, amelyek egy adott alkatrészt gyártanak. Az egyes alkatrészek mérete véletlenszerű érték, amely az egyes gépek beállításaitól és az alkatrészek gyártási folyamata során előforduló véletlenszerű eltérésektől függ. Az alkatrészek méretméréseiből meg kell határozni, hogy a gépek egyformán vannak-e beállítva.

2. példa

Az elektromos készülékek gyártása során különféle típusú szigetelőpapírokat használnak: kondenzátoros, elektromos stb. A készüléket különféle anyagokkal lehet impregnálni: epoxigyanta, lakk, ML-2 gyanta stb. A szivárgások vákuum alatt eltávolíthatók magas vérnyomás, melegítéskor. Impregnálható lakkba merítéssel, folyamatos lakkáram alatt stb. Az elektromos készülék egészét egy bizonyos vegyülettel öntik, amelyből több lehetőség is van. A minőségi mutatók a szigetelés dielektromos szilárdsága, a tekercs túlmelegedési hőmérséklete működési módban és számos más. Az eszközök gyártási technológiai folyamatának kialakítása során meg kell határozni, hogy a felsorolt ​​tényezők mindegyike hogyan befolyásolja az eszköz teljesítményét.

3. példa

A trolibusztelep több trolibusz útvonalat szolgál ki. Különböző típusú trolibuszokat üzemeltetnek, 125 ellenőr szedi a viteldíjat. A depó vezetését érdekli a kérdés: hogyan lehet összehasonlítani az egyes irányítók gazdasági teljesítményét (bevételét) a különböző útvonalak, különböző típusú trolibuszok ismeretében? Hogyan határozható meg egy bizonyos típusú trolibuszok egy adott útvonalon történő indításának gazdasági megvalósíthatósága? Hogyan állapíthatunk meg ésszerű követelményeket a kalauz által az egyes útvonalakon a különböző típusú trolibuszokon elért bevétel összegére?

A módszer kiválasztásának feladata, hogy az egyes tényezők végeredményére gyakorolt ​​hatásról minél több információt szerezzünk, meghatározzuk az ilyen hatások számszerű jellemzőit, megbízhatóságát minimális költséggel és a lehető legrövidebb idő alatt. A diszperzióanalízis módszerei lehetővé teszik az ilyen problémák megoldását.

Egyváltozós elemzés

A tanulmány célja annak felmérése, hogy egy adott eset milyen hatást gyakorol az elemzett felülvizsgálatra. Az egyváltozós elemzés másik feladata lehet két vagy több körülmény egymással való összehasonlítása annak érdekében, hogy meghatározzuk a felidézésre gyakorolt ​​hatásuk különbségét. Ha a nullhipotézist elutasítják, akkor a következő lépés a számszerűsítés és az összeállítás konfidencia intervallumok a kapott jellemzőkre. Abban az esetben, ha a nullhipotézist nem lehet elvetni, általában elfogadják, és következtetést vonnak le a hatás természetéről.

Az egyirányú varianciaanalízis nem-paraméteres analóggá válhat rang módszer Kruskal-Wallis. William Kruskal amerikai matematikus és Wilson Wallis közgazdász dolgozta ki 1952-ben. Ez a teszt azt a nullhipotézist kívánja tesztelni, hogy a befolyás hatása a vizsgált mintákra egyenlő az ismeretlen, de egyenlő átlagértékekkel. Ebben az esetben a minták számának kettőnél többnek kell lennie.

A Jonkhier (Jonkhier-Terpstra) kritériumot egymástól függetlenül T. J. Terpstrom holland matematikus 1952-ben és E. R. Jonkhier brit pszichológus 1954-ben javasolta. Akkor alkalmazzák, ha előre ismert, hogy a rendelkezésre álló eredménycsoportok az eredmény növekedésével vannak rendezve. a vizsgált tényező befolyása, amelyet ordinális skálán mérnek.

M - a Bartlett-kritérium, amelyet Maurice Stevenson Bartlett brit statisztikus javasolt 1937-ben, a nullhipotézis tesztelésére szolgál több normál varianciáinak egyenlőségéről. populációk, amelyből a vizsgált mintákat veszik, általában eltérő térfogatúak (minden minta számának legalább négynek kell lennie).

G a Cochran-teszt, amelyet az amerikai William Gemmel Cochran fedezett fel 1941-ben. Ezt a nullhipotézist a normál populációk varianciáinak egyenlőségére vonatkozóan, azonos méretű független minták esetén használják.

A nem-paraméteres Levene-teszt, amelyet Howard Levene amerikai matematikus javasolt 1960-ban, a Bartlett-teszt alternatívája olyan körülmények között, ahol nem biztos, hogy a vizsgált minták engedelmeskednek. normális eloszlás.

1974-ben Morton B. Brown és Alan B. Forsythe amerikai statisztikusok egy tesztet javasoltak (Brown-Forsyth teszt), amely némileg eltér a Levene-teszttől.

Kétirányú elemzés

A kétirányú varianciaanalízist az összekapcsolt normál eloszlású mintákhoz használják. A gyakorlatban gyakran alkalmazzák ennek a módszernek az összetett táblázatait, különösen azokat, amelyekben minden cella rögzített szintű értékeknek megfelelő adathalmazt (ismételt mérést) tartalmaz. Ha a kétirányú varianciaanalízis alkalmazásához szükséges feltevések nem teljesülnek, akkor a Milton Friedman amerikai közgazdász által 1930 végén kidolgozott nem-paraméteres Friedman rangtesztet (Friedman, Kendall és Smith) alkalmazzuk. kritérium nem függ az elosztás típusától.

Csak azt feltételezzük, hogy a mennyiségek eloszlása ​​azonos és folytonos, és maguk is függetlenek egymástól. A nullhipotézis tesztelésekor a kimeneti adatokat egy téglalap alakú mátrix formájában jelenítjük meg, amelyben a sorok a B faktor szintjeinek, az oszlopok pedig az A szinteknek felelnek meg. A táblázat (blokk) minden cellája lehet a a paraméterek mérésének eredménye egy objektumon vagy objektumok csoportján mindkét tényező szintjének állandó értékével. Ebben az esetben a megfelelő adatok egy bizonyos paraméter átlagos értékeként jelennek meg a vizsgált minta összes mérésére vagy tárgyára vonatkozóan. A kimeneti kritérium alkalmazásához a mérések közvetlen eredményeitől el kell lépni a rangjuk felé. A rangsorolást minden sorra külön-külön végzik el, vagyis az értékeket minden rögzített értékhez rendelik.

A Page teszt (L-teszt), amelyet E. B. Page amerikai statisztikus javasolt 1963-ban, a nullhipotézis tesztelésére szolgál. Nagy minták esetén az oldal közelítését használjuk. A megfelelő nullhipotézisek valóságától függően engedelmeskednek a standard normális eloszlásnak. Abban az esetben, ha a forrástábla sorai azonos értékűek, akkor az átlagos rangokat kell használni. Ebben az esetben a következtetések pontossága annál rosszabb, minél nagyobb az ilyen egybeesések száma.

Q – Cochran-kritérium, V. Cochran javasolta 1937-ben. Olyan esetekben használatos, amikor a homogén alanyok csoportja kettőnél több hatásnak van kitéve, és két válaszlehetőség lehetséges - feltételesen negatív (0) és feltételesen pozitív (1). . A nullhipotézis a hatáshatások egyenlőségéből áll. A kétirányú varianciaanalízis lehetővé teszi a feldolgozási hatások meglétének meghatározását, de nem teszi lehetővé annak meghatározását, hogy mely oszlopoknál áll fenn ez a hatás. A probléma megoldására a módszer több egyenlet Scheffe a linkelt mintákhoz.

Többváltozós elemzés

A többváltozós varianciaanalízis problémája akkor merül fel, ha két vagy több feltételnek egy bizonyos valószínűségi változóra gyakorolt ​​hatását kell meghatározni. A tanulmány egy eltartott jelenlétét írja elő valószínűségi változó, különbség- vagy arányskálában mérve, és több független érték, amelyek mindegyike névskálában vagy rangsorban van kifejezve. Az adatok diszperziós elemzése a matematikai statisztika egy meglehetősen fejlett ága, amely számos lehetőséget kínál. A vizsgálat fogalma mind az egyváltozós, mind a többváltozós vizsgálatokban közös. A lényege az teljes variancia komponensekre osztva, ami megfelel az adatok bizonyos csoportosításának. Minden adatcsoportnak megvan a maga modellje. Itt csak a megértéshez szükséges főbb rendelkezéseket vesszük figyelembe gyakorlati használat a leggyakrabban használt opciókat.

A varianciafaktor-analízis gondos odafigyelést igényel a bemeneti adatok gyűjtése és bemutatása, különös tekintettel az eredmények értelmezésére. Ellentétben az egytényezővel, amelynek eredményei feltételesen egy bizonyos sorrendbe helyezhetők, a kéttényezős eredményei összetettebb bemutatást igényelnek. Még nehezebb helyzet áll elő, ha három, négy vagy több körülmény áll fenn. Emiatt a modell ritkán tartalmaz háromnál (négy) több feltételt. Példa erre a rezonancia előfordulása az elektromos kör bizonyos kapacitásának és induktivitásának értékénél; megnyilvánulása kémiai reakció egy bizonyos elemkészlettel, amelyből a rendszer épül; anomális hatások előfordulása összetett rendszerekben a körülmények bizonyos egybeesése mellett. Az interakció jelenléte gyökeresen megváltoztathatja a rendszer modelljét, és néha a kísérletező által kezelt jelenségek természetének újragondolásához vezethet.

Többváltozós varianciaanalízis ismételt kísérletekkel

A mérési adatok gyakran nem két, hanem több tényező szerint csoportosíthatók. Tehát, ha figyelembe vesszük a trolibusz kerekei gumiabroncsainak élettartamának diszperziós elemzését, figyelembe véve a körülményeket (a gyártó és az abroncshasználat útvonala), akkor külön feltételként kiemelhetjük azt az évszakot, amelyben a gumiabroncsokat használják. használt (nevezetesen: téli és nyári üzem). Ennek eredményeként a háromtényezős módszer problémája lesz.

Több feltétel fennállása esetén a megközelítés ugyanaz, mint a kétirányú elemzésnél. A modell minden esetben egyszerűsítésre törekszik. A két tényező kölcsönhatásának jelensége ritkábban jelenik meg, a hármas kölcsönhatás pedig csak kivételes esetekben fordul elő. Tartalmazza azokat az interakciókat, amelyekről van korábbi információ, és jó okok vannak ezek figyelembevételére a modellben. Az egyes tényezők elkülönítésének és figyelembe vételének folyamata viszonylag egyszerű. Ezért gyakran felmerül a vágy, hogy több körülményt is kiemeljünk. Nem szabad elragadtatni magát ezzel. Hogyan több feltétel, annál kevésbé lesz megbízható a modell, és annál nagyobb a hiba valószínűsége. Maga a modell, amely nagyszámú független változót tartalmaz, meglehetősen nehezen értelmezhetővé és a gyakorlati felhasználás szempontjából kényelmetlenné válik.

A varianciaanalízis általános ötlete

A statisztika varianciaanalízise a különböző egyidejű körülményektől függő megfigyelési eredmények megszerzésének és befolyásuk felmérésének módszere. Tényezőnek nevezzük azt a szabályozott változót, amely megfelel a vizsgált tárgyra gyakorolt ​​hatás módszerének, és egy bizonyos idő alatt bizonyos értéket szerez. Lehetnek minőségiek és mennyiségiek. A mennyiségi feltételek szintjei egy numerikus skálán bizonyos értéket kapnak. Ilyen például a hőmérséklet, a préselési nyomás, az anyag mennyisége. A minőségi tényezők különböző anyagok, különböző technológiai módszerek, készülékek, töltőanyagok. Szintjük megfelel a névskálának.

A minőséghez tartozik még a csomagolóanyag típusa, a gyógyszerforma tárolási feltételei. A mennyiségi értékű, de nehezen szabályozható nyersanyagok őrlési fokát, a granulátum frakcionált összetételét is ésszerű mennyiségi skála alkalmazása esetén feltüntetni. A minőségi tényezők száma a gyógyszerforma típusától, valamint a gyógyászati ​​anyagok fizikai és technológiai tulajdonságaitól függ. Például kristályos anyagokból közvetlen préseléssel tablettákat kaphatunk. Ebben az esetben elegendő a csúszó- és kenőanyagok kiválasztását elvégezni.

Példák a különböző típusú adagolási formák minőségi tényezőire

  • Tinktúrák. Az extrahálószer összetétele, az extraháló típusa, az alapanyag-előkészítés módja, az előállítás módja, a szűrési mód.
  • Kivonatok (folyékony, sűrű, száraz). Az extrahálószer összetétele, az extrakció módja, a beépítés módja, az extraháló és a ballasztanyagok eltávolításának módja.
  • Tabletták. Segédanyagok, töltőanyagok, szétesést elősegítő anyagok, kötőanyagok, kenőanyagok és kenőanyagok összetétele. A tabletták beszerzésének módja, a technológiai berendezés típusa. A héj típusa és alkotóelemei, filmképzők, pigmentek, színezékek, lágyítók, oldószerek.
  • injekciós oldatok. Oldószer típusa, szűrési módja, stabilizátorok és tartósítószerek jellege, sterilizálás körülményei, ampullák töltési módja.
  • Kúpok. A kúpalap összetétele, a kúpok, töltőanyagok, csomagolás beszerzésének módja.
  • Kenőcsök. Az alap összetétele, szerkezeti komponensei, a kenőcs elkészítési módja, berendezés típusa, csomagolás.
  • Kapszulák. A héj anyagának típusa, a kapszulák előállítási módja, a lágyító, tartósítószer, festék típusa.
  • Liniments. Az előállítás módja, összetétele, berendezés típusa, emulgeálószer típusa.
  • Felfüggesztések. Oldószer típusa, stabilizátor típusa, diszperziós módszer.

Példák a tablettagyártási folyamatban vizsgált minőségi tényezőkre és azok szintjeire

  • Sütőpor. Burgonyakeményítő, fehér agyag, nátrium-hidrogén-karbonát és citromsav keveréke, bázikus magnézium-karbonát.
  • kötőoldat. Víz, keményítőpaszta, cukorszirup, metil-cellulóz-oldat, hidroxi-propil-metil-cellulóz-oldat, polivinil-pirrolidon-oldat, polivinil-alkohol-oldat.
  • csúszó anyag. Aerosil, keményítő, talkum.
  • Töltőanyag. Cukor, glükóz, laktóz, nátrium-klorid, kalcium-foszfát.
  • Kenőanyag. Sztearinsav, polietilénglikol, paraffin.

A diszperzióelemzés modelljei az állam versenyképességi szintjének vizsgálatában

Az állam állapotának megítélésének egyik legfontosabb kritériuma, amely szerint jólétének és társadalmi-gazdasági fejlettségének mértékét értékelik, a versenyképesség, vagyis az államban rejlő tulajdonságok összessége. nemzetgazdaság, amelyek meghatározzák az állam versenyképességét más országokkal. Miután meghatároztuk az állam helyét és szerepét a világpiacon, világos stratégiát lehet kialakítani a nemzetközi szintű gazdasági biztonság biztosítására, mert ez a kulcsa az Oroszország és a világpiac összes szereplője: a befektetők közötti pozitív kapcsolatoknak. , hitelezők, állami kormányok.

Az államok versenyképességi szintjének összehasonlítása érdekében az országokat összetett indexekkel rangsorolják, amelyek különböző súlyozott mutatókat tartalmaznak. Ezek az indexek a kulcstényezők amelyek befolyásolják a gazdasági, politikai stb. helyzetet. Az állam versenyképességének tanulmányozására szolgáló modellek komplexuma lehetővé teszi a többváltozós statisztikai elemzés módszereinek alkalmazását (különösen ez a varianciaanalízis (statisztika), az ökonometriai modellezés, a döntéshozatal), és a következő fő szakaszokat tartalmazza:

  1. Indikátorok-mutatók rendszerének kialakítása.
  2. Az állam versenyképességi mutatóinak értékelése, előrejelzése.
  3. Az államok versenyképességét jelző indikátorok-indikátorok összehasonlítása.

És most nézzük meg a komplexum egyes szakaszaihoz tartozó modellek tartalmát.

Az első szakaszban szakértői vizsgálati módszerek segítségével kialakítják az állam versenyképességének felmérésére szolgáló gazdasági mutatók-mutatók ésszerű készletét, figyelembe véve fejlődésének sajátosságait a nemzetközi minősítések és a statisztikai osztályok adatai alapján, tükrözve az állam állapotát. a rendszer egészét és annak folyamatait. Ezen mutatók kiválasztását az indokolja, hogy ki kell választani azokat, amelyek a gyakorlat szempontjából a legteljesebben lehetővé teszik az állam szintjének, befektetési vonzerejének, valamint a meglévő potenciális és tényleges veszélyek relatív lokalizációjának lehetőségét.

A nemzetközi minősítési rendszerek fő mutatói-mutatói az indexek:

  1. Globális versenyképesség (GCC).
  2. Gazdasági szabadság (IES).
  3. Human Development (HDI).
  4. A korrupció észlelése (CPI).
  5. Belső és külső fenyegetések (IVZZ).
  6. A nemzetközi befolyás lehetősége (IPIP).

Második fázis rendelkezik az állam versenyképességének mutatóinak nemzetközi minősítések szerinti értékeléséről és előrejelzéséről a világ vizsgált 139 államára vonatkozóan.

Harmadik szakasz biztosítja az államok versenyképessége feltételeinek összehasonlítását a korrelációs és regressziós elemzés módszereivel.

A vizsgálat eredményeit felhasználva meg lehet határozni a folyamatok jellegét általában és az állam versenyképességének egyes összetevőire vonatkozóan; tesztelje a hipotézist a tényezők hatásáról és azok kapcsolatáról a megfelelő szignifikanciaszinten.

A javasolt modellkészlet megvalósítása nemcsak a versenyképességi szint jelenlegi helyzetének felmérését teszi lehetővé, hanem befektetési vonzerőállamok, hanem a gazdálkodás hiányosságainak elemzésére, a hibás döntések hibáinak megelőzésére, az állam válságának kialakulásának megelőzésére.



hiba: A tartalom védett!!