Válassza az Oldal lehetőséget

A variancia konfidencia intervalluma, ha az átlag ismert. A normál eloszlás varianciájának konfidencia intervalluma

Itt az átlagot ismert fix számnak tekintjük, a variancia pedig ismeretlen paraméterként működik. Tegyük fel

Mivel --, szabványos normál eloszlású. Így a függvénynek van egy olyan szabadságfok-eloszlása, amely semmilyen módon nem függ az ismeretlen paramétertől. Ennek az eloszlásnak kvantiliseivel jelölve és rögzítve néhányat, úgy, hogy , eljutunk az egyenlőtlenséghez

amely megelégszik a valószínűséggel . Honnan kapjuk a konfidencia intervallumot:

Ismeretlen átlagú variancia konfidencia intervalluma

Vegye figyelembe, hogy a függvény úgy van definiálva, hogy egy minta esetén értékei csak a paramétertől függenek. Egy valószínűségi változó eloszlásával kapcsolatban , akkor Fisher tétele szerint (lásd 8.3) ez a szabadságfokok -eloszlása, és ezért nem függ ismeretlen paraméterektől. Olyan javítás , és a (47) szerinti érveléssel a következő konfidenciaintervallumhoz jutunk:

amely a (30) jelölés segítségével a következőképpen írható át

Az ismeretlen varianciájú átlag konfidencia intervalluma

Az előző bekezdéshez hasonlóan mindkét paraméter ismeretlennek minősül, a zavaró paraméter a zavaró paraméter. Fisher tétele szerint

És

függetlenek, és eloszlásaik, illetve szabadságfok-eloszlásaik vannak. Ezért az arány

szabadságfokokkal rendelkező Student-eloszlással rendelkezik. Válasszunk ki egy függvényt egyenlő a jobb oldallal (48):

ahol a (30) képlettel meghatározott minta szórása. A funkció nem függ kifejezetten a zavaró paramétertől. A szabadság fokát a Student-eloszlás kvantilisén keresztül jelölve azt kapjuk, hogy az egyenlőtlenség

valószínűséggel teljesül . Innen megkapjuk a konfidencia intervallumot:

Mivel a Student-eloszlás szimmetrikus, ezért a 3.3

Ezért a konfidenciaintervallum így írható fel

Így a minta átlaga ennek az intervallumnak a közepe.

8.2. példa

Nézzük a 6.4 példát. Tegyük fel hogy a minták mindegyikéből származnak normál disztribúciók a ismeretlen paramétereket – és ennek megfelelően. (Arról, hogy mi alapján tehetünk ilyen feltételezést, később a 9.5-ben lesz szó.)

Célunk a GS50 acél elméleti széntartalmára és szakítószilárdságára vonatkozó konfidencia intervallumok megtalálása. Emlékezzünk arra, hogy az egyes minták mérete. Javítsuk ki megbízhatósági valószínűség, közel az egységhez, mondjuk. Az oldalon található Hallgatói eloszlási táblázat segítségével hozzávetőlegesen ezt határozzuk meg. A oldalon a 6.5 példában talált értékeket felidézve kiszámítjuk

és a (49) képlet segítségével megkapjuk a százalék -konfidencia intervallumot széntartalom

és - az érték konfidencia intervalluma szakítószilárdság

12. sz. laboratóriumi munka. Értékeléselmélet alapjai

A statisztikus a véletlenszerű változékonyságnak alávetett adatokkal foglalkozik. Viselkedésüket egy bizonyos valószínűség-eloszlási törvény jellemzi. Egy ilyen törvény általában ismeretlen mennyiségeket tartalmaz, amelyeket a törvény paramétereinek tekintünk. A megfigyelt adatok véletlenszerű változékonysága miatt ezek alapján lehetetlen a paraméterek teljesen pontos értékét megadni. Csak hozzávetőleges értékekkel kell megelégednünk. Tehát a matematikai statisztikus a következő mennyiségekkel dolgozik: - egy valószínűségi változó, amelyet soha nem figyel meg, de amelyet az általa vizsgált adatok „lelkének”, az őket kiváltó oknak tekint. Ezt az értéket több paraméter határozza meg; - a vizsgált adatok, amelyeket egy valószínűségi változó realizálásaként kapunk. Például egy valószínűségi változó a pontos idő. Megvalósításai a statisztikus számára elérhető óraleolvasások. A statisztikus feladata, hogy n óra t 1,...,t n leolvasását felhasználva állítsa be az időt a lehető legpontosabban. Emellett köteles jellemezni a megállapított érték pontosságát. A kívánt értéket t = t 0 + ξ(a,σ) alakban értékeli ki, ahol t 0 a valódi időpont a kutatás időpontjában, ξ(a,σ) - valószínűségi változó, a valós értéktől való eltérést jellemzi, t 0 , a, σ paraméterek, a ξ értéket az eloszlási törvény jellemzi, annak a valószínűsége, hogy különböző értékeket vesz fel. A becslés a statisztikában a megfigyelt adatok alapján egy paraméter közelítő értékének kiszámításának szabálya. A becslés egy paraméter hozzávetőleges értéke, amelyet a megfigyelt adatokból találtak meg. A gyakorlati felhasználásra szánt becslések összeállításakor három fő követelményt támasztanak a becslésekkel szemben:

    pontosság, vagyis a paraméter valódi értékéhez való közelség, a példában ξ(a,σ) kicsinek kell lennie;

    torzítatlanság, vagyis az a követelmény, hogy a becslés matematikai elvárása egyenlő legyen a példában szereplő paraméter valódi értékével, ξ(a,σ) átlagosan nullával egyenlő;

    konzisztencia, vagyis az a követelmény, hogy a megfigyelések számának növekedésével a becslés valószínűsége konvergáljon a paraméter valódi értékéhez. A példában nagy számú óra n esetén ξ(a,σ) értékének nullára kell mutatnia, egységnyi valószínűséggel.

Nincsenek minden szempontból legjobb becslések. Például az aritmetikai átlag, egy valószínűségi változó átlagos értékének széles körben használt becslése, az a tulajdonsága, hogy optimális a normális eloszlású adatokhoz. Hibához vezet azonban, ha az adatok között vannak kiugró értékek, vagyis élesen kiugró értékek. Ilyen kibocsátást a gazdaságban a durva mérési hibák vagy elírások generálnak, amelyekben a rubel és kopejka közötti pont eltűnhet, és a bérek százszorosára nőnek. Tekintsük azt a véletlenszerű folyamatot, amely Nagy-Britannia történetéhez kapcsolódik, amikor Nagy-Britannia térképére felrajzolják birtokainak finomított határait, szétszórva a világ minden részén. Ismeretes, hogy a Föld bármely pontját két koordináta jellemez - szélesség és hosszúság. Ma már minden iskolás hallott olyan műholdas műszerekről, amelyek akár méteres pontossággal meghatározzák a Föld bármely pontját. Azonban akkoriban még egy ilyen eszköz sem segített volna a tengerészeken, mivel egyetlen „referencia” műholdat sem észlelt volna az égen. A szélességi fokot közvetlenül a világítótestek horizont feletti magasságából határozták meg egy „szektáns” eszközzel, amely hasonló egy modern teodolithoz (teleszkóp plusz szögmérő). A hosszúság a földgömb forgási szöge, amelynél a lokális meridián és a hagyományos nullaként választott Greenwich-meridián egyesül. A Föld csaknem egy nap alatt 360°-os fordulatot tesz, azaz egy óra alatt 15°-ot, 4 perc alatt 1°-ot elfordul. A hosszúság meghatározásához pontosan ismernie kell a helyi és a greenwichi időt. Ha a navigátor azt mondja a kapitánynak: „Helyi dél, uram”, és a kapitány tudja az adott pillanatban Greenwichben töltött időt, akkor az időkülönbség 4 perccel osztva határozza meg a terület hosszúságát fokban. Ma minden egyszerű lenne – hívd fel Greenwich-et, és tudd meg az idejét. De akkor még nem találták fel a rádiót. Ha lett volna a hajón a perc töredékét mozgó kvarcóra évente, akkor sem lett volna gond, de az akkoriban létező legjobb kronométerek nem adták volna meg a hosszúságméréshez szükséges pontosságot. A több hónapos hajózás során több tíz perccel távolodtak el a pontos időtől. Amikor pedig 1831-ben a Beagle hajó világkörüli útra indult, hogy térképeket állítson össze, a hajó kapitánya, Fitz Roy, a felvilágosult és tanult ember 24(!) tengeri kronométert vitt magával. Mindegyik kronométer a saját „greenwichi idejét” mutatta. Ebben a tanulmányban a valószínűségi változó az a pillanat, amikor a navigátor valamilyen égitestből meghatározta a pontos helyi időt. A mért valószínűségi változó "lelke" az adott pillanatban Greenwichben érvényes valós idő. Ezt a mennyiséget ξ-vel jelöljük. Ennek a mennyiségnek az értéke soha nem ismert. A valószínűségi változó megfigyelt értékei (különböző) kronométerek leolvasásai. Mindegyikük elkövetett néhány hibát, de összességében a közös „lelket” követték, ráerőltették a sajátjukat. véletlenszerű hiba. A valószínűségi változó becslése a greenwichi idő, amelyet a kapitány a megfigyelt adatokból feltételezett. Legyenek az x i, i = 1,...,n valószínűségi változók egy ξ valószínűségi változó realizációi, azaz azonos eloszlásúak (egy „lélek”), és bármely i-re a leolvasások átlagértéke egyenlő ugyanarra a számra: E( x i) = E(ξ). Ennek az állításnak a jelentése: tervezési problémák miatt nem lehet minden óra lemaradva vagy sietni. Átlagosan ugyanannyira valószínű, hogy sietnek vagy lemaradnak. Ezenkívül hagyja, hogy függetlenek legyenek. Más szóval, nincs semmi közös a csoportjukban. Így egy matróz, aki az óraleolvasásokat rögzíti, egy sorozatban rögzítheti azokat. Ekkor az utolsó leolvasást egy perccel később rögzítik, mint az elsőt. Vagy akár órákig is lóghatnak meleg helyen, és együtt rohangálnak a hőségtől. Az a feltételezés, hogy nincs ilyen jelenség, összhangban van a függetlenség feltételével a vizsgálatok során. A legegyszerűbb becslési probléma egy esemény valószínűségének meghatározása, például annak, hogy egy valódi (nem feltétlenül helyes) érme képpel felfelé fog landolni. Szinte soha nem lehet közvetlenül meghatározni egy esemény valószínűségét. Nincs olyan univerzális módszer, amely lehetővé tenné, hogy egy tetszőleges esemény jelezze annak valószínűségét. Az A esemény valószínűségét meg lehet becsülni, ha megengedhető független ismételt tesztek elvégzése, amelyek során ez az esemény állandó valószínűséggel következik be. Maradjon változatlan az A esemény p = P(A) valószínűsége mind az n próbában, és az egyes kísérletek eredménye független legyen a többitől. Jelöljük m-rel azon kísérletek véletlenszámát teljes szám n amelyben A bekövetkezett Azt mondják, hogy m a „sikerek” száma n Bernoulli-próbában. A valószínűség statisztikai definíciója szerint nagy n esetén az A esemény m/n relatív gyakorisága megközelítőleg egyenlő az A esemény bekövetkezésének valószínűségével, azaz m/n ~ p, ahol p = P(A). Bizonyítsuk be, hogy ez Kolmogorov axiomatikájából következik. A matematikai elemzésben a sorozat határértékének szigorú fogalmát alkalmazzák: kellően nagy számú sorozattag esetén értéke tetszőlegesen a határérték közelébe tehető. Ez a meghatározás nem felel meg igazi életet, ahol ritkán fordulnak elő teljesen hihetetlen események. Például az ősi kaotikus levesből egy baktérium bukkan elő, amely képes önmagát szaporítani. Vagy egy hal alkot valamit, amire eleinte évmilliókig nincs szüksége (de fejlődik), aztán szárnysá válik. Vagy egy egész várost (vagy országot) elönt a víz. A valószínűségszámításban a határ fogalmát más értelemben értelmezik, mint a matematikai elemzésben. A valószínűségszámítás definíciója közelebb áll az élethez. Nem tiltja, hogy a sorozat egy pontján olyan szám legyen, amely élesen különbözik a többitől. Egy u n valószínűségi változók sorozata p-hez konvergál, ha bármely ε > 0 szám esetén annak a valószínűsége, hogy a különbség modulusa |u n - p| mivel n → ∞ kisebb, mint ε, egységre hajlik:

A valószínűségszámításban egyetlen esemény sem biztos, de az esemény: |u n - р| ≤ ε gyakorlatilag megbízható kellően nagy n esetén. Bizonyítsuk be Csebisev egyenlőtlenségét. Legyen ξ egy valószínűségi változó, amelynek matematikai elvárása E(ξ) = a és variancia D(ξ) = σ², ε pozitív szám. Ekkor annak az eseménynek a valószínűsége, hogy a központosított (E(ξ) - a) és normalizált valószínűségi változó meghaladja ε-t, kisebb, mint ε -2:

Valóban, σ² = E(ξ - a)². A jobb oldali átlag kiszámításakor két ξ értéktartományt választunk ki. Azokra a ξ-ekre, amelyekre |ξ - а|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >εσ, összeg (vagy integrál):

Érdekes speciális eset: σ = 0. Nyilvánvaló, hogy |ξ - a| = 0, azaz ξ = a. Bizonyítsuk be Csebisev tételét. Legyenek x 1,..., x n független, azonos eloszlású valószínűségi változók, amelyeknek matematikai elvárása és varianciája van. Azaz minden x i egy ξ valószínűségi változó realizációja, és E(ξ) = E(x i) = a, D(ξ) = D(x i) = σ². Ezután bármely ε > 0 esetén:

Bizonyíték. A számtani átlag szórása:

Tekintsük az η n valószínűségi változót, amely n megfigyelés számtani átlaga. Az átlaga és a szórása . η n megfigyelhető realizációi a következők. Az η n valószínűségi változóra vonatkozó Csebisev-egyenlőtlenségnek megfelelően annak a valószínűsége, hogy az átlagos értéktől nagyobb mértékben tér el, nullára hajlamos:

Az ellenkező esemény valószínűsége 1-re hajlamos nagy n esetén: P(|η n - a|) → 1. Ez azt jelenti, hogy az n valószínűségi változók sorozata valószínűség szerint a-hez konvergál. Térjünk vissza az idő mérésére a Beagle-en. Az egyes kronométerek x i, i = 1,...,n leolvasása a többi műszertől független mérés. Nyilvánvaló, hogy a kronométert úgy tervezték, hogy működésében ne legyen szisztematikus hiba. Ez azt jelenti, hogy a kronométerek egyes példái „mennek előre”, mások „lemaradnak”, de ezek a hibák véletlenszerűek, egy adott minta gyártásához kapcsolódnak. Matematikailag ez azt jelenti, hogy az átlagos idő a valódi idő. A kronométerek tervezési és gyártási technológiájának minőségét az jellemzi, hogy a teljes termék mennyire egységes a pontosság szempontjából. Matematikailag ezt fejezi ki az egyes műszerek leolvasásának terjedése, i.e. valószínűségi változók varianciája x i . Az átlag szórása n = 24-szer kisebb, mint egy egyedi kronométer diszperziója. Ezért a 24 kronométerből meghatározott „átlagidő” átlagosan közel 5-ször közelebb van a valódi időhöz, mint bármely egyedi kronométer ideje.

Használhatod ezt az űrlapot keressen, hogy megtalálja a szükséges feladatot. Írjon be egy szót, kifejezést a feladatból vagy annak számát, ha ismeri.


Csak ebben a részben keressen


Konfidencia intervallumok: a problémák megoldásainak listája

Konfidenciaintervallumok: elmélet és problémák

A bizalmi intervallumok megértése

Röviden mutassuk be a konfidenciaintervallum fogalmát, amely
1) a numerikus minta valamely paraméterét közvetlenül magának a mintának az adataiból becsüli meg,
2) γ valószínűséggel fedi le ennek a paraméternek az értékét.

Bizalmi intervallum paraméterhez X(γ valószínűséggel) formájú intervallumnak nevezzük, így , és az értékeket valamilyen módon a mintából számítják ki.

Általában az alkalmazott feladatokban a megbízhatósági valószínűséget γ = 0,9-nek veszik; 0,95; 0,99.

Tekintsünk egy n méretű mintát, amelyből készült lakosság, feltehetően a normál eloszlási törvény szerint oszlik el. Mutassuk meg, milyen képleteket használunk a kereséshez az eloszlási paraméterek konfidencia intervallumai - matematikai elvárásés diszperzió (szórás).

Konfidenciaintervallum a matematikai elvárásokhoz

1. eset. Az eloszlás varianciája ismert és egyenlő vele. Ezután a paraméter konfidenciaintervallumát a a következő formában van:
tösszefüggésnek megfelelően a Laplace-eloszlástáblázatból határozzuk meg

2. eset. Az eloszlás szórása ismeretlen; Ezután a paraméter konfidenciaintervallumát a a következő formában van:
, ahol a mintából, paraméterből számított mintaátlag t a Hallgatói eloszlási táblázatból határozzuk meg

Példa. Egy bizonyos mennyiség 7 mérése alapján megállapítottuk átlagos eredmények a mérések értéke 30, a minta variancia pedig 36. Keresse meg azokat a határokat, amelyeken belül a mért érték valódi értéke 0,99-es megbízhatósággal van.

Megoldás. Meg fogjuk találni . Ekkor a mért érték valódi értékét tartalmazó intervallum konfidenciahatárait a következő képlet segítségével találhatjuk meg:
, ahol a minta átlaga, a minta varianciája. Az összes értéket helyettesítjük, és a következőket kapjuk:

Variancia konfidencia intervallum

Úgy gondoljuk, hogy általánosságban elmondható, hogy a matematikai elvárás ismeretlen, és csak a variancia pontszerű elfogulatlan becslése ismert. Ekkor a konfidencia intervallum alakja a következő:
, Hol - táblázatokból meghatározott eloszlási kvantilisek.

Példa. 7 teszt adatai alapján került megállapításra a szórás értékelési értéke s=12. Határozza meg 0,9 valószínűséggel a diszperzió becsléséhez megszerkesztett konfidenciaintervallum szélességét.

Megoldás. Bizalmi intervallum egy ismeretlen populációs varianciához a következő képlettel lehet keresni:

Cseréljük és kapjuk:


Ekkor a konfidencia intervallum szélessége 465,589-71,708=393,881.

Valószínűségi konfidencia intervallum (arány)

1. eset. Legyen ismert a feladatban a minta mérete és a minta töredéke (relatív gyakoriság). Ekkor az általános részesedés (valós valószínűség) konfidenciaintervallumának alakja a következő:
, ahol a paraméter tösszefüggésnek megfelelően a Laplace-eloszlástáblázatból határozzuk meg.

2. eset. Ha a feladatban a mintavételezési sokaság teljes mérete is ismert, akkor az általános részarány (valós valószínűség) konfidenciaintervallumát a korrigált képlet segítségével találhatjuk meg:
.

Példa. Ismeretes, hogy Keresse meg azokat a határokat, amelyeken belül az általános részvény valószínűleg megtalálható.

Megoldás. A képletet használjuk:

Keressük meg a paramétert a feltételből , megkapjuk a Helyettesítőt a képletbe:


Az oldalon további példákat talál a matematikai statisztikák problémáira

A populáció átlagának konfidenciaintervallum határainak meghatározásához a következő lépéseket kell végrehajtania:

1) a kapott térfogatminta alapján n számítsa ki a számtani átlag számtani átlagát és standard hibáját képlet szerint:

;

2) állítsa be az 1-es megbízhatósági valószínűséget – α , a vizsgálat célja alapján;

3) a táblázat szerint t-A tanulói megoszlás (4. melléklet) keresse meg a határértéket t α szignifikanciaszinttől függően α és a szabadságfokok száma k = n – 1;

4) keresse meg a konfidenciaintervallum határait a képlet segítségével:

.

Jegyzet: Gyakorlatban tudományos kutatás, amikor egy kis mintás sokaság eloszlásának törvénye (n < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для hozzávetőlegeskonfidencia intervallum becslések.

Bizalmi intervallum at n≥ 30 a következő képlettel található:

,

Ahol u – a normalizált százalékpontja normál eloszlás, amelyek az 5.1. táblázatban találhatók.

8. Munkarend az V. szakaszban

1. Ellenőrizze a kis (n< 30) выборку, составленную из разностей парных значений результатов измерений исходного показателя скоростных качеств у «спортсменов» (эти результаты обозначены индексом В) и показателя, достигнутого после двухмесячных тренировок (эти результаты обозначены индексом Г).

2. Válasszon ki egy kritériumot, és értékelje a „sportolók” gyorsasági tulajdonságainak felgyorsítására alkalmazott edzésmódszer hatékonyságát.

Beszámoló a játék V. szakaszában végzett munkáról (minta)

Téma: Az edzéstechnika hatékonyságának felmérése.

Célok:

    Ismerkedjen meg a teszteredmények normál eloszlási törvényének jellemzőivel.

    Sajátítson el készségeket a mintaeloszlások normalitási tesztelésében.

    Sajátítson el készségeket a képzési módszerek hatékonyságának értékeléséhez.

    Tanuljon meg konfidencia-intervallumokat kiszámítani és megszerkeszteni kis minták általános aritmetikai átlagához.

Kérdések:

    Az edzéstechnika hatékonyságát értékelő módszer lényege.

    Normál elosztási törvény. Lényeg, jelentés.

    A normál eloszlási görbe alapvető tulajdonságai.

    A három szigma szabály és gyakorlati alkalmazása.

    Kis mintaeloszlás normalitásának felmérése.

    Milyen szempontok alapján és milyen esetekben hasonlítjuk össze a páronkénti függő minták átlagait?

    Mit jellemez a konfidencia intervallum?

Meghatározásának módszertana.

Jegyzet: 1. lehetőség: parametrikus kritériumPéldaként vegyük a sportolók edzés megkezdése előtti sebességi mutatójának mérési eredményeit az 5.2. táblázatban megadott (azokat a B index jelöli, ezeket a mérések eredményeként kaptukén színpadonüzleti játékok

) és két hónapos képzés után (ezeket a G index jelzi). A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d = én d N én d G IN

és meghatározzuk ezeknek a különbségeknek a négyzetét. Az adatokat beírjuk a számítási táblázatba 5.2. A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d 2

én d G 5.2. táblázat – Az értékek párosított különbségeinek négyzeteinek kiszámítása

én d N 5.2. táblázat – Az értékek párosított különbségeinek négyzeteinek kiszámítása

A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d = én d Nén d G 5.2. táblázat – Az értékek párosított különbségeinek négyzeteinek kiszámítása

A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d 2 , verte

, verte 2

Az 5.2. táblázat segítségével megtaláljuk a párosított különbségek számtani átlagát:

üt A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d Ezután kiszámítjuk az eltérések négyzetes összegét képlet szerint:

-tól A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d :

Határozzuk meg a minta szórását

üt 2

Hipotéziseket állítottunk fel: A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d normál eloszlású;

– versengő – H 1: hogy a páros különbségek sokaságának megoszlása A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d különbözik a normáltól.

A szignifikancia szintjén ellenőrizzük = 0,05.

Ehhez számítási táblázatot készítünk 5.3.

5.3. táblázat – Adatok a Shapiro és Wilk-kritérium kiszámításához W megfigyelhető párosított értékek közötti különbségekből összeállított mintához A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d

A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d 5.2. táblázat – Az értékek párosított különbségeinek négyzeteinek kiszámítása

A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára n - k + 1 -d k = k

a nk

k ×a nk

17 – (–2) = 19

Az 5.3 táblázat kitöltésének menete:

    Az első oszlopba sorba írjuk a számokat.

    A másodikban - a párosított értékek közötti különbségek A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d nem csökkenő sorrendben.

    A harmadikban - számok sorrendben k páros különbségek. Mivel esetünkben n= 10, akkor k 1-től változik n/2 = 5.

4. A negyedikben - különbségek k, amelyet így találunk:

- a nagyon nagy jelentőségű A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára 10 vonjuk ki a legkisebbet A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára 1 k = 1,

-tól A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára 9 kivonni A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára 2 és írja be a kapott értéket a for sorba k= 2 stb.

    Az ötödikben - felírjuk az együtthatók értékeit a nk a statisztikákban a Shapiro és Wilk teszt kiszámításához használt táblázatból ( W) az eloszlás normalitásának ellenőrzése (2. függelék) for n= 10.

    A hatodikban - egy mű k × a nkés keresse meg a termékek összegét:

.

Megfigyelt kritériumérték W megfigyelhető képlettel találjuk meg:

.

Ellenőrizzük a Shapiro és Wilk kritérium számításainak helyességét ( W megfigyelhető) számítógépen, a „Statisztika” program segítségével történő kiszámításával.

A Shapiro és Wilk-kritérium kiszámítása ( W megfigyelhető) a számítógépen lehetővé tette számunkra, hogy megállapítsuk, hogy:

.

Ezután a Shapiro- és Wilk-kritérium kritikus értékeinek táblázatát használva (3. függelék) keressük a W Kréta Mert n= 10. Azt találjuk W Kréta= 0,842. Hasonlítsuk össze az értékeket W KrétaÉs W megfigyelhető .

Csináljuk következtetés: mert W megfigyelhető (0,874) > W Kréta(0,842), a sokaság normális eloszlásának nullhipotézisét el kell fogadni A C és D mintából továbblépünk a párosított értékek közötti különbségekből összeállított mintára d. Ezért a sebességi tulajdonságok fejlesztésére alkalmazott módszertan hatékonyságának értékeléséhez paramétert kell használni t- Diákok t-próbája.

A statisztikákban kétféle becslés létezik: pont és intervallum. Pontbecslés egy egymintás statisztika, amelyet egy populációs paraméter becslésére használnak. Például a minta átlaga a sokaság matematikai elvárásának és a minta varianciájának pontbecslése S 2- a populáció variancia pontbecslése σ 2. kimutatták, hogy a minta átlaga a sokaság matematikai elvárásának elfogulatlan becslése. A mintaátlagot torzítatlannak nevezzük, mert az összes mintaátlag átlaga (azonos mintaméret mellett) n) megegyezik a teljes sokaság matematikai elvárásával.

A minta szórásának érdekében S 2 a populáció varianciájának elfogulatlan becslése lett σ 2, akkor a minta szórásának nevezője egyenlőnek kell lennie n – 1 , nem n. Más szóval, a sokaság szórása az összes lehetséges mintavariancia átlaga.

A populációs paraméterek becslésénél szem előtt kell tartani, hogy a mintastatisztika, mint pl , adott mintáktól függ. Ezt a tényt figyelembe venni, megszerezni intervallum becslés az általános sokaság matematikai elvárása, elemezze a mintaátlagok eloszlását (bővebben lásd). A megszerkesztett intervallumot egy bizonyos konfidenciaszint jellemzi, amely annak valószínűségét jelenti, hogy a valódi populációs paramétert helyesen becsülik meg. Hasonló konfidencia intervallumok használhatók egy jellemző arányának becslésére rés a lakosság fő elosztott tömege.

Töltse le a jegyzetet vagy formátumban, a példákat formátumban

Konfidenciaintervallum felépítése ismert szórással rendelkező sokaság matematikai elvárására

Konfidenciaintervallum felépítése egy jellemző populációban való részesedésére

Ez a szakasz kiterjeszti a konfidenciaintervallum fogalmát a kategorikus adatokra. Ez lehetővé teszi, hogy megbecsüljük a jellemző arányát a populációban r mintamegosztás használatával rS= X/n. Amint jeleztük, ha a mennyiségeket nrÉs n(1 – p) haladja meg az 5-ös számot, binomiális eloszlás a szokásos módon közelíthető meg. Ezért megbecsülni egy jellemző részesedését a sokaságban r meg lehet alkotni egy intervallumot, amelynek konfidenciaszintje egyenlő (1 – α)х100%.


Ahol pS- a jellemző mintaaránya egyenlő X/n, azaz a sikerek száma osztva a minta méretével, r- a jellemző részesedése a lakosság körében, Z- a standardizált normál eloszlás kritikus értéke, n- minta mérete.

3. példa Tételezzük fel, hogy egy 100 számlából álló minta került kitöltésre múlt hónapban. Tegyük fel, hogy ebből a számlából 10 hibásan lett összeállítva. Így, r= 10/100 = 0,1. A 95%-os megbízhatósági szint a Z = 1,96 kritikus értéknek felel meg.

Így annak valószínűsége, hogy a számlák 4,12-15,88%-a tartalmaz hibát, 95%.

Egy adott mintaméretnél a jellemző populációban való arányát tartalmazó konfidenciaintervallum szélesebbnek tűnik, mint egy folytonos valószínűségi változó esetén. Ennek az az oka, hogy a folytonos valószínűségi változó mérései több információt tartalmaznak, mint a kategorikus adatok mérései. Más szóval, a kategorikus adatok, amelyek csak két értéket vesznek fel, nem tartalmaznak elegendő információt eloszlásuk paramétereinek becsléséhez.

Gvéges sokaságból kinyert becslések kiszámítása

A matematikai elvárás becslése. Korrekciós tényező a végső sokasághoz ( fpc) csökkentésére használták standard hiba néha. A populációparaméter-becslések konfidenciaintervallumának kiszámításakor korrekciós tényezőt alkalmaznak olyan helyzetekben, amikor a mintákat visszaküldés nélkül veszik. Így a matematikai elvárás konfidencia intervalluma, amelynek megbízhatósági szintje egyenlő (1 – α)х100%, a következő képlettel számítjuk ki:

4. példa A korrekciós tényező véges sokaságra való használatának szemléltetésére térjünk vissza a fenti, 3. példában tárgyalt, átlagos számlamennyiség konfidenciaintervallumának kiszámításához. Tegyük fel, hogy egy vállalat havonta 5000 számlát állít ki, és = 110,27 dollár, S= 28,95 USD én = 5000, n = 100, α = 0,05, t 99 = 1,9842. A (6) képlet segítségével megkapjuk:

Egy jellemző részesedésének becslése. Visszaadás nélküli választás esetén az attribútum azon arányának konfidenciaintervalluma, amelynek konfidenciaszintje egyenlő (1 – α)х100%, a következő képlettel számítjuk ki:

Bizalmi intervallumok és etikai problémák

A sokaság mintavételekor és a statisztikai következtetések levonásakor gyakran felmerülnek etikai kérdések. A legfontosabb az, hogy a mintastatisztikák konfidenciaintervallumai és pontbecslései hogyan egyeznek. Kiadvány pontbecslések A megfelelő konfidenciaintervallumok (általában 95%-os konfidenciaszinten) és a minta méretének meghatározása nélkül, amelyből származnak, ez félreértésekhez vezethet. Ez azt a benyomást keltheti a felhasználóban, hogy a pontbecslés pontosan az, amire szüksége van a teljes sokaság tulajdonságainak előrejelzéséhez. Ezért meg kell érteni, hogy minden kutatás során nem a pontbecslésekre, hanem az intervallumbecslésekre kell összpontosítani. Kívül, különös figyelmet meg kell adni a helyes választás mintaméretek.

A statisztikai manipuláció tárgyai leggyakrabban bizonyos politikai kérdésekben a lakosság szociológiai felméréseinek eredményei. Ugyanakkor a felmérés eredményeit az újságok címlapjain teszik közzé, a mintavételi hiba és a statisztikai elemzés módszertana pedig valahol középen. A kapott pontbecslések érvényességének bizonyításához fel kell tüntetni, hogy mekkora minta alapján kaptuk, a konfidenciaintervallum határait és szignifikancia szintjét.

Következő megjegyzés

A Levin et al. Statisztika menedzsereknek című könyv anyagait használjuk. – M.: Williams, 2004. – p. 448–462

Központi határérték tétel kimondja, hogy kellően nagy mintaméret mellett az átlagok mintaeloszlása ​​normális eloszlással közelíthető. Ez a tulajdonság nem függ a populáció megoszlási típusától.

Legyen egy olyan valószínűségi változó eloszlása ​​normális törvény szerint, amelyre a D variancia ismeretlen. Készül egy n méretű minta. Ebből meghatározzuk a korrigált s 2 mintavarianciát. Véletlen változó

törvény szerint elosztva 2 n -1 szabadságfokkal. Adott megbízhatóság mellett 1 2 és 2 2 intervallumok tetszőleges számú határa megtalálható, így

Keressünk 1 2-t és 2 2-t a következő feltételekből:

P(2 1 2) = (1 -)/2(**)

P(2 2 2) = (1 -)/2(***)

Nyilvánvalóan, ha az utolsó két feltétel teljesül, a (*) egyenlőség igaz.

A 2. valószínűségi változóhoz tartozó táblázatokban általában megadják az egyenlet megoldását

Egy ilyen táblázatból egy adott q érték és az n - 1 szabadságfokok számának felhasználásával meghatározhatja q 2 értékét. Így a (***) képletben azonnal megtaláljuk a 2 2 értéket.

Az 1 2 meghatározásához átalakítjuk (**):

P(2 1 2) = 1 - (1 -)/ 2 = (1 +)/ 2

A kapott egyenlőség lehetővé teszi, hogy a táblázatból meghatározzuk az 1 2 értéket.

Most, hogy megtaláltuk az 1 2 és 2 2 értékeket, ábrázoljuk az egyenlőséget (*) a formában

Írjuk át az utolsó egyenlőséget úgy, hogy az ismeretlen D érték konfidenciaintervallumának határai legyenek meghatározva:

Innen könnyen beszerezhető a szórás konfidenciaintervallumának meghatározására szolgáló képlet:

Feladat. Feltételezzük, hogy az azonos típusú, bizonyos üzemmódban működő hajtóművekkel rendelkező helikopterek pilótafülkéiben a zaj egy normális törvény szerint eloszló valószínűségi változó. Véletlenszerűen kiválasztottunk 20 helikoptert, és mindegyikben megmérték a zajszintet (decibelben). A mérések korrigált mintaszórását 22,5-nek találtuk. Keresse meg az ismeretlent lefedő konfidencia intervallumot szórás zajszint az ilyen típusú helikopterek pilótafülkéiben 98%-os megbízhatósággal.

Megoldás. A 19-cel egyenlő szabadsági fokok száma és az (1 - 0,98)/2 = 0,01 valószínűség alapján a 2. eloszlási táblázatból a 2 2 = 36,2 értéket kapjuk. Hasonlóképpen (1 + 0,98)/2 = 0,99 valószínűséggel 1 2 = 7,63-at kapunk. A (****) képlet segítségével megkapjuk a szükséges konfidencia intervallumot: (3,44; 7,49).





hiba: A tartalom védett!!