Wybierz stronę

Przedziały ufności do szacowania oczekiwań matematycznych. Matematyka i Informatyka

Niech zmienna losowa X populacji ogólnej będzie miała rozkład normalny, zakładając, że wariancja i odchylenie standardowe s tego rozkładu są znane. Wymagane jest oszacowanie nieznanego matematycznego oczekiwania na podstawie średniej próbki. W tym przypadku problem polega na znalezieniu przedział ufności dla matematyczne oczekiwanie z niezawodnością b. Jeśli ustawimy wartość prawdopodobieństwa ufności (rzetelność) b, to możemy znaleźć prawdopodobieństwo wpadnięcia w przedział dla nieznanego matematycznego oczekiwania za pomocą wzoru (6.9a):

gdzie Ф(t) jest funkcją Laplace'a (5.17a).

W rezultacie możemy sformułować algorytm wyznaczania granic przedziału ufności dla oczekiwań matematycznych, jeśli znana jest wariancja D = s 2 :

  1. Ustaw wartość niezawodności na b .
  2. Z (6,14) wyraź Ф(t) = 0,5×b. Wybierz wartość t z tabeli dla funkcji Laplace'a przez wartość Ф(t) (patrz Dodatek 1).
  3. Oblicz odchylenie e ze wzoru (6.10).
  4. Zapisz przedział ufności według wzoru (6.12) tak, aby z prawdopodobieństwem b następująca nierówność była prawdziwa:

.

Przykład 5.

Zmienna losowa X ma rozkład normalny. Znajdź przedziały ufności dla oszacowania o wiarygodności b = 0,96 nieznanej średniej a, jeśli podano:

1) ogólne odchylenie standardowe s = 5;

2) średnia próbki;

3) wielkość próby n = 49.

We wzorze (6.15) oszacowania przedziałowego oczekiwanego matematycznego a z niezawodnością b wszystkie wielkości z wyjątkiem t są znane. Wartość t można znaleźć za pomocą (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Zgodnie z tabelą w Dodatku 1 dla funkcji Laplace'a Ф(t) = 0,48, znajdź odpowiednią wartość t = 2,06. W związku z tym, . Podstawiając obliczoną wartość e do wzoru (6.12), otrzymujemy przedział ufności: 30-1,47< a < 30+1,47.

Pożądany przedział ufności dla oszacowania z wiarygodnością b = 0,96 nieznanego oczekiwania matematycznego wynosi: 28,53< a < 31,47.

Najpierw przypomnijmy następującą definicję:

Rozważmy następującą sytuację. Niech warianty populacji ogólnej mają rozkład normalny z oczekiwaniem matematycznym $a$ i odchyleniem standardowym $\sigma $. Średnia próbki w tym przypadku będzie traktowana jako zmienna losowa. Gdy $X$ ma rozkład normalny, średnia próbki będzie miała również rozkład normalny z parametrami

Znajdźmy przedział ufności, który pokrywa $a$ z niezawodnością $\gamma $.

Aby to zrobić, potrzebujemy równości

Z tego otrzymujemy

Stąd możemy łatwo znaleźć $t$ z tabeli wartości funkcji $Ф\left(t\right)$ iw efekcie znaleźć $\delta $.

Przywołaj tabelę wartości funkcji $Ф\left(t\right)$:

Rysunek 1. Tabela wartości funkcji $Ф\left(t\right).$

Całka ufności do szacowania wartości oczekiwanej, gdy $(\mathbf \sigma )$ jest nieznana

W tym przypadku użyjemy wartości skorygowanej wariancji $S^2$. Zastępując $\sigma $ w powyższym wzorze $S$, otrzymujemy:

Przykładowe zadania do znalezienia przedziału ufności

Przykład 1

Niech wielkość $X$ ma rozkład normalny z wariancją $\sigma =4$. Niech wielkość próby będzie równa $n=64$, a rzetelność równa $\gamma =0.95$. Znajdź przedział ufności, aby oszacować matematyczne oczekiwanie danego rozkładu.

Musimy znaleźć przedział ($\overline(x)-\delta ,\overline(x)+\delta)$.

Jak widzieliśmy powyżej

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\ t)(2)\]

Znajdujemy parametr $t$ ze wzoru

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

Z tabeli 1 otrzymujemy $t=1.96$.

Przedział ufności– wartości graniczne Statystyczny, które przy danym prawdopodobieństwie ufności γ będzie w tym przedziale przy większej liczebności próby. Oznaczone jako P(θ - ε . W praktyce wybierz poziom zaufaniaγ od wartości γ = 0,9, γ = 0,95, γ = 0,99 wystarczająco blisko jedności.

Przypisanie usługi. Ta usługa określa:

  • przedział ufności dla średniej ogólnej, przedział ufności dla wariancji;
  • przedział ufności dla odchylenia standardowego, przedział ufności dla ułamka ogólnego;
Wynikowe rozwiązanie jest zapisywane w pliku Word (patrz przykład). Poniżej znajduje się instrukcja wideo, jak wypełnić początkowe dane.

Przykład 1. W kołchozie, ze stada liczącego 1000 owiec, 100 owiec zostało poddanych selektywnej kontroli strzyżenia. W rezultacie ustalono średnie strzyżenie wełny 4,2 kg na owcę. Wyznacz z prawdopodobieństwem 0,99 średnią błąd kwadratowy pobieranie próbek przy określaniu średniego ścinania wełny na owcę oraz granic, w których zawarta jest wartość ścinania, jeśli wariancja wynosi 2,5. Próbka nie jest powtarzalna.
Przykład #2. Z partii produktów importowanych na poczcie Moskiewskiego Urzędu Celnego Północnego pobrano 20 próbek produktu „A” w kolejności losowego ponownego pobierania próbek. W wyniku kontroli ustalono średnią zawartość wilgoci produktu „A” w próbce, która wyniosła 6% przy odchyleniu standardowym 1%.
Wyznacz z prawdopodobieństwem 0,683 limity średniej wilgotności produktu w całej partii importowanych produktów.
Przykład #3. Ankieta przeprowadzona wśród 36 uczniów wykazała, że ​​średnia liczba podręczników, w których czytali rok akademicki, okazało się równe 6. Zakładając, że liczba podręczników czytanych przez studenta w semestrze ma rozkład normalny z odchyleniem standardowym równym 6, znajdź: A) z rzetelnością 0,99, oszacowanie przedziałowe dla oczekiwanie tej zmiennej losowej; B) z jakim prawdopodobieństwem można twierdzić, że średnia liczba podręczników przeczytanych przez studenta w semestrze obliczona dla tej próby odbiega od oczekiwań matematycznych w wartości bezwzględnej nie więcej niż o 2.

Klasyfikacja przedziałów ufności

Według typu ocenianego parametru:

Według typu próbki:

  1. Przedział ufności dla nieskończonego próbkowania;
  2. Przedział ufności dla próbki końcowej;
Próbkowanie nazywa się ponownym próbkowaniem, jeśli wybrany obiekt jest zwracany do populacji ogólnej przed wybraniem następnego. Próbka nazywana jest niepowtarzalną. jeśli wybrany obiekt nie zostanie zwrócony ogólnej populacji. W praktyce zwykle mamy do czynienia z nie powtarzającymi się próbkami.

Obliczanie średniego błędu próbkowania dla doboru losowego

Nazywa się rozbieżność między wartościami wskaźników uzyskanych z próby a odpowiadającymi im parametrami populacji ogólnej błąd reprezentatywności.
Oznaczenia głównych parametrów populacji ogólnej i próbnej.
Przykładowe wzory błędów średnich
reselekcjanie powtarzalny wybór
dla średniegodo udostępnieniadla średniegodo udostępnienia
Stosunek granicy błędu próbkowania (Δ) gwarantowany z pewnym prawdopodobieństwem P(t), oraz średni błąd próbka ma postać: lub Δ = t μ, gdzie T– współczynnik ufności, wyznaczany w zależności od poziomu prawdopodobieństwa P(t) zgodnie z tablicą całkowej funkcji Laplace'a.

Wzory do obliczania liczebności próby za pomocą odpowiedniej metody doboru losowego

Niech zmienna losowa (możemy mówić o populacji ogólnej) rozkłada się zgodnie z prawem normalnym, dla którego znana jest wariancja D = 2 (> 0). Z populacji ogólnej (na zbiorze obiektów, z których wyznaczana jest zmienna losowa) pobierana jest próba o liczebności n. Próba x 1 , x 2 ,..., x n jest traktowana jako zbiór n niezależnych zmiennych losowych rozłożonych w taki sam sposób jak (podejście wyjaśnione powyżej w tekście).

Wcześniej omówiono i udowodniono również następujące równości:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Wystarczy po prostu udowodnić (pomijamy dowód), że zmienna losowa w tym przypadku również ma rozkład zgodnie z prawem normalnym.

Oznaczmy nieznaną wartość M przez a i wybierzmy liczbę d > 0 zgodnie z daną niezawodnością tak, aby spełniony był warunek:

Rocznie< d) = (1)

Ponieważ zmienna losowa jest rozłożona zgodnie z prawem normalnym z matematycznym oczekiwaniem M = M = a i wariancją D = D /n = 2 /n, otrzymujemy:

Rocznie< d) =P(a - d < < a + d) =

Pozostaje wybrać d tak, aby równość

Dla każdego można znaleźć taką liczbę t z tabeli, że (t) \u003d / 2. Ta liczba t jest czasami nazywana kwantyl.

Teraz z równości

zdefiniuj wartość d:

Ostateczny wynik uzyskujemy przedstawiając wzór (1) w postaci:

Znaczenie ostatniego wzoru jest następujące: z rzetelnością przedział ufności

obejmuje nieznany parametr a = M populacji. Można powiedzieć inaczej: Punktowe oszacowanie określa wartość parametru M z dokładnością d= t / i niezawodnością.

Zadanie. Niech będzie populacja ogólna o pewnej charakterystyce rozłożonej zgodnie z prawem normalnym z rozrzutem równym 6,25. Wykonano próbę o liczebności n = 27 i uzyskano średnią wartość próby cechy = 12. Wyznacz przedział ufności obejmujący nieznane oczekiwanie matematyczne badanej cechy populacji ogólnej o rzetelności = 0,99.

Rozwiązanie. Najpierw, korzystając z tabeli dla funkcji Laplace'a, znajdujemy wartość t z równania (t) \u003d / 2 \u003d 0,495. Na podstawie otrzymanej wartości t = 2,58 określamy dokładność oszacowania (lub połowę długości przedziału ufności) d: d = 2,52,58 / 1,24. Stąd otrzymujemy pożądany przedział ufności: (10,76; 13,24).

hipoteza statystyczna ogólna zmienność

Przedział ufności dla oczekiwanego rozkładu normalnego z nieznaną wariancją

Niech będzie zmienną losową o rozkładzie zgodnie z prawem normalnym o nieznanym oczekiwaniu matematycznym M, które oznaczymy literą a . Zróbmy próbkę o rozmiarze n. Wyznaczmy średnią próbę i skorygowaną wariancję próbki s 2 przy użyciu znanych wzorów.

Wartość losowa

rozłożone zgodnie z prawem Studenta o n - 1 stopniach swobody.

Zadanie polega na znalezieniu takiej liczby t zgodnie z zadaną niezawodnością i liczbą stopni swobody n - 1, aby równość

lub równoważna równość

Tutaj w nawiasach zapisany jest warunek, że wartość nieznanego parametru a należy do pewnego przedziału, którym jest przedział ufności. Jego granice zależą od wiarygodności, parametrów próbkowania i s.

Aby określić wartość t przez wielkość, przekształcamy równość (2) do postaci:

Teraz, zgodnie z tabelą dla zmiennej losowej t, rozłożonej zgodnie z prawem Studenta, zgodnie z prawdopodobieństwem 1 - i liczbą stopni swobody n - 1, znajdujemy t. Formuła (3) daje odpowiedź na problem.

Zadanie. W testach kontrolnych 20 lamp elektrycznych średni czas ich działania wynosił 2000 godzin przy odchyleniu standardowym (obliczonym jako pierwiastek kwadratowy z skorygowanej wariancji próbki) równym 11 godzin. Wiadomo, że czas pracy lampy jest rozłożony normalnie zmienna losowa. Określ z rzetelnością 0,95 przedział ufności dla matematycznego oczekiwania tej zmiennej losowej.

Rozwiązanie. Wartość 1 - w tym przypadku jest równa 0,05. Zgodnie z tabelą rozkładu Studenta, przy liczbie stopni swobody równej 19, otrzymujemy: t = 2,093. Obliczmy teraz dokładność oszacowania: 2,093121/= 56,6. Stąd otrzymujemy pożądany przedział ufności: (1943,4; 2056,6).

Zbudujmy w MS Zaufanie EXCEL przedział szacowania średniej wartości rozkładu w przypadku znanej wartości wariancji.

Oczywiście wybór poziom zaufania całkowicie zależy od zadania. Zatem stopień zaufania pasażera lotniczego do niezawodności samolotu powinien oczywiście być wyższy niż stopień zaufania kupującego do niezawodności żarówki.

Formułowanie zadań

Załóżmy, że od populacja biorąc próbka rozmiar nr. Zakłada się, że odchylenie standardowe ten rozkład jest znany. Niezbędne na tej podstawie próbki oceń nieznane dystrybucja średnia(μ, ) i skonstruuj odpowiedni dwustronny przedział ufności.

Oszacowanie punktowe

Jak wiadomo z Statystyka(nazwijmy to X cf) jest bezstronne oszacowanie średniej ten populacja i ma rozkład N(μ;σ 2 /n).

Notatka: Co jeśli potrzebujesz zbudować? przedział ufności w przypadku dystrybucji, która nie jest normalna? W tym przypadku na ratunek przychodzi, który mówi, że przy odpowiednio dużym rozmiarze próbki n z dystrybucji nie- normalna, próbkowanie rozkład statystyk Х av Wola około korespondować normalna dystrybucja o parametrach N(μ;σ 2 /n).

Więc, Punktowe oszacowanie środek wartości rozkładu mamy to średnia próbki, tj. X cf. Teraz zajmijmy się przedział ufności.

Budowanie przedziału ufności

Zwykle znając rozkład i jego parametry możemy obliczyć prawdopodobieństwo, że zmienna losowa przyjmie wartość z danego przedziału. Teraz zróbmy coś odwrotnego: znajdź przedział, w którym z danym prawdopodobieństwem przypada zmienna losowa. Na przykład z właściwości normalna dystrybucja wiadomo, że z prawdopodobieństwem 95% zmienna losowa rozłożona na normalne prawo, będzie mieścić się w przedziale około +/- 2 od Średnia wartość(patrz artykuł na temat). Ten przedział będzie służył jako nasz prototyp dla przedział ufności.

Zobaczmy teraz, czy znamy rozkład , obliczyć ten przedział? Aby odpowiedzieć na pytanie, musimy określić formę rozkładu i jego parametry.

Wiemy, że forma dystrybucji to normalna dystrybucja(pamiętaj, że mówimy) dystrybucja próbek Statystyka X cf).

Parametr μ jest nam nieznany (należy go jedynie oszacować za pomocą przedział ufności), ale mamy jego oszacowanie X cf, obliczona na podstawie próbka, które można wykorzystać.

Drugi parametr to średnia próbki odchylenie standardowe będzie znany, jest równe σ/√n.

Bo nie znamy μ, to zbudujemy przedział +/- 2 odchylenia standardowe nie z Średnia wartość, ale na podstawie znanych szacunków X cf. Tych. podczas obliczania przedział ufności NIE będziemy zakładać, że X cf mieści się w przedziale +/- 2 odchylenia standardowe z μ z prawdopodobieństwem 95% i przyjmiemy, że przedział wynosi +/- 2 odchylenia standardowe z X cf z prawdopodobieństwem 95% pokryje μ - średnia populacji ogólnej, z którego próbka. Te dwa zdania są równoważne, ale drugie zdanie pozwala nam skonstruować przedział ufności.

Dodatkowo doprecyzowujemy przedział: zmienna losowa rozłożona na normalne prawo, z 95% prawdopodobieństwem mieści się w przedziale +/- 1,960 odchylenia standardowe, nie +/- 2 odchylenia standardowe. Można to obliczyć za pomocą wzoru \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. przykładowy plik Odstępy między arkuszami.

Teraz możemy sformułować twierdzenie probabilistyczne, które posłuży nam do sformułowania przedział ufności:
„Prawdopodobieństwo, że średnia populacji położony z średnia próbki w ciągu 1.960" odchylenia standardowe średniej próbki", wynosi 95%.

Wspomniana w oświadczeniu wartość prawdopodobieństwa ma specjalną nazwę , który jest powiązany z poziom istotności α (alfa) prostym wyrażeniem poziom zaufania =1 . W naszym przypadku poziom istotności α =1-0,95=0,05 .

Teraz na podstawie tego probabilistycznego stwierdzenia piszemy wyrażenie do obliczania przedział ufności:

gdzie Zα/2 standard normalna dystrybucja(taka wartość zmiennej losowej) z, Co P(z>=Zα/2 )=α/2).

Notatka: Górny α/2-kwantyl definiuje szerokość przedział ufności v odchylenia standardowe średnia próbki. Górny α/2-kwantyl standard normalna dystrybucja jest zawsze większe od 0, co jest bardzo wygodne.

W naszym przypadku przy α=0,05, górny α/2-kwantyl równa się 1.960. Dla innych poziomów istotności α (10%; 1%) górny α/2-kwantyl Zα/2 można obliczyć za pomocą wzoru \u003d NORM.ST.OBR (1-α / 2) lub, jeśli jest znany poziom zaufania, =NORM.ST.OBR((1+poziom ufności)/2).

Zwykle podczas budowania przedziały ufności do szacowania średniej tylko do użytku górna α/2-kwantyl i nie używaj niższy α/2-kwantyl. Jest to możliwe, ponieważ standard normalna dystrybucja symetryczny względem osi x ( gęstość jego dystrybucji symetryczny około średnia, czyli 0). Dlatego nie ma potrzeby obliczania niższy α/2-kwantyl(nazywa się to po prostu α /2-kwantyl), bo to jest równe górna α/2-kwantyl ze znakiem minus.

Przypomnijmy, że niezależnie od kształtu rozkładu x, odpowiadająca mu zmienna losowa X cf Rozpowszechniane około Cienki N(μ;σ 2 /n) (patrz artykuł na temat). Dlatego w przypadek ogólny, powyższe wyrażenie dla przedział ufności jest tylko przybliżona. Jeśli x jest rozłożone na normalne prawo N(μ;σ 2 /n), to wyrażenie na przedział ufności jest dokładne.

Obliczanie przedziału ufności w MS EXCEL

Rozwiążmy problem.
Czas odpowiedzi komponentu elektronicznego na sygnał wejściowy jest ważną cechą urządzenia. Inżynier chce wykreślić przedział ufności dla średniego czasu odpowiedzi na poziomie ufności 95%. Z dotychczasowych doświadczeń inżynier wie, że odchylenie standardowe czasu odpowiedzi wynosi 8 ms. Wiadomo, że inżynier wykonał 25 pomiarów w celu oszacowania czasu odpowiedzi, średnia wartość to 78 ms.

Rozwiązanie: Inżynier chce znać czas odpowiedzi urządzenia elektronicznego, ale rozumie, że czas odpowiedzi nie jest stały, ale zmienna losowa, która ma swój własny rozkład. Zatem jedyne, na co może liczyć, to określenie parametrów i kształtu tego rozkładu.

Niestety ze stanu problemu nie znamy formy rozkładu czasu odpowiedzi (nie musi to być normalna). , ta dystrybucja jest również nieznana. Tylko on jest znany odchylenie standardoweσ=8. Dlatego, chociaż nie możemy obliczyć prawdopodobieństw i skonstruować przedział ufności.

Jednak chociaż nie znamy dystrybucji czas oddzielna odpowiedź wiemy, że według CPT, dystrybucja próbek średni czas odpowiedzi jest w przybliżeniu normalna(założymy, że warunki CPT są wykonywane, ponieważ Rozmiar próbki wystarczająco duży (n=25)) .

Ponadto, Średnia ten rozkład jest równy Średnia wartość rozkłady odpowiedzi jednostkowych, tj. μ. A odchylenie standardowe tego rozkładu (σ/√n) można obliczyć ze wzoru =8/ROOT(25) .

Wiadomo też, że inżynier otrzymał Punktowe oszacowanie parametr μ równy 78 ms (X cf). Dlatego teraz możemy obliczyć prawdopodobieństwa, ponieważ znamy formę dystrybucji ( normalna) i jego parametry (Х ср i σ/√n).

Inżynier chce wiedzieć wartość oczekiwanaμ rozkładu czasu odpowiedzi. Jak stwierdzono powyżej, to μ jest równe oczekiwanie rozkładu próby średniego czasu odpowiedzi. Jeśli używamy normalna dystrybucja N(X cf; σ/√n), to pożądane μ będzie w przedziale +/-2*σ/√n z prawdopodobieństwem około 95%.

Poziom istotności równa się 1-0,95=0,05.

Na koniec znajdź lewą i prawą granicę przedział ufności.
Ramka lewa: \u003d 78-NORM.ST.INR (1-0,05/2) * 8 / ROOT (25) = 74,864
Prawa granica: \u003d 78 + NORMA ST OBR (1-0,05/2) * 8 / ROOT (25) \u003d 81,136

Ramka lewa: =ROZKŁAD.NORMALNY.S.ODW(0,05/2, 78; 8/PIERWIASTEK(25))
Prawa granica: =ROZKŁAD.NORMALNY.ODW (1-0,05/2, 78; 8/PIERWIASTEK(25))

Odpowiedź: przedział ufności w 95% poziom ufności i σ=8msek równa się 78 +/- 3,136 ms

V przykładowy plik na arkuszu Sigma znany stworzył formularz do obliczeń i konstrukcji dwustronny przedział ufności za arbitralne próbki z zadanym σ i poziom istotności.

Funkcja UFNOŚĆ.NORM()

Jeśli wartości próbki są w zasięgu B20:B79 , a poziom istotności równy 0,05; następnie formuła MS EXCEL:
=ŚREDNIA(B20:B79)-UFNOŚĆ(0,05;σ;LICZBA(B20:B79))
zwróci lewą ramkę przedział ufności.

Tę samą granicę można obliczyć za pomocą wzoru:
=ŚREDNIA(B20:B79)-ROZKŁAD.NORMALNY.ST.ODW (1-0,05/2)*σ/PIERWIASTEK(LICZBA(B20:B79))

Notatka: Funkcja TRUST.NORM() pojawiła się w MS EXCEL 2010. Wcześniejsze wersje MS EXCEL używały funkcji TRUST().



błąd: Treść jest chroniona!!