Изберете Страница

Доверителни интервали за оценка на математическото очакване. Математика и компютърни науки

Нека случайната променлива X на общата съвкупност се разпредели нормално, като се има предвид, че дисперсията и стандартното отклонение s на това разпределение са известни. Необходимо е да се оцени неизвестното математическо очакване от средната стойност на извадката. В този случай задачата се свежда до намиране доверителен интервалза математическо очакванес надеждност б. Ако зададем стойността на доверителната вероятност (надеждност) b, тогава можем да намерим вероятността да попаднем в интервала за неизвестното математическо очакване, използвайки формула (6.9a):

където Ф (t) е функцията на Лаплас (5.17a).

В резултат на това е възможно да се формулира алгоритъм за намиране на границите на доверителния интервал за математическото очакване, ако е известна дисперсията D = s 2:

  1. Задайте стойността за надеждност - b.
  2. От (6.14) изразете Ф (t) = 0,5 × b. Изберете стойността на t от таблицата за функцията на Лаплас по стойността на Ф (t) (виж Приложение 1).
  3. Изчислете отклонението e по формулата (6.10).
  4. Запишете доверителния интервал съгласно формула (6.12), така че с вероятност b да е валидно следното неравенство:

.

Пример 5.

Случайната променлива X има нормално разпределение. Намерете доверителните интервали за оценката с надеждност b = 0,96 на неизвестното математическо очакване a, ако е дадено:

1) общо стандартно отклонение s = 5;

2) средна извадка;

3) размер на извадката n = 49.

Във формула (6.15), интервалната оценка на математическото очакване а с надеждност b, всички величини с изключение на t са известни. Стойността на t може да се намери с помощта на (6.14): b = 2Ф (t) = 0,96. Ф (t) = 0,48.

Съгласно таблицата в Приложение 1 за функцията на Лаплас Φ (t) = 0,48 се намира съответната стойност t = 2,06. следователно, ... Замествайки изчислената стойност на e във формулата (6.12), можете да получите доверителния интервал: 30-1,47< a < 30+1,47.

Желаният доверителен интервал за оценката с надеждността b = 0,96 на неизвестното математическо очакване е: 28,53< a < 31,47.

Като начало си припомнете следното определение:

Ще разгледаме следната ситуация. Нека вариантите на генералната съвкупност имат нормално разпределение с математическото очакване $ a $ и средното квадратно отклонение $ \ sigma $. Средната извадка в този случай ще се разглежда като случайна променлива. Когато $ X $ е нормално разпределено, средната извадка също ще бъде нормално разпределена с параметрите

Нека намерим доверителния интервал, който покрива стойността $ a $ с надеждността $ \ gamma $.

За това се нуждаем от равенство

От него получаваме

Оттук лесно можем да намерим $ t $ по таблицата на стойностите на функцията $ Ф \ left (t \ right) $ и като следствие да намерим $ \ delta $.

Нека си припомним таблицата със стойностите на функцията $ Ф \ вляво (t \ вдясно) $:

Фигура 1. Таблица със стойностите на функцията $ Ф \ вляво (t \ вдясно). $

Интеграл на доверието за оценка на математическото очакване с неизвестен $ (\ mathbf \ sigma) $

В този случай ще използваме стойността на коригираната дисперсия $ S ^ 2 $. Заменяйки $ \ sigma $ в горната формула с $ S $, получаваме:

Пример за задачи за намиране на доверителния интервал

Пример 1

Нека стойността $ X $ има нормално разпределение с дисперсия $ \ sigma = 4 $. Нека размерът на извадката е $ n = 64 $, а надеждността е $ \ гама = 0,95 $. Намерете доверителния интервал за оценка на математическото очакване на дадено разпределение.

Трябва да намерим интервала ($ \ overline (x) - \ delta, \ overline (x) + \ delta) $.

Както видяхме по-горе

\ [\ delta = \ frac (\ sigma t) (\ sqrt (n)) = \ frac (4t) (\ sqrt (64)) = \ frac (\ t) (2) \]

Намираме параметъра $ t $ от формулата

\ [Ф \ ляво (t \ дясно) = \ frac (\ гама) (2) = \ frac (0,95) (2) = 0,475 \]

От таблица 1 получаваме, че $ t = $ 1,96.

Доверителен интервал- гранични стойности статистика, което с дадена доверителна вероятност γ ще бъде в този интервал за по-голяма извадка. Означава се като P (θ - ε. На практика изберете ниво на увереностγ от достатъчно близки до единицата стойности γ = 0,9, γ = 0,95, γ = 0,99.

Цел на услугата... Тази услуга дефинира:

  • доверителен интервал за обща средна стойност, доверителен интервал за дисперсия;
  • доверителния интервал за стандартното отклонение, доверителния интервал за общата фракция;
Полученото решение се записва в Word файл (вижте примера). По-долу е дадена видео инструкция как да попълните първоначалните данни.

Пример №1. В колективната ферма от общо стадо от 1000 глави овце 100 овце са подложени на селективна контролна стрижка. В резултат на това беше установено средно срязване на вълна от 4,2 кг на овца. Определете средната стойност с вероятност 0,99 квадратна грешкавземане на проби при определяне на средното срязване на вълната на една овца и границите, в които е заложена стойността на срязване, ако дисперсията е 2,5. Пробата не се повтаря.
Пример №2. От партида вносни продукти на поста на Московската северна митница са взети 20 проби от продукт "А" по реда на произволно многократно вземане на проби. В резултат на проверката беше установено средното съдържание на влага на продукт "А" в пробата, което се оказа 6% със стандартно отклонение от 1%.
Определете с вероятност 0,683 границите на средното съдържание на влага на продукта в цялата партида вносни продукти.
Пример №3. Проучване сред 36 ученици показа, че средният брой учебници, в които четат академична година, се оказа равно на 6. Ако приемем, че броят на учебниците, прочетени от студент за семестър, има нормален закон за разпределение със стандартно отклонение, равно на 6, намерете: A) с надеждност 0,99 интервална оценка за математическото очакване на тази случайна променлива; Б) колко вероятно е да се твърди, че средният брой учебници, прочетени от студент за семестър, изчислен за тази извадка, ще се отклони от математическото очакване в абсолютна стойност с не повече от 2.

Класификация на доверителния интервал

По вида на оценявания параметър:

По тип проба:

  1. Доверителен интервал за безкрайна извадка;
  2. Доверителен интервал за крайната проба;
Извадката се нарича повторно вземане на проби.ако избраният обект бъде върнат в популацията, преди да се избере следващият. Извадката се нарича неповтаряща сеако избраният обект не бъде върнат в общата съвкупност. На практика обикновено се работи с проби, които не се повтарят.

Изчисляване на средната грешка на извадката за произволна извадка

Несъответствието между стойностите на показателите, получени от извадката, и съответните параметри на общата съвкупност се нарича грешка в представителността.
Обозначения на основните параметри на генералната и извадковата съвкупност.
Формули за средна извадкова грешка
повторен подборнеповтарящ се избор
за среденза дялза среденза дял
Съотношението между границата на грешката на извадката (Δ), гарантирана с известна вероятност P (t),и средна грешкапробата има формата: или Δ = t μ, където т- коефициентът на доверие, определен в зависимост от нивото на вероятност P(t) съгласно таблицата на интегралната функция на Лаплас.

Формули за изчисляване на размера на извадката с подходящ метод на случаен подбор

Нека произволна променлива (може да говорим за генералната съвкупност) е разпределена по нормалния закон, за която е известна дисперсията D = 2 (> 0). Извадка с размер n се прави от генералната съвкупност (върху множеството от обекти, от които се определя случайна променлива). Извадката x 1, x 2, ..., x n се разглежда като колекция от n независими случайни променливи, разпределени по същия начин, както (подходът, обяснен по-горе в текста).

Следните равенства също бяха обсъдени и доказани по-рано:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Достатъчно лесно е да се докаже (пропускаме доказателството), че случайната променлива в този случай също се разпределя според нормалния закон.

Нека обозначим неизвестната стойност M през a и изберем числото d> 0 за дадената надеждност, така че да е изпълнено условието:

P (- а< d) = (1)

Тъй като случайната променлива се разпределя според нормалния закон с математическо очакване M = M = a и дисперсия D = D / n = 2 / n, получаваме:

P (- а< d) =P(a - d < < a + d) =

Остава да изберете d, така че равенството

За всяко едно от таблицата може да се намери число t такова, че (t) = / 2. Това число t понякога се нарича квантил.

Сега от равенството

дефинирайте стойността на d:

Крайният резултат се получава чрез представяне на формула (1) във вида:

Значението на последната формула е следното: с надеждност, доверителният интервал

обхваща неизвестния параметър a = M на генералната съвкупност. Можете да го поставите по различен начин: точкова оценкаопределя стойността на параметъра M с точност d = t / и надеждност.

Задача. Нека има генерална съвкупност с някаква характеристика, разпределена по нормалния закон с дисперсия, равна на 6,25. Направена е извадка с размер n = 27 и се получава средната извадкова стойност на характеристиката = 12. Намерете доверителния интервал, покриващ неизвестното математическо очакване на изследваната характеристика на генералната съвкупност с надеждност = 0,99.

Решение. Първо, използвайки таблицата за функцията на Лаплас, намираме стойността на t от равенството (t) = / 2 = 0,495. Въз основа на получената стойност t = 2,58, ние определяме точността на оценката (или половината от дължината на доверителния интервал) d: d = 2,52,58 / 1,24. От тук получаваме необходимия доверителен интервал: (10.76; 13.24).

статистическа хипотеза обща вариация

Доверителен интервал за математическото очакване на нормално разпределение с неизвестна дисперсия

Нека е случайна променлива, разпределена по нормалния закон с неизвестно математическо очакване M, което означаваме с буквата a. Нека направим извадка от обем n. Нека определим средната извадка и коригираната извадкова дисперсия s 2 по известните формули.

Случайна стойност

разпределени по закона на Студент с n - 1 степени на свобода.

Задачата е да се намери число t за дадена надеждност и брой степени на свобода n - 1, така че равенството

или еквивалентно равенство

Тук в скоби е записано условието, че стойността на неизвестния параметър a принадлежи на определен интервал, който е доверителният интервал. Неговите граници зависят от надеждността, както и от параметрите на пробата и s.

За да определим стойността на t по величина, трансформираме равенство (2) във вида:

Сега, според таблицата за произволна променлива t, разпределена според закона на Студент, според вероятността 1 - и броя на степените на свобода n - 1, намираме t. Формула (3) дава отговора на проблема.

Задача. При контролни тестове на 20 електрически лампи средната продължителност на тяхната работа се оказва 2000 часа, като стандартното отклонение (изчислено като корен квадратен от коригираната дисперсия на пробата) е равно на 11 часа. Известно е, че животът на лампата е нормално разпределен случайна величина... Определете с надеждност 0,95 доверителния интервал за математическото очакване на тази случайна променлива.

Решение. Стойността 1 - в този случай е равна на 0,05. Съгласно таблицата за разпределение на Студент, при броя на степените на свобода, равен на 19, намираме: t = 2,093. Нека сега изчислим точността на оценката: 2,093121 / = 56,6. От тук получаваме необходимия доверителен интервал: (1943.4; 2056.6).

Изграждане в MS Управител на EXCELинтервал за оценка на средната стойност на разпределението в случай на известна стойност на дисперсията.

Разбира се изборът ниво на довериенапълно зависи от проблема, който се решава. По този начин степента на увереност на пътника във въздуха в надеждността на самолета несъмнено трябва да бъде по-висока от степента на доверие на купувача в надеждността на електрическата крушка.

Постановка на проблема

Да предположим, че от общото населениекато взе пробаразмер n. Предполага се, че стандартно отклонение това разпределение е известно. Необходимо е въз основа на това вземане на пробиоцени неизвестното средно разпределение(μ,) и построете съответния двустранно доверителен интервал.

Точкова оценка

Както е известно от, статистика(означаваме го X ср) е безпристрастна оценка на средната стойносттова общото населениеи има разпределение N (μ; σ 2 / n).

Забележка: Какво да направите, ако трябва да строите доверителен интервалв случай на разпределение, което не е нормално?В този случай идва на помощ, което казва, че с достатъчно голям размер вземане на проби n от разпределението да не бъдеш нормално, извадково разпределение на статистиката X срще приблизителноотговарят нормална дистрибуцияс параметри N (μ; σ 2 / n).

Така, точкова оценка среден разпределителни стойностиимаме - това средна извадка, т.е. X ср... Сега да се заемем с това доверителен интервал.

Начертаване на доверителен интервал

Обикновено, знаейки разпределението и неговите параметри, можем да изчислим вероятността произволна променлива да вземе стойност от интервала, който сме посочили. Сега нека направим обратното: да намерим интервала, в който произволната променлива ще попадне с дадена вероятност. Например от имотите нормална дистрибуцияизвестно е, че с вероятност от 95%, произволна променлива, разпределена по нормален закон, ще попадне в интервал от приблизително +/- 2 от средна стойност(виж статията за). Този интервал ще ни послужи като прототип доверителен интервал.

Сега нека разберем дали знаем разпределението , да се изчисли този интервал? За да отговорим на въпроса, трябва да посочим формата на разпределението и неговите параметри.

Формуляра за разпространение знаем - тя е нормална дистрибуция(припомнете си, че говорим за извадково разпределение статистика X ср).

Не знаем параметъра μ (просто трябва да се изчисли с помощта на доверителен интервал), но имаме неговата оценка X ср,изчислено въз основа на вземане на проби,които могат да се използват.

Вторият параметър е стандартно отклонение на средната стойност на извадката ще го считаме за известно, той е равен на σ / √n.

Защото не знаем μ, тогава ще построим интервала +/- 2 стандартни отклоненияне от средна стойност, и от известната му оценка X ср... Тези. при изчисляване доверителен интервалняма да приемем това X српопада в диапазона +/- 2 стандартни отклоненияот μ с вероятност 95% и ще приемем, че интервалът +/- 2 стандартни отклоненияот X срс вероятност 95% ще покрие μ - средна стойност от общото население,от който е взето проба... Тези две твърдения са еквивалентни, но второто твърдение ни позволява да конструираме доверителен интервал.

В допълнение, ние изясняваме интервала: произволна променлива, разпределена върху нормален закон, с 95% вероятност попада в диапазона +/- 1.960 стандартни отклонения,не +/- 2 стандартни отклонения... Това може да се изчисли по формулата = NORM.ST.OBR ((1 + 0,95) / 2), см. примерен файл Разстояние между листовете.

Сега можем да формулираме вероятностно твърдение, което ще ни послужи за формиране доверителен интервал:
„Вероятността, че средно населениее от средна извадкав рамките на 1960 " стандартни отклонения на средната извадка ", е равно на 95%".

Стойността на вероятността, посочена в изявлението, има специално име което е свързано сниво на значимост α (алфа) чрез прост израз ниво на доверие =1 . В нашия случай ниво на значимост α =1-0,95=0,05 .

Сега, въз основа на това вероятностно твърдение, ние записваме израз за изчисляване доверителен интервал:

където Z α / 2 стандартен нормална дистрибуция(такава стойност на произволна променлива z, Какво П(z>=Z α / 2 ) = α / 2).

Забележка: Горен α / 2-квантилопределя ширината доверителен интервал v стандартни отклонения средна извадка. Горен α / 2-квантил стандартен нормална дистрибуциявинаги по-голямо от 0, което е много удобно.

В нашия случай при α = 0,05, горен α / 2-квантил е равно на 1,960. За други нива на значимост α (10%; 1%) горен α / 2-квантил Z α / 2 може да се изчисли по формулата = NORM.ST.OBR (1-α / 2) или, ако е известно ниво на доверие, = СТАНДАРТ ST.OBR ((1 + ниво на доверие) / 2).

Обикновено при изграждане доверителни интервали за оценка на средната стойностизползвайте само горен α/2-квантили не използвайте по-ниско α/2-квантил... Това е възможно, защото стандартен нормална дистрибуциясиметрично около оста x ( неговата плътност на разпространениесиметрични по отношение на средно, т.е. 0). Следователно не е необходимо да се изчислява по-нисък α / 2-квантил(той се нарича просто α / 2-квантил), защото равно е горен α/2-квантилсъс знак минус.

Припомнете си, че въпреки формата на разпределението на количеството x, съответната случайна променлива X срразпределени приблизително глоба N (μ; σ 2 / n) (виж статията за). Следователно, в общ случай, горният израз за доверителен интервале само приблизителен. Ако количеството x е разпределено върху нормален закон N (μ; σ 2 / n), тогава изразът за доверителен интервале точен.

Изчисляване на доверителния интервал в MS EXCEL

Нека решим проблема.
Времето за реакция на електронен компонент към входен сигнал е важна характеристика на устройството. Инженерът иска да начертае доверителен интервал за средното време за реакция при 95% ниво на доверие. Инженерът знае от предишен опит, че стандартното отклонение на времето за реакция е 8 ms. Известно е, че инженерът е направил 25 измервания, за да оцени времето за реакция, средната стойност е 78 ms.

Решение: Инженер иска да знае времето за реакция на електронно устройство, но осъзнава, че времето за реакция не е фиксирана, а произволна променлива, която има свое собствено разпределение. Така че най-доброто, на което може да разчита, е да определи параметрите и формата на това разпределение.

За съжаление, от условието на проблема, формата на разпределението на времето за реакция не ни е известна (не е задължително да е нормално). , това разпределение също е неизвестно. Известен само с него стандартно отклонениеσ = 8. Следователно, докато не можем да изчислим вероятностите и да изградим доверителен интервал.

Въпреки това, въпреки факта, че не знаем разпределението време отделен отговор, знаем, че според CPT, извадково разпределение средно време за реакцияе приблизително нормално(ще приемем, че условията CPTсе извършват, защото размерът вземане на пробидостатъчно голям (n = 25)) .

Освен това, среднотона това разпределение е средно аритметичноразпределението на единичен отговор, т.е. μ. А стандартно отклонениена това разпределение (σ / √n) може да се изчисли по формулата = 8 / ROOT (25).

Известно е също, че инженерът е получил точкова оценкапараметър μ равен на 78 msec (X срв.). Следователно, сега можем да изчислим вероятностите, тъй като знаем формата за разпределение ( нормално) и неговите параметри (X cf и σ / √n).

Инженерът иска да знае очаквана стойностμ от разпределението на времето за реакция. Както бе споменато по-горе, това μ е равно на математическото очакване на извадковото разпределение на средното време за реакция... Ако използваме нормална дистрибуция N (X cf; σ / √n), тогава желаното μ ще бъде в диапазона +/- 2 * σ / √n с вероятност от около 95%.

Ниво на значимосте равно на 1-0,95 = 0,05.

Накрая намерете лявата и дясната граница доверителен интервал.
Лява граница: = 78-СТАНДАРТ СТ.ОБР (1-0,05 / 2) * 8 / КОРЕН (25) = 74,864
дясна граница: = 78 + NORM.ST.OBR (1-0,05 / 2) * 8 / КОРЕН (25) = 81,136

Лява граница: = NORM.OBR (0,05 / 2; 78; 8 / КОРЕН (25))
дясна граница: = NORM.INV (1-0.05 / 2; 78; 8 / ROOT (25))

Отговор: доверителен интервалв ниво на достоверност 95% и σ=8Госпожицае равно на 78 +/- 3,136 msec.

V примерен файл в работен лист на Sigmaизвестна е форма за изчисляване и конструиране двустранно доверителен интервалза произволен пробис дадено σ и ниво на значимост.

Функция CONFIDENCE.NORM ().

Ако стойностите вземане на пробиса в обхвата B20: B79 , а ниво на значимостравно на 0,05; след това формулата на MS EXCEL:
= СРЕДНО (B20: B79) -TRUST.NORM (0,05, σ, COUNT (B20: B79))
ще върне лявата граница доверителен интервал.

Същата граница може да се изчисли по формулата:
= СРЕДНО (B20: B79) -NORM.ST.INV (1-0,05 / 2) * σ / ROOT (БРОЙ (B20: B79))

Забележка: Функцията CONFIRM.NORM () се появи в MS EXCEL 2010. В по-ранните версии на MS EXCEL беше използвана функцията CONFIDENCE ().



грешка:Съдържанието е защитено!!