Odaberite Stranica

Metode za postavljanje jednadžbe regresije para. Linearna regresija para

Najjednostavniji u smislu razumijevanja, interpretacije i tehnike izračunavanja je linearni oblik regresije.

Jednačina linearne regresije para , gdje

a 0 , a 1 - parametri modela, ε i - slučajna varijabla (preostala vrijednost).

Parametri modela i njihov sadržaj:


Jednačina regresije je dopunjena indikatorom nepropusnosti veze. Takav pokazatelj je linearni koeficijent korelacija, koja se izračunava po formuli:

ili .

Za procjenu kvaliteta izbora linearne funkcije izračunava se kvadrat koeficijenta linearne korelacije, tzv. koeficijent determinacije. Koeficijent determinacije karakterizira udio disperzije rezultujućeg atributa, objašnjen regresijom, u totalna varijansa efektivan znak:

,

Gdje

.

Shodno tome, vrijednost karakterizira udio disperzije uzrokovane utjecajem drugih faktora koji nisu uzeti u obzir u modelu.

Nakon što je regresiona jednačina izgrađena, provjerava se njena adekvatnost i tačnost.Ova svojstva modela se proučavaju na osnovu analize većeg broja reziduala ε i (odstupanja izračunatih vrijednosti od stvarnih).

Nivo reda ostatka

Korelativ i regresiona analiza provodi se za ograničenu populaciju. U tom smislu, indikatori regresije, korelacije i determinacije mogu biti iskrivljeni djelovanjem slučajnih faktora. Da bismo provjerili koliko su ovi pokazatelji tipični za cjelokupnu populaciju, da li su rezultat spleta slučajnih okolnosti, potrebno je provjeriti adekvatnost konstruiranog modela.

Provjera adekvatnosti modela se sastoji u utvrđivanju značaja modela i utvrđivanju prisustva ili odsustva sistematske greške.

Vrijednosti 1 relevantne podatke X i na teorijske vrijednosti a 0 I a 1 , nasumično. Vrijednosti koeficijenata izračunatih iz njih također će biti nasumične. a 0 I a 1 .

Provjera značajnosti pojedinih regresijskih koeficijenata vrši se prema Studentov t-test testiranjem hipoteze da je svaki koeficijent regresije jednak nuli. Istovremeno se otkriva koliko su izračunati parametri karakteristični za prikazivanje skupa uslova: jesu li dobivene vrijednosti parametara rezultat djelovanja slučajnih varijabli. Koriste se odgovarajuće formule za odgovarajuće regresijske koeficijente.

Formule za određivanje Studentovog t-testa

Gdje

S a 0 ,S a 1 - standardne devijacije slobodnog člana i koeficijenta regresije. Formule

Gdje

S ε - standardna devijacija ostaci modela ( standardna greška procjene), što je određeno formulom

Izračunate vrijednosti t-kriterija se upoređuju sa tabelarnom vrijednošću kriterija tαγ , koji je određen za (n - k— 1) stepeni slobode i odgovarajući nivo značajnosti α. Ako izračunata vrijednost t-kriterijuma prelazi njegovu tabelarnu vrijednost tαγ , tada se parametar prepoznaje kao značajan. U ovom slučaju, gotovo je nevjerovatno da su pronađene vrijednosti parametara rezultat samo slučajnih podudarnosti.

Procjena značaja regresione jednačine u cjelini vrši se na osnovu - Fišerovog kriterija, kojem prethodi analiza varijanse.

Ukupan zbir kvadrata odstupanja varijable od srednje vrijednosti se dekomponuje na dva dijela - "objašnjeno" i "neobjašnjeno":

Ukupan zbroj kvadrata odstupanja;

Zbir kvadrata odstupanja objašnjenih regresijom (ili suma faktora kvadrata odstupanja);


- rezidualni zbir kvadrata odstupanja, koji karakteriše uticaj faktora koji nisu uzeti u obzir u modelu.

Šema analiza varijanse ima oblik prikazan u tabeli 35 ( - broj zapažanja, - broj parametara sa varijablom ).

Tabela 35 - Šema analize varijanse

Komponente varijanse Zbir kvadrata Broj stepeni slobode Disperzija po stepenu slobode
Generale
faktorijel
Ostatak

Određivanje disperzije po jednom stepenu slobode dovodi disperzije u uporediv oblik. Upoređujući faktorijalne i rezidualne varijanse po jednom stepenu slobode, dobijamo vrednost Fišerovog kriterijuma:

Da biste provjerili značaj regresione jednadžbe u cjelini, koristite Fisher F-test. U slučaju uparene linearne regresije, značaj regresijskog modela određuje se sljedećom formulom: .

Ako je, na datom nivou značajnosti, izračunata vrijednost F-kriterijuma sa γ 1 =k, γ 2 =( p-k- 1) su stepeni slobode veći od tabelarnog, tada se model smatra značajnim, hipoteza o slučajnoj prirodi procenjenih karakteristika se odbacuje i priznaje kao njihova statistički značaj i pouzdanost. Provjera prisustva ili odsustva sistematske greške (ispunjenost preduslova metode najmanjih kvadrata- OLS) se vrši na osnovu analize većeg broja ostataka. Proračun slučajnih grešaka parametara linearne regresije i koeficijenta korelacije vrši se prema formulama

,

Da biste testirali svojstvo slučajnosti niza reziduala, možete koristiti kriterij prekretnih tačaka (vrhova). Tačka se smatra prekretnicom ako su ispunjeni sljedeći uslovi: ε i -1< ε i >ε i +1 ili ε i -1 > ε i< ε i +1

Zatim se izračunava broj okretnih tačaka p. Test slučajnosti sa nivoom značajnosti od 5%, tj. With nivo samopouzdanja 95% je ispunjenje nejednakosti:

Uglaste zagrade znače da se uzima cijeli dio broja u zagradama. Ako je nejednakost zadovoljena, tada se model smatra adekvatnim.

Za testiranje jednakosti matematičko očekivanje rezidualni niz nula, izračunava se prosječna vrijednost niza reziduala:

Ako je = 0, onda se smatra da model ne sadrži konstantnu sistematsku grešku i da je adekvatan prema kriteriju nulte srednje vrijednosti.

Ako je ≠ 0, tada se testira nulta hipoteza da je matematičko očekivanje jednako nuli. Da biste to učinili, izračunajte Studentov t-test prema formuli:

gdje je S ε standardna devijacija reziduala modela (standardna greška).

Vrijednost t-kriterijuma se upoređuje sa tablicom t αγ . Ako je nejednakost t > t αγ zadovoljena, onda je model neadekvatan prema ovom kriteriju

Varijanca nivoa niza ostataka mora biti ista za sve vrijednosti X(imovina homoskedastičnost) Ako ovaj uslov nije ispunjen, onda heteroskedastičnost .

Za procjenu heteroskedastičnosti s malom veličinom uzorka, može se koristiti Goldfeld–Quandt metoda, čija je suština da je neophodno:

Pronađite varijabilne vrijednosti X u rastućem redoslijedu;

Podijelite skup uređenih zapažanja u dvije grupe;

Za svaku grupu zapažanja konstruirajte regresijske jednačine;

Odredite preostale sume kvadrata za prvu i drugu grupu koristeći formule: ; , Gdje

n 1 - broj zapažanja u prvoj grupi;

n 2 - broj zapažanja u drugoj grupi.

Izračunajte kriterij ili (brojnik mora sadržavati veliki zbir kvadrata). Kada je nulta hipoteza homoskedastičnosti ispunjena, kriterij F calc će zadovoljiti F-kriterijum sa stupnjevima slobode γ 1 =n 1 -m, γ 2 =n - n 1 - m) za svaki preostali zbir kvadrata (gdje je m broj procijenjenih parametara u jednadžbi regresije). Što više vrijednost Fcalc premašuje tabelarnu vrijednost F-kriterijuma, to je više narušena premisa o jednakosti disperzija reziduala.

Provjera nezavisnosti niza ostataka (nedostatak autokorelacije) vrši se pomoću Durbin-Watsonovog d-testa. Određuje se formulom:

Izračunata vrijednost kriterija uspoređuje se sa donjom d 1 i gornjom d 2 kritičnim vrijednostima Durbin-Watsonove statistike. Mogući su sljedeći slučajevi:

1) ako d< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) ako je d 1 < d < d 2 (uključujući i same ove vrijednosti), smatra se da nema dovoljno osnova za izvođenje jednog ili drugog zaključka. Potrebno je koristiti dodatni kriterij, na primjer, prvi koeficijent autokorelacije:

Ako je izračunata vrijednost koeficijenta po modulu manja od tabelarne vrijednosti r 1kr, tada se prihvaća hipoteza o odsustvu autokorelacije; u suprotnom, ova hipoteza se odbacuje;

3) ako je d 2 < d < 2, tada se prihvata hipoteza o nezavisnosti reziduala i model se priznaje kao adekvatan prema ovom kriterijumu;

4) ako je d> 2, to ukazuje na negativnu autokorelaciju reziduala. U tom slučaju, izračunata vrijednost kriterija mora se pretvoriti prema formuli d′= 4 - d i uporediti sa kritičnom vrijednošću d′ , ne d.

Provjera usklađenosti distribucije zaostalog niza sa normalnim zakonom raspodjele može se provesti pomoću R / S - kriterija, koji se određuje formulom:

gdje je S ε standardna devijacija reziduala modela (standardna greška). Izračunata vrijednost R/S - kriterija se uspoređuje sa vrijednostima u tabeli (donja i gornja granica ovog omjera), a ako vrijednost ne pada u interval između kritičnih granica, onda se postavlja hipoteza normalne distribucije. odbacuje se sa datim nivoom značaja; u suprotnom hipoteza je prihvaćena

Za procjenu kvaliteta regresionih modela, također je preporučljivo koristiti indeks korelacije(višestruki koeficijent korelacije).

Formula za određivanje indeksa korelacije

Gdje

Ukupan zbroj kvadrata odstupanja zavisne varijable od srednje vrednosti. Određeno formulom:

Zbir kvadrata odstupanja objašnjenih regresijom. Određeno formulom:

Preostali zbir kvadrata odstupanja. Izračunato prema formuli:

Jednačina može se predstaviti na sljedeći način:

Indeks korelacije ima vrijednost od 0 do 1. Što je veća vrijednost indeksa, to su izračunate vrijednosti rezultirajuće karakteristike bliže stvarnim. Indeks korelacije se koristi za bilo koji oblik povezivanja varijabli; sa uparenom linearnom regresijom, jednaka je koeficijent para korelacije.

Karakteristike tačnosti se koriste kao mjera tačnosti modela: Da bi se odredila mjera tačnosti modela, izračunava se sljedeće:

- maksimalna greška- odgovara odstupanju izračunatog odstupanja izračunatih vrijednosti od stvarnih

- srednja apsolutna greška- greška pokazuje koliko stvarne vrijednosti u prosjeku odstupaju od modela

- varijansa niza reziduala(preostala varijansa)

gdje je prosječna vrijednost niza ostataka. Određeno formulom

- korijen srednje kvadratne greške. To je kvadratni korijen varijanse: , kako manje vrijednosti greške, to je model precizniji

- prosjek relativna greška aproksimacije.

Prosječna greška aproksimacije ne bi trebala prelaziti 8-10%.

Ako je regresijski model prepoznat kao adekvatan, a parametri modela su značajni, nastavite sa izradom prognoze .

predviđenu vrijednost varijabla at se dobija zamjenom očekivane vrijednosti nezavisne varijable u jednadžbu regresije X progn.

Ovo predviđanje se zove tačka. Vjerovatnoća implementacije tačkaste prognoze je skoro nula, tako da se interval povjerenja prognoze izračunava s velikom pouzdanošću.

Intervali pouzdanosti prognoze zavise od standardne greške, uklanjanja X pobjeći od svoje srednje vrijednosti , broj zapažanja n i nivo značajnosti prognoze α. Intervali pouzdanosti prognoze se izračunavaju po formuli: ili

Gdje

t tabela - određena Studentovom tablicom distribucije za nivo značajnosti α i broj stepeni slobode γ=n-k-1.

Primjer 13.

Prema istraživanju osam grupa porodica poznati su podaci o odnosu potrošnje stanovništva na hranu i visine porodičnih prihoda (tabela 36).

Tabela 36 – Odnosi između potrošnje domaćinstava na hranu i porodičnih prihoda

Izdaci za hranu, tis. rub. 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
Porodični prihod, hiljada rubalja 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

Pretpostavimo da je odnos između porodičnih prihoda i izdataka za hranu linearan. Da bismo potvrdili našu pretpostavku, konstruišemo korelaciono polje (slika 8).

Grafikon pokazuje da se tačke postavljaju u neku pravu liniju.

Radi pogodnosti daljih proračuna sastavit ćemo tabelu 37.

Izračunajmo parametre linearna jednačina parna regresija . Da bismo to učinili, koristimo formule:

Slika 8 - Korelaciono polje.

Dobili smo jednačinu:

One. uz povećanje porodičnog prihoda za 1000 rubalja. troškovi hrane se povećavaju za 168 rubalja.

Proračun linearnog koeficijenta korelacije.

1. Osnovne definicije i formule

Pair Regression- regresija (odnos) između dvije varijable, itd. pogledajte model:

gdje je - zavisna varijabla (rezultantni znak);

- nezavisna eksplanatorna varijabla (znak-faktor);

Perturbacija ili stohastička varijabla, uključujući utjecaj faktora koji nisu uzeti u obzir u modelu.

U gotovo svakom pojedinačnom slučaju vrijednost se sastoji od dva pojma:

gdje je stvarna vrijednost efektivne karakteristike;

Teorijska vrijednost rezultirajuće karakteristike, pronađena na osnovu jednadžbe regresije. Znak "^" znači da ne postoji strogi funkcionalni odnos između varijabli i.

Razlikovati linearno I nelinearne regresija.

Linearna regresija je opisana jednačinom prave linije

Nelinearne regresije dijele se u dvije klase:

1) regresije, nelinearne u objašnjavajućim varijablama, ali linearne u procijenjenim parametrima, Na primjer:

Polinomi različitih stupnjeva

Jednakostranična hiperbola

2) regresije, nelinearne u procijenjenim parametrima, Na primjer:

Snaga

Demonstracija

Eksponencijalno

Da bi se izgradila uparena linearna regresija, izračunavaju se pomoćne veličine ( - broj opservacija).

Uzorak znači: I

Kovarijansa uzorka između i

ili

kovarijansa je numerička karakteristika zajedničke distribucije dvije slučajne varijable.

Uzorak varijance za

ili

Uzorak varijance za

ili

Varijanca uzorka karakterizira stupanj širenja vrijednosti slučajne varijable oko srednje vrijednosti (varijabilnost, varijabilnost).

Bliskost veze između proučavanih fenomena ocjenjuje se po koeficijent korelacije uzorka između i

Koeficijent korelacije varira od -1 do +1. Što je bliži od modula do 1, bliži je statistički odnos između i linearnom funkcionalnom.

Ako je =0, onda ne postoji linearna veza između i;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

Pozitivna vrijednost koeficijenta ukazuje da je odnos između znakova direktan (vrijednost raste s rastom), negativna vrijednost ukazuje na inverznu vezu (vrijednost opada s rastom).

Izgradnja linearne regresije svodi se na procjenu njegovih parametara i Klasični pristup procjeni parametara linearne regresije zasniva se na najmanjih kvadrata(MNK). LSM omogućava da se dobiju takve procjene parametara pod kojima je zbroj kvadrata odstupanja stvarnih vrijednosti rezultirajuće karakteristike od teorijskih minimalan, tj.

Za linearnu regresiju, parametri i se nalaze iz sistema normalnih jednačina:

Rješavanje sistema, nalazimo V on

i parametar

Koeficijent sa faktorskom varijablom pokazuje koliko će se vrijednost u prosjeku promijeniti kada se faktor promijeni po jedinici mjere.

Parametar kada If ne može biti jednak 0, onda nema ekonomskog smisla. Moguće je tumačiti samo predznak ako ako je onda relativna promjena rezultata sporija od promjene faktora, tj. varijansa rezultata je manja od varijanse faktora i obrnuto.

Za procjenu kvaliteta izgrađenog regresijskog modela možete koristiti koeficijent odlučnosti ili prosječna greška aproksimacije.

TOkoeficijent determinacije

Or

prikazuje udio varijanse objašnjene regresijom u ukupnoj varijansi rezultirajućeg atributa.Shodno tome, vrijednost karakteriše udio varijanse indikatora uzrokovanog utjecajem faktora koji nisu uzeti u obzir u modelu i drugih razloga.

Što je bliže 1, to je bolji regresijski model, tj. konstruisani model dobro aproksimira početne podatke.

Prosječna greška aproksimacije je prosječno relativno odstupanje teoretskih vrijednosti od stvarnih, tj.

Konstruisana regresiona jednačina se smatra zadovoljavajućom ako vrednost ne prelazi 10-12%.

Za linearnu regresiju prosječni koeficijent elastičnosti nalazi se prema formuli:

Prosječni koeficijent elastičnosti pokazuje za koliko će se procenata prosečno u populaciji rezultat promeniti u odnosu na svoju vrednost kada se faktor promeni za 1% od svoje vrednosti.

Grade hnachimostIregresijske jednačine se općenito daje korištenjem Fisher-testa, koji se sastoji u testiranju hipoteze o statističkoj beznačajnosti jednadžbe regresije . Za to se pravi poređenje stvarnienebo I kritičan(tabela) vrijednosti - Fišerov kriterijum .

određuje se iz omjera vrijednosti faktora i rezidualnih varijansi izračunatih za jedan stepen slobode, tj.

- maksimalna moguća vrijednost kriterijuma pod uticajem slučajnih faktora sa stepenom slobode =1, =-2 i nivoom značajnosti nalazi se iz tabele Fisher kriterijuma (tabela 1 u prilogu).

Nivo značaja- je vjerovatnoća odbacivanja tačne hipoteze, s obzirom da je tačna.

Ako tada se odbacuje hipoteza o nepostojanju veze između proučavanog indikatora i faktora i zaključuje se o značajnosti ove veze sa nivoom značajnosti (tj. jednačina regresije je značajna).

Ako tada se hipoteza prihvata i priznaje se statistička beznačajnost i nepouzdanost jednačine regresije.

Za linearnu regresiju značajkoeficijenti regresije evaluirano sa - Studentov kriterijum, prema kojem se postavlja hipoteza o slučajnoj prirodi indikatora, tj. o njihovoj neznatnoj razlici od nule. Zatim se izračunavaju stvarne vrijednosti kriterija za svaki od procijenjenih koeficijenata regresije, tj.

gdje i - standardne greške parametri linearne regresije određeni su formulama:

- maksimalna moguća vrednost Studentovog kriterijuma pod uticajem slučajnih faktora za dati stepen slobode = -2, a nivo značajnosti se nalazi iz tabele Studentovih kriterijuma (tabela 2 u prilogu).

Ako tada se hipoteza o beznačajnosti koeficijenta regresije odbacuje sa nivoom značajnosti tj. koeficijent ( ili ) se slučajno ne razlikuje od nule i formiran je pod uticajem sistematski delujućeg faktora

Ako tada se hipoteza ne odbacuje i prepoznaje se slučajna priroda formiranja parametra.

Značaj koeficijenta linearne korelacije također provjereno sa - Studentov kriterijum, tj.

Hipoteza o beznačajnosti koeficijenta korelacije se odbacuje sa nivoom značajnosti ako

Komentar. Za linearnu parnu regresiju testiranje hipoteza o značajnosti koeficijenta i koeficijenta korelacije je ekvivalentno testiranju hipoteze o značaju regresione jednadžbe u cjelini, tj.

Da biste izračunali interval pouzdanosti, odredite marginalna greška za svaki indikator, tj.

Intervali pouzdanosti za koeficijente linearne regresije:

Ako nula spada u granice intervala povjerenja, tj. donja granica je negativna, a gornja pozitivna, tada se pretpostavlja da je procijenjeni parametar nula, jer ne može istovremeno poprimiti i pozitivne i negativne vrijednosti.

Predviđena vrijednost se određuje zamjenom odgovarajuće prediktivne vrijednosti u jednadžbu regresije. Zatim se izračunava prosječna standardna greška prognoze

Gdje

i gradi se interval pouzdanosti prognoze

Interval može biti prilično širok zbog malog obima opažanja.

regresije, nelinearne u uključenim varijablama , se jednostavnom promjenom varijabli svode na linearni oblik, a daljnja procjena parametara se vrši metodom najmanjih kvadrata.

Ghyperballicna regresija:

R egresije , nelinearne e prema procijenjenim parametrima dijele se na dvije vrste: interno nelinearnei tako dalje. (nije svedeno na linearni oblik) i interno linearno(sveden na linearni oblik pomoću odgovarajućih transformacija), na primjer:

Eksponencijalna regresija:

Linearizirajuća transformacija:

Regresija snage:

Linearizirajuća transformacija:

Indeksnaya regresija:

Linearizirajuća transformacija:

logaritamskiregresija:

Linearizirajuća transformacija:

2. Rješenje tipičnih problema

Primjer9 .1 . Za 15 poljoprivrednih preduzeća (Tabela 9.1) poznati su: - broj opreme po jedinici zasejane površine (jedinica/ha) i - obim uzgojenih proizvoda (hiljadu den. jedinica). potrebno:

1) odrediti zavisnost od

2) nacrtajte korelacione polja i nacrtajte jednačinu linearne regresije

3) izvući zaključak o kvalitetu modela i izračunati predviđenu vrijednost sa predviđenom vrijednošću od 112% prosječnog nivoa.

Tabela 9.1

Rješenje:

1) U Excelu ćemo sastaviti pomoćnu tabelu 9.2.

Tabela 9.2

Rice.9 .1. Tabela za izračunavanje međuvrijednosti

Izračunajte broj mjerenja Da biste to učinili, u ćeliji B19 stavi = COUNT(A2:A16 ) .

Korišćenje funkcije ∑ (AutoSum) na traci sa alatkama Standard T naya pronađite zbir svih (ćelija B17) i (ćelija C17).

Rice. 9.2. Izračunavanje zbira vrijednosti i prosjeka

Za izračunavanje prosječnih vrijednosti koristimo ugrađenu funkciju MS Excel AVERAGE(), raspon vrijednosti za određivanje prosjeka je naveden u zagradama. Tako je prosečan obim uzgojenih proizvoda za 15 farmi 210.833 hiljada den. jedinica, a prosječan broj vozila je 6.248 jedinica/ha.

Za popunjavanje kolona D, E, F unesite formulu za izračunavanje proizvoda: u ćeliju D2 stavi = B2*C2, zatim pritisnite ENTER na tastaturi. Kliknite levim tasterom miša na ćeliju D2 i, uhvativši donji desni ugao ove ćelije (crni plus), povucite prema dolje do ćelije D16 . Opseg će se automatski popuniti. D3 - D16 .

Za obračun u selektivnooh kovarijansa između i koristite formulu, tj. u ćeliju B21 stavi = D18- B18* C18 i dobijete 418.055 (slika 9.3).

Rice.9 .3. proračun

SelektivnowowdisperzijaYu za pronalaženje po formuli za ovo u ćeliji B22 stavi = E18-B18^2 (^- znak koji pokazuje eksponencijaciju ) i dobijete 11.337. Slično, određujemo \u003d 16745.05556 (slika 9.4)

Rice.9 .4. proračunVar(x) IVar (y)

Nadalje, koristeći standardnu ​​MS Excel funkciju “CORREL”, izračunavamo vrijednost koeficijenta linearne korelacije za naš zadatak, funkcija će izgledati kao “=CORREL(B2:B16;C2:C16)”, a vrijednost rxy=0,96 . Dobijena vrijednost koeficijenta korelacije ukazuje na direktnu i jaku vezu između raspoloživosti opreme i količine uzgojenih proizvoda.

Mi nalazimo Vkoeficijent uzorka linearne regresije =36,87; parametar = -17,78. Dakle, uparena jednačina linearne regresije izgleda kao = -17,78 + 36,87

Koeficijent pokazuje da će sa povećanjem broja opreme za 1 jedinicu/ha, obim uzgojenih proizvoda porasti u proseku za 36.875 hiljada den. jedinice (Sl. 9.5)

Rice.9 .5. Proračun parametara regresione jednadžbe.

Dakle, jednadžba regresije će izgledati ovako: .

Zamjenjujemo stvarne vrijednosti u rezultirajuću jednadžbu x(broj opreme) nalazimo teorijske vrijednosti ​​volumena uzgojenih proizvoda (sl. 9.6).

Rice.9 .6. Proračun teoretskih vrijednosti volumena uzgojenih proizvoda

Koristeći Čarobnjak za karte gradimo korelaciona polja (odabirom stupaca sa vrijednostima i ) i jednadžbu linearne regresije (odabirom stupaca sa vrijednostima i ). Odaberite vrstu grafikona - T spektakl U rezultirajućem dijagramu popunite potrebne parametre (naslov, oznake za osi, legendu, itd.). Kao rezultat, dobijamo grafikon prikazan na Sl. 9.7.

Rice.9 .7. Grafikon zavisnosti zapremine uzgojenih proizvoda od broja opreme

Za procjenu kvaliteta izgrađenog regresijskog modela izračunavamo:

. Tokoeficijent determinacije\u003d 0,92, što pokazuje da je promjena troškova proizvodnje 92% zbog promjene obima proizvodnje, a 8% otpada na udio faktora koji nisu uzeti u obzir u modelu, što ukazuje na kvalitetu izgrađene regresije model;

. Withrednyuyugreškaataproksimacije. Da biste to učinili, u koloni H izračunajte razliku između stvarne i teorijske vrijednosti a u koloni I- izraz . Imajte na umu da se standardna MS Excel funkcija "ABS" koristi za izračunavanje modulo vrijednosti. Prilikom množenja prosječne vrijednosti (ćelija I18 ) na 100% dobijamo 18,2%. Shodno tome, u prosjeku, teorijske vrijednosti odstupaju od stvarnih za 18,2% (Sl. 1.8).

Koristeći Fišerov kriterijum, vršimo procenu hnachimostbjednačineregreWithove uopšte: 150,74.

Na nivou značajnosti od 0,05 = 4,67, određujemo pomoću ugrađene statističke funkcije F DISTRIBUCIJA(Sl. 1.9). Istovremeno, treba imati na umu da je "Degrees_of_freedom1" nazivnik, a "Degrees_of_freedom2" je brojilac, gdje je broj parametara u jednadžbi regresije (imamo 2), n- broj početnih parova vrijednosti (imamo 15).

Jer tada je jednadžba regresije značajna na =0,05.

Rice.9 .8. Određivanje koeficijenta determinacije iprosječna greška aproksimacije

Rice. 9 . 9 . Prozor dijalogafunkcijeF DISTRIBUCIJA

Dalje, definišemo Withsrednji koeficijent elastičnosti prema formuli. Utvrđeno je da će se povećanjem obima proizvedenih proizvoda za 1% troškovi proizvodnje ovih proizvoda u prosjeku povećati za 1,093%.

Izračunati prognozirana vrijednost zamjenom predviđene vrijednosti faktora =1,12=6,248*1,12=6,9978 u regresionu jednačinu =-19,559+36,8746. Dobijamo =238,48. Sledstveno, sa brojem opreme u iznosu od 6,9978 jedinica/ha, obim proizvodnje će biti 238,48 hiljada den. jedinice

Pronađite zaostalu varijansu, za to izračunavamo zbir kvadrata razlike između stvarne i teorijske vrijednosti. =39.166 stavljanjem sljedeće formule = KORIJEN(J17/(B19-2)) u ćeliju H2 1 (Sl. 9.10).

Rice.9 .10. Određivanje preostale varijanse

WITHrednyastandardth errorprognoza:

Na nivou značajnosti =0,05 koristeći ugrađenu statističku funkciju STEUDRESPOBR definišemo =2,1604 i izračunamo graničnu grešku prognoze, koja u 95% slučajeva neće premašiti .

Dinterval pouzdanosti prognoze:

Or .

Prognoza troškova proizvodnje pokazala se pouzdanom (1-0,05=0,95), ali netačnom, jer je raspon gornje i donje granice intervala povjerenja puta. To se dogodilo zbog malog obima zapažanja.

Mora se poništiti da MS Excel ima ugrađene statističke funkcije koje mogu značajno smanjiti broj međukalkulacija, na primjer (slika 9.11.):

Da izračunam VselektivnoXprosjekX koristite funkciju PROSEK(broj1:brojN) iz kategorije Statistički .

Kovarijansa uzorka između i nalazi se pomoću funkcije COVAR(nizX;arrayY) iz kategorije Statistički .

SelektivnosdisperzijaI određena statističkom funkcijom VARP(broj1:brojN) .

Rice.9 .eleven. Računarstvo nindeksira ugrađene funkcijeGOSPOĐAexcel

Pparametarslinearna regresija u Excel-u se može definirati na nekoliko načina.

1 način) Sa ugrađenom funkcijom LINEST. Procedura je sljedeća:

1. Odaberite područje praznih ćelija 5x2 (5 redaka, 2 kolone) za prikaz rezultata statistike regresije ili područje 1x2 - da dobijete samo regresijske koeficijente.

2. Korišćenje Čarobnjaci funkcija među statistički izaberite funkciju LINEST i popunite njegove argumente (slika 9.12):

Rice. 9 . 12 . Dijaloški okvir za unos argumenta funkcijeLINEST

poznate_vrijednosti_y

poznate_vrijednosti_x

Konst- logička vrijednost (1 ili 0), koja ukazuje na prisustvo ili odsustvo slobodnog člana u jednačini; staviti 1;

Statistika- logička vrijednost (1 ili 0) koja pokazuje da li treba prikazati dodatne informacije o regresionoj analizi ili ne; staviti 1.

3. Prvi broj tabele će se pojaviti u gornjoj lijevoj ćeliji odabranog područja. Pritisnite dugme da otvorite celu tabelu. < F2> , a zatim - na kombinaciju tipki < CTRL> + < SHIFT> + < ENTER> .

Dodatna statistika regresije će biti prikazana u obliku (Tabela 9.3):

Tabela 9.3

Vrijednost koeficijenta

Vrijednost koeficijenta

RMS
odstupanje

RMS
odstupanje

Koeficijent
određenja

RMS
odstupanje

Statistika

Broj stepeni slobode

Regresijski zbir kvadrata

Preostali zbir kvadrata

Kao rezultat primjene funkcije LINEST dobijamo:

( 2 način) Korištenje alata za analizu podataka Regresija možete dobiti rezultate statistike regresije, analize varijanse, intervali poverenja, reziduali, dijagrami uklapanja regresijskih linija, dijagrami reziduala i normalne vjerovatnoće. Procedura je sljedeća:

1. Morate provjeriti pristup Paket analiza. Da biste to uradili, u glavnom meniju (putem dugmeta Microsoft Office za pristup opcijama MS Excel-a) u „Opcije GOSPOĐAexcel» odaberite naredbu "Dodaci" i odaberite dodatak s desne strane Analiza paketa A zatim kliknite na dugme "Idi" (slika 9.13). U dijaloškom okviru koji se otvori, označite polje pored "Paket analize" i kliknite na "OK" (slika 9.14).

Na kartici "Podaci" u grupi "Analiza" imat ćete pristup instaliranom dodatku. (Sl. 9.15).

Rice.9 .13. Omogućite dodatke uGOSPOĐAexcel

Rice.9 .14. Dijaloški okvir za dodatke

Rice.9 .15. Dodatak za analizu podataka na traciGOSPOĐAexcel 2007 .

2. Odaberite "Podaci" u grupi "Analiza", odaberite naredbu Analiza da n nyh u dijaloškom okviru koji se otvori odaberite alat za analizu "Regresija" i kliknite "OK" (slika 9.16):

Rice.9 .16. Dijaloški okvir za analizu podataka

U dijaloškom okviru koji se pojavi (slika 9.17) popunite polja:

ulazni intervalY- opseg koji sadrži podatke efektivnog atributa Y;

ulazni intervalX- opseg koji sadrži podatke eksplanatornog atributa X;

Oznake- zastavicu koja pokazuje da li prvi red sadrži nazive kolona ili ne;

Konstant zero- zastavicu koja označava prisustvo ili odsustvo slobodnog člana u jednačini;

izlazni interval- dovoljno je naznačiti gornju lijevu ćeliju budućeg raspona;

Novi radni list- možete postaviti proizvoljan naziv za novi list na kojem će biti prikazani rezultati.

Rice.9 .17. Dijaloški okvir Regresija

Za preostale informacije, rezidualne dijagrame, uklapanje i normalnu vjerovatnoću, označite odgovarajuća polja za potvrdu u dijaloškom okviru.

Rice. 9 . 18 . Rezultati primjene alataRegresija

IN GOSPOĐAexcel linija trenda može se dodati na trakasti ili linijski grafikon. Za ovo:

1. Potrebno je odabrati područje izgradnje grafikona i na traci odabrati "Layout" i u grupi za analizu odabrati naredbu "Linija trenda" (Sl. 9.19.). U padajućem izborniku odaberite "Napredne opcije trenda".

Rice. 1.19.Ribbon

2. U dijaloškom okviru koji se pojavi odaberite stvarne vrijednosti, a zatim će se otvoriti dijaloški okvir "Trend Line Format" (Sl. 9.20.) u kojem se bira tip linije trenda i postavljaju odgovarajući parametri.

Rice. 9 . 20 . Prozor dijaloga"Format linije trenda"

Za polinomski trend, morate navesti stepen aproksimativnog polinoma, za linearno filtriranje, broj tačaka usrednjavanja.

Izaberi Linearno da se napravi jednačina linearne regresije.

Za dodatne informacije možete prikaži jednačinu na diAgram I staviti vrijednost na dijagram(sl.9.21).

Rice. 9 . 21 . Linearni trend

Modeli nelinearne regresije su ilustrirani prilikom izračunavanja parametara jednadžbe pomoću statističke funkcije odabrane u Excelu LGRFPRIBL. Procedura izračuna je slična korištenju funkcije LINEST.

Parna regresijska jednačina.

Na osnovu korelacionog polja, može se pretpostaviti (za opću populaciju) da je odnos između svih mogućih vrijednosti X i Y linearan.

Jednačina linearne regresije je y = bx + a + ε

Sistem normalnih jednačina.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Za naše podatke sistem jednačina ima oblik

12a + 1042 b = 1709

1042 a + 91556 b = 149367

Iz prve jednačine koju izražavamo A i zamijeni u drugu jednačinu:

Dobijamo koeficijente empirijske regresije: b = 0,9, a = 64,21

Regresijska jednačina (empirijska regresijska jednačina):

y = 0,9 x + 64,21

Empirijski regresijski koeficijenti a I b su samo procjene teorijskih koeficijenata β i , a sama jednadžba odražava samo opći trend ponašanja varijabli koje se razmatraju.

Za izračunavanje parametara linearne regresije napravićemo proračunsku tabelu (Tabela 1)

1. Parametri regresione jednadžbe.

Uzorak znači.

Uzorci varijacija:

standardna devijacija

1.1. Koeficijent korelacije

kovarijansa.

Izračunavamo indikator bliskosti komunikacije. Takav pokazatelj je selektivni linearni koeficijent korelacije, koji se izračunava po formuli:

1.2. Regresijska jednačina(procjena jednadžbe regresije).

Jednačina linearne regresije je y = 0,9 x + 64,21

1.3. Koeficijent elastičnosti.

Koeficijent elastičnosti se nalazi po formuli:

1.4. Greška aproksimacije.

Greška aproksimacije unutar 5%-7% ukazuje na dobar odabir jednačine regresije prema originalnim podacima.

1.5. Empirijska korelacija.

Empirijski korelacijski odnos se izračunava za sve oblike povezanosti i služi za mjerenje bliskosti zavisnosti. Promjene unutar .

Indeks korelacije.

Za linearnu regresiju, indeks korelacije je jednak koeficijentu korelacije r xy = 0,79.

Za bilo koji oblik zavisnosti, nepropusnost veze se određuje pomoću koeficijent višestruke korelacije:

1.6. Koeficijent determinacije.

Najčešće, dajući tumačenje koeficijenta determinacije, on se izražava u postocima.

R2 = 0,792 = 0,62

Za procjenu kvaliteta parametara linearne regresije napravit ćemo proračunsku tablicu (Tabela 2)

2. Procjena parametara regresione jednadžbe.

2.1. Značaj koeficijenta korelacije.

Da bi se testirala nulta hipoteza na nivou značajnosti α da je opšti koeficijent korelacije normalne dvodimenzionalne slučajne varijable jednak nuli sa konkurentskom hipotezom H 1 ≠ 0, potrebno je izračunati uočenu vrednost kriterijuma

i prema tabeli kritičnih tačaka Studentove distribucije, s obzirom na nivo značajnosti α i broj stepena slobode k = n - 2, naći kritičnu tačku t crit dvostranog kritičnog područja. Ako t obs< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t crit - nulta hipoteza se odbacuje.

Prema Studentovoj tabeli sa nivoom značajnosti α=0,05 i stepenima slobode k=10 nalazimo t crit:

gdje je m = 1 broj varijabli koje objašnjavaju.

2.2. Intervalna procjena koeficijenta korelacije (interval povjerenja).

2.3. Analiza tačnosti određivanja procjena regresijskih koeficijenata.

Nepristrasna procjena varijanse perturbacija je vrijednost:

S 2 y = 53,63 - neobjašnjiva varijansa (mjera disperzije zavisne varijable oko linije regresije).

S y = 7,32 - standardna greška procjene (standardna greška regresije).

S a - standardna devijacija slučajne varijable a.

S b - standardna devijacija slučajne varijable b.

2.4. Intervali povjerenja za zavisnu varijablu.

(a + bx p ± ε)

Izračunajmo granice intervala u kojem će 95% mogućih vrijednosti Y biti koncentrisano s neograničenim brojem promatranja i X p = 107

Individualni intervali povjerenja za Y s obzirom na vrijednost X.

(a + bx i ± ε)

t crit (n-m-1;α/2) = (10;0,025) = 2,228

2.5. Testiranje hipoteza u pogledu koeficijenata jednačine linearne regresije.

1) t-statistika. Studentov kriterijum.

t crit (n-m-1;α/2) = (10;0,025) = 2,228

Interval povjerenja za koeficijente regresione jednadžbe.

(b - t krit S b; b + t krit S b)

(a - t crit S a; a + t crit S a)

2) F-statistika. Fišerov kriterijum.

Tabelarna vrijednost kriterija sa stupnjevima slobode k 1 = 1 i k 2 = 10, F tablica = 4,96

Linearna regresija para se široko koristi u ekonometriji u obliku jasne ekonomske interpretacije njenih parametara. Linearna regresija se svodi na pronalaženje jednačine oblika

ili . (3.6)

Tipska jednadžba omogućava date vrijednosti faktora X imaju teorijske vrijednosti efektivne karakteristike, zamjenjujući stvarne vrijednosti faktora u njega x.

Konstrukcija uparene linearne regresije svodi se na procjenu njenih parametara i . Procjene parametara linearne regresije mogu se pronaći različitim metodama. Na primjer, metoda najmanjih kvadrata (LSM).

Prema metodi najmanjih kvadrata procjene parametara i biraju se na takav način da zbir kvadrata odstupanja stvarnih vrijednosti rezultirajuće karakteristike (y) od izračunatog (teorijskog, modelskog) bio minimalan.Drugim rečima, iz čitavog skupa linija bira se linija regresije na grafu tako da zbir kvadrata vertikalnih rastojanja između tačaka i ove linije bude minimalan (sl. 3.2):

, (3.7)

Rice. 3.2. Regresijska linija sa minimalnim zbirom kvadrata vertikalnih udaljenosti između tačaka i ove linije

Za dalje zaključke u izrazu (3.7) zamjenjujemo vrijednost modela, tj., i dobijamo:

Da bi se pronašao minimum funkcije (3.8), potrebno je izračunati parcijalne izvode u odnosu na svaki od parametara I i izjednačiti ih sa nulom:

Transformacijom ovog sistema dobijamo sledeći sistem normalnih jednačina za procenu parametara i :

. (3.9)

Matrični oblik ovog sistema ima oblik:

. (3.10)

Rješavajući sistem normalnih jednačina (3.10) u matričnom obliku dobijamo:

Algebarski oblik rješenja sistema (3.11) može se napisati na sljedeći način:

Nakon jednostavnih transformacija, formula (3.12) se može napisati u prikladnom obliku:

Treba napomenuti da se procjene parametara regresione jednadžbe mogu dobiti i korištenjem drugih formula, na primjer:

(3.14)

Ovdje je uzorak koeficijenta linearne korelacije u paru.

Nakon izračunavanja parametara regresije, možemo napisati jednačinu matematičkog modela regresija:

Treba napomenuti da parametar pokazuje prosječnu promjenu rezultata sa promjenom faktora za jednu jedinicu. Dakle, ako je u funkciji troškova (u - troškovi (hiljadu rubalja), X- broj proizvodnih jedinica). Dakle, sa povećanjem obima proizvodnje (X) za 1 jedinicu troškovi proizvodnje rastu u prosjeku za 2 hiljade rubalja, odnosno dodatno povećanje proizvodnje za 1 jedinicu. će zahtijevati povećanje troškova u prosjeku za 2 hiljade rubalja.

Mogućnost jasne ekonomske interpretacije koeficijenta regresije učinila je jednačinu linearne regresije prilično uobičajenom u ekonometrijskim studijama.

Formalno - značenje at at X= 0. Ako predznak-faktor nema i ne može imati nultu vrijednost, onda gornja interpretacija slobodnog pojma nema smisla. Parametar možda nemaju ekonomski sadržaj. Pokušaji ekonomskog tumačenja parametra može dovesti do apsurda, posebno kada < 0.

Primjer 3.2. Pretpostavimo da se za grupu preduzeća koja proizvode istu vrstu proizvoda razmatra funkcija troškova: . Informacije potrebne za izračunavanje procjena parametara i , predstavljeno u tabeli. 3.1.

Tabela 3.1

Procijenjeno sto

broj kompanije

Izlaz, hiljade jedinica ()

Troškovi proizvodnje, milioni rubalja ()

Sistem normalnih jednačina će izgledati ovako:

.

Rješenje ovog sistema po formuli (4.13) daje rezultat:

Napišimo model regresione jednadžbe (4.16):

Zamjena vrijednosti u jednačinu x, nalazimo teorijske (modelne) vrijednosti y,(vidi posljednju kolonu tabele 3.1).

U ovom slučaju, vrijednost parametra nema ekonomskog smisla.

U ovom primjeru imamo:

Jednačina regresije je uvijek dopunjena indikatorom nepropusnosti veze. Kada se koristi linearna regresija, koeficijent linearne korelacije djeluje kao takav indikator. Postoje različite modifikacije formule koeficijenta linearne korelacije. Neki od njih su navedeni u nastavku:

Kao što znate, koeficijent linearne korelacije je u granicama: .

Ako je koeficijent regresije , tada, i obrnuto, na, .

Prema tabeli. 4.1, vrijednost koeficijenta linearne korelacije bila je 0,993, što je prilično blizu 1 i znači da postoji vrlo bliska zavisnost troškova proizvodnje od obima proizvodnje.

Treba imati na umu da vrijednost koeficijenta linearne korelacije ocjenjuje bliskost odnosa razmatranih karakteristika u njegovom linearnom obliku. Stoga, blizina apsolutne vrijednosti koeficijenta linearne korelacije nuli ne znači da ne postoji veza između obilježja. Uz drugačiju specifikaciju modela, odnos između karakteristika može biti prilično blizak.

Za procjenu kvaliteta izbora linearne funkcije izračunava se kvadrat koeficijenta linearne korelacije, tzv. koeficijent determinacije. Koeficijent determinacije karakteriše proporciju varijanse efektivne karakteristike y, objasniti regresijom, u ukupnoj varijansi rezultirajuće karakteristike.

Shodno tome, vrijednost karakterizira udio disperzije uzrokovane utjecajem drugih faktora koji nisu uzeti u obzir u modelu.

U našem primjeru. Prema tome, jednačina regresije objašnjava 98,6% varijanse rezultirajućeg atributa, a samo 1,4% njegove varijanse (tj. preostale varijanse) otpada na udio drugih faktora. Vrijednost koeficijenta determinacije služi kao jedan od kriterija za ocjenu kvaliteta linearnog modela. Što je veći udio objašnjene varijacije, to je manja uloga ostalih faktora, te stoga linearni model dobro aproksimira početne podatke i može se koristiti za predviđanje vrijednosti efektivnog atributa. Dakle, pod pretpostavkom da obim proizvodnje preduzeća može biti 6 hiljada . jedinica, predviđena vrijednost troškova proizvodnje iznosit će 221,01 hiljada rubalja.

Parna linearna regresija

RADIONICA

parna soba linearna regresija: Radionica. -

Studij ekonometrije podrazumeva sticanje iskustva studenata u izgradnji ekonometrijskih modela, donošenju odluka o specifikaciji i identifikaciji modela, odabiru metode za procenu parametara modela, proceni njegovog kvaliteta, interpretaciji rezultata, dobijanju prediktivnih procena itd. Radionica će pomoći studentima steknu praktične vještine u ovim pitanjima.

Odobreno od strane uredničkog i izdavačkog vijeća

Sastavio: M.B. Perova, doktor ekonomskih nauka, prof

Opće odredbe

Ekonometrijsko istraživanje počinje teorijom koja uspostavlja odnose između pojava. Iz čitavog niza faktora koji utiču na efektivno svojstvo izdvajaju se najznačajniji faktori. Nakon što se utvrdi postojanje veze između proučavanih karakteristika, pomoću regresione analize se utvrđuje tačan oblik ovog odnosa.

Regresiona analiza sastoji se u definiciji analitičkog izraza (u definiciji funkcije), u kojem je promjena jedne vrijednosti (rezultantnog atributa) posljedica utjecaja nezavisne vrijednosti (faktorski atribut). Ovaj odnos se može kvantificirati konstruiranjem jednadžbe regresije ili funkcije regresije.

Osnovni regresijski model je upareni (jednofaktorski) regresijski model. Pair Regression– jednačina veze dvije varijable at I X:

Gdje - zavisna varijabla (rezultantni znak);

– nezavisna, eksplanatorna varijabla (faktorski znak).

U zavisnosti od prirode promene at sa promjenom X razlikovati linearne i nelinearne regresije.

Linearna regresija

Ova funkcija regresije naziva se polinom prvog stepena i koristi se za opisivanje procesa koji se ravnomerno razvijaju u vremenu.

Imati slučajnog člana (greške regresije) povezuje se sa uticajem na zavisnu varijablu drugih faktora koji nisu uzeti u obzir u jednačini, sa mogućom nelinearnošću modela, greškama merenja, dakle, pojavom jednačina slučajne greške regresija može biti posljedica sljedećeg cilja razlozi:

1) nereprezentativnost uzorka. Model uparene regresije uključuje faktor koji nije u mogućnosti da u potpunosti objasni varijaciju u varijabli ishoda, na koju mogu u mnogo većoj mjeri utjecati mnogi drugi faktori (varijable koje nedostaju). Zaposlenost, plate mogu zavisiti, pored kvalifikacija, od nivoa obrazovanja, radnog iskustva, pola, itd.;

2) postoji mogućnost da se varijable uključene u model mogu izmjeriti greškom. Na primjer, podaci o porodičnim izdacima za hranu se prikupljaju iz evidencije učesnika ankete, od kojih se očekuje da pažljivo bilježe svoje dnevne troškove. Naravno, to može dovesti do grešaka.

Na osnovu posmatranja uzorka, procjenjuje se jednadžba regresije uzorka ( regresijska linija):

,

Gdje
– procjene parametara regresione jednadžbe (
).

Analitički oblik zavisnosti između proučavanog para obilježja (regresijska funkcija) određuje se pomoću sljedećeg metode:

    Na osnovu teorijske i logičke analize priroda proučavanih pojava, njihova društveno-ekonomska suština. Na primjer, ako se proučava odnos između dohotka stanovništva i veličine depozita stanovništva u bankama, onda je očigledno da je veza direktna.

    Grafička metoda kada se priroda odnosa procjenjuje vizuelno.

Ova zavisnost se može jasno vidjeti ako izgradite graf iscrtavanjem vrijednosti atributa na x-osi X, a na y-osi - vrijednosti obilježja at. Stavljanje na grafikon tačaka koje odgovaraju vrijednostima X I at, dobijamo korelaciono polje:

a) ako su tačke nasumično raspoređene po cijelom polju, to ukazuje na nepostojanje veze između ovih karakteristika;

b) ako su tačke koncentrisane oko ose koja se proteže od donjeg levog ugla do gornjeg desnog, tada postoji direktna veza između karakteristika;

c) ako su tačke koncentrisane oko ose koja ide od gornjeg lijevog ugla do donjeg desnog, tada je odnos između karakteristika inverzan.

Ako povežemo tačke na korelacionom polju sa pravim segmentima, onda ćemo dobiti izlomljenu liniju sa određenim uzlaznim trendom. Ovo će biti empirijska veza ili empirijska regresijska linija. Po njegovom izgledu može se suditi ne samo o prisutnosti, već io obliku odnosa između proučavanih karakteristika.

Izgradnja jednadžbe regresije para

Konstrukcija regresione jednadžbe se svodi na procjenu njenih parametara. Ove procjene parametara mogu se pronaći na različite načine. Jedna od njih je metoda najmanjih kvadrata (LSM). Suština metode je sljedeća. Svaka vrijednost odgovara empirijskoj (opaženoj) vrijednosti . Konstruiranjem jednadžbe regresije, na primjer, jednačine pravolinijske, svaka vrijednost će odgovarati teorijskoj (izračunatoj) vrijednosti . Uočene vrijednosti ne leže tačno na liniji regresije, tj. ne poklapaju se sa . Razlika između stvarne i izračunate vrijednosti zavisne varijable se naziva ostatak:

LSM vam omogućava da dobijete takve procjene parametara, u kojima je zbir kvadrata odstupanja stvarnih vrijednosti efektivne karakteristike at od teorijskih , tj. zbir kvadrata ostataka, minimum:

Za linearne jednadžbe i nelinearne jednadžbe koje se svode na linearne, rješava se sljedeći sistem s obzirom na A I b:

Gdje n- veličina uzorka.

Rješavajući sistem jednačina, dobijamo vrijednosti A I b, što nam omogućava da pišemo jednadžba regresije(jednačina regresije):

Gdje je eksplanatorna (nezavisna) varijabla;

–objašnjena (zavisna) varijabla;

Regresijska linija prolazi kroz tačku ( ,) i jednakosti su ispunjene:

Možete koristiti gotove formule koje slijede iz ovog sistema jednadžbi:

Gdje - prosječna vrijednost zavisne karakteristike;

je prosječna vrijednost nezavisnog obilježja;

je aritmetička sredina proizvoda zavisnih i nezavisnih karakteristika;

je varijansa nezavisne karakteristike;

je kovarijansa između zavisnih i nezavisnih karakteristika.

Kovarijansa uzorka dvije varijable X, at naziva se prosječna vrijednost proizvoda odstupanja ovih varijabli od njihovih prosjeka

Parametar b at X je od velike praktične važnosti i naziva se koeficijent regresije. Koeficijent regresije pokazuje za koliko se jedinica u prosjeku mijenja vrijednost at X 1 jedinica njegove mjere.

Znak parametra b u regresijskoj jednadžbi para pokazuje smjer odnosa:

Ako
, tada je odnos između proučavanih indikatora direktan, tj. sa povećanjem predznaka faktora X rezultujući predznak se povećava at, i obrnuto;

Ako
, tada je odnos između proučavanih indikatora inverzan, tj. sa povećanjem predznaka faktora X efektivan znak at smanjuje i obrnuto.

Vrijednost parametra A u jednadžbi regresije para u nekim slučajevima može se tumačiti kao početna vrijednost efektivne karakteristike at. Ova interpretacija parametra A moguće samo ako je vrijednost
ima značenje.

Nakon izgradnje regresione jednadžbe, uočene vrijednosti y može se zamisliti kao:

Ostaje , kao i greške , are slučajne varijable, ali oni, za razliku od grešaka , vidljivo. Ostatak je dio zavisne varijable y, što se ne može objasniti jednadžbom regresije.

Na osnovu jednačine regresije može se izračunati teorijske vrijednosti X za bilo koje vrednosti X.

U ekonomskoj analizi često se koristi koncept elastičnosti funkcije. Funkcija elastičnosti
izračunato kao relativna promjena y na relativnu promjenu x. Elastičnost pokazuje koliko se funkcija mijenja
kada se nezavisna varijabla promijeni za 1%.

Budući da je elastičnost linearne funkcije
nije konstantan, već zavisi od X, tada se koeficijent elastičnosti obično izračunava kao prosječni indeks elastičnosti.

Koeficijent elastičnosti pokazuje za koliko posto će se vrijednost efektivnog atributa u prosjeku promijeniti u agregatu at pri promeni predznaka faktora X 1% njegove prosječne vrijednosti:

Gdje
– prosječne vrijednosti varijabli X I at u uzorku.

Procjena kvaliteta izgrađenog regresijskog modela

Kvaliteta regresijskog modela– adekvatnost izgrađenog modela početnim (posmatranim) podacima.

Za mjerenje nepropusnosti veze, tj. da biste izmjerili koliko je blizu funkcionalnoj, morate odrediti varijansu koja mjeri odstupanja at od at X i karakteriziranje rezidualne varijacije zbog drugih faktora. Oni su u osnovi indikatora koji karakterišu kvalitet regresionog modela.

Kvalitet parne regresije se određuje korišćenjem koeficijenata koji karakterišu

1) nepropusnost veze - indeks korelacije, upareni linearni koeficijent korelacije;

2) greška aproksimacije;

3) kvalitet jednačine regresije i njenih pojedinačnih parametara - srednje kvadratne greške regresione jednačine kao celine i njenih pojedinačnih parametara.

Za regresijske jednačine bilo koje vrste je definirana indeks korelacije, koji karakteriše samo tesnost korelacione zavisnosti, tj. stepen njegove aproksimacije funkcionalnoj vezi:

,

Gdje – faktorska (teorijska) varijansa;

je ukupna varijansa.

Indeks korelacije uzima vrijednosti
, pri čemu,

Ako

Ako
je odnos između karakteristika X I at je funkcionalan, što bliže do 1, uzima se u obzir bliža veza između proučavanih osobina. Ako
, onda se odnos može smatrati bliskim

Izračunavaju se varijanse potrebne za izračunavanje pokazatelja nepropusnosti veze:

Ukupna varijansa, koji mjeri ukupnu varijaciju zbog djelovanja svih faktora:

Faktorska (teorijska) varijansa, mjerenje varijacije rezultirajuće osobine at zbog djelovanja faktorskog znaka X:

Preostala disperzija, koji karakteriše varijaciju osobine at zbog svih faktora osim X(tj. sa isključenim X):

Zatim, prema pravilu sabiranja varijansi:

Kvaliteta parne sobe linearno regresija se može definirati i pomoću upareni koeficijent linearne korelacije:

,

Gdje
– kovarijansa varijabli X I at;

– standardna devijacija nezavisnog obeležja;

je standardna devijacija zavisne karakteristike.

Koeficijent linearne korelacije karakterizira čvrstoću i smjer odnosa između proučavanih karakteristika. Mjeri se unutar [-1; +1]:

Ako
- tada je odnos između znakova direktan;

Ako
- tada je odnos između znakova inverzan;

Ako
– tada nema veze između znakova;

Ako
ili
- tada je odnos između karakteristika funkcionalan, tj. karakterizira savršen spoj između X I at. Što bliže do 1, uzima se u obzir bliža veza između proučavanih osobina.

Ako se indeks korelacije (upareni linearni koeficijent korelacije) stavi na kvadrat, onda se dobije koeficijent determinacije.

Koeficijent determinacije- predstavlja udio faktorske varijanse u ukupnom iznosu i pokazuje koliko je posto varijacija rezultirajućeg atributa at objašnjeno varijacijom faktorske osobine X:

Ne pokriva sve varijacije. at od faktorske osobine X, već samo onaj njegov dio koji odgovara jednadžbi linearne regresije, tj. emisije specifična gravitacija varijacija rezultirajuće osobine, linearno povezana sa varijacijom faktorske osobine.

Vrijednost
- udio varijacije rezultirajućeg atributa, koji regresijski model nije mogao uzeti u obzir.

Raskid tačaka u korelacionom polju može biti veoma velik, a izračunata jednačina regresije može dati veliku grešku u proceni analiziranog indikatora.

Prosječna greška aproksimacije prikazuje prosječno odstupanje izračunatih vrijednosti od stvarnih:

Maksimalna dozvoljena vrijednost je 12–15%.

Standardna greška se koristi kao mjera širenja zavisne varijable oko linije regresije.Za cijeli skup promatranih vrijednosti, standard (rms) greška regresijske jednačine, što je standardna devijacija stvarnih vrijednosti at u odnosu na teorijske vrijednosti izračunate regresijskom jednadžbom at X .

,

Gdje
je broj stepeni slobode;

m je broj parametara jednadžbe regresije (za pravolinijske jednačine m=2).

Procijenite vrijednost prosjeka kvadratna greška možete ga uporediti

a) sa prosječnom vrijednošću efektivne karakteristike at;

b) sa standardnom devijacijom karakteristike at:

Ako
, onda je upotreba ove regresione jednadžbe prikladna.

Zasebno ocijenjeno standard (rms) greške parametara jednačine i indeksa korelacije:

;
;
.

X- standardna devijacija X.

Provjera značaja regresione jednačine i pokazatelja nepropusnosti veze

Da bi se izgrađeni model koristio za dalje ekonomske proračune, nije dovoljno provjeriti kvalitet izrađenog modela. Također je potrebno provjeriti značajnost (važnost) procjena regresione jednačine i indikatora bliskosti veze dobijenog metodom najmanjih kvadrata, tj. potrebno je provjeriti njihovu usklađenost sa pravim parametrima odnosa.

To je zbog činjenice da pokazatelji izračunati za ograničenu populaciju zadržavaju element slučajnosti svojstven pojedinačnim vrijednostima atributa. Dakle, oni su samo procjene određene statističke pravilnosti. Potrebno je procijeniti stepen tačnosti i značajnosti (pouzdanosti, materijalnosti) parametara regresije. Ispod važnost razumjeti vjerovatnoću da vrijednost provjerenog parametra nije jednaka nuli ne uključuje vrijednosti suprotnih predznaka.

Test značajnosti– provjera pretpostavke da se parametri razlikuju od nule.

Procjena značaja uparene regresione jednačine svodi se na testiranje hipoteza o značaju regresione jednadžbe u cjelini i njenih pojedinačnih parametara ( a, b), koeficijent determinacije para ili indeks korelacije.

U ovom slučaju se može iznijeti sljedeće glavne hipotezeH 0 :

1)
– koeficijenti regresije su beznačajni i jednačina regresije je takođe beznačajna;

2)
– koeficijent determinacije para je beznačajan i regresiona jednačina je takođe beznačajna.

Alternativne (ili obrnute) su sljedeće hipoteze:

1)
– koeficijenti regresije se značajno razlikuju od nule, a konstruisana jednačina regresije je značajna;

2)
– koeficijent determinacije para se značajno razlikuje od nule i konstruisana regresiona jednačina je značajna.

Testiranje hipoteze o značaju uparene regresijske jednadžbe

Za testiranje hipoteze o statističkoj beznačajnosti regresione jednadžbe u cjelini i koeficijenta determinacije koristimo F-kriterijum(Fišerov kriterijum):

ili

Gdje k 1 = m–1 ; k 2 = nm je broj stepeni slobode;

n je broj populacijskih jedinica;

m je broj parametara jednadžbe regresije;

– faktor disperzije;

je rezidualna varijansa.

Hipoteza se provjerava na sljedeći način:

1) ako je stvarna (uočena) vrijednost F-kriterijum je veći od kritične (tabelarne) vrijednosti ovog kriterija
, zatim sa vjerovatnoćom
odbacuje se glavna hipoteza o beznačajnosti jednačine regresije ili para koeficijenta determinacije, a regresiona jednačina se priznaje kao značajna;

2) ako je stvarna (uočena) vrijednost F-kriterijuma manja od kritične vrijednosti ovog kriterija
, zatim sa vjerovatnoćom (
) prihvata se glavna hipoteza o beznačajnosti regresione jednačine ili para koeficijenta determinacije, a konstruisana regresiona jednačina se priznaje kao beznačajna.

kritična vrijednost F- kriterijum se nalazi prema odgovarajućim tabelama u zavisnosti od nivoa značajnosti i broj stepena slobode
.

Broj stepeni slobode– indikator, koji se definiše kao razlika između veličine uzorka ( n) i broj procijenjenih parametara za ovaj uzorak ( m). Za model uparene regresije, broj stupnjeva slobode se izračunava kao
, budući da su dva parametra procijenjena iz uzorka (
).

Nivo značaja - utvrđena vrijednost
,

Gdje je vjerovatnoća povjerenja da procijenjeni parametar spada u interval pouzdanosti. Obično se uzima 0,95. Dakle je vjerovatnoća da procijenjeni parametar neće pasti u interval pouzdanosti, jednak 0,05 (5%).

Zatim, u slučaju procene značajnosti uparene regresione jednačine, kritična vrednost F-kriterijuma se izračunava kao
:

.

Testiranje hipoteze o značajnosti parametara jednadžbe regresije para i indeksa korelacije

Prilikom provjere značajnosti parametara jednačine (pretpostavka da se parametri razlikuju od nule) postavlja se glavna hipoteza o beznačajnosti dobijenih procjena (
. Kao alternativna (obrnuta) hipoteza se postavlja o značaju parametara jednačine (
).

Za testiranje predloženih hipoteza koristimo se t -kriterijum (t-statistika) Student. Uočena vrijednost t-kriterijum se poredi sa vrednošću t-kriterijum određen Studentovom raspodjelom (kritična vrijednost). kritična vrijednost t- kriterijumi
zavisi od dva parametra: nivoa značajnosti i broj stepena slobode
.

Predložene hipoteze se testiraju na sljedeći način:

1) ako je modul posmatrane vrednosti t-kriterijum je veći od kritične vrijednosti t-kriterijumi, tj.
, zatim sa vjerovatnoćom
odbacuje se glavna hipoteza o beznačajnosti parametara regresije, tj. parametri regresije nisu jednaki 0;

2) ako je modul posmatrane vrednosti t- kriterij je manji ili jednak kritičnoj vrijednosti t-kriterijumi, tj.
, zatim sa vjerovatnoćom
prihvata se glavna hipoteza o beznačajnosti parametara regresije, tj. parametri regresije se gotovo ne razlikuju od 0 ili su jednaki 0.

Procjena značajnosti koeficijenata regresije pomoću Studentovog testa vrši se poređenjem njihovih procjena sa vrijednošću standardne greške:

;

Za procjenu statističke značajnosti indeksa (linearnog koeficijenta) korelacije također se koristi t-Učenički kriterijum.



greška: Sadržaj je zaštićen!!