Necesar pe baza analizei matricei coeficienților perechi. Determinarea coeficientului de corelație multiplă în MS Excel

Sarcina 2

1. Construiți o matrice de coeficienți de corelație de perechi. Verificați multicoliniaritatea. Justificați selecția factorilor din model.

2. Construiți o ecuație de regresie multiplă în formă liniară cu factori selectați.

3. Evaluați semnificația statistică a ecuației de regresie și a parametrilor acesteia folosind testele Fisher și Student.

4. Construiți o ecuație de regresie cu factori semnificativi statistic. Evaluați calitatea ecuației de regresie folosind coeficientul de determinare R2. Evaluați acuratețea modelului construit.

5. Evaluați prognoza volumului producției dacă valorile prognozate ale factorilor sunt de 75% din valorile maxime ale acestora.

Condiții de problemă (opțiunea 21)

Conform datelor prezentate în Tabelul 1 (n = 17), se studiază dependența volumului producției Y (milioane de ruble) de următorii factori (variabile):

X 1 – număr personal de producție industrială, persoane.

X 2 – costul mediu anual al mijloacelor fixe, milioane de ruble.

X 3 – amortizarea mijloacelor fixe, %

X 4 – alimentare, kWh.

X 5 – echipament tehnic al unui muncitor, milion de ruble.

X 6 – producția de produse comercializabile per muncitor, frec.

Tabel 1. Date despre lansarea produsului

Y X 1 X 2 X 3 X 4 X 5 X 6
39,5 4,9 3,2
46,4 60,5 20,4
43,7 24,9 9,5
35,7 50,4 34,7
41,8 5,1 17,9
49,8 35,9 12,1
44,1 48,1 18,9
48,1 69,5 12,2
47,6 31,9 8,1
58,6 139,4 29,7
70,4 16,9 5,3
37,5 17,8 5,6
62,0 27,6 12,3
34,4 13,9 3,2
35,4 37,3 19,0
40,8 55,3 19,3
48,1 35,1 12,4


Construiți o matrice de coeficienți de corelație de perechi. Verificați multicoliniaritatea. Justificați selecția factorilor din model

Tabelul 2 arată matricea coeficientului de corelație de pereche pentru toate variabilele implicate în considerare. Matricea a fost obținută cu ajutorul instrumentului Corelaţie din pachet Analiza datelor V Excela.

Tabelul 2. Matricea coeficienților de corelație perechi

Y X1 X2 X3 X4 X5 X6
Y
X1 0,995634
X2 0,996949 0,994947
X3 -0,25446 -0,27074 -0,26264
X4 0,12291 0,07251 0,107572 0,248622
X5 0,222946 0,166919 0,219914 -0,07573 0,671386
X6 0,067685 -0,00273 0,041955 -0,28755 0,366382 0,600899

Analiza vizuală a matricei vă permite să stabiliți:

1) U are corelații în perechi destul de mari cu variabilele X1, X2 (>0,5) și scăzut cu variabile X3,X4,X5,X6 (<0,5);

2) Variabilele de analiză X1, X2 demonstrează corelații perechi destul de mari, ceea ce necesită verificarea factorilor pentru prezența multicoliniarității între ele. Mai mult, una dintre condițiile modelului clasic de regresie este ipoteza independenței variabilelor explicative.

Pentru a identifica multicoliniaritatea factorilor, procedăm Testul Farrar-Glouber prin factorii X1, X2, X3,X4,X5,X6.

Verificarea testului Farrar-Glouber pentru multicoliniaritatea factorilor include mai multe etape.

1) Verificarea multicoliniarității întregii matrice de variabile .

Una dintre condiţiile modelului clasic de regresie este ipoteza independenţei variabilelor explicative. Pentru a identifica multicoliniaritatea între factori, matricea corelațiilor interfactorilor R este calculată folosind Pachetul de analiză a datelor (Tabelul 3).

Tabelul 3. Matricea corelațiilor interfactorilor R

X1 X2 X3 X4 X5 X6
X1 0,994947 -0,27074 0,07251 0,166919 -0,00273
X2 0,994947 -0,26264 0,107572 0,219914 0,041955
X3 -0,27074 -0,26264 0,248622 -0,07573 -0,28755
X4 0,07251 0,107572 0,248622 0,671386 0,366382
X5 0,166919 0,219914 -0,07573 0,671386 0,600899
X6 -0,00273 0,041955 -0,28755 0,366382 0,600899

Există o dependență puternică (>0,5) între factorii X1 și X2, X5 și X4, X6 și X5.

Determinantul det (R) = 0,001488 este calculat folosind funcția MOPRED. Determinantul matricei R tinde spre zero, ceea ce ne permite să facem o ipoteză despre multicoliniaritatea generală a factorilor.

2) Verificarea multicoliniarității fiecărei variabile cu alte variabile:

· Să calculăm matricea inversă R -1 folosind funcția Excel MOBR (Tabelul 4):

Tabelul 4. Matricea inversă R -1

X1 X2 X3 X4 X5 X6
X1 150,1209 -149,95 3,415228 -1,70527 6,775768 4,236465
X2 -149,95 150,9583 -3,00988 1,591549 -7,10952 -3,91954
X3 3,415228 -3,00988 1,541199 -0,76909 0,325241 0,665121
X4 -1,70527 1,591549 -0,76909 2,218969 -1,4854 -0,213
X5 6,775768 -7,10952 0,325241 -1,4854 2,943718 -0,81434
X6 4,236465 -3,91954 0,665121 -0,213 -0,81434 1,934647

· Calculul criteriilor F, unde sunt elementele diagonale ale matricei, n=17, k = 6 (Tabelul 5).

Tabelul 5. Valori F-test

F1 (X1) F2 (X2) F3 (X3) F4 (X4) F5 (X5) F6 (X6)
89,29396 89,79536 0,324071 0,729921 1,163903 0,559669

· Valorile reale ale testului F sunt comparate cu valoarea tabelului Tabelul F = 3,21(FDIST(0,05;6;10)) cu n1= 6 și n2 = n - k – 1=17-6-1=10 grade de libertate și nivelul de semnificație α=0,05, unde k este numărul de factori.

· Valorile criteriilor F pentru factorii X1 și X2 sunt mai mari decât cele tabulate, ceea ce indică prezența multicoliniarității între acești factori. Factorul X3 are cel mai mic efect asupra multicoliniarității generale a factorilor.

3) Verificarea multicoliniarității fiecărei perechi de variabile

· Să calculăm coeficienții de corelație parțială folosind formula , unde sunt elementele matricei (Tabelul 6)

Tabelul 6. Matricea coeficienților de corelație parțială

X1 X2 X3 X4 X5 X6
X1
X2 0,996086
X3 -0,22453 0,197329
X4 0,093432 -0,08696 0,415882
X5 -0,32232 0,337259 -0,1527 0,581191
X6 -0,24859 0,229354 -0,38519 0,102801 0,341239

· Calcul t-criterii conform formulei (Tabelul 7)

n - numărul de date = 17

K - numărul de factori = 6

Tabelul 7.t-teste pentru coeficienții de corelație parțială

X1 X2 X3 X4 X5 X6
X1
X2 35,6355
X3 -0,72862 0,636526
X4 0,296756 -0,27604 1,446126
X5 -1,07674 1,13288 -0,4886 2,258495
X6 -0,81158 0,745143 -1,31991 0,326817 1,147999

tabel t = STUDARSOBR(0,05,10) = 2,23

Valorile reale ale testelor t sunt comparate cu valoarea tabelului cu grade de libertate n-k-1 = 17-6-1=10 și nivelul de semnificație α=0,05;

t21 > ttable

t54 > ttable

Din tabelele 6 și 7 reiese clar că două perechi de factori X1 și X2, X4 și X5 au o corelație parțială semnificativă statistic ridicată, adică sunt multicoliniari. Pentru a scăpa de multicoliniaritate, puteți exclude una dintre variabilele perechii coliniare. În perechea X1 și X2 lăsăm X2, în perechea X4 și X5 lăsăm X5.

Astfel, ca urmare a verificării testului Farrar-Glouber, rămân următorii factori: X2, X3, X5, X6.

La finalizarea procedurilor de analiză a corelației, este recomandabil să se analizeze corelațiile parțiale ale factorilor selectați cu rezultatul Y.

Să construim o matrice de coeficienți de corelație perechi pe baza datelor din tabelul 8.

Tabelul 8. Date de ieșire a produsului cu factori selectați X2, X3, X5, X6.

Observația nr. Y X 2 X 3 X 5 X 6
39,5 3,2
46,4 20,4
43,7 9,5
35,7 34,7
41,8 17,9
49,8 12,1
44,1 18,9
48,1 12,2
47,6 8,1
58,6 29,7
70,4 5,3
37,5 5,6
12,3
34,4 3,2
35,4
40,8 19,3
48,1 12,4

Ultima coloană a tabelului 9 prezintă valorile testului t pentru coloana Y.

Tabelul 9. Matricea coeficienților de corelație parțială cu rezultatul Y

Y X2 X3 X5 X6 criteriul t (tabelul t (0,05;11)= 2,200985
Y 0,996949 -0,25446 0,222946 0,067685
X2 0,996949 -0,26264 0,219914 0,041955 44,31676
X3 -0,25446 -0,26264 -0,07573 -0,28755 0,916144
X5 0,222946 0,219914 -0,07573 0,600899 -0,88721
X6 0,067685 0,041955 -0,28755 0,600899 1,645749

Din Tabelul 9 este clar că variabila Y are o corelație parțială ridicată și în același timp semnificativă statistic cu factorul X2.

OPȚIUNEA 5

Dependenţa speranţei medii de viaţă de mai mulţi factori este studiată conform datelor pentru anul 1995, prezentate în tabel. 5.

Tabelul 5

Mozambic

……………………………………………………………………………………..

Elveţia

Denumirile utilizate în tabel:

· Y-- speranța medie de viață la naștere, ani;

· X 1 -- PIB în parităţi de putere de cumpărare;

· X 2 -- lanț rata de creștere a populației, %;

· X 3 -- lanț rata de creștere a forței de muncă, %;

· X 4 -- rata mortalității infantile, % .

Necesar:

1. Creați o matrice de coeficienți de corelație perechi între toate variabilele studiate și identificați factorii coliniari.

2. Construiți o ecuație de regresie care să nu conțină factori coliniari. Verificați semnificația statistică a ecuației și a coeficienților acesteia.

3. Construiți o ecuație de regresie care să conțină doar factori semnificativi statistic și informativi. Verificați semnificația statistică a ecuației și a coeficienților acesteia.

Punctele 4 - 6 se referă la ecuația de regresie construită la efectuarea punctului 3.

4. Evaluați calitatea și acuratețea ecuației de regresie.

5. Oferiți o interpretare economică a coeficienților ecuației de regresie și o evaluare comparativă a puterii influenței factorilor asupra variabilei rezultat Y.

6. Calculați valoarea prezisă a variabilei rezultante Y, dacă valorile prezise ale factorilor sunt de 75% din valorile maxime ale acestora. Construiți un interval de încredere pentru prognoza valorii reale Y cu o fiabilitate de 80%.

Soluţie. Pentru a rezolva problema, se folosește procesorul de foi de calcul EXCEL.

1. Folosind add-in-ul „Analiza datelor… Corelație”, construim o matrice de coeficienți de corelație perechi între toate variabilele studiate (meniul „Instrumente” „Analiza datelor…” „Corelație”). În fig. Figura 1 prezintă panoul de analiză a corelației cu câmpuri completate Pentru a copia un instantaneu al unei ferestre în clipboard-ul de date WINDOWS, utilizați combinația de taste Alt+Print Screen (pe unele tastaturi - Alt+PrtSc). în anexă. 2 și transferat la masă. 1.

orez. 1. Panoul de analiză a corelației

Tabelul 1

Matricea coeficienților de corelație de pereche

Analiză interfactorială coeficienţii de corelaţie arată că valoarea de 0,8 depăşeşte în valoare absolută coeficient de corelație între o pereche de factori X 2 -X 3 (îngroșat). Factori X 2 -X 3 sunt astfel recunoscute ca fiind coliniare.

2. După cum sa arătat în paragraful 1, factorii X2-X3 sunt coliniari, ceea ce înseamnă că se dublează de fapt unul pe altul, iar includerea lor simultană în model va duce la interpretarea incorectă a coeficienților de regresie corespunzători. Se poate observa că factorul X2 are un coeficient de corelație cu rezultatul Y mai mare decât factorul X3: ry,x2=0,72516; ry,x3=0,53397; |ry,x2|>|ry,x3| (vezi Tabelul 1). Acest lucru indică o influență mai puternică a factorului X2 asupra modificării lui Y. Factorul X3 este astfel exclus din luare în considerare.

Pentru a construi o ecuație de regresie, valorile variabilelor utilizate ( Y,X 1 , X 2 , X 4) copiați-o într-o foaie de lucru goală ( adj. 3). Construim ecuația de regresie folosind programul de completare „ Analiza datelor... Regresie" (meniu" Serviciu" « Analiza datelor...» « Regresia"). Panoul de analiză de regresie cu câmpuri completate este afișat în orez. 2.

Rezultatele analizei de regresie sunt date în adj. 4și s-a mutat la masă 2. Ecuația de regresie are forma (vezi „ Cote" V masă 2):

y = 75,44 + 0,0447 ? x 1 - 0,0453 ? x 2 - 0,24 ? x 4

Ecuația de regresie este considerată semnificativă din punct de vedere statistic, deoarece probabilitatea formării ei aleatoare în forma în care a fost obținută este 1,04571?10 -45 (vezi. „Semnificație F” V masă 2), care este semnificativ mai mic decât nivelul de semnificație acceptat = 0,05.

Probabilitatea formării aleatorii a coeficienților pentru un factor X 1 sub nivelul de semnificație acceptat = 0,05 (vezi „ Valoarea P" V masă 2), care indică semnificația statistică a coeficienților și influența semnificativă a acestor factori asupra modificării profitului anual Y.

Probabilitatea formării aleatorii a coeficienților pentru factori X 2 și X 4 depășește nivelul de semnificație acceptat = 0,05 (vezi „ Valoarea P" V masă 2), iar acești coeficienți nu sunt considerați semnificativi statistic.

orez. 2. Panou de analiză de regresie model Y(X 1 ,X 2 ,X 4 )

Tabelul 2

Y(X 1 , X 2 , X 4 )

Analiza varianței

Semnificația F

Regresia

Ecuația de regresie

Cote

Eroare standard

t-statistică

Valoarea P

De jos 95%

Top 95%

De jos 95,0%

Top 95,0%

Intersecția în Y

3. Pe baza rezultatelor verificării semnificației statistice a coeficienților ecuației de regresie efectuată în paragraful anterior, construim un nou model de regresie care conține doar factori informativi, care includ:

· factori ai căror coeficienți sunt semnificativi statistic;

factori ai căror coeficienţi t _statistica depășește unul în valoare absolută (cu alte cuvinte, valoarea absolută a coeficientului este mai mare decât eroarea sa standard).

Prima grupă include factorul X 1 la 2 este un factor X 4. Factor X 2 este exclus din considerație ca neinformativă, iar modelul final de regresie va conține factori X 1 , X 4 .

Pentru a construi o ecuație de regresie, copiați valorile variabilelor utilizate într-o foaie de lucru goală ( adj. 5)și efectuați o analiză de regresie ( orez. 3). Rezultatele sale sunt date în adj. 6și s-a mutat la masă 3. Ecuația de regresie este:

y = 75,38278 + 0,044918 ? x 1 - 0,24031 ? x 4

(cm. " Cote" V tabelul 3).

orez. 3. Panou de analiză de regresie model Y(X 1 , X 4 )

Tabelul 3

Rezultatele analizei de regresie a modelului Y(X 1 , X 4 )

Statistici de regresie

Plural R

R-pătrat

R-pătrat normalizat

Eroare standard

Observatii

Analiza varianței

Semnificația F

Regresia

Ecuația de regresie

Cote

Eroare standard

t-statistică

Valoarea P

Intersecția în Y

Ecuația de regresie este semnificativă statistic: probabilitatea formării sale aleatoare este sub nivelul acceptabil de semnificație = 0,05 (vezi „ Semnificația F" V tabelul 3).

Coeficientul pentru factor este de asemenea considerat semnificativ statistic X 1 probabilitatea formării sale aleatorii este sub nivelul de semnificație acceptabil = 0,05 (vezi „ Valoarea P" V masă 3). Acest lucru indică un impact semnificativ al PIB-ului asupra parităților puterii de cumpărare X 1 pe modificare a profitului anual Y.

Coeficientul factorului X 4 (rata anuală a mortalității infantile) nu este semnificativă statistic. Cu toate acestea, acest factor poate fi considerat încă informativ, deoarece t _statisticile coeficientului său depășesc modulo unitate, deși concluzii suplimentare cu privire la factor X 4 ar trebui tratat cu o oarecare prudență.

4. Să evaluăm calitatea și acuratețea ultimei ecuații de regresie folosind unele caracteristici statistice obținute în timpul analizei de regresie (vezi „Statistici de regresie” în Tabelul 3):

coeficient multiplu de determinare

R2 = _ i=1 ____________ =0.946576

R 2 = arată că modelul de regresie explică 94,7% din variația speranței medii de viață la naștere Y, iar această variație se datorează modificărilor factorilor incluși în modelul de regresie X 1 , X 4 ;

eroare standard de regresie

arată că valorile speranței medii de viață la naștere prezise de ecuația de regresie Y diferă de valorile reale cu o medie de 2,252208 ani.

Eroarea medie de aproximare relativă este determinată de formula aproximativă:

Erel?0.8 ? --? 100%=0,8 ? 2,252208/66,9 ? 100%?2.7

unde mii freacă. -- speranța medie de viață (determinată folosind funcția încorporată " MEDIE»; adj. 1).

E rel arată că valorile profitului anual prezise de ecuația de regresie Y diferă de valorile reale cu o medie de 2,7%. Modelul are o precizie ridicată (la - acuratețea modelului este mare, la - bine, la - satisfăcător, la - nesatisfăcător).

5. Pentru interpretarea economică a coeficienților ecuației de regresie, întabulăm valorile medii și abaterile standard ale variabilelor din datele sursă (Tabelul 4). Valorile medii au fost determinate folosind funcția încorporată „MEDIA”, abaterile standard - folosind funcția încorporată „STANDARDEVAL” (vezi Anexa 1).

1. CONSTRUIȚI O MATRICE DE COEFICIENȚI DE CORELARE PERECHE.

Pentru a face acest lucru, calculăm coeficienții de corelație de pereche folosind formula:

Calculele necesare sunt prezentate în Tabelul 9.

-

legătura dintre veniturile întreprinderii Y și valoarea investiției de capital X 1 este slabă și directă;

-

practic nu există nicio legătură între veniturile întreprinderii Y și activele fixe de producție X 2;

-

legătura dintre volumul investițiilor de capital X 1 și activele fixe de producție X 2 este strânsă și directă;

Tabelul 9

Tabel auxiliar pentru calcularea coeficienților de corelație pe perechi

t Y X1 X2

(a-asr)*
(x1-x1sr)

(a-asr)*
(x2-x2sr)

(x1-x1sr)*
(x2-x2sr)

1998 3,0 1,1 0,4 0,0196 0,0484 0,0841 0,0308 0,0406 0,0638
1999 2,9 1,1 0,4 0,0576 0,0484 0,0841 0,0528 0,0696 0,0638
2000 3,0 1,2 0,7 0,0196 0,0144 1E-04 0,0168 -0,0014 -0,0012
2001 3,1 1,4 0,9 0,0016 0,0064 0,0441 -0,0032 -0,0084 0,0168
2002 3,2 1,4 0,9 0,0036 0,0064 0,0441 0,0048 0,0126 0,0168
2003 2,8 1,4 0,8 0,1156 0,0064 0,0121 -0,0272 -0,0374 0,0088
2004 2,9 1,3 0,8 0,0576 0,0004 0,0121 0,0048 -0,0264 -0,0022
2005 3,4 1,6 1,1 0,0676 0,0784 0,1681 0,0728 0,1066 0,1148
2006 3,5 1,3 0,4 0,1296 0,0004 0,0841 -0,0072 -0,1044 0,0058
2007 3,6 1,4 0,5 0,2116 0,0064 0,0361 0,0368 -0,0874 -0,0152
Σ 31,4 13,2 6,9 0,684 0,216 0,569 0,182 -0,036 0,272
Mediu 3,14 1,32 0,69

De asemenea, matricea coeficienților de corelație perechi poate fi găsită în Excel folosind add-in-ul ANALIZA DATELOR, instrumentul CORELATION.

Matricea coeficienților de corelație de pereche are forma:

Y X1 X2
Y 1
X1 0,4735 1
X2 -0,0577 0,7759 1

Matricea coeficienților de corelație pereche arată că atributul efectiv y (venitul) are o legătură slabă cu volumul investițiilor de capital x 1, iar practic nu există nicio legătură cu mărimea fondului general. Relația dintre factorii din model este evaluată ca fiind apropiată, ceea ce indică dependența lor liniară, multicoliniaritatea.

2. CONSTRUIȚI UN MODEL DE REGRESIUNE MULTIPLĂ LINEAR

Vom găsi parametrii modelului folosind cele mai mici pătrate. Pentru a face acest lucru, să creăm un sistem de ecuații normale.

Calculele sunt prezentate în Tabelul 10.

Să rezolvăm sistemul de ecuații folosind metoda lui Cramer:

Tabelul 10

Calcule auxiliare pentru găsirea parametrilor unui model de regresie multiplă liniară

y
3,0 1,1 0,4 1,21 0,44 0,16 3,3 1,2
2,9 1,1 0,4 1,21 0,44 0,16 3,19 1,16
3,0 1,2 0,7 1,44 0,84 0,49 3,6 2,1
3,1 1,4 0,9 1,96 1,26 0,81 4,34 2,79
3,2 1,4 0,9 1,96 1,26 0,81 4,48 2,88
2,8 1,4 0,8 1,96 1,12 0,64 3,92 2,24
2,9 1,3 0,8 1,69 1,04 0,64 3,77 2,32
3,4 1,6 1,1 2,56 1,76 1,21 5,44 3,74
3,5 1,3 0,4 1,69 0,52 0,16 4,55 1,4
3,6 1,4 0,5 1,96 0,7 0,25 5,04 1,8
31,4 13,2 6,9 17,64 9,38 5,33 41,63 21,63

Modelul de regresie multiplă liniară are forma:

Dacă volumul investițiilor de capital crește cu 1 milion de ruble, atunci veniturile companiei vor crește cu o medie de 2,317 milioane de ruble. cu dimensiuni constante ale mijloacelor fixe de producţie.

Dacă activele fixe de producție cresc cu 1 milion de ruble, atunci veniturile întreprinderii vor scădea în medie cu 1,171 milioane de ruble. cu o sumă constantă de investiții de capital.

3. CALCULĂM:

coeficient de determinare:

67,82% din modificarea veniturilor întreprinderii se datorează modificărilor volumului investițiilor de capital și al activelor fixe de producție, iar 32,18% se datorează influenței unor factori neincluși în model.

F – Criteriul Fisher

Să verificăm semnificația ecuației

Valoarea de tabel a testului F la un nivel de semnificație de α = 0,05 și numărul de grade de libertate d.f. 1 = k = 2 (număr de factori), număr de grade de libertate d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 va fi 4,74.

Din moment ce F a calculat = 7,375 > F tab. = 4,74, atunci ecuația de regresie în ansamblu poate fi considerată semnificativă statistic.

Indicatorii calculați pot fi găsiți în mediul Excel folosind add-on-ul ANALIZA DATELOR, instrumentul REGRESIUNE.


Tabelul 11

Calcule auxiliare pentru găsirea erorii relative medii de aproximare

y O
3,0 1,1 0,4 2,97 0,03 0,010
2,9 1,1 0,4 2,97 -0,07 0,024
3,0 1,2 0,7 2,85 0,15 0,050
3,1 1,4 0,9 3,08 0,02 0,007
3,2 1,4 0,9 3,08 0,12 0,038
2,8 1,4 0,8 3,20 -0,40 0,142
2,9 1,3 0,8 2,96 -0,06 0,022
3,4 1,6 1,1 3,31 0,09 0,027
3,5 1,3 0,4 3,43 0,07 0,019
3,6 1,4 0,5 3,55 0,05 0,014
0,353

eroare medie de aproximare relativă

În medie, valorile calculate diferă de cele reale cu 3,53%. Eroarea este mică, modelul poate fi considerat exact.

4. Construiți un model de regresie multiplă cu legea puterii

Pentru a construi acest model, să luăm logaritmii ambelor părți ale egalității

log y = log a + β 1 ∙ log x 1 + β 2 ∙ log x 2 .

Să facem înlocuirea Y = log y, A = log a, X 1 = log x 1, X 2 = log x 2.

Atunci Y = A + β 1 ∙ X 1 + β 2 ∙ X 2 – un model liniar de regresie cu doi factori. Puteți utiliza OLS.

Calculele sunt prezentate în tabelul 12.

Tabelul 12

Calcule auxiliare pentru găsirea parametrilor unui model de regresie multiplă cu lege putere

y lg y
3,0 1,1 0,4 0,041 -0,398 0,477 0,002 -0,016 0,020 0,158 -0,190
2,9 1,1 0,4 0,041 -0,398 0,462 0,002 -0,016 0,019 0,158 -0,184
3,0 1,2 0,7 0,079 -0,155 0,477 0,006 -0,012 0,038 0,024 -0,074
3,1 1,4 0,9 0,146 -0,046 0,491 0,021 -0,007 0,072 0,002 -0,022
3,2 1,4 0,9 0,146 -0,046 0,505 0,021 -0,007 0,074 0,002 -0,023
2,8 1,4 0,8 0,146 -0,097 0,447 0,021 -0,014 0,065 0,009 -0,043
2,9 1,3 0,8 0,114 -0,097 0,462 0,013 -0,011 0,053 0,009 -0,045
3,4 1,6 1,1 0,204 0,041 0,531 0,042 0,008 0,108 0,002 0,022
3,5 1,3 0,4 0,114 -0,398 0,544 0,013 -0,045 0,062 0,158 -0,217
3,6 1,4 0,5 0,146 -0,301 0,556 0,021 -0,044 0,081 0,091 -0,167
31,4 13,2 6,9 1,178 -1,894 4,955 0,163 -0,165 0,592 0,614 -0,943

Rezolvăm sistemul de ecuații folosind metoda lui Cramer.

Modelul de regresie multiplă de putere are forma:

Într-o funcție de putere, coeficienții factorilor sunt coeficienți de elasticitate. Coeficientul de elasticitate arată cu ce procent se va modifica valoarea medie a caracteristicii efective y dacă unul dintre factori este crescut cu 1%, în timp ce valorile altor factori rămân neschimbate.

Dacă volumul investițiilor de capital crește cu 1%, atunci veniturile întreprinderii vor crește în medie cu 0,897% cu aceeași dimensiune a activelor fixe de producție.

Dacă activele fixe de producție cresc cu 1%, atunci veniturile companiei vor scădea cu 0,226% cu investiții de capital constante.

5. CALCULĂM:

coeficient de corelație multiplă:

Legătura dintre veniturile unei întreprinderi și volumul investițiilor de capital și al activelor fixe de producție este strânsă.

Tabelul 13

Calcule auxiliare pentru găsirea coeficientului de corelație multiplă, coeficient de determinare, eroare relativă medie de aproximare a modelului de regresie multiplă de putere

Y

(Y-Y calc.) 2

O
3,0 1,1 0,4 2,978 0,000 0,020 0,007
2,9 1,1 0,4 2,978 0,006 0,058 0,027
3,0 1,2 0,7 2,838 0,026 0,020 0,054
3,1 1,4 0,9 3,079 0,000 0,002 0,007
3,2 1,4 0,9 3,079 0,015 0,004 0,038
2,8 1,4 0,8 3,162 0,131 0,116 0,129
2,9 1,3 0,8 2,959 0,003 0,058 0,020
3,4 1,6 1,1 3,317 0,007 0,068 0,024
3,5 1,3 0,4 3,460 0,002 0,130 0,012
3,6 1,4 0,5 3,516 0,007 0,212 0,023
31,4 13,2 6,9 0,198 0,684 0,342

coeficient de determinare:

71,06% din modificarea veniturilor întreprinderii în modelul energetic se datorează modificărilor volumului investițiilor de capital și activelor fixe de producție, iar 28,94% se datorează influenței unor factori neincluși în model.

F – Criteriul Fisher

Să verificăm semnificația ecuației

Valoarea de tabel a testului F la un nivel de semnificație de α = 0,05 și numărul de grade de libertate d.f. 1 = k = 2, numărul de grade de libertate d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 va fi 4,74.

Din moment ce F a calculat = 8,592 > F tab. = 4,74, atunci ecuația de regresie a puterii în ansamblu poate fi considerată semnificativă statistic.

Aterizarea este imposibilă, în care dintre cazurile fezabile consumul de combustibil este mai mic. Se obtine un program de control optim cand pana la un anumit moment t1 nu exista control u*=0, iar incepand de la t=t1, controlul este egal cu valoarea sa maxima u*=umax, care corespunde consumului minim de combustibil. 6.) Rezolvați sistemul canonic de ecuații, luându-l în considerare pentru cazurile în care controlul...

Spre compilarea modelelor matematice. Dacă un model matematic este un diagnostic al unei boli, atunci un algoritm este o metodă de tratament. Se pot distinge următoarele etape principale ale cercetării operaționale: observarea fenomenului și colectarea datelor inițiale; enunțul problemei; construirea unui model matematic; model de calcul; testarea modelului și analiza datelor de ieșire. Daca rezultatele obtinute nu sunt satisfacatoare...

Construcțiile matematice prin analogie cu dezvăluie într-o aproximare plană o undă electromagnetică longitudinal-scalară cu componente electrice (28) și magnetice (29) în fază. Modelul matematic al electrodinamicii irrotaționale este caracterizat de structura scalară-vectorală a ecuațiilor sale. Ecuațiile fundamentale ale electrodinamicii irrotaționale sunt rezumate în Tabelul 1. Tabelul 1, ...

Coeficientul de corelație reflectă gradul de relație dintre doi indicatori. Ia întotdeauna o valoare de la -1 la 1. Dacă coeficientul este situat în jurul valorii de 0, atunci nu există nicio legătură între variabile.

Dacă valoarea este aproape de unu (de la 0,9, de exemplu), atunci există o relație directă puternică între obiectele observate. Dacă coeficientul este aproape de celălalt punct extrem al intervalului (-1), atunci există o relație inversă puternică între variabile. Când valoarea este undeva între 0 la 1 sau 0 la -1, atunci vorbim de o conexiune slabă (directă sau inversă). De obicei, această relație nu este luată în considerare: se crede că nu există.

Calculul coeficientului de corelare în Excel

Să ne uităm la un exemplu de metode de calcul al coeficientului de corelație, caracteristici ale relațiilor directe și inverse între variabile.

Valorile indicatorilor x și y:

Y este o variabilă independentă, x este o variabilă dependentă. Este necesar să se găsească puterea (puternic / slab) și direcția (directă / inversă) conexiunii dintre ele. Formula coeficientului de corelație arată astfel:


Pentru a fi mai ușor de înțeles, să-l împărțim în câteva elemente simple.

Între variabile se determină o relație directă puternică.

Funcția CORREL încorporată evită calculele complexe. Să calculăm coeficientul de corelație de pereche în Excel folosindu-l. Apelați vrăjitorul de funcție. Îl găsim pe cel potrivit. Argumentele funcției sunt o matrice de valori y și o matrice de valori x:

Să arătăm valorile variabilelor pe grafic:


O conexiune puternică între y și x este vizibilă, deoarece liniile sunt aproape paralele între ele. Relația este directă: y crește - x crește, y scade - x scade.



Matricea coeficientului de corelație a perechilor în Excel

Matricea de corelație este un tabel la intersecția rândurilor și coloanelor din care se află coeficienții de corelație dintre valorile corespunzătoare. Este logic să-l construiți pentru mai multe variabile.

Matricea coeficienților de corelație în Excel este construită folosind instrumentul „Corelație” din pachetul „Analiza datelor”.


S-a găsit o relație directă puternică între valorile lui y și x1. Există un feedback puternic între x1 și x2. Practic nu există nicio legătură cu valorile din coloana x3.

1. Calculați matricea coeficienților de corelație perechi; analizați apropierea și direcția conexiunii caracteristicii rezultate Y cu fiecare factor X; evaluează semnificația statistică a coeficienților de corelație r(Y,X i); alege factorul cel mai informativ.

2. Construiți un model de regresie pereche cu cel mai informativ factor; dați o interpretare economică a coeficientului de regresie.

3. Evaluați calitatea modelului folosind eroarea relativă medie de aproximare, coeficientul de determinare și testul F Fisher (acceptați nivelul de semnificație α=0,05).

4. Cu o probabilitate de încredere de γ = 80%, preziceți valoarea medie a indicatorului Y(valorile de prognoză ale factorilor sunt date în Anexa 6). Prezentați grafic valorile reale și de model Y,rezultate de predicție.

5. Folosind metoda includerii, construiți modele cu doi factori, păstrând în ele cel mai informativ factor; construiți un model cu trei factori cu o listă completă de factori.

6. Selectați cel mai bun dintre modelele multiple construite. Oferiți o interpretare economică a coeficienților săi.

7. Verificați semnificația coeficienților de regresie multiple folosind t–Testul elevului (se acceptă nivelul de semnificație α=0,05). S-a îmbunătățit calitatea modelului multiplu în comparație cu modelul pereche?

8. Evaluați influența factorilor asupra rezultatului utilizând coeficienți de elasticitate, coeficienți beta și delta.

Sarcina 2. Modelarea unei serii de timp univariate

Anexa 7 prezintă serii de timp Y(t) indicatori socio-economici pentru teritoriul Altai pentru perioada 2000-2011. Este necesar să se studieze dinamica indicatorului corespunzător opțiunii de sarcină.

Opţiune Denumirea, denumirea, unitatea de măsură a indicatorului
Y1 Cheltuielile medii de consum pe cap de locuitor (pe lună), frecați.
Y2 Emisii de poluanți în aerul atmosferic, mii de tone
Y3 Prețurile medii pe piața secundară a locuințelor (la sfârșitul anului, pe metru pătrat de suprafață totală), ruble
Y4 Volumul serviciilor plătite pe cap de locuitor, rub
Y5 Numărul mediu anual de persoane angajate în economie, mii de persoane
Y6 Număr de autoturisme proprii la 1000 de locuitori (la sfârșitul anului), unități
Y7 Venitul mediu în numerar pe cap de locuitor (pe lună), rub.
Y8 Indicele prețurilor de consum (decembrie comparativ cu decembrie a anului precedent), %
Y9 Investiții în active fixe (în prețuri reale), milioane de ruble
Y10 Cifra de afaceri în comerțul cu amănuntul pe cap de locuitor (în prețuri reale), rub.


Comanda de lucru

1. Construiți un model liniar de serie de timp, ai cărui parametri pot fi estimați prin cele mai mici pătrate. Explicați semnificația coeficientului de regresie.

2. Evaluați caracterul adecvat al modelului construit folosind proprietățile aleatoriei, independenței și conformității componentei reziduale cu legea distribuției normale.

3. Evaluați acuratețea modelului pe baza utilizării erorii relative medii de aproximare.

4. Prognoza indicatorul luat în considerare cu un an în avans (calculați intervalul de prognoză cu o probabilitate de încredere de 70%).

5. Prezentați grafic valorile efective ale indicatorului, rezultatele modelării și previziunii.

6. Calculați parametrii tendințelor logaritmice, polinomiale (polinom de gradul 2), putere, exponențiale și hiperbolice. Pe baza imaginii grafice și a valorii indicelui de determinare, selectați cel mai potrivit tip de tendință.

7. Folosind cel mai bun model neliniar, faceți o prognoză punctuală a indicatorului în cauză pentru anul următor. Comparați rezultatul obținut cu intervalul de prognoză de încredere construit folosind un model liniar.

EXEMPLU

Efectuarea testului

Problema 1

Compania vinde masini second hand. Denumirile indicatorilor și datele inițiale pentru modelarea econometrică sunt prezentate în tabel:

Preț de vânzare, mii e. Y) ( Prețul unei mașini noi, mii e.) ( X1) Durata de viata, ani ( X2)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Volant pe stanga - 1, volan pe dreapta - 0, (

X3

Necesar:

1. Calculați matricea coeficienților de corelație perechi; analizați apropierea și direcția relației dintre caracteristica rezultată Y și fiecare dintre factorii X; evaluați semnificația statistică a coeficienților de corelație r(Y, X i); alege factorul cel mai informativ.

U Prețul unei mașini noi, mii e. X1 X2
Folosim Excel (Date / Analiza datelor / CORELARE):
Obținem o matrice de coeficienți de corelație perechi între toate variabilele disponibile: 0,910987
U -0,4156 -0,2603
X1 0,190785 0,221927 -0,30308

X2 Y X3 X Să analizăm coeficienții de corelație dintre caracteristica rezultată

și fiecare dintre factori Y j: X> 0, prin urmare, între variabile

Şi

< 0, значит, между переменными Y j: X 1 există o corelație directă: cu cât prețul unei mașini noi este mai mare, cu atât este mai mare prețul de vânzare.

> 0,7 – această dependență este apropiată.

2 observat

corelație inversă: prețul de vânzare este mai mic pentru mașini

telefoane mobile cu o durată lungă de viață. Y j: X– această dependență este moderată, mai aproape de slabă.

< 0,4 – эта зависимость слабая.

> 0, ceea ce înseamnă între variabile

3 există o corelație directă: prețul de vânzare este mai mare pentru mașinile cu volan pe stânga. Pentru a verifica semnificația coeficienților de corelație găsiți, folosim testul Student. t Pentru fiecare coeficient de corelare hai sa calculam

U Prețul unei mașini noi, mii e. X1 X2 -statistici conform formulei
Folosim Excel (Date / Analiza datelor / CORELARE):
Obținem o matrice de coeficienți de corelație perechi între toate variabilele disponibile: 0,910987 7,651524603
U -0,4156 -0,2603 1,582847988
X1 0,190785 0,221927 -0,30308 0,673265587

și introduceți rezultatele calculului într-o coloană suplimentară a tabelului de corelare: și numărul de grade de libertate, determinăm valoarea critică (Anexa 1, sau funcția STUDARSOBR).Y și durata de viață X 2 este de încredere.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Y si pozitia volanului X 3 este de încredere.

Astfel, cea mai apropiată și semnificativă relație se observă între prețul de vânzare Yși prețul unei mașini noi X 1; factor X 1 este cel mai informativ.





eroare: Continut protejat!!