Válassza az Oldal lehetőséget

Előrejelzési konfidencia intervallumok. A modellek megfelelőségének és pontosságának felmérése

Az egyik legelterjedtebb előrejelzési módszer az extrapoláció, azaz. a jövő előrejelzésében a múlt adatai alapján.

Az extrapoláció a következő feltételezéseken alapul:

§ a jelenség fejlődése ésszerűen sima pályával - tendenciával jellemezhető;

§-a szerint a fejlődési tendenciát korábban meghatározó általános feltételek a jövőben nem változnak lényegesen.

Így az extrapoláció az előrejelzési objektum néhány általános jövőbeli fejlődésének leírását adja. Sőt, ha a fejlődés a múltban tartósan görcsös jellegű volt, akkor kellően hosszú megfigyelési idővel az ugrások „rögzülnek” magában a trendben, és ez utóbbi ismét felhasználható az előrejelzésben.

Készítsünk előrejelzést extrapoláció alapján jobb forma tendencia (lineáris) a 2001-2007 közötti időszakra vonatkozóan:

Emlékezzünk vissza, hogy az aktuális változónak a sorozat 7 szintje van, amelyeket természetes számok jelölnek. Ennek megfelelően a 2008-as exportdinamika előrejelzése (t=8):

(milliárd dollár)

Készítsünk előrejelzést a 2001-2007 közötti időszakra vonatkozó import legjobb trendformájának (lineáris) extrapolációja alapján:

Emlékezzünk vissza, hogy az aktuális változónak a sorozat 7 szintje van, amelyeket természetes számok jelölnek. Ennek megfelelően a 2008. évi importdinamika előrejelzése (t=8) a következő lesz:

(milliárd dollár)

Az extrapoláció lehetővé teszi az előrejelzés pontértékének megszerzését, amely csak funkcionális függés esetén tekinthető kielégítőnek. A gazdasági jelenségeket azonban korrelációs függőség jellemzi, és a változók rendszerint folytonosak. Ebből következően a pontos előrejelzési értékek feltüntetése szigorúan véve tartalmatlan. Ebből következik, hogy az előrejelzést értékintervallum formájában kell megadni, pl. meg kell határozni az előrejelzés konfidencia intervallumát.

Előrejelzési konfidencia intervallumok

Előrejelzés készítésekor a hiba a következő forrásokból származik:

§ a trendet jellemző görbe alakjának megválasztása szubjektivitás elemet tartalmaz. Mindenesetre gyakran nincs szilárd alapja annak kijelentésének, hogy a választott görbe alakzat az egyetlen lehetséges, még kevésbé a legjobb az extrapolációhoz adott meghatározott feltételek mellett;

§ A görbe paramétereinek becslése (más szóval trendbecslés) korlátozott számú megfigyelés alapján történik, amelyek mindegyike tartalmaz egy véletlenszerű komponenst. Emiatt a görbe paramétereit, következésképpen a térbeli helyzetét bizonyos bizonytalanság jellemzi;

§ a trend az egyes időpontokban a sorozat átlagos szintjét jellemzi. Az egyéni megfigyelések a múltban általában eltértek ettől.

Természetes, hogy az ilyen eltérések a jövőben is előfordulnak.

Elképzelhető, hogy a trendet leíró görbe alakját rosszul választják meg, vagy ha a jövőbeni fejlődési trend jelentősen megváltozik, és nem követi az igazítás során feltételezett görbét. Ez utóbbi esetben az extrapoláció alapfeltevés nem felel meg a tényállásnak. A talált görbe csak az idősort igazítja, és csak a megfigyelés által lefedett időszakon belül jellemzi a trendet. Egy ilyen trend extrapolálása elkerülhetetlenül hibás eredményhez vezet, és ezt a fajta hibát nem lehet előre megbecsülni. Ezzel kapcsolatban csak annyit tudunk megjegyezni, hogy látszólag az átfutási idő növekedésével számolnunk kell egy ilyen hiba (illetve előfordulásának valószínűsége) növekedésével.

A második és harmadik forráshoz kapcsolódó bizonytalanság az előrejelzés konfidenciaintervallumában tükröződhet, ha bizonyos feltételezéseket teszünk a sorozat tulajdonságairól. Egy ilyen intervallum használatával egy pont előrejelzés intervallum-előrejelzéssé alakul.

Mindenesetre a megfigyelési periódus egyetlen lépéssel történő eltolása, illetve a sorozat tagjainak hozzáadása vagy eltávolítása abból a tényből adódóan, hogy a sorozat minden tagja véletlenszerű komponenst tartalmaz, a paraméterek számszerű becslésének megváltozásához vezet. Ezért a számított értékek viselik a paraméterek értékeinek hibáihoz kapcsolódó bizonytalanság terhét.

IN általános nézet A trend konfidenciaintervallumát a következőképpen határozzuk meg:

ahol a trend átlagos négyzetes hibája;

Számított érték y t ;

A tanuló t-statisztikai értéke.

A STATISTICA-ban a számításnál konfidencia intervallumok előrejelzés, az S y szórás értéke a táblázat segítségével határozható meg varianciaanalízis. A Residual Mean Squares cellában kiszámított érték az S y képletében szereplő gyökkifejezésnek, azaz a maradék varianciának felel meg. Már csak a négyzetgyökét kell kivonni belőle.

Exportnál (lásd 77. táblázat), importnál (lásd 80. táblázat).

Ez azt jelenti, hogy exportnál S y = 18,11, importnál S y = 25,45.

A t konfidencia együttható értékét a Student táblázat segítségével találjuk meg, figyelembe véve megbízhatósági valószínűség 95%. Lineáris és teljesítmény függvények a szabadságfokok száma 4, a kritérium értéke 2,776.

Így a 2008. évi export előrejelzés konfidenciaintervallumát a következőképpen határozzuk meg:

Ez az előrejelzés a következőképpen értelmezhető: Japán exportja 2008-ban 95%-os valószínűséggel 704,542 milliárd dollár és 805,089 milliárd dollár között mozog.

A 2008-as behozatalra vonatkozó előrejelzés konfidenciaintervallumát a következőképpen határozzák meg:

Ez az előrejelzés a következőképpen értelmezhető: 95%-os valószínűséggel Japán importja 2008-ban 596,072 és 737,371 milliárd dollár között mozog.

Az előrejelzési eredmények grafikus ábrázolása

Az előrejelzés utolsó szakasza olyan grafikus képek készítése, amelyek képet adnak az előrejelzés pontosságáról, és egyértelműen bemutatják a konfidenciaintervallumok tartományát.

89. táblázat: Az export előrejelzési adatai



Rizs. 63.

90. táblázat: Az export előrejelzési adatai


Rizs. 64.

Sajnos esetünkben a tényleges értékek az előrejelzés konfidencia intervallumán kívül estek, ami ismét rávilágít a trendmodell kiválasztásának nehézségeire.

Extrapoláció az átlagos növekedési ütem és az átlagos abszolút növekedés alapján

Ebben a bekezdésben az átlagos növekedési ráta alapján történő előrejelzést fogjuk fontolóra venni. A jövőbeli időszakok értékeit a következő képlet segítségével kapjuk meg:

hol az átlagos növekedési ütem; - az extrapoláció alapjául szolgáló szint.

Az átlagos növekedési ütem a következőképpen definiálható:

ahol y n - adatok tavaly időszak, és y 1 - a vizsgált időszak első évére vonatkozó adatok.

Számítsuk ki az exportra:

Bizalmi intervallum:

91. táblázat Képlet számítások, átlagos növekedési ütem a japán exportnál

TESZT

a "Tervezés és előrejelzés" tudományágban

piaci körülmények között"

a témában: Előrejelzési konfidencia intervallumok

A modellek megfelelőségének és pontosságának felmérése


Fejezet 1. Elméleti rész

Előrejelzési konfidencia intervallumok. A modellek megfelelőségének és pontosságának felmérése

1.1. Előrejelzési konfidenciaintervallumok

A növekedési görbék alkalmazásának utolsó lépése a trend extrapolálása a választott egyenletből. A vizsgált indikátor becsült értékeit úgy számítjuk ki, hogy az időértékeket behelyettesítjük a görbe egyenletébe t, amely megfelel az átfutási időszaknak. Az így kapott előrejelzést pont előrejelzésnek nevezzük, mivel minden időpillanathoz csak az előrejelzett mutató egy értéke kerül meghatározásra.

A gyakorlatban a pont-előrejelzés mellett kívánatos meghatározni az előrejelzett mutató lehetséges változásainak határait, beállítani az előrejelzett mutató lehetséges értékeinek „tartományát”, pl. intervallum előrejelzés kiszámítása.

A tényleges adatok és a növekedési görbékből a trend extrapolálásával kapott pont-előrejelzés közötti eltérést a következők okozhatják:

1. szubjektív hiba a görbe típusának megválasztásában;

2. hiba a görbe paramétereinek becslésében;

3. az egyes megfigyeléseknek az egyes időpontokban a sorozat egy bizonyos átlagos szintjét jellemző trendtől való eltérésével kapcsolatos hiba.

A második és harmadik forráshoz kapcsolódó bizonytalanság tükröződhet az előrejelzés konfidenciaintervallumában. A konfidenciaintervallum, amely figyelembe veszi a trend helyzetéhez kapcsolódó bizonytalanságot és az ettől a trendtől való eltérés lehetőségét, a következőképpen definiálható:


ahol n az idősor hossza;

L az átfutási időszak;

y n + L - n+L időpontban előrejelzett pont;

t a - Student-féle t-statisztika értéke;

S p - az előrejelzés négyzetes középhibája.

Tegyük fel, hogy a trendet egyenes vonal jellemzi:

Mivel a paraméterbecsléseket a mintapopuláció, amelyet egy idősor képvisel, akkor hibát tartalmaznak. Az a o paraméter hibája az egyenes függőleges eltolódásához, az a 1 paraméter hibája a vonal abszcissza tengelyhez viszonyított dőlésszögének megváltozásához vezet. Figyelembe véve az egyes megvalósítások trendvonalakhoz viszonyított szóródását, a diszperzió a következőképpen ábrázolható:

(1.2.),

ahol a tényleges megfigyelések és a számított eltérések szórása;

t 1 - átfutási idő, amelyre az extrapolációt elvégzik;

t 1 = n + L ;

t- a sorozat szintjeinek sorszáma, t = 1,2,..., n;

A sor közepén lévő szint sorszáma a

Ekkor a konfidenciaintervallum a következőképpen ábrázolható:

(1.3.),

Jelöljük az (1.3.) kifejezés gyökét K-val. K értéke csak n-től és L-től függ, azaz. a sorozat hosszáról és az átfutási időszakról. Ezért létrehozhat K értékek vagy K*= t a K táblázatokat. Ekkor az intervallumbecslés így fog kinézni:

(1.4.),

Az (1.3.)-hoz hasonló kifejezést kaphatunk egy másodrendű polinomra:

(1.5.),

(1.6.),

A tényleges megfigyelések és a számított eltérések szórását a következő kifejezés határozza meg:


(1.7.),

Ahol y t- a sorozatszintek tényleges értékei,

a sorszintek számított értékei,

n- az idősor hossza,

k- a szintezési görbe becsült paramétereinek száma.

Így a konfidencia intervallum szélessége függ a szignifikancia szinttől, az átfutási periódustól, a trendtől való szórástól és a polinom mértékétől.

Minél magasabb a polinom foka, annál szélesebb a konfidenciaintervallum ugyanazon értékhez S y, mivel a trendegyenlet szórását az egyenlet megfelelő paraméterei szórásának súlyozott összegeként számítjuk

1.1. ábra. Konfidenciaintervallumok előrejelzése lineáris trendhez

Az exponenciális egyenlet segítségével kapott előrejelzések konfidencia intervallumait hasonló módon határozzuk meg. A különbség az, hogy mind a görbe paramétereinek számításakor, mind az átlag kiszámításakor négyzetes hiba Nem maguk az idősorszintek értékeit használják, hanem azok logaritmusait.

Ugyanezt a sémát használva a konfidenciaintervallumok számos aszimptotákkal rendelkező görbére határozhatók meg, ha az aszimptota értéke ismert (például egy módosított exponenciális esetében).

1.1. táblázat. adott értékeket TO* az idősor hosszától függően nés átfutási időszak L vonalhoz és parabolához. Nyilvánvaló, hogy a sorok hosszának növekedésével ( n) értékeket TO* csökken az átfutási idő növekedésével Lértékeket TO* növekedés. Sőt, az átfutási periódus hatása nem ugyanaz a számára különböző jelentések n: minél hosszabb a sorozat, annál kisebb az átfutási idő befolyása L .

1.1. táblázat.

K* értékek az előrejelzés konfidencia intervallumainak értékeléséhez lineáris trend és parabola trend alapján 0,9 (7) konfidencia valószínűséggel.

Lineáris trend Parabolikus trend
Hossz sor (n)

Átfutási idő (L)

sor hossza (n)

átfutási idő (L)

7 2,6380 2,8748 3,1399 7 3,948 5,755 8,152
8 2,4631 2,6391 2,8361 8 3,459 4,754 6,461
9 2,3422 2,4786 2,6310 9 3,144 4,124 5,408
10 2,2524 2,3614 2,4827 10 2,926 3,695 4,698
11 2,1827 2,2718 2,3706 11 2,763 3,384 4,189
12 2,1274 2,2017 2,2836 12 2,636 3,148 3,808
13 2,0837 2,1463 2,2155 13 2,536 2,965 3,516
14 2,0462 2,1000 2,1590 14 2,455 2,830 3,286
15 2,0153 2,0621 2,1131 15 2,386 2,701 3,100
16 1,9883 2,0292 2,0735 16 2,330 2,604 2,950
17 1,9654 2,0015 2,0406 17 2,280 2,521 2,823
18 1,9455 1,9776 2,0124 18 2,238 2,451 2,717
19 1,9280 1,9568 1,9877 19 2,201 2,391 2,627
20 1,9117 1,9375 1,9654 20 2,169 2,339 2,549
21 1,8975 1,9210 1,9461 21 2,139 2,293 2,481
22 1,8854 1,9066 1,9294 22 2,113 2,252 2,422
23 1,8738 1,8932 1,9140 23 2,090 2,217 2,371
24 1,8631 1,8808 1,8998 24 2,069 2,185 2,325
25 1,8538 1,8701 1,8876 25 2,049 2,156 2,284

2. fejezet Gyakorlati rész

Feladat 1.5. Adaptív módszerek alkalmazása a gazdasági előrejelzésben

1. Számítsa ki a YuM vállalat részvényárfolyamának idősorának exponenciális átlagát! Az exponenciális átlag kezdőértékeként vegyük a sorozat első 5 szintjének átlagát. Az a adaptációs paraméter értéke 0,1.

1.2. táblázat.

IBM részvényárfolyam

t y t t y t t y t
1 510 11 494 21 523
2 497 12 499 22 527
3 504 13 502 23 523
4 510 14 509 24 528
5 509 15 525 25 529
6 503 16 512 26 538
7 500 17 510 27 539
8 500 18 506 28 541
9 500 19 515 29 543
10 495 20 522 30 541

2. Az 1. feladat adatai alapján számítsa ki az exponenciális átlagot az adaptációs paraméter értékén A egyenlő 0,5. Hasonlítsa össze grafikusan az eredeti idősort és a kapott exponenciális átlagok sorozatát A=0,1 és A=0,5. Jelölje meg, melyik sor simább.

3. Az IBM részvényárfolyamának előrejelzése adaptív másodrendű polinommodell alapján történt.


,

hol van az átfutási időszak.

Az utolsó lépésben a következő együtthatóbecsléseket kaptuk:

1 nappal előre (=1);

2 nappal előre (=2).

Az 1.5. feladat megoldása

1. Határozzuk meg

Keressük meg az exponenciális átlag értékeit at A =0,1.

. A=0,1 – feltétel szerint;

; S 1 = 0,1 x 510 + 0,9 x 506 = 506,4;

; S 2 = 0,1 x 497 + 0,9 x 506,4 = 505,46;

; S 3 = 0,1 x 504 + 0,9 x 505,46 = 505,31 stb.

A=0,5 – a feltételnek megfelelően.

; S 1 = 0,5 x 510 + 0,5 x 506 = 508;

; S 2 = 0,5 x 497 + 0,5 x 508 = 502,5 stb.

A számítási eredményeket az 1.3. táblázat tartalmazza.

1.3. táblázat.

Exponenciális átlagok

t Exponenciális átlag t Exponenciális átlag
A =0,1 A =0,5 A =0,1 A =0,5
1 506,4 508 16 505,7 513,3
2 505,5 502,5 17 506,1 511,7
3 505,3 503,2 18 506,1 508,8
4 505,8 506,6 19 507,0 511,9
5 506,1 507,8 20 508,5 517
6 505,8 505,4 21 509,9 520
7 505,2 502,7 22 511,6 523,5
8 504,7 501,4 23 512,8 523,2
9 504,2 500,7 24 514,3 525,6
10 503,4 497,8 25 515,8 527,3
11 502,4 495,9 26 518,0 532,7
12 502,0 497,5 27 520,1 525,8
13 502,0 499,7 28 522,2 538,4
14 502,7 504,4 29 524,3 540,7
15 505,0 514,7 30 525,9 540,9

1.2. ábra. Exponenciális simítás részvényárak idősorai: A – aktuális adatok; B – exponenciális átlag alfa = 0,1; C – exponenciális átlag alfa = 0,5-nél

at A=0,1 exponenciális átlag simább, mert ebben az esetben az idősorok véletlenszerű ingadozásai nyelődnek el a legnagyobb mértékben.

3. A másodrendű adaptív polinommodell előrejelzése az utolsó lépésben kerül kialakításra, az együtthatók utolsó értékeinek és az átfutási idő értékének behelyettesítésével a modellegyenletbe.

Előrejelzés 1 napra (= 1):

Előrejelzés 2 napra (= 2):

Felhasznált irodalom jegyzéke

1. Dubrova T.A. Statisztikai előrejelzési módszerek a közgazdaságtanban: oktatóanyag/ Moszkva állami egyetem közgazdaságtan, statisztika és számítástechnika. – M.: MESI, 2003. – 52 p.

2. Afanasjev V.N., Juzbasev M.M. Idősorelemzés és előrejelzés M.: Pénzügy és Statisztika, 2001.

3. Lukashin Yu.P. Regressziós és adaptív előrejelzési módszerek. Tanulmányi útmutató. – M.: MESI, 1997.

Tegyük fel, hogy ki akarjuk terjeszteni a modellünket a független változó más értékeire, és felvetjük az átlag előrejelzésének problémáját. at egy adott értéknek felel meg, amely a minta megfigyelések között lehet hogy , és ezen az intervallumon kívül. Az előrejelzés lehet pont vagy intervallum.

Pont előrejelzés– ezt az egyenlet segítségével számítjuk ki
jelentése .

Intervallum előrejelzés egy konfidencia intervallum, amely adott megbízhatósággal 1-
várható érték :

, (3.1.13)

. (3.1.14)


Konfidenciaintervallumot készíthet a paraméterhez
, amely a paraméter valódi értékét takarja
adott megbízhatósággal 1-
:

. (3.1.16)

A korrelációs együttható konfidencia intervalluma a (3.1.17) képlet alapján található:

. (3.1.18)

Mert nemlineáris regressziók számítsuk ki a (3.1.10) képlet alapján számított meghatározási együttható négyzetgyökével egyenlő korrelációs indexet.

A korrelációs index megbízhatóságát a segítségével értékeljük
- a (3.2.19) képlet alapján számított statisztikák:

, (3.1.19)

Ahol m– a paraméterek száma a regressziós egyenletben. A Fisher-táblázatok szerint (E. melléklet) adott megbízhatóságra 1-
és a szabadságfokok száma (
) És (
) keresse meg a táblázat értékét
. Ha
, akkor adott megbízhatósággal 1-
a korrelációs index megbízhatóságára lehet következtetni.

A felépített modell megfelelősége a vizsgált folyamatnak a közelítés átlagos hibájával (az elméleti és a tényleges értékek közötti eltérés átlagos százaléka) határozható meg:

. (3.1.20)

A gazdasági mutatók modellezésekor leggyakrabban 5%-os hiba megengedett (néha 7%, ritkán 10%). A modell akkor tekinthető megfelelőnek (és ezért alkalmasnak), ha
.

Mivel ugyanazt a trendet különböző modellek is kifejezhetik, gyakran számos funkciót használnak, majd kiválasztják a legelőnyösebbet. A legelőnyösebb modell kiválasztása a maradék szórás (maradék variancia) alapján történhet:

, (3.1.21)

Ahol
- a paraméterek száma az egyenletben.

A legjobb funkció az lesz kevesebb.

3.1. példa Vizsgálja meg a profit volumenének függőségét a kiskereskedelmi egységek számától! Készítsen előrejelzést, feltételezve, hogy a kiskereskedelmi egységek számát 25-re növelik.

Megoldás. A (3.1.1) lineáris regressziós egyenlet paramétereinek megtalálása a rendszer segítségével lineáris egyenletek Gauss (3.1.2) összeállítunk egy segédszámítási táblázatot 3.1.

§ 4.1. Előrejelzési konfidencia intervallumok

A növekedési görbék alkalmazásának utolsó lépése a trend extrapolálása a választott egyenletből. A vizsgált mutató előrejelzési értékeit úgy számítjuk ki, hogy a görbe egyenletébe behelyettesítjük az átfutási periódusnak megfelelő t időértékeket. Az így kapott előrejelzést pont előrejelzésnek nevezzük, mivel minden időpillanathoz csak az előrejelzett mutató egy értéke kerül meghatározásra.

A gyakorlatban a pont előrejelzésen kívül kívánatos meghatározni az előrejelzett mutató lehetséges változásának határait, beállítani az előrejelzett mutató lehetséges értékeinek „tartományát”, pl. intervallum előrejelzés kiszámítása.

A tényleges adatok és a növekedési görbékből a trend extrapolálásával kapott pont-előrejelzés közötti eltérést a következők okozhatják:

1) szubjektív hiba a görbe típusának kiválasztásában;

2) hiba a görbe paramétereinek becslésében;

3) az egyes megfigyeléseknek az egyes időpontokban a sorozat egy bizonyos átlagos szintjét jellemző trendtől való eltérésével kapcsolatos hiba.

A második és harmadik forráshoz kapcsolódó bizonytalanság tükröződhet az előrejelzés konfidenciaintervallumában. A konfidenciaintervallum, amely figyelembe veszi a trend helyzetéhez kapcsolódó bizonytalanságot és az ettől a trendtől való eltérés lehetőségét, a következőképpen definiálható:

(4.1.),

ahol n az idősor hossza;

L az átfutási időszak;

Pont előrejelzés n+L időpontban;

Student t-statisztikai értéke;

Átlagos négyzetes előrejelzési hiba.

Tegyük fel, hogy a trendet egyenes vonal jellemzi:

Mivel a paraméterbecsléseket egy idősor által reprezentált mintapopulációból határozzák meg, hibát tartalmaznak. Paraméter hiba az egyenes függőleges eltolódásához, a paraméterhibához vezet - az egyenes dőlésszögének megváltoztatása az abszcissza tengelyhez képest. Figyelembe véve az egyes megvalósítások trendvonalakhoz viszonyított szóródását, a diszperzió a következőképpen ábrázolható:

(4.2.),

ahol a tényleges megfigyelések és a számított eltérések szórása;

Az átfutási idő, amelyre az extrapolációt elvégzik;

N+L ;

t- a sorozat szintjeinek sorszáma, t=1,2, ... , n;

A sor közepén lévő szint sorszáma a

=(n+1):2

Ekkor a konfidenciaintervallum a következőképpen ábrázolható:

(4.3.)

Jelöljük a gyöket a (4.3.) kifejezésben K-val. K értéke csak n-től és L-től függ, azaz. a sorozat hosszáról és az átfutási időszakról. Ezért létrehozhat K értékek vagy K*= t táblázatokat a K. Ekkor az intervallumbecslés így fog kinézni:

(4.4.)

A (4.3.)-hoz hasonló kifejezést kaphatunk egy másodrendű polinomra:

(4.5.)

vagy

(4.6.)

A tényleges megfigyelések és a számított eltérések szórását a következő kifejezés határozza meg:

(4.7.),

Ahol - a sorozatszintek tényleges értékei,

a sorszintek számított értékei,

n az idősor hossza,

k a szintezési görbe becsült paramétereinek száma.

Így a konfidencia intervallum szélessége függ a szignifikancia szinttől, az átfutási periódustól, a trendtől való szórástól és a polinom mértékétől.

Minél magasabb a polinom foka, annál szélesebb a konfidenciaintervallum ugyanazon értékhez , mivel a trendegyenlet szórását az egyenlet megfelelő paraméterei szórásának súlyozott összegeként számítjuk

4.1. ábra. Konfidenciaintervallumok előrejelzése lineáris trendhez

Az exponenciális egyenlet segítségével kapott előrejelzések konfidencia intervallumait hasonló módon határozzuk meg. A különbség az, hogy mind a görbe paramétereinek, mind az átlagos négyzetes hiba kiszámításakor nem maguk az idősorok szintjei, hanem azok logaritmusai kerülnek felhasználásra.

Ugyanezt a sémát használva a konfidenciaintervallumok számos aszimptotákkal rendelkező görbére határozhatók meg, ha az aszimptota értéke ismert (például egy módosított exponenciális esetében).

4.1. táblázat. A K* értékei az n idősor hosszától és az egyenes és parabola L átfutási periódusától függően vannak megadva. Nyilvánvaló, hogy az (n) sorozat hosszának növekedésével a K* értékei csökkennek az L átfutási periódus növekedésével, a K* értékei nőnek. Ezenkívül az átfutási periódus hatása nem azonos n különböző értékeire: minél nagyobb a sorozat hossza, annál kisebb az L átfutási periódus befolyása.


4.1. táblázat.

Értékek K * az előrejelzés konfidenciaintervallumainak becslésére lineáris trend és parabola trend alapján 0,9 (7) konfidenciavalószínűséggel.

Lineáris trend

Parabolikus trend

Sor hossza (n)

Átfutási idő (L)

sor hossza (n)

átfutási idő (L)

2,6380 2,8748 3,1399

2,4631 2,6391 2,8361

2,3422 2,4786 2,6310

2,2524 2,3614 2,4827

2,1827 2,2718 2,3706

2,1274 2,2017 2,2836

2,0837 2,1463 2,2155

2,0462 2,1000 2,1590

2,0153 2,0621 2,1131

1,9883 2,0292 2,0735

1,9654 2,0015 2,0406

1,9455 1,9776 2,0124

1,9280 1,9568 1,9877

1,9117 1,9375 1,9654

1,8975 1,9210 1,9461

1,8854 1,9066 1,9294

1,8738 1,8932 1,9140

1,8631 1,8808 1,8998

1,8538 1,8701 1,8876

3,948 5,755 8,152

3,459 4,754 6,461

3,144 4,124 5,408

2,926 3,695 4,698

2,763 3,384 4,189

2,636 3,148 3,808

2,536 2,965 3,516

2,455 2,830 3,286

2,386 2,701 3,100

2,330 2,604 2,950

2,280 2,521 2,823

2,238 2,451 2,717

2,201 2,391 2,627

2,169 2,339 2,549

2,139 2,293 2,481

2,113 2,252 2,422

2,090 2,217 2,371

2,069 2,185 2,325

2,049 2,156 2,284

§ 4.2. A kiválasztott modellek megfelelőségének ellenőrzése

A kiválasztott modellek valós folyamatnak való megfelelőségének (különösen a kapott növekedési görbe megfelelőségének) ellenőrzése a véletlen komponens elemzésén alapul. A véletlenszerű maradék komponenst a szisztematikus komponensnek a vizsgált sorozattól való elkülönítése után kapjuk meg (trend és periodikus komponens, ha az idősorban jelen van). Tételezzük fel, hogy az eredeti idősor olyan folyamatot ír le, amely nincs kitéve szezonális ingadozásoknak, pl. Fogadjuk el a hipotézist a következő alaksorok additív modelljéről:

(4.8.)

Ekkor egy sor maradékot kapunk az idősor () tényleges szintjének eltéréseiként a korrigált, számított értékektől ( ):

(4.9.)

Növekedési görbék használatakor úgy számítjuk ki, hogy a megfelelő szekvenciális időértékeket behelyettesítjük a kiválasztott görbék egyenleteibe.

Általánosan elfogadott, hogy a modell akkor megfelelő a leírt folyamathoz, ha a maradék komponens értékei kielégítik a véletlenszerűség, a függetlenség tulajdonságait, és a véletlen komponens megfelel a normál eloszlási törvénynek.

at a helyes választás meghozatala típusú trend, az ettől való eltérések véletlenszerűek lesznek. Ez azt jelenti, hogy a maradék valószínűségi változó változása nincs összefüggésben az időbeli változással. Így a vizsgált intervallum minden időpontjára kapott minta felhasználásával teszteljük az értéksor időfüggőségére vonatkozó hipotézist, vagy ami ugyanaz, a változásában bekövetkező trend jelenlétéről. . Ezért ennek a tulajdonságnak az ellenőrzésére az I. részben tárgyalt kritériumok egyike, például a sorozatkritérium használható.

Ha a szisztematikus komponenst leíró függvény típusát rosszul választják meg, akkor előfordulhat, hogy a maradékok sorozatának egymást követő értékei nem rendelkeznek függetlenségi tulajdonságokkal, mert korrelálni tudnak egymással. Ebben az esetben azt mondják, hogy a hibák autokorrelációja van.

Az autokorreláció körülményei között a módszerrel kapott modellparaméterek becslései legkisebb négyzetek, az elfogulatlanság és a konzisztencia tulajdonságaival fog rendelkezni (ezeket a tulajdonságokat a matematikai statisztika során tanuljuk meg). Ugyanakkor ezeknek a becsléseknek a hatékonysága csökkenni fog, következésképpen a konfidenciaintervallumok megbízhatatlanságuk miatt csekély jelentéssel bírnak.

Az autokorreláció kimutatására számos technika létezik. A legelterjedtebb a D által javasolt módszer Arby's ny és Watson. D kritérium Arby's on-Watson összefüggésbe hozható az elsőrendű autokorreláció létezésének hipotézisével, azaz. autokorreláció a sorozat szomszédos maradéktagjai között. Ennek a kritériumnak az értékét a következő képlet határozza meg:

(4.10.)

Megmutatható, hogy d értéke megközelítőleg egyenlő:

d » 2(1- ) (4.11),

ahol az elsőrendű autokorrelációs együttható (pl. pár együttható korreláció két sorozat és ).

Az utolsó képletből jól látható, hogy ha erős pozitív autokorreláció van az értékekben (» 1), akkor a d=0 érték erős negatív autokorreláció esetén (» -1) d=4. Autokorreláció hiányában (» 0) d=2.

Ennél a kritériumnál olyan kritikus határokat találtunk, amelyek lehetővé teszik az autokorreláció hiányára vonatkozó hipotézis elfogadását vagy elutasítását. A kritérium készítői 1, 2,5 és 5%-os szignifikanciaszintek határait határozták meg. D kritérium értékek Arby's on-Watson 5%-os szignifikancia szinten a 4.2. táblázatban látható. Ebben a táblázatban és a D kritérium alsó és felső konfidenciahatára Arby-Watson; - a változók száma a modellben; n az idősor hossza.

4.2. táblázat.

D kritérium értékek Arby's on-Watson d 1 és d 2 5%-os szignifikancia szinten

1,08

1,13

1,16

1,18

1,22

1,”4

1,26

1,27

1,29

1,32

1,33

1,34

1,35

1,36

1,37

1,38

1,49

1,41

1,36

1,37

1,38

1,39

1,41

1,42

1,43

1,44

1,45

1,45

1,46

1,47

1,48

1,48

1,49

1,51

1,51

1,52

1,52

0,95

0,98

1,02

1,05

1,08

1,13

1,15

1,17

1,19

1,21

1,22

1,24

1,26

1,27

1,28

1,31

1,32

1,33

1,34

1,35

1,54

1,54

1,54

1,53

1,53

1,54

1,54

1,54

1,54

1,55

1,55

1,55

1,56

1,56

1,56

1,57

1,57

1,57

1,58

1,58

1,58

1,59

0,82

0,86

0,93

0,97

1,03

1,05

1,08

1,12

1,14

1,16

1,18

1,21

1,23

1,24

1,26

1,27

1,28

1,29

1,75

1,73

1,71

1,69

1,68

1,68

1,67

1,66

1,66

1,66

1,66

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

A D kritérium alkalmazása a gyakorlatban Arby's on-Watson a (4.10.) képlettel számított d értékének a táblázatból vett d 1 és d 2 elméleti értékeivel való összehasonlításán alapul. Vegye figyelembe, hogy a legtöbb statisztikai adatfeldolgozásra szolgáló szoftvercsomag kiszámítja ezt a kritériumot (például PPP "Olympus", "Mesosaurus", "Statistica" stb.).

Ha d értékét a és -vel összehasonlítja, a következő lehetőségek lehetségesek:

1) Ha d< , то гипотеза о независимости случайных отклонений (отсутствие автокорреляции) отвергается;

2) Ha d > , akkor a véletlen eltérések függetlenségére vonatkozó hipotézist nem utasítják el;

3) Ha £ d £ , akkor nincs kellő ok a döntések meghozatalára, pl. az érték a „bizonytalanság” tartományába esik.

A figyelembe vett opciók arra az esetre vonatkoznak, amikor pozitív autokorreláció van a reziduumokban.

Ha d számított értéke meghaladja a 2-t, akkor azt mondhatjuk, hogy negatív autokorreláció áll fenn.

A kritikus értékekkel való negatív autokorreláció ellenőrzéséhez nem magát a d együtthatót, hanem a 4-d együtthatót kell összehasonlítani.

A modell konfidenciaintervallumainak meghatározásához fontos a maradékok eloszlásának normalitási tulajdonsága. Mivel a gazdasági mutatók idősorai általában kicsik (<50), то проверка распределения на нормальность может быть произведена лишь приближенно, например, на основе исследования показателей асимметрии и эксцесса.

Normál eloszlás esetén a ferdeség (A) és a görbület (E) mutatója nulla. Mivel azt feltételezzük, hogy a trendtől való eltérések valamilyen általános sokaságból vett mintát jelentenek, így meghatározhatjuk a minta ferdeség és görbület jellemzőit, valamint ezek átlagos négyzetes hibáit.

Ha az egyenlőtlenségek közül legalább az egyik teljesül

(4.17.),

akkor az eloszlás normális természetére vonatkozó hipotézist elvetik.

Más esetekben további tesztelésre van szükség erősebb kritériumok alapján.

4.1. példa.

A program számos maradékanyag esetében a következő jellemzőket hozta létre:

sorhossz n=20;

aszimmetria-együttható A = 0,6;

Kurtózis-együttható E=0,7.

Ezen jellemzők alapján feltételezhető, hogy:

a) a véletlen komponens engedelmeskedik a normális eloszlási törvénynek;

b) a véletlen komponens nem engedelmeskedik a normális eloszlási törvénynek;

c) a véletlenszerű komponens eloszlásának jellegének további ellenőrzése szükséges.

Megoldás:

Határozzuk meg:


Mivel mindkét egyenlőtlenség egyszerre teljesül


§ 4.3. A modell pontossági jellemzői

Az előrejelzéshez választott modell minőségének legfontosabb jellemzői a pontossági mutatói. Leírják a modell használata során kapott véletlenszerű hibák nagyságát. A kiválasztott modell minőségének megítéléséhez tehát egy olyan mutatórendszert kell elemezni, amely mind a modell megfelelőségét, mind pontosságát jellemzi.

A gyakorlatban széles körben használják a relatív előrejelzési hibát, amelyet a mutató tényleges értékéhez viszonyított százalékban fejeznek ki:

(4.19.)

Átlagos abszolút hibákat (abszolút és relatív) is használunk:

(4.20.),

Ahol n az idősor azon szintjeinek száma, amelyekre az előrejelzési értéket meghatározták.

A (4.18.), (4.19.) pontokból jól látható, hogy ha az abszolút és relatív hiba nagyobb, mint 0, akkor ez „túlbecsült” előrejelzési becslést jelez, ha kisebb, mint 0, akkor az előrejelzés alulbecslésre került.

Nyilvánvaló, hogy mindezek a jellemzők az átfutási időszak lejárta után is kiszámíthatók, és vannak aktuális adatok az előre jelzett mutatóról, vagy a mutatót egy retrospektív szakaszban figyelembe véve.

Ez utóbbi esetben a rendelkezésre álló információk két részre oszlanak: az elsőben a modell paramétereit becsüljük meg, a második részben az adatokat tekintjük ténylegesnek. A visszamenőlegesen (a második részben) kapott előrejelzési hibák jellemzik az alkalmazott modell pontosságát.

A gyakorlatban a modellek összehasonlító értékelése során olyan minőségi jellemzők használhatók, mint a diszperzió () vagy az előrejelzési hiba négyzetes átlaga (S):

(4.21.).

Minél alacsonyabbak ezek a jellemzők, annál nagyobb a modell pontossága.

Egy modell pontossága nem ítélhető meg egyetlen előrejelzési hibaérték alapján. Például, ha a júniusi havi termelési szint előrejelzése egybeesett a tényleges értékkel, akkor ez nem elegendő bizonyíték a modell nagy pontosságára. Figyelembe kell venni, hogy egy rossz modellből egyetlen jó előrejelzés nyerhető, és fordítva.

Következésképpen az alkalmazott modellek minősége csak a becsült értékek és a tényleges értékek összehasonlításával ítélhető meg.

Az előrejelzések minőségének egyszerű mérőszáma lehetm-azon esetek relatív száma, amikor a tényleges értéket lefedte az intervallum előrejelzés:

(4.22.),

ahol p a tényleges adatokkal megerősített előrejelzések száma;

q azoknak az előrejelzéseknek a száma, amelyeket nem erősítenek meg tényleges adatok.

Ha minden előrejelzés beigazolódik, q=0 és m = 1.

Ha az összes előrejelzés nem igazolódott be, akkor p = 0 és m = 0.

Vegye figyelembe, hogy az együtthatók összehasonlítása m Különböző modellek esetén lehet értelme, feltéve, hogy a megbízhatósági valószínűségeket azonosnak tételezzük fel.

A kapott regressziós együtthatók kiszámítása és megbízhatóságának ellenőrzése nem öncél, ez csak egy szükséges közbenső lépés. A legfontosabb dolog a modell használata a vizsgált gazdasági jelenség viselkedésének elemzésére és előrejelzésére. Az előrejelzés a faktorérték helyettesítésével történik X a kapott regressziós képletbe.

A kereskedelmi forgalom volumenének előrejelzésére a 2.1. példában kapott regressziós egyenletet használjuk. Legyen megtervezve egy üzlet megnyitása létszámmal X=140 fő, akkor az egyenlet segítségével kellően indokolt kereskedelmi forgalom nagyságát kell megállapítani ŷ (X)= –0,974 + 0,01924×140=1,72 milliárd rubel.

A prediktív érték konfidencia intervalluma at(X)=a 0 +a 1 X képlet határozza meg

ahol t p a Student-eloszlás kritikus határa n – 2 szabadságfokkal, amely megfelel a szignifikanciaszintnek r. A konfidenciaintervallum meghatározásához az (5.2) kifejezést használjuk.

Válasszunk 5%-os szignifikancia szintet. A szabadságfokszámunk 8 – 2 = 6, ekkor a Student eloszlási táblázatból (1. melléklet) azt találjuk,

t 0,05 (6) = 2,447.s = Ö 0,008 = 0,089,

ezért 95%-os valószínűséggel a kereskedelmi forgalom valódi értékei belül lesznek

1,72 – 2,447 × 0,048<y(x)<1,72+2,447×0,048, или 1,60<y(x)<1,84.

5.8. Praktikus blokk

Példa. Készítsen modellt ezen tényezők közötti kapcsolatról, ellenőrizze annak megfelelőségét, végezzen pont- és intervallum-előrejelzéseket extrapolációs módszerrel.

1 . Készítsen szórási diagramot EXCEL-ben, és vonjon le előzetes következtetést a kapcsolat meglétére vonatkozóan.

5.6. táblázat 5.1. diagram

x Y
2,1 29,5
2,9 34,2
3,3 30,6
3,8 35,2
4,2 40,7
3,9 44,5
5,0 47,2
4,9 55,2
6,3 51,8
5,8 56,7

Következtetés: Az 5.1 diagramból jól látható, hogy a tényezők közötti kapcsolat xÉs y

közvetlen erős lineáris kapcsolat.

2. Számítsa ki a lineáris korrelációs együtthatót! A Student-féle t-próba segítségével tesztelje a korrelációs együttható szignifikanciáját. Vonjon le következtetést a tényezők közötti szoros kapcsolatról! XÉs at.

5.7. táblázat

xy
2,1 29,5 4,41 870,25 61,95 27,91 1,59 0,054
2,9 34,2 8,41 1169,64 99,18 33,46 0,74 0,022
3,3 30,6 10,89 936,36 100,98 36,23 -5,63 0,184
3,8 35,2 14,44 1239,04 133,76 39,69 -4,49 0,128
4,2 40,7 17,64 1656,49 170,94 42,47 -1,77 0,043
3,9 44,5 15,21 1980,25 173,55 40,39 4,11 0,092
5,0 47,2 2227,84 48,01 -0,81 0,017
4,9 55,2 24,01 3047,04 270,48 47,32 7,88 0,143
6,3 51,8 39,69 2683,24 326,34 57,02 -5,22 0,101
5,8 56,7 33,64 3214,89 328,86 53,55 3,15 0,056
TELJES: 42,2 193,34 19025,04 1902,04 0,840
Átlagos érték 4,22 42,56 19,334 1902,504 190,204

2.1 Vizsgáljuk meg a tényezők közötti kapcsolat szorosságát:

;

Következtetés: kommunikáció erős.

2.2 Ellenőrizzük a statisztikai szignifikanciát a Student-féle teszt segítségével:

1) A tanuló kritériuma: tselect<=tкр

2) N o: r=0 tcr=2,31

tselect=rselect*

Következtetés: így, mivel tselect = 5,84

A nullhipotézis 90%-a elutasításra kerül, jelezve a jelenlétét erős lineáris kapcsolat.

3. Abban a hitben, hogy a tényezők közötti kapcsolat XÉs at lineáris függvénnyel leírható, a legkisebb négyzetek eljárásával írjunk fel normálegyenletrendszert a lineáris regressziós egyenlet együtthatóira. Számítsa ki ezeket az együtthatókat bármilyen módszerrel.

Következetesen behelyettesítve az 5.7 táblázat (2) oszlopából származó regressziós egyenletbe, kiszámítjuk az értékeket és kitöltjük az 5.7 táblázat (7) oszlopát.

4. Az X és Y faktorok közötti kapcsolat eredő modelljéhez számítsa ki a közelítés átlagos hibáját! Készítsen előzetes következtetést a kapott modell elfogadhatóságáról.

A számításhoz töltse ki az 5.7. táblázat 8. és 9. oszlopát.

<Екр=12%

Következtetés: a modellt kielégítőnek kell tekinteni.

5 . Ellenőrizze az a 1 regressziós egyenlet együtthatójának jelentőségét a Student-féle t-próba alapján!

Megoldás: 5.8. táblázat

2,1 29,5 27,91 2,5281 214,623 170,5636
2,9 34,2 33,46 0,5476 82,81 69,8896
3,3 30,6 36,23 31,6969 40,069 143,0416
3,8 35,2 39,69 20,1601 8,237 54,1696
4,2 40,7 42,47 3,1329 0,008 3,4596
3,9 44,5 40,39 16,8921 4,709 3,7636
47,2 48,01 0,6561 29,703 21,5296
4,9 55,2 47,32 62,0944 22,658 159,7696
6,3 51,8 57,02 27,2484 209,092 85,3776
5,8 56,7 53,55 9,9225 120,78 199,9396
TELJES: 42,2 425,6 426,1 174,8791 732,687 911,504
Átlagos 4,22 42,56

Statisztikai ellenőrzés:

Következtetés: 90%-os együtthatóval a 1 - statisztikailag szignifikáns, i.e. a nullhipotézist elvetik.

6. Ellenőrizze a modell (regressziós egyenlet) egészének megfelelőségét a Fisher-Snedecor F teszt alapján.

Statisztikai vizsgálati eljárás:

:modell nem megfelelő

Következtetés: mert Fselect>Fcr, akkor 95%-os konfidenciavalószínűséggel a nullhipotézist elvetjük (azaz az alternatívát elfogadjuk). A vizsgált modell megfelelő, előrejelzésre és vezetői döntések meghozatalára használható.

7. Számítsa ki az empirikus determinációs együtthatót!

(3. lap)

A változás arányát mutatja.

Következtetés: i.e. Az eltérések 80%-át a modellben szereplő tényezők, 20%-át a modellben nem szereplő tényezők magyarázzák.

8. Számítsa ki a korrelációs arányt! Hasonlítsa össze a kapott értéket a lineáris korrelációs együttható értékével.

Az empirikus korrelációs kapcsolat bármely kapcsolat esetén két tényező kapcsolatának szorosságát jelzi, ha a kapcsolat lineáris, akkor , azaz. a korrelációs együttható egybeesik a determinációs együtthatóval.

9 . Végezze el a pont előrejelzését .

10-12 . Számítsa ki a konfidencia intervallumokat a regressziós egyenlethez és a kapott karakterisztikához =90% konfidenciaszinten. Rajzolj egy koordináta-rendszerbe:

a) kezdeti adatok,

b) regressziós egyenes,

c) pont előrejelzés,

d) 90%-os konfidencia intervallumok.

Fogalmazzon meg egy általános következtetést a kapott modellre vonatkozóan!

-az átlag matematikai elvárása.

Az intervallum-előrejelzés elvégzéséhez két területet veszünk figyelembe.

1) számára y a faktorváltozás területéről x A lineáris regressziós egyenlet megbízhatósági határait a következő képlet segítségével számítjuk ki:

2) a becsült értékhez a konfidenciaintervallumot a következő képlet segítségével számítjuk ki:

Kiinduló adatok:

2) t=2,31 (tab.)

5) : 27,91 42,56 57,02 66,72

6) 19,334-4,22 2)=1,53.

5.9. táblázat

1 2,1 -2,12 4,49 3,03 1,74 2,31 4,68 18,81 27,91 9,10 46,72
4,22 0,00 0,00 0,1 0,32 2,31 4,68 3,46 42,56 39,10 46,02
6,3 2,08 4,33 2,93 1,71 2,31 4,68 18,49 57,02 38,53 75,51
7,7 3,48 12,11 9,02 2,31 4,68 32,43 66,72 34,29 99,15

Következtetés: Mivel a megfigyelési pontok 90%-a a 90%-os konfidencia intervallumon belülre esett, ez a modell és a megbízhatósági határai 90%-os megbízhatósági szinttel jósolhatók.

Biztonsági kérdések

1. Lineáris regressziós modellek heteroszkedasztikus és autokorrelált reziduumokkal.

2. Az autokorreláció típusai és rövid jellemzőik.

3. Autokorreláció a maradékokban és kimutatásának eljárása.

4. Az autokorreláció típusai reziduumokban.

5. A Durbin-Watson-kritérium használatának eljárása.

6. Autokorreláció a forrásadatokban és a jelenlétük meghatározásának eljárása.

7. Módszerek az autokorreláció előrejelzési eredményekre gyakorolt ​​hatásának kiküszöbölésére.

8. Általánosított legkisebb négyzetek módszere (GLM).

9. Mit jelent homoszkedaszticitás?

10. Hogyan tesztelik a maradékok sorozatának homoszkedaszticitására vonatkozó hipotézist?

11. Regressziós minőségértékelés. A modell megfelelőségének és megbízhatóságának ellenőrzése.

12. A regressziós együtthatók jelentősége (Student-féle t-próba).

13. Varianciaanalízis. A kapcsolati modell megbízhatóságának ellenőrzése (Fisher-féle F teszt segítségével).

14. Korrelációs együtthatók és indexek. Multicollateralitás.

15. Az összefüggés jelentőségének felmérése. Meghatározás.

16. Átlagos közelítési hiba.

17. Döntéshozatal regressziós egyenletek alapján.

18. Milyen ökonometriai feladatokban használják a Fisher-eloszlást?

19. Milyen eloszlási táblákat használunk a lineáris regresszió minőségének értékelésére?

20. Milyen jellemzői vannak a regressziós modellek gyakorlati alkalmazásának?

21. Hogyan történik a gazdasági mutatók előrejelzése lineáris regressziós modellekkel?

22. Hogyan becsülhető meg a munkanélküliség „természetes” aránya lineáris regressziós modell segítségével?

23. Milyen esetekben szükséges a lineáris regressziós modell finomítása és hogyan valósítható meg?

24. Mikor szükséges a jelentéktelen magyarázó változók figyelmen kívül hagyása és új változók hozzáadása?

Feladatok és feladatok

1 . Vannak adatok a legnagyobb amerikai cégek 2006-os tevékenységéről.

Nem. Nettó jövedelem, milliárd USA dollár, at Tőkeforgalom, milliárd USD, X 1 Felhasznált tőke, milliárd USA dollár, X 2 Alkalmazottak száma, ezer fő, X 3 A cég piaci kapitalizációja, milliárd USA dollár, X 4
0,9 31,3 18,9 43,0 40,9
1,7 13,4 13,7 64,7 40,5
0,7 4,5 18,5 24,0 38,9
1,7 10,0 4,8 50,2 38,5
2,6 20,0 21,8 106,0 37,3
1,3 15,0 5,8 96,6 26,5
4,1 137,1 99,0 347,0 37,0
1,6 17,9 20,1 85,6 36,8
6,9 165,4 60,6 745,0 36,3
0,4 2,0 1,4 4,1 35,3
1,3 6,8 8,0 26,8 35,3
1,9 27,1 18,9 42,7 35,0
1,9 13,4 13,2 61,8 26,2
1,4 9,8 12,6 212,0 33,1
0,4 19,5 12,2 105,0 32,7
0,8 6,8 3,2 33,5 32,1
1,8 27,0 13,0 142,0 30,5
0,9 12,4 6,9 96,0 29,8
1,1 17,7 15,0 140,0 25,4
1,9 12,7 11,9 59,3 29,3
-0,9 21,4 1,6 131,0 29,2
1,3 13,5 8,6 70,7 29,2
2,0 13,4 11,5 65,4 29,1
0,6 4,2 1,9 23,1 27,9
0,7 15,5 5.8 80,8 27,2

Számítsa ki a páros korrelációs együtthatók mátrixait, és ezek alapján válasszon informatív tényezőket a modellhez. Készítsen modellt csak informatív tényezőkkel, és becsülje meg a paramétereit.

Számítsa ki az előrejelzés hibáit és konfidencia intervallumát
szignifikancia szintje 5 vagy 10% (γ = 0,05; γ = 0,10).

2. Vannak adatok a legnagyobb amerikai cégek 2006-os tevékenységéről.

Nem. Nettó bevétel, milliárd dollár at Tőkeforgalom, milliárd dollár. EGYESÜLT ÁLLAMOK, X 1 Felhasznált tőke, milliárd dollár. X 2 Szám, ezer ember, X 3
6,6 6,9 83,6 222,0
3,0 18.0 6,5 32,0
6,5 107,9 50,4 82,0
3,3 16,7 15,4 45,2
0,1 79,6 29,6 299,3
3,6 16,2 13,3 41,6
1,5 5,9 5,9 17,8
5,5 53,1 27,1 151,0
2,4 18,8 11,2 82,3
3,0 35,3 16,4 103,0
4,2 71,9 32,5 225,4
2,7 93,6 25,4 675,0
1,6 10,0 6,4 43,8
2,4 31,5 12,5 102,3
3,3 36,7 14,3 105,0
1,8 13,8 6,5 49,1
2,4 64,8 22,7 50,4
1,6 30,4 15,8 480,0
1,4 12,1 9,3 71,0
0,9 31,3 18,9 43,0

Számítsa ki egy lineáris többszörös regressziós egyenlet paramétereit a tényezők teljes listájával.

Adjon összehasonlító értékelést a tényezők és az eredmény közötti kapcsolat erősségéről rugalmassági együtthatók segítségével!

Számítsa ki a páros és parciális korrelációs együtthatók mátrixait, és ezek alapján válasszon informatív tényezőket a modellhez. Készítsen modellt csak informatív tényezőkkel, és becsülje meg a paramétereit.

Számítsa ki az eredmény becsült értékét, ha a tényezők előrejelzett értékei a maximális értékük 80%-a.

Számítsa ki az előrejelzés hibáit és konfidenciaintervallumát 5 vagy 10%-os szignifikanciaszint esetén (α = 0,05; α = 0,10).


©2015-2019 oldal
Minden jog a szerzőket illeti. Ez az oldal nem igényel szerzői jogot, de ingyenesen használható.
Az oldal létrehozásának dátuma: 2016-02-16





hiba: A tartalom védett!!