Odaberite Stranica

Predviđanje zasnovano na metodi eksponencijalnog izglađivanja. Primjer rješenja problema

02.04.2011 – Čovekova želja da podigne veo budućnosti i predvidi tok događaja ima dugu istoriju koliko i njegovi pokušaji da razume svet oko nas. Očigledno je da je interes za prognoziranje zasnovan na prilično jakim životnim motivima (teorijskim i praktičnim). Prognoza djeluje kao najvažniji metod za testiranje naučnih teorija i hipoteza. Sposobnost predviđanja budućnosti sastavni je aspekt svijesti, bez kojeg bi sam ljudski život bio nemoguć.

Koncept „prognoza“ (od grčkog prognosis - predviđanje, predviđanje) znači proces razvijanja vjerovatnoćeg suda o stanju bilo koje pojave ili procesa u budućnosti, to je znanje o onome što još ne postoji, ali šta može desiti u bliskoj ili daljoj budućnosti.

Prognoza je po svom sadržaju složenija od predviđanja. S jedne strane, odražava najvjerovatnije stanje objekta, as druge, određuje načine i sredstva za postizanje željenog rezultata. Na osnovu informacija dobijenih predviđanjem za postizanje željenog cilja, donose se određene odluke.

Treba napomenuti da je dinamika ekonomskih procesa u savremenim uslovima karakteriziraju nestabilnost i neizvjesnost, što otežava korištenje tradicionalnih metoda predviđanja.

Eksponencijalno izglađivanje i modeli predviđanja spadaju u klasu metoda adaptivnog predviđanja, čija je glavna karakteristika sposobnost kontinuiranog uzimanja u obzir evolucije dinamičkih karakteristika procesa koji se proučavaju, prilagođavanja ovoj dinamici, dajući, posebno, veću težinu i veća je vrijednost informacija dostupnim zapažanjima, što su bliže trenutnoj tački u vremenu. Značenje termina je da adaptivno predviđanje omogućava ažuriranje prognoza sa minimalnim kašnjenjem i korištenjem relativno jednostavnih matematičkih procedura.

Metoda eksponencijalnog izglađivanja je nezavisno otkrivena Brown(Brown R.G. Statistical forecasting for inventory control, 1959) i Holtom(Holt C.C. Predviđanje sezonskih i trendova prema eksponencijalno ponderiranim pokretnim prosjecima, 1957.). Eksponencijalno izglađivanje, kao i metoda pokretnog prosjeka, koristi prethodne vrijednosti vremenske serije za izradu prognoze.

Suština metode eksponencijalnog izglađivanja je da se vremenska serija izglađuje korištenjem ponderiranog pokretnog prosjeka, u kojem se ponderi pridržavaju eksponencijalnog zakona. Ponderisani pokretni prosek sa eksponencijalno raspoređenim težinama karakteriše vrednost procesa na kraju intervala ujednačavanja, tj. prosečna karakteristika poslednji nivoi serije. Ovo svojstvo se koristi za predviđanje.

Konvencionalno eksponencijalno izglađivanje se koristi kada u podacima nema trenda ili sezonskosti. U ovom slučaju, prognoza je ponderisani prosjek svih dostupnih prethodnih vrijednosti serije; težine se geometrijski smanjuju tokom vremena kako se krećemo u prošlost (unazad). Stoga (za razliku od metode pokretnog prosjeka) ne postoji tačka u kojoj se težine prekidaju, odnosno idu na nulu. Pragmatično jasan model jednostavnog eksponencijalnog izglađivanja može se napisati na sljedeći način (sve formule članka možete preuzeti sa priloženog linka):

Pokažimo eksponencijalnu prirodu smanjenja pondera vrijednosti vremenske serije - od trenutnog do prethodnog, od prethodnog do prethodnog i tako dalje:

Ako se formula primjenjuje rekurzivno, onda se svaka nova izglađena vrijednost (koja je također prognoza) izračunava kao ponderirani prosjek trenutnog opažanja i izglađene serije. Očigledno, rezultat izglađivanja zavisi od parametra prilagođavanja alfa. Može se tumačiti kao diskontni faktor koji karakterizira mjeru devalvacije podataka po jedinici vremena. Štaviše, uticaj podataka na prognozu se eksponencijalno smanjuje sa „starošću“ podataka. Zavisnost uticaja podataka na prognozu kod različitih koeficijenata alfa je prikazano na slici 1.

Slika 1. Ovisnost utjecaja podataka na prognozu za različite koeficijente adaptacije

Treba napomenuti da vrijednost parametra izglađivanja ne može biti jednaka 0 ili 1, jer se u ovom slučaju odbacuje sama ideja eksponencijalnog izglađivanja. Dakle, ako alfa jednaka 1, tada je predviđena vrijednost F t+1 poklapa se sa trenutnom vrednošću serije Xt, dok eksponencijalni model teži najjednostavnijem “naivnom” modelu, odnosno u ovom slučaju predviđanje je apsolutno trivijalan proces. Ako alfa jednako 0, tada je početna predviđena vrijednost F 0 (početna vrijednost) će istovremeno biti prognoza za sve naredne trenutke serije, odnosno prognoza će u ovom slučaju izgledati kao obična horizontalna linija.

Međutim, razmotrimo opcije za parametar uglađivanja koje su blizu 1 ili 0. Dakle, ako alfa blizu 1, tada su prethodna zapažanja vremenske serije skoro potpuno zanemarena. U slučaju alfa blizu 0, tada se trenutna zapažanja zanemaruju. Vrijednosti alfa između 0 i 1 daju srednje rezultate. Prema brojnim autorima, optimalna vrijednost alfa je u rasponu od 0,05 do 0,30. Međutim ponekad alfa, veći od 0,30 daje bolju prognozu.

Općenito, bolje je procijeniti optimalno alfa na osnovu izvornih podataka (koristeći pretragu mreže), umjesto korištenja umjetnih preporuka. Međutim, ako vrijednost alfa, veći od 0,3, minimizira brojne posebne kriterijume, što ukazuje da druga tehnika predviđanja (koristeći trend ili sezonalnost) može dati još preciznije rezultate. Da biste pronašli optimalnu vrijednost alfa(tj. minimiziranje posebnih kriterijuma). algoritam maksimizacije kvazi-njutnovske vjerovatnoće(vjerovatnosti), što je efikasnije od konvencionalnog pretraživanja mreže.

Prepišimo jednačinu (1) kao alternativu koja nam omogućava da procijenimo kako model eksponencijalnog izglađivanja „uči“ iz svojih prošlih grešaka:

Iz jednačine (3) se jasno vidi da je prognoza za period t+1 podložan je promjeni naviše ako stvarna vrijednost vremenske serije premašuje period t iznad predviđene vrijednosti i, obrnuto, prognoza za period t+1 treba smanjiti ako X t manje od Ft.

Imajte na umu da kada koristite metode eksponencijalnog izglađivanja važno pitanje je uvijek određivanje početnih uslova (početna predviđena vrijednost F 0). Proces odabira početne vrijednosti izglađene serije naziva se inicijalizacija ( inicijaliziranje), ili, inače, „zagrijavanje“ (“ zagrijavanje") modeli. Činjenica je da početna vrijednost izglađenog procesa može značajno utjecati na prognozu za naredna promatranja. S druge strane, utjecaj izbora opada s dužinom serije i postaje nekritičan kada je broj opservacija vrlo velik. Brown je bio prvi koji je predložio korištenje prosjeka vremenske serije kao početne vrijednosti. Drugi autori predlažu korištenje prve stvarne vrijednosti vremenske serije kao početne prognoze.

Sredinom prošlog stoljeća, Holt je predložio proširenje jednostavnog eksponencijalnog modela izglađivanja uključivanjem faktora rasta ( faktor rasta), ili na neki drugi način trend ( faktor trenda). Kao rezultat, Holtov model se može napisati na sljedeći način:

Ova metoda vam omogućava da uzmete u obzir prisustvo linearnog trenda u podacima. Kasnije su predložene druge vrste trendova: eksponencijalni, prigušeni, itd.

Winters predložio poboljšanje Holt modela sa stanovišta mogućnosti opisivanja uticaja sezonskih faktora (Winters P.R. Predviđanje prodaje prema eksponencijalno ponderiranim pokretnim prosjecima, 1960.).

Konkretno, on je dalje proširio Holtov model uključivanjem dodatne jednačine koja opisuje ponašanje sezonska komponenta(komponenta). Sistem jednačina Wintersovog modela je sljedeći:

Razlomak u prvoj jednadžbi služi za eliminaciju sezonalnosti iz originalne serije. Nakon isključivanja sezonalnosti (koristeći metodu sezonske dekompozicije Popis stanovništvaI) algoritam radi sa “čistim” podacima u kojima nema sezonskih fluktuacija. Pojavljuju se već u konačnoj prognozi (15), kada se „čista“ prognoza, izračunata gotovo po Holt metodi, pomnoži sa sezonskom komponentom ( indeks sezonskosti).

Jednostavan i logički jasan model vremenske serije izgleda ovako:

Gdje b je konstanta, i ε - slučajna greška. Konstantno b je relativno stabilan u svakom vremenskom intervalu, ali se takođe može sporo mijenjati tokom vremena. Jedan od intuitivnih načina za isticanje značenja b od podataka je korištenje izglađivanja pokretnog prosjeka, u kojem se posljednjim zapažanjima dodijeljuju veće težine od pretposljednjih, pretposljednjim više težine od pretposljednjih itd. Jednostavno eksponencijalno izglađivanje je dizajnirano upravo ovako. Ovdje se eksponencijalno opadajuće težine dodjeljuju starijim opservacijama i, za razliku od pokretnog prosjeka, uzimaju se u obzir sva prethodna opažanja serije, a ne samo ona koja su bila unutar određenog prozora. Tačna formula za jednostavno eksponencijalno izglađivanje je:

Kada se ova formula primenjuje rekurzivno, svaka nova izglađena vrednost (koja je takođe prognoza) se izračunava kao ponderisani prosek trenutnog posmatranja i izglađene serije. Očigledno, rezultat izglađivanja zavisi od parametra α . Ako α jednako 1, tada se prethodna zapažanja potpuno zanemaruju. Ako je a 0, tada se trenutna zapažanja zanemaruju. Vrijednosti α između 0 i 1 daju srednje rezultate. Empirijska istraživanja su pokazala da jednostavno eksponencijalno izglađivanje često daje prilično tačnu prognozu.

U praksi se obično preporučuje uzimanje α manje od 0,30. Međutim, odabir većeg od 0,30 ponekad daje preciznije predviđanje. To znači da je ipak bolje procijeniti optimalnu vrijednost α zasnovano na stvarnim podacima, a ne na općim preporukama.

U praksi, optimalni parametar za izravnavanje se često pronalazi korištenjem procedure pretraživanja mreže. Mogući raspon vrijednosti parametara podijeljen je u mrežu s određenim korakom. Na primjer, razmotrite mrežu vrijednosti od α =0,1 do α = 0,9 u koracima od 0,1. Zatim se bira ova vrijednost α , za koji je zbroj kvadrata (ili srednjih kvadrata) reziduala (opažene vrijednosti minus predviđanja korak naprijed) minimalan.

Microsoft Excel ima funkciju Eksponencijalno izglađivanje (Eksponencijalno izglađivanje), koji se obično koristi za izglađivanje nivoa empirijskih vremenskih serija zasnovanih na jednostavnoj metodi eksponencijalnog izglađivanja. Da biste pozvali ovu funkciju, izaberite komandu Alati - Analiza podataka na traci menija. Na ekranu će se otvoriti prozor Data Analysis u kojem treba odabrati vrijednost eksponencijalnog izravnavanja. Kao rezultat, pojavit će se dijaloški okvir Eksponencijalno izglađivanje, predstavljen na sl. 11.5.


U dijaloškom okviru Eksponencijalno izglađivanje, postavljaju se gotovo isti parametri kao u dijaloškom okviru Pokretni prosjek o kojem se govorilo gore.

1. Opseg unosa - u ovo polje se unosi opseg ćelija koje sadrže vrijednosti parametra koji se proučava.

2. Oznake - ova opcija je označena ako prvi red (kolona) u opsegu unosa sadrži naslov. Ako nema naslova, potvrdni okvir treba poništiti. U ovom slučaju, standardni nazivi će se automatski kreirati za podatke o opsegu izlaza.

3. Faktor prigušenja - u ovo polje upisuje se vrijednost odabranog eksponencijalnog koeficijenta izravnavanja α . Zadana vrijednost je α = 0,3.

4. Izlazne opcije - u ovoj grupi, pored specificiranja opsega ćelija za izlazne podatke u polju Output Range, možete zatražiti i da se grafikon automatski generiše provjerom opcije Chart Output, te izračunati standardne greške provjerom opciju Standardne greške.

Koristimo funkciju Eksponencijalno izglađivanje Za ponovno odlučivanje problem razmatran gore, ali koristeći metodu jednostavnog eksponencijalnog izglađivanja. Odabrane vrijednosti parametara izglađivanja prikazane su na Sl. 11.5. Na sl. 11.6 prikazuje izračunate indikatore, a sl. 11.7 - konstruisani grafovi.

1. Osnovne metodološke odredbe.

Jednostavna metoda eksponencijalnog izglađivanja koristi ponderisani (eksponencijalni) pokretni prosek svih podataka iz prethodnih posmatranja. Ovaj model se najčešće primjenjuje na podatke u kojima je potrebno ocijeniti postojanje veze između analiziranih indikatora (trend) ili ovisnost analiziranih podataka. Svrha eksponencijalnog izglađivanja je procjena trenutnog stanja, čiji će rezultati odrediti sve naredne prognoze.

Eksponencijalno izglađivanje obezbeđuje Stalno ažuriranje modela koristeći najnovije podatke. Ova metoda se zasniva na usrednjavanju (izglađivanju) vremenskih serija prošlih opservacija u opadajućem (eksponencijalnom) smjeru. To jest, novijim događajima se pridaje veća težina. Težina se dodjeljuje na sljedeći način: za posljednje opažanje težina će biti α, za pretposljednje - (1-α), za ono koje je bilo prije njega - (1-α) 2, itd.

U izglađenom obliku, nova prognoza (za vremenski period t+1) može se predstaviti kao ponderisani prosjek posljednjeg opažanja količine u trenutku t i njene prethodne prognoze za isti period t. Štaviše, težina α se dodeljuje posmatranoj vrednosti, a težina (1- α) se dodeljuje prognozi; pretpostavlja se da je 0< α<1. Это правило в общем виде можно записать следующим образом.

Nova prognoza = [α*(poslednje zapažanje)]+[(1- α)*poslednja prognoza]

gdje je predviđena vrijednost za naredni period;

α – konstanta zaglađivanja;

Y t – posmatranje vrijednosti za tekući period t;

Prethodna izglađena prognoza ove vrijednosti za period t.

Eksponencijalno izglađivanje je postupak za kontinuiranu reviziju rezultata prognoze u svjetlu najnovijih događaja.

Konstanta izglađivanja α je ponderisani faktor. Njegova stvarna vrijednost je određena mjerom u kojoj bi trenutno posmatranje trebalo da utiče na predviđenu vrednost. Ako je α blizu 1, tada prognoza značajno uzima u obzir veličinu greške posljednje prognoze. Suprotno tome, za male vrijednosti α, predviđena vrijednost je najbliža prethodnoj prognozi. Može se smatrati ponderisanim prosjekom svih prošlih zapažanja, s ponderima koji se eksponencijalno smanjuju kako podaci stari.



Tabela 2.1

Poređenje uticaja različitih vrednosti konstanti glađenja

Konstanta α je ključ za analizu podataka. Ako je potrebno da predviđene vrijednosti budu stabilne i da se slučajna odstupanja izglade, potrebno je odabrati malu vrijednost α. Velika vrijednost konstante α ima smisla ako je potreban brz odgovor na promjene u spektru opažanja.

2. Praktični primjer eksponencijalnog izglađivanja.

Prikazani su podaci kompanije o obimu prodaje (hiljada jedinica) za sedam godina, a konstanta izravnavanja je uzeta jednaka 0,1 i 0,6. Podaci za 7 godina čine testni dio; na osnovu njih potrebno je proceniti efikasnost svakog modela. Za eksponencijalno ujednačavanje serija, početna vrijednost se uzima jednaka 500 (prva vrijednost stvarnih podataka ili prosječna vrijednost za 3-5 perioda se upisuje u izglađenu vrijednost za 2. kvartal).

Tabela 2.2

Početni podaci

Vrijeme Realna vrijednost (stvarna) Izglađena vrijednost Greška prognoze
godine kvartal 0,1 0,1
Excel prema formuli
#N/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Na sl. Slika 2.1 predstavlja prognozu zasnovanu na eksponencijalnom izglađivanju sa konstantom izglađivanja jednakom 0,1.



Rice. 2.1. Eksponencijalno izglađivanje

Rješenje u Excelu.

1. Odaberite meni “Alati” – “Analiza podataka”. Na listi Alati za analizu izaberite Eksponencijalno izglađivanje. Ako u meniju „Alati“ nema analize podataka, potrebno je da instalirate „Paket analize“. Da biste to učinili, pronađite stavku "Postavke" u "Opcijama" i u dijaloškom okviru koji se pojavi potvrdite okvir "Paket analize" i kliknite U redu.

2. Na ekranu će se otvoriti dijaloški okvir prikazan na sl. 2.2.

3. U polje “input interval” unesite vrijednosti izvornih podataka (plus jedna slobodna ćelija).

4. Označite polje za potvrdu “oznake” (ako opseg unosa sadrži nazive kolona).

5. Unesite vrijednost (1-α) u polje „faktor atenuacije“.

6. U polje “input interval” unesite vrijednost ćelije u kojoj želite da vidite rezultirajuće vrijednosti.

7. Označite polje za potvrdu “Opcije” - “Izlaz grafa” da biste ga automatski napravili.

Rice. 2.2. Dijaloški okvir za eksponencijalno izglađivanje

3. Laboratorijski zadatak.

Postoje početni podaci o obimu proizvodnje preduzeća za proizvodnju nafte za 2 godine, prikazani u tabeli 2.3:

Tabela 2.3

Početni podaci

Izvršite eksponencijalno izravnavanje serije. Uzmite eksponencijalni koeficijent izglađivanja jednak 0,1; 0,2; 0.3. Komentirajte dobijene rezultate. Možete koristiti statistiku prikazanu u Dodatku 1.

Identificiranje i analiza trenda vremenske serije često se vrši izravnavanjem ili izglađivanjem. Eksponencijalno izglađivanje je jedna od najjednostavnijih i najčešćih metoda za ispravljanje niza. Eksponencijalno izglađivanje se može predstaviti kao filter, čiji se ulaz sekvencijalno prima iz termina originalne serije, a izlaz se formira trenutnim vrijednostima eksponencijalnog prosjeka.

Neka bude vremenska serija.

Eksponencijalno izglađivanje niza se izvodi pomoću rekurentne formule: , .

Što je manji α, to se više filtriraju i potiskuju oscilacije originalne serije i šum.

Ako dosljedno koristimo ovaj rekurentni odnos, tada se eksponencijalni prosjek može izraziti kroz vrijednosti vremenske serije X.

Ako postoje raniji podaci kada počne ravnanje, tada se kao početna vrijednost može koristiti aritmetički prosjek svih dostupnih podataka ili neki njihov dio.

Nakon pojave radova R. Browna, eksponencijalno izglađivanje se često koristi za rješavanje problema kratkoročnog predviđanja vremenskih serija.

Izjava o problemu

Neka je data vremenska serija: .

Potrebno je riješiti problem predviđanja vremenske serije, tj. naći

Horizont prognoze, potrebno je da

Da bismo uzeli u obzir starenje podataka, tada uvodimo nerastući niz težina

Smeđi model

Pretpostavimo da je D mali (kratkoročna prognoza), pa za rješavanje takvog problema koristimo se Smeđi model.

Ako prognozu smatramo korak ispred, onda je greška ove prognoze, a nova prognoza dobijena kao rezultat prilagođavanja prethodne prognoze uzimajući u obzir njenu grešku - suštinu prilagođavanja.

U kratkoročnom predviđanju, poželjno je što je brže moguće odraziti nove promjene i istovremeno što bolje „očistiti“ niz od slučajnih fluktuacija. To. težinu novijih zapažanja treba povećati: .

S druge strane, da bi se izgladila nasumična odstupanja, α treba smanjiti: .

To. ova dva zahtjeva su u sukobu. Pronalaženje kompromisne vrijednosti α predstavlja problem optimizacije modela. Obično se α uzima iz intervala (0,1/3).

Primjeri

Rad eksponencijalnog izglađivanja na α=0,2 na podacima iz mjesečnih izvještaja o prodaji stranih automobilskih marki u Rusiji za period od januara 2007. do oktobra 2008. Napomenimo oštre padove u januaru i februaru, kada prodaja tradicionalno opada i raste na početak ljeta.

Problemi

Model radi samo za kratak horizont prognoze. Trend i sezonske promjene se ne uzimaju u obzir. Kako bi se uzeli u obzir njihov utjecaj, predlaže se korištenje sljedećih modela: Holt (u obzir se uzima linearni trend), Holt-Winters (multiplikativni eksponencijalni trend i sezonalnost), Theil-Wage (aditivni linearni trend i sezonalnost).

Tema 3. Izglađivanje i predviđanje vremenskih serija na osnovu trend modela

Svrha Izučavanje ove teme je stvaranje osnovne osnove za obuku menadžera u specijalnosti 080507 u oblasti izgradnje modela različitih problema iz oblasti ekonomije, razvijanje kod studenata sistematskog pristupa postavljanju i rešavanju problema prognoziranja. Predloženi kurs će omogućiti stručnjacima da se brzo prilagode praktičnom radu, bolje snalaze u naučnim i tehničkim informacijama i literaturi u svojoj specijalnosti i budu sigurniji u donošenju odluka koje se javljaju u njihovom radu.

Main zadataka izučavanje teme su: studenti stiču dubinska teorijska znanja o korišćenju prognostičkih modela, stiču održive veštine u izvođenju istraživačkog rada, sposobnost rešavanja složenih naučnih problema povezanih sa konstrukcijom modela, uključujući i višedimenzionalne, sposobnost logičke analize dobijene rezultate i odrediti načine za pronalaženje prihvatljivih odluka.

Prilično jednostavan metod za identifikaciju razvojnih trendova je izglađivanje vremenskih serija, tj. zamjena stvarnih nivoa izračunatim nivoima koji imaju manje varijacije od originalnih podataka. Odgovarajuća transformacija se zove filtriranje. Pogledajmo nekoliko metoda zaglađivanja.

3.1. Jednostavni proseci

Svrha ujednačavanja je da se izgradi model predviđanja za naredne periode na osnovu prošlih zapažanja. U metodi jednostavnih prosjeka, vrijednosti varijable se uzimaju kao početni podaci Y u trenucima u vremenu t, a vrijednost prognoze je definirana kao jednostavan prosjek za naredni vremenski period. Formula izračuna izgleda ovako

Gdje n broj zapažanja.

Kada novo zapažanje postane dostupno, novodobijenu prognozu treba uzeti u obzir prilikom predviđanja za naredni period. Kada se koristi ova metoda, prognoza se radi usrednjavanjem svih prethodnih podataka, međutim, nedostatak takvog predviđanja je teškoća korištenja u trend modelima.

3.2. Metoda pokretnog prosjeka

Ova metoda se zasniva na predstavljanju serije kao zbira prilično glatkog trenda i slučajne komponente. Metoda se temelji na ideji izračunavanja teorijske vrijednosti na temelju lokalne aproksimacije. Za konstruiranje procjene trenda u nekoj tački t na osnovu serijskih vrijednosti iz vremenskog intervala izračunati teorijsku vrijednost serije. Najrasprostranjeniji slučaj u praksi izglađivanja nizova je kada su sve težine za elemente intervala su jednake jedna drugoj. Iz tog razloga se ova metoda naziva metoda pokretnog prosjeka, budući da se prilikom izvođenja postupka otvara prozor širine od (2 m + 1) duž cijelog reda. Širina prozora se obično uzima neparno, jer se teoretska vrijednost izračunava za središnju vrijednost: broj pojmova k = 2m + 1 sa istim brojem nivoa lijevo i desno od trenutka t.

Formula za izračunavanje pokretnog prosjeka u ovom slučaju ima oblik:

Varijanca pokretnog prosjeka je definirana kao σ 2 /k, gde kroz σ 2 označava disperziju originalnih članova serije, i k interval izglađivanja, dakle, što je veći interval izglađivanja, to je jače usrednjavanje podataka i manje varijabilan identifikovani trend. Najčešće se izglađivanje izvodi pomoću tri, pet i sedam članova originalne serije. U ovom slučaju treba uzeti u obzir sljedeće karakteristike pokretnog prosjeka: ako uzmemo u obzir niz s periodičnim fluktuacijama konstantne dužine, onda kada se izglađuje na osnovu pokretnog prosjeka sa intervalom izravnavanja jednakim ili višekratnim od perioda, fluktuacije će biti potpuno eliminirane. Često, izglađivanje zasnovano na pokretnom proseku transformiše seriju toliko da se identifikovani trend razvoja pojavljuje samo u najopštijim terminima, a manji, ali važni detalji za analizu (talasi, krivine, itd.) nestaju; nakon zaglađivanja, mali talasi ponekad mogu da promene pravac tako da se na mestu „vrhova“ pojavljuju suprotne „rupe“ i obrnuto. Sve ovo zahtijeva oprez u korištenju jednostavnog pokretnog prosjeka i tjera nas da tražimo suptilnije metode opisa.

Metoda pokretnog prosjeka ne daje vrijednosti trenda za prvu i posljednju mčlanovi serije. Ovaj nedostatak je posebno uočljiv kada je dužina reda kratka.

3.3. Eksponencijalno izglađivanje

Eksponencijalni prosjek y t je primjer asimetričnog ponderiranog pokretnog prosjeka koji uzima u obzir stupanj starenja podataka: starije informacije sa manjom težinom uključene su u formulu za izračunavanje izglađene vrijednosti nivoa serije

Evo — eksponencijalni prosek, koji zamenjuje posmatranu vrednost serije y t(izglađivanje uključuje sve podatke primljene do danas t), α parametar izglađivanja koji karakteriše težinu trenutnog (najnovijeg) opažanja; 0< α <1.

Metoda se koristi za predviđanje nestacionarnih vremenskih serija sa slučajnim promjenama nivoa i nagiba. Kako se krećemo dalje u prošlost od trenutnog trenutka u vremenu, težina odgovarajućeg člana serije brzo (eksponencijalno) opada i praktično prestaje da utiče na vrijednost.

Lako je dobiti da nam posljednja relacija omogućava da damo sljedeću interpretaciju eksponencijalnog prosjeka: if — prognoza serijske vrijednosti y t, tada je razlika greška prognoze. Dakle, prognoza za naredni trenutak t+1 uzima u obzir ono što je postalo poznato u ovom trenutku t greška prognoze.

Parametar izglađivanja α je faktor težine. U slučaju α je blizu jedinice, tada prognoza značajno uzima u obzir veličinu greške posljednje prognoze. Pri malim vrijednostima α predviđena vrijednost je bliska prethodnoj prognozi. Odabir parametra za izravnavanje je prilično složen problem. Opća razmatranja su sljedeća: metoda je dobra za predviđanje prilično glatkih serija. U ovom slučaju, možete odabrati konstantu izravnavanja tako što ćete minimizirati grešku predviđanja za jedan korak unaprijed procijenjenu iz posljednje trećine serije. Neki stručnjaci ne preporučuju korištenje velikih vrijednosti parametra izravnavanja. Na sl. Slika 3.1 prikazuje primjer izglađenog niza koristeći metodu eksponencijalnog izglađivanja sa α= 0,1.

Rice. 3.1. Rezultat eksponencijalnog izglađivanja na α =0,1
(1 originalna serija; 2 izglađene serije; 3 ostatka)

3.4. Eksponencijalno izglađivanje
uzimajući u obzir trend (Holtova metoda)

Ova metoda uzima u obzir lokalni linearni trend prisutan u vremenskoj seriji. Ako postoji uzlazni trend u vremenskoj seriji, tada je uz procjenu trenutnog nivoa neophodna i procjena nagiba. U Holt tehnici, vrijednosti nivoa i nagiba se izravnavaju korištenjem različitih konstanti za svaki parametar. Konstantno izglađivanje vam omogućava da procijenite trenutni nivo i nagib, prečišćavajući ih kad god se pojave nova zapažanja.

Holt metoda koristi tri formule za izračunavanje:

  1. Eksponencijalno izglađena serija (procjena trenutnog nivoa)

(3.2)

  1. Procjena trenda

(3.3)

  1. Prognoza za r periodi pred nama

(3.4)

Gdje α, β izglađujuće konstante iz intervala.

Jednačina (3.2) je slična jednačini (3.1) za jednostavno eksponencijalno izglađivanje osim za termin trenda. Konstantno β potrebno da se izgladi procjena trenda. U jednačini prognoze (3.3), procjena trenda se množi sa brojem perioda r, na kojem se zasniva prognoza, a zatim se ovaj proizvod dodaje trenutnom nivou izglađenih podataka.

Trajno α I β biraju se subjektivno ili minimiziranjem greške predviđanja. Što se uzimaju veće težine, brži će se odgovor na promjene dogoditi i podaci će biti glatkiji. Manje težine čine strukturu izglađenih vrijednosti manje glatkom.

Na sl. 3.2 pokazuje primjer izglađivanja niza pomoću Holt metode sa vrijednostima α I β , jednako 0,1.

Rice. 3.2. Rezultat izglađivanja pomoću Holt metode
at α = 0,1 I β = 0,1

3.5. Eksponencijalno izglađivanje uzimajući u obzir trendove i sezonske varijacije (Winters metoda)

Kada postoje sezonske varijacije u strukturi podataka, troparametarski model eksponencijalnog izglađivanja koji je predložio Winters koristi se za smanjenje grešaka u prognozi. Ovaj pristup je produžetak Holtovog prethodnog modela. Da bi se uzele u obzir sezonske varijacije, ovdje se koristi dodatna jednadžba, a ova metoda je u potpunosti opisana sa četiri jednačine:

  1. Eksponencijalno izglađene serije

(3.5)

  1. Procjena trenda

(3.6)

  1. Procjena sezonalnosti

.

(3.7)

  1. Prognoza za r periodi pred nama

(3.8)

Gdje α, β, γ stalno izglađivanje za nivo, trend i sezonalnost, respektivno; s- trajanje perioda sezonskih fluktuacija.

Jednačina (3.5) ispravlja izglađenu seriju. Termin u ovoj jednadžbi uzima u obzir sezonskost u izvornim podacima. Nakon uzimanja u obzir sezonalnosti i trenda u jednadžbama (3.6), (3.7), procjene se izglađuju i predviđa se u jednačini (3.8).

Isto kao u prethodnoj metodi, utezi α, β, γ može se odabrati subjektivno ili minimiziranjem greške predviđanja. Prije primjene jednačine (3.5) potrebno je odrediti početne vrijednosti za izglađene serije Lt, trend T t, koeficijenti sezonskosti S t. Obično se početna vrijednost izglađene serije uzima jednaka prvom opažanju, zatim je trend jednak nuli, a koeficijenti sezonskosti se postavljaju jednakima jedan.

Na sl. Slika 3.3 prikazuje primjer izglađivanja niza korištenjem Wintersove metode.

Rice. 3.3. Rezultat zaglađivanja po Winters metodi
at α = 0,1 = 0,1; γ = 0,1(1 - originalna serija; 2 izglađene serije; 3 ostatka)

3.6. Predviđanje zasnovano na trend modelima

Vrlo često vremenske serije imaju linearni trend (trend). Uz pretpostavku linearnog trenda, potrebno je konstruisati pravu liniju koja bi najpreciznije odražavala promjenu dinamike u posmatranom periodu. Postoji nekoliko metoda za konstruisanje prave linije, ali najobjektivnija sa formalne tačke gledišta biće konstrukcija zasnovana na minimiziranju zbira negativnih i pozitivnih odstupanja početnih vrednosti serije od prave.

Prava linija u dvokoordinatnom sistemu (x,y) može se odrediti presječnom točkom jedne od koordinata at i ugao nagiba prema osi X. Jednačina takve linije će izgledati ovako Gdje a- tačka preseka; b ugao nagiba.

Da bi prava linija odražavala tok dinamike, potrebno je minimizirati zbir vertikalnih odstupanja. Kada se kao kriterij za procjenu minimizacije koristi jednostavan zbir odstupanja, rezultat neće biti baš dobar, jer se negativna i pozitivna odstupanja međusobno kompenziraju. Minimiziranje zbira apsolutnih vrijednosti također ne dovodi do zadovoljavajućih rezultata, jer su procjene parametara u ovom slučaju nestabilne, a postoje i računske poteškoće u implementaciji takvog postupka procjene. Stoga je najčešće korištena procedura minimiziranje sume kvadrata odstupanja ili metoda najmanjih kvadrata(MNC).

Budući da niz početnih vrijednosti ima fluktuacije, model serije će sadržavati greške, čiji kvadrati moraju biti minimizirani

gdje je y i posmatrana vrijednost; y i * teorijske vrijednosti modela; broj posmatranja.

Prilikom modeliranja trenda originalne vremenske serije koristeći linearni trend, pretpostavljamo da

Dijeljenje prve jednadžbe sa n, dolazimo do sljedećeg

Zamjena dobijenog izraza u drugu jednačinu sistema (3.10), za koeficijent b* dobijamo:

3.7. Provjera uklapanja modela

Kao primjer na sl. 3.4 prikazuje grafik linearne regresije između snage automobila X i njen trošak at.

Rice. 3.4. Grafikon linearne regresije

Jednačina za ovaj slučaj je: at=1455,3 + 13,4 X. Vizuelna analiza ove slike pokazuje da za brojna opažanja postoje značajna odstupanja od teorijske krive. Grafikon ostatka prikazan je na Sl. 3.5.

Rice. 3.5. Bilans grafikon

Analiza reziduala regresijske linije može pružiti korisnu mjeru koliko dobro procijenjena regresija odražava stvarne podatke. Dobra regresija je ona koja objašnjava značajan dio varijanse i, obrnuto, loša regresija ne prati veliku količinu varijacija u izvornim podacima. Intuitivno je jasno da će svaka dodatna informacija poboljšati model, tj. smanjiti neobjašnjivi dio varijacije u varijabli at. Da bismo analizirali regresiju, dekomponovaćemo varijansu na komponente. Očigledno je da

Posljednji član će biti jednak nuli, jer predstavlja zbir ostataka, pa dolazimo do sljedećeg rezultata

Gdje SS 0, SS 1, SS 2 odrediti ukupni, regresijski i rezidualni zbir kvadrata, respektivno.

Regresijski zbir kvadrata mjeri dio varijanse objašnjen linearnim odnosom; rezidualni dio varijanse koji nije objašnjen linearnim odnosom.

Svaki od ovih zbroja karakterizira odgovarajući broj stupnjeva slobode (DOF), koji određuje broj jedinica podataka neovisnih jedna o drugoj. Drugim rečima, broj otkucaja srca je povezan sa brojem posmatranja n i broj parametara izračunat iz ukupnosti podataka. U slučaju koji se razmatra, izračunati SS 0 određuje se samo jedna konstanta (prosječna vrijednost), dakle broj otkucaja srca za SS 0 će biti (n1), Otkucaji srca za SS 2 – (n – 2) i puls za SS 1će biti n – (n – 1)=1, pošto postoji n – 1 konstantna tačka u jednačini regresije. Baš kao i sumi kvadrata, otkucaji srca su povezani relacijom

Zbroji kvadrata koji su povezani sa dekompozicijom varijanse, zajedno sa odgovarajućim HR, mogu se staviti u tzv. analizu varijanse (ANOVA table ANAlysis Of VARiance) (Tablica 3.1).

Tabela 3.1

ANOVA table

Izvor

Zbir kvadrata

Srednji kvadrat

Regresija

SS 2/(n-2)

Koristeći uvedenu skraćenicu za sume kvadrata, definiramo koeficijent determinacije kao omjer zbira kvadrata regresije i ukupnog zbira kvadrata u obliku

(3.13)

Koeficijent determinacije mjeri udio varijabilnosti varijable Y, što se može objasniti korištenjem informacija o varijabilnosti nezavisne varijable X. Koeficijent determinacije se mijenja od nule kada X ne utiče Y, na jedan kada se promeni Y u potpunosti objašnjeno promjenom X.

3.8. Model regresijske prognoze

Najbolja prognoza je ona sa minimalnom varijansom. U našem slučaju, obični OLS proizvodi najbolju prognozu od svih metoda koje proizvode nepristrasne procjene zasnovane na linearnim jednačinama. Greška prognoze povezana sa procedurom predviđanja može doći iz četiri izvora.

Prvo, slučajna priroda aditivnih grešaka kojima se upravlja linearnom regresijom osigurava da će prognoza odstupiti od pravih vrijednosti čak i ako je model ispravno specificiran i njegovi parametri su precizno poznati.

Drugo, sam proces procene unosi grešku u procenu parametara, oni retko mogu biti jednaki pravim vrednostima, iako su im u proseku jednaki.

Treće, u slučaju uvjetne prognoze (u slučaju točno nepoznatih vrijednosti nezavisnih varijabli), unosi se greška u prognozu varijabli objašnjenja.

Četvrto, može doći do greške jer specifikacija modela nije tačna.

Kao rezultat toga, izvori grešaka se mogu klasificirati na sljedeći način:

  1. priroda varijable;
  2. priroda modela;
  3. greška koju donosi prognoza nezavisnih slučajnih varijabli;
  4. greška u specifikaciji.

Razmotrićemo bezuslovnu prognozu, kada se nezavisne varijable lako i tačno predviđaju. Počnimo da razmatramo problem kvaliteta prognoze sa uparenom regresijskom jednadžbom.

Iskaz problema u ovom slučaju može se formulirati na sljedeći način: koja će biti najbolja prognoza y T+1, pod uvjetom da je u modelu y = a + bx parametri A I b su tačno procijenjene, a vrijednost x T+1 poznato.

Tada se predviđena vrijednost može definirati kao

Greška prognoze će biti

.

Greška predviđanja ima dva svojstva:

Rezultirajuća varijansa je minimalna među svim mogućim procjenama zasnovanim na linearnim jednačinama.

Mada A i b su poznati, greška prognoze se javlja zbog činjenice da na T+1 možda neće ležati na liniji regresije zbog greške ε T+1, podložna normalnoj distribuciji sa nultom srednjom vrijednosti i varijansom σ 2. Da bismo provjerili kvalitetu prognoze, uvodimo normaliziranu vrijednost

Tada možete definirati interval pouzdanosti od 95% na sljedeći način:

Gdje β 0,05 kvantila normalne distribucije.

Granice intervala od 95% mogu se definirati kao

Imajte na umu da u ovom slučaju širina intervala povjerenja ne ovisi o vrijednosti X, a granice intervala su prave linije paralelne sa linijom regresije.

Češće je prilikom konstruisanja regresijske linije i provjere kvaliteta prognoze potrebno procijeniti ne samo parametre regresije, već i varijansu greške prognoze. Može se pokazati da u ovom slučaju varijansa greške zavisi od vrijednosti (), gdje je prosječna vrijednost nezavisne varijable. Osim toga, što je serija duža, to je tačnija prognoza. Greška prognoze se smanjuje ako je vrijednost X T+1 blizu prosječne vrijednosti nezavisne varijable, i obrnuto, kada se udalji od prosječne vrijednosti, prognoza postaje manje tačna. Na sl. Slika 3.6 prikazuje rezultate prognoze korištenjem jednadžbe linearne regresije za 6 vremenskih intervala unaprijed zajedno sa intervalima povjerenja.

Rice. 3.6. Prognoza linearnom regresijskom jednadžbom

Kao što se može videti sa sl. 3.6, ova linija regresije ne opisuje dovoljno dobro originalne podatke: postoji velika varijacija u odnosu na liniju uklapanja. O kvalitetu modela može se suditi i po rezidualima, koje, ako je model zadovoljavajući, treba rasporediti približno prema normalnom zakonu. Na sl. Slika 3.7 prikazuje graf reziduala konstruisan korišćenjem skale verovatnoće.

Sl.3.7. Bilans grafikon

Kada se koristi ovakva skala, podaci koji se pridržavaju normalnog zakona moraju ležati na pravoj liniji. Kao što proizilazi iz gornje slike, tačke na početku i kraju perioda posmatranja donekle odstupaju od prave linije, što ukazuje da odabrani model u obliku jednačine linearne regresije nije dovoljno kvalitetan.

U tabeli Tabela 3.2 prikazuje rezultate prognoze (druga kolona) zajedno sa intervalima pouzdanosti od 95% (donja treća i gornja četvrta kolona, ​​respektivno).

Tabela 3.2

Rezultati prognoze

3.9. Multivarijantni regresijski model

U multivarijantnoj regresiji, podaci za svaki slučaj uključuju vrijednosti zavisne varijable i svake nezavisne varijable. Zavisna varijabla y ovo je slučajna varijabla povezana sa nezavisnim varijablama sljedećim odnosom:

gdje se određuju koeficijenti regresije; ε komponenta greške koja odgovara odstupanju vrijednosti zavisne varijable od pravog odnosa (pretpostavlja se da su greške nezavisne i da imaju normalnu distribuciju sa nultim matematičkim očekivanjem i nepoznatom varijansom σ ).

Za dati skup podataka, procjene koeficijenata regresije mogu se naći pomoću OLS-a. Ako su OLS procjene označene sa , tada će odgovarajuća regresijska funkcija imati oblik:

Ostaci su procjene komponente greške i slični su rezidualima u slučaju jednostavne linearne regresije.

Statistička analiza multivarijantnog regresijskog modela provodi se slično jednostavnoj linearnoj regresijskoj analizi. Standardni statistički softverski paketi omogućavaju dobijanje OLS procjena za parametre modela i procjene njihovih standardnih grešaka. Alternativno, možete dobiti vrijednost t-statistiku za provjeru značaja pojedinih termina regresionog modela i vrijednosti F-statistiku za provjeru značajnosti regresijske zavisnosti.

Oblik podjele suma kvadrata u slučaju multivarijantne regresije sličan je izrazu (3.13), ali će odnos za broj otkucaja srca biti sljedeći

Još jednom to naglasimo n predstavlja obim zapažanja, i k broj varijabli u modelu. Ukupna varijacija zavisne varijable sastoji se od dvije komponente: varijacije objašnjene nezavisnim varijablama kroz funkciju regresije i neobjašnjive varijacije.

ANOVA tabela za slučaj multivarijantne regresije će imati oblik prikazan u tabeli. 3.3.

Tabela 3.3

ANOVA table

Izvor

Zbir kvadrata

Srednji kvadrat

Regresija

SS 2/(n-k-1)

Kao primjer multivarijantne regresije koristit ćemo podatke iz paketa Statistica (datoteka sa podacima Poverty.Sta) Prikazani podaci zasnovani su na poređenju rezultata popisa iz 1960. i 1970. godine. za slučajni uzorak od 30 zemalja. Imena zemalja su unesena kao nazivi nizova, a imena svih varijabli u ovoj datoteci su data u nastavku:

POP_CHNG promjena stanovništva za 1960-1970;

N_EMPLD broj zaposlenih u poljoprivredi;

PT_SIRAN procenat porodica koje žive ispod nivoa siromaštva;

TAX_RATE poreska stopa;

PT_PHONE postotak stanova sa telefonom;

PT_RURAL procenat ruralnog stanovništva;

STAROST srednjih godina.

Kao zavisnu varijablu biramo znak Pt_Poor, a kao nezavisni - sve ostalo. Izračunati koeficijenti regresije između odabranih varijabli dati su u tabeli. 3.4

Tabela 3.4

Regresijski koeficijenti

Ova tabela prikazuje koeficijente regresije ( IN) i standardizirani koeficijenti regresije ( Beta). Korištenje koeficijenata IN uspostavlja se oblik regresione jednadžbe, koja u ovom slučaju ima oblik:

Uključivanje samo ovih varijabli na desnoj strani je zbog činjenice da samo ovi znakovi imaju vrijednost vjerovatnoće r manji od 0,05 (vidi četvrtu kolonu tabele 3.4).

Bibliografija

  1. Basovsky L. E. Predviđanje i planiranje u tržišnim uslovima. – M.: Infra - M, 2003.
  2. Box J., Jenkins G. Analiza vremenskih serija. Izdanje 1. Prognoza i upravljanje. – M.: Mir, 1974.
  3. Borovikov V. P., Ivčenko G. I. Predviđanje u sistemu Statistica u Windows okruženju. – M.: Finansije i statistika, 1999.
  4. Vojvoda V. Obrada podataka na PC-u u primjerima. – Sankt Peterburg: Petar, 1997.
  5. Ivčenko B. P., Martiščenko L. A., Ivancov I. B. Informaciona mikroekonomija. Dio 1. Metode analize i predviđanja. – Sankt Peterburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Uvod u umjetne neuronske mreže: Udžbenik. dodatak. – SPb.: SPb. stanje marine tech. Univerzitet, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Multivarijantna statistička analiza u ekonomiji. – M.: Jedinstvo-Dana, 1999.




greška: Sadržaj zaštićen!!