Vyberte možnost Stránka

Prognózování založené na metodě exponenciálního vyhlazování. Příklad řešení problému

Extrapolace je metoda vědecký výzkum, která je založena na rozložení minulých a současných trendů, vzorců, vztahů k budoucímu vývoji prognostického objektu. Extrapolační metody zahrnují metoda klouzavého průměru, metoda exponenciální vyhlazování, metoda nejmenší čtverce.

Metoda exponenciálního vyhlazování nejúčinnější při vývoji střednědobých prognóz. Je přijatelné, když se předpovídá pouze jedno období dopředu. Jeho hlavními výhodami jsou jednoduchost postupu výpočtu a možnost zohlednit váhy výchozí informace. Pracovní vzorec metody exponenciálního vyhlazování je:

Prognóza pomocí této metody má dva problémy:

  • výběr hodnoty vyhlazovacího parametru α;
  • stanovení počáteční hodnoty Uo.

Hodnota α závisí jak rychle klesá váha vlivu předchozích pozorování. Čím větší α, tím menší vliv předchozích let. Pokud se hodnota α blíží jednotce, pak to vede k zohlednění v prognóze především vlivu pouze posledních pozorování. Pokud je hodnota α blízká nule, pak váhy, kterými jsou hladiny časové řady váženy, klesají pomalu, tzn. prognóza zohledňuje všechna (nebo téměř všechna) minulá pozorování.

Pokud tedy existuje jistota, že výchozí podmínky, na jejichž základě je prognóza vypracována, jsou spolehlivé, měla by se použít malá hodnota vyhlazovacího parametru (α→0). Když je parametr vyhlazování malý, chová se zkoumaná funkce jako průměr velkého počtu minulých úrovní. Pokud není dostatečná důvěra ve výchozí podmínky prognózy, pak by měla být použita velká hodnota α, která povede k zohlednění v prognóze především vlivu posledních pozorování.

Neexistuje přesná metoda pro výběr optimální hodnoty vyhlazovacího parametru α. V některých případech autor této metody profesor Brown navrhl určit hodnotu α na základě délky vyhlazovacího intervalu. V tomto případě se α vypočítá podle vzorce:

kde n je počet pozorování zahrnutých do vyhlazovacího intervalu.

Uo problém s výběrem (exponenciálně vážený počáteční průměr) se řeší následujícími způsoby:

  • pokud existují údaje o vývoji jevu v minulosti, pak můžete použít aritmetický průměr a přirovnat k němu Uo;
  • pokud taková informace neexistuje, použije se počáteční první hodnota předpovědní základny Y1 jako Uo.

Využít můžete i znaleckých posudků.

Všimněte si, že při studiu ekonomických časových řad a předpovídání ekonomických procesů metoda exponenciálního vyhlazování ne vždy „funguje“. Je to dáno tím, že ekonomické časové řady jsou příliš krátké (15-20 pozorování) a v případě vysokých temp růstu a růstu tato metoda „nestíhá“ reflektovat všechny změny.

Příklad použití metody exponenciálního vyhlazování k vytvoření prognózy

Úkol . Existují údaje charakterizující míru nezaměstnanosti v kraji, %

  • Sestavte předpověď míry nezaměstnanosti v regionu na měsíce listopad, prosinec, leden pomocí metod: klouzavý průměr, exponenciální vyhlazování, nejmenší čtverce.
  • Vypočítejte chyby ve výsledných prognózách pomocí každé metody.
  • Porovnejte získané výsledky, vyvodte závěry.

Exponenciální vyhlazovací řešení

1) Určete hodnotu parametru vyhlazování podle vzorce:

kde n je počet pozorování zahrnutých do vyhlazovacího intervalu. a = 2/ (10+1) = 0,2

2) Počáteční hodnotu Uo určíme dvěma způsoby:
Metoda I (aritmetický průměr) Uo = (2,99 + 2,66 + 2,63 + 2,56 + 2,40 + 2,22 + 1,97 + 1,72 + 1,56 + 1,42)/ 10 = 22,13/10 = 2,21
Metoda II (vezmeme první hodnotu předpovědní báze) Uo = 2,99

3) Vypočítejte exponenciálně vážený průměr pro každé období pomocí vzorce

kde t je období předcházející prognózovanému období; t+1 – období prognózy; Ut+1 - predikovaný indikátor; α - parametr vyhlazování; Уt je skutečná hodnota studovaného ukazatele za období předcházející prognóze; Ut - exponenciálně vážený průměr za období předcházející prognózovanému období.

Například:
Ufeb \u003d 2,99 * 0,2 + (1-0,2) * 2,21 \u003d 2,37 (metoda I)
Umart \u003d 2,66 * 0,2 + (1-0,2) * 2,37 \u003d 2,43 (metoda I) atd.

Ufeb \u003d 2,99 * 0,2 + (1-0,2) * 2,99 \u003d 2,99 (metoda II)
Umart \u003d 2,66 * 0,2 + (1-0,2) * 2,99 \u003d 2,92 (metoda II)
Uapr \u003d 2,63 * 0,2 + (1-0,2) * 2,92 \u003d 2,86 (metoda II) atd.

4) Pomocí stejného vzorce vypočítáme predikovanou hodnotu
Nelistopad \u003d 1,42 * 0,2 + (1-0,2) * 2,08 \u003d 1,95 (metoda I)
Nelistopad \u003d 1,42 * 0,2 + (1-0,2) * 2,18 \u003d 2,03 (metoda II)
Výsledky jsme dali do tabulky.

5) Vypočítejte průměrnou relativní chybu pomocí vzorce:

ε = 209,58/10 = 20,96 % (metoda I)
ε = 255,63/10 = 25,56 % (metoda II)

V každém případě přesnost předpovědi je vyhovující, protože průměr relativní chyba spadá do rozmezí 20-50 %.

Po vyřešení tohoto problému metodami klouzavý průměr A nejmenší čtverce Udělejme závěry.

Je zřejmé, že v metodě váženého klouzavého průměru existuje mnoho způsobů, jak nastavit váhy tak, aby se jejich součet rovnal 1. Jedna z těchto metod se nazývá exponenciální vyhlazování. V tomto schématu metody váženého průměru je pro jakékoli t > 1 hodnota prognózy v čase t+1 váženým součtem skutečných prodejů, , v časovém období t, a předpokládaných tržeb, , v časovém období t V ostatních slova,

Exponenciální vyhlazování má oproti klouzavým průměrům výpočetní výhody. Zde, abychom mohli vypočítat , je nutné znát pouze hodnoty , a , (spolu s hodnotou α). Pokud například společnost potřebuje předpovídat poptávku po 5 000 položkách v každém časovém období, pak by musela uložit 10 001 datových hodnot (5 000 hodnot , 5 000 hodnot a hodnotu α), zatímco vytvořit předpověď na základě klouzavého průměru 8 uzlů vyžaduje 40 000 datových hodnot. V závislosti na chování dat může být nutné ukládat různé hodnoty α pro každý produkt, ale i v tomto případě je množství uložených informací mnohem menší než při použití klouzavého průměru. Dobrá věc na exponenciálním vyhlazování je, že při zachování α a poslední predikce jsou implicitně zachovány i všechny předchozí předpovědi.

Podívejme se na některé vlastnosti modelu exponenciálního vyhlazování. Pro začátek si všimneme, že pokud t > 2, pak ve vzorci (1) může být t nahrazeno t–1, tzn. Dosazením tohoto výrazu do původního vzorce (1) získáme

Postupným prováděním podobných substitucí získáme následující výraz pro

Protože od nerovnosti 0< α < 1 следует, что 0 < 1 – α < 1, то Другими словами, наблюдение , имеет больший вес, чем наблюдение , которое, в свою очередь, имеет больший вес, чем . Это иллюстрирует основное свойство модели экспоненциального сглаживания - коэффициенты при убывают при уменьшении номера k. Также можно показать, что сумма всех коэффициентов (включая коэффициент при ), равна 1.

Ze vzorce (2) je vidět, že hodnota je váženým součtem všech předchozích pozorování (včetně posledního pozorování ). Poslední člen v součtu (2) není statistické pozorování, ale „předpoklad“ (můžeme předpokládat, že např. ). Je zřejmé, že s rostoucí t vliv na prognózu klesá a v určitém okamžiku ji lze zanedbat. I když je hodnota α dostatečně malá (taková, že (1 - α) je přibližně rovna 1), hodnota se rychle sníží.

Hodnota parametru α značně ovlivňuje výkon predikčního modelu, protože α je váha nejnovějšího pozorování. To znamená, že větší hodnota α by měla být přiřazena v případě, kdy je poslední pozorování v modelu nejvíce prediktivní. Pokud se α blíží 0, znamená to téměř úplnou důvěru v předchozí předpověď a ignorování posledního pozorování.

Victor měl problém: jak nejlépe zvolit hodnotu α. Opět vám s tím pomůže nástroj Řešitel. Najít optimální hodnotuα (tedy ta, při které se prediktivní křivka bude nejméně odchylovat od křivky hodnot časové řady), proveďte následující.

  1. Vyberte příkaz Nástroje -> Hledat řešení.
  2. V dialogovém okně Najít řešení, které se otevře, nastavte cílovou buňku na G16 (viz list Expo) a určete, že její hodnota by měla být minimální.
  3. Určete, že buňka, kterou chcete upravit, je buňka B1.
  4. Zadejte omezení B1 > 0 a B1< 1
  5. Kliknutím na tlačítko Spustit získáte výsledek znázorněný na obr. 8.

Opět, stejně jako u metody váženého klouzavého průměru, nejlepší předpověď bude získána přiřazením plné váhy poslednímu pozorování. Optimální hodnota α je tedy 1, přičemž střední absolutní odchylky jsou 6,82 (buňka G16). Victor obdržel předpověď, kterou už viděl.

Metoda exponenciálního vyhlazování funguje dobře v situacích, kdy se proměnná, která nás zajímá, se chová stacionárně a její odchylky od konstantní hodnoty jsou způsobeny náhodnými faktory a nejsou pravidelné. Ale: bez ohledu na hodnotu parametru α, metoda exponenciálního vyhlazování nebude schopna předpovídat monotónně rostoucí nebo monotónně klesající data (predikované hodnoty budou vždy menší nebo vyšší než pozorované). Lze také ukázat, že v modelu se sezónními výkyvy nebude možné touto metodou získat uspokojivé předpovědi.

Pokud se statistiky mění monotónně nebo podléhají sezónním změnám, jsou zapotřebí speciální předpovědní metody, o kterých bude pojednáno níže.

Holt metoda (exponenciální vyhlazování s trendem)

,

Holtova metoda umožňuje předpovídat na k časových období dopředu. Metoda, jak vidíte, používá dva parametry α a β. Hodnoty těchto parametrů se pohybují od 0 do 1. Proměnná L udává dlouhodobou úroveň hodnot nebo podkladovou hodnotu dat časové řady. Proměnná T označuje možné zvýšení nebo snížení hodnot za jedno období.

Podívejme se na práci této metody na novém příkladu. Světlana pracuje jako analytička ve velké makléřské firmě. Na základě čtvrtletních zpráv, které má pro Startup Airlines, chce předpovědět zisky této společnosti na příští čtvrtletí. Dostupné údaje a na jejich základě sestavené schéma jsou v sešitu Startup.xls (obr. 9). Je vidět, že data mají jasný trend (téměř monotónně rostoucí). Světlana chce Holt metodou predikovat zisk na akcii za třinácté čtvrtletí. Chcete-li to provést, musíte nastavit počáteční hodnoty pro L a T. Existuje několik možností: 1) L se rovná hodnotě zisku na akcii za první čtvrtletí a T = 0; 2) L se rovná průměrné hodnotě zisku na akcii za 12 čtvrtletí a T se rovná průměrné změně za všech 12 čtvrtletí. Existují další možnosti pro počáteční hodnoty pro L a T, ale Světlana zvolila první možnost.

Rozhodla se pomocí nástroje Najít řešení najít optimální hodnotu parametrů α a β, při které je hodnota střední absolutní chyby procento by bylo minimální. Chcete-li to provést, musíte postupovat podle těchto kroků.

Vyberte příkaz Služba -> Hledat řešení.

V dialogovém okně Hledat řešení, které se otevře, nastavte buňku F18 jako cílovou buňku a označte, že její hodnota by měla být minimalizována.

Do pole Změna buněk zadejte rozsah buněk B1:B2. Přidejte omezení B1:B2 > 0 a B1:B2< 1.

Klikněte na tlačítko Execute.

Výsledná předpověď je znázorněna na Obr. 10.

Jak je vidět, optimální hodnoty se ukázaly být α = 0,59 a β = 0,42, zatímco průměrné absolutní chyby v procentech jsou 38 %.

Účtování sezónních změn

Sezónní změny by měly být brány v úvahu při předpovídání z dat časové řady Sezónní změny jsou kolísání nahoru a dolů s konstantní periodou hodnot proměnné.

Pokud se například podíváte na prodej zmrzliny podle měsíců, můžete vidět v teplé měsíce(červen až srpen na severní polokouli) přes vysoká úroveň prodej než v zimě, a tak každý rok. Zde mají sezónní výkyvy období 12 měsíců. Pokud se použijí týdenní data, bude se sezónní model opakovat každých 52 týdnů v noci v úterý, středu a čtvrtek, nejméně zákazníků bude v sobotu a neděli večer a průměrný počet hostů se očekává v pátek a v pondělí večer. Tato datová struktura zobrazující počet zákazníků v různých dnech v týdnu se bude opakovat každých sedm dní.

Postup tvorby sezónně očištěné prognózy se skládá z následujících čtyř kroků:

1) Na základě výchozích údajů je stanovena struktura sezónních výkyvů a období těchto výkyvů.

3) Na základě dat, ze kterých je vyloučena sezónní složka, je provedena nejlepší možná prognóza.

4) K přijaté předpovědi se připočítává sezónní složka.

Pojďme si tento přístup ilustrovat na údajích o prodeji uhlí (měřeno v tisících tun) ve Spojených státech v průběhu devíti let jako manažer Gillette Coal Mine, Frank potřebuje předpovídat poptávku po uhlí na další dvě čtvrtletí. Do sešitu Coal.xls zadal data za celý uhelný průmysl a vykreslil data (obrázek 11). Graf ukazuje, že objemy prodejů jsou nadprůměrné v prvním a čtvrtém čtvrtletí (zimní sezóna) a podprůměrné ve druhém a třetím čtvrtletí (měsíce jaro-léto).

Vyloučení sezónní složky

Nejprve je třeba vypočítat průměr všech odchylek za jedno období sezónních změn. Pro vyloučení sezónní složky do jednoho roku se používají údaje za čtyři období (čtvrtletí). A pro vyloučení sezónní složky z celé časové řady se vypočítá posloupnost klouzavých průměrů přes T uzly, kde T je doba trvání sezónních výkyvů.K provedení potřebných výpočtů Frank použil sloupce C a D, jak je znázorněno na Obr. níže. Sloupec C obsahuje 4-uzlový klouzavý průměr na základě dat ve sloupci B.

Nyní musíme přiřadit výsledné hodnoty klouzavého průměru středním bodům sekvence dat, ze kterých byly tyto hodnoty vypočteny. Tato operace se nazývá centrování hodnoty. Pokud je T liché, pak první hodnota klouzavého průměru (průměr hodnot od prvního do T-bod) by měla být přiřazena (T + 1)/2 bodu (například pokud T = 7, pak bude první klouzavý průměr přiřazen čtvrtému bodu). Podobně je průměr hodnot od druhého do (T + 1) bodu vystředěn v bodě (T + 3)/2 atd. Střed n-tého intervalu je v bodě (T+ (2n-1))/2.

Pokud je T sudé, jako v uvažovaném případě, pak se problém poněkud zkomplikuje, protože zde se centrální (střední) body nacházejí mezi body, pro které byla vypočtena hodnota klouzavého průměru. Proto se vycentrovaná hodnota pro třetí bod vypočítá jako průměr první a druhé hodnoty klouzavého průměru. Například první číslo ve sloupci D středového prostředku na Obr. 12, vlevo je (1613 + 1594)/2 = 1603. Na Obr. 13 ukazuje grafy hrubých dat a centrovaných průměrů.

Dále najdeme poměry hodnot datových bodů k odpovídajícím hodnotám centrovaných průměrů. Protože body na začátku a na konci datové sekvence nemají odpovídající středový průměr (viz první a poslední hodnoty ve sloupci D), tyto body nejsou ovlivněny. Tyto poměry udávají, do jaké míry se hodnoty dat odchylují od typické úrovně definované středovými prostředky. Všimněte si, že hodnoty poměru pro třetí čtvrtletí jsou menší než 1 a hodnoty pro čtvrté čtvrtletí jsou větší než 1.

Tyto vztahy jsou základem pro tvorbu sezónních indexů. Pro jejich výpočet jsou vypočtené poměry seskupeny po čtvrtletích, jak je znázorněno na Obr. 15 ve sloupcích G-O.

Poté se zjistí průměrné hodnoty poměrů pro každé čtvrtletí (sloupec E na obr. 15). Například průměr všech ukazatelů za první čtvrtletí je 1,108. Tato hodnota je sezónním indexem za 1. čtvrtletí, ze kterého lze usuzovat, že objem prodeje uhlí za 1. čtvrtletí činí v průměru cca 110,8 % relativního průměrného ročního prodeje.

Sezónní index je průměrný poměr údajů vztahujících se k jedné sezóně (v tomto případě sezóně je čtvrtina) ke všem údajům. Pokud je sezónní index větší než 1, pak je výkonnost této sezóny nad průměrem za rok, podobně je-li sezónní index pod 1, pak je výkonnost sezóny pod průměrem roku.

A konečně, chcete-li vyloučit sezónní složku z původních dat, měly by být hodnoty původních dat vyděleny odpovídajícím sezónním indexem. Výsledky této operace jsou uvedeny ve sloupcích F a G (obr. 16). Graf dat, která již neobsahují sezónní složku, je na Obr. 17.

Prognózování

Na základě dat, ze kterých je vyloučena sezónní složka, je sestavena prognóza. K tomu se používá vhodná metoda, která zohledňuje povahu chování dat (např. data mají trend nebo jsou relativně konstantní). V tomto příkladu je předpověď provedena pomocí jednoduchého exponenciálního vyhlazování. Optimální hodnotu parametru α zjistíme pomocí nástroje Řešitel. Graf prognózy a reálných dat s vyloučenou sezónní složkou je na obr. 18.

Účtování sezónní struktury

Nyní musíme vzít v úvahu sezónní složku v prognóze (1726,5). Chcete-li to provést, vynásobte 1726 sezónním indexem z prvního čtvrtletí 1,108, čímž získáte hodnotu 1912. Podobná operace (vynásobením čísla 1726 sezónním indexem 0,784) poskytne předpověď pro druhé čtvrtletí, která se rovná 1353. Výsledek přidání sezónní struktury do výsledné prognózy je na Obr. 19.

Možnosti úkolu:

Úkol 1

Vzhledem k časové řadě

t
X

1. Nakreslete závislost x = x(t).

  1. Pomocí jednoduchého klouzavého průměru přes 4 uzly předpovězte poptávku v 11. časovém bodě.
  2. Je tato metoda předpovědi vhodná pro tato data nebo ne? Proč?
  3. Přizpůsobte datům lineární přizpůsobení metodou nejmenších čtverců.

Úkol 2

Pomocí modelu prognózy tržeb Startup Airlines (Startup.xls) proveďte následující:

Úkol 3

Pro časové řady

t
X

běh:

  1. Pomocí váženého klouzavého průměru přes 4 uzly a přiřazením vah 4/10, 3/10, 2/10, 1/10 předpovězte poptávku v 11. časovém bodě. Větší váhu by měla mít novější pozorování.
  2. Je tato aproximace lepší než jednoduchý klouzavý průměr přes 4 uzly? Proč?
  3. Najděte průměr absolutních odchylek.
  4. Použijte nástroj Řešitel k nalezení optimálních vah uzlů. Jak moc se aproximační chyba snížila?
  5. K predikci použijte exponenciální vyhlazování. Která z použitých metod dává nejlepší výsledky?

Úkol 4

Analyzujte časové řady

Čas
Poptávka
  1. Použijte 4-uzlový vážený klouzavý průměr s váhami 4/10, 3/10, 2/10, 1/10, abyste získali předpověď v časech 5-13. Větší váhu by měla mít novější pozorování.
  2. Najděte průměr absolutních odchylek.
  3. Myslíte si, že tato aproximace je lepší než 4-uzlový jednoduchý model klouzavého průměru? Proč?
  4. Použijte nástroj Řešitel k nalezení optimálních vah uzlů. O kolik se vám podařilo snížit chybovou hodnotu?
  5. K predikci použijte exponenciální vyhlazování. Která z použitých metod dává nejlepší výsledek?

Úkol 5

Vzhledem k časové řadě

Úkol 7

Marketingový manažer malé rostoucí společnosti, která obsahuje řetězec obchodů s potravinami, má informace o objemech prodeje za celou dobu existence nejziskovějšího obchodu (viz tabulka).

Pomocí jednoduchého klouzavého průměru přes 3 uzly předpovězte hodnoty v uzlech 4 až 11.

Pomocí váženého klouzavého průměru přes 3 uzly předpovězte hodnoty v uzlech 4 až 11. Pomocí nástroje Řešitel určete optimální váhy.

Použijte exponenciální vyhlazování k předpovědi hodnot v uzlech 2-11. Určete optimální hodnotu parametru α pomocí nástroje Řešitel.

Která ze získaných prognóz je nejpřesnější a proč?

Úkol 8

Vzhledem k časové řadě

  1. Nakreslete tuto časovou řadu. Spojte body rovnými čarami.
  2. Pomocí jednoduchého klouzavého průměru přes 4 uzly předpovězte poptávku pro uzly 5-13.
  3. Najděte průměr absolutních odchylek.
  4. Je rozumné použít tuto metodu předpovědi pro prezentovaná data?
  5. Je tato aproximace lepší než jednoduchý klouzavý průměr přes 3 uzly? Proč?
  6. Z dat vyneste lineární a kvadratický trend.
  7. K predikci použijte exponenciální vyhlazování. Která z použitých metod dává nejlepší výsledky?

Úkol 10

Sešit Business_Week.xls zobrazuje data z Business Week za 43 měsíců měsíčního prodeje aut.

  1. Odstraňte z těchto dat sezónní složku.
  2. Určit nejlepší metoda prognózování pro dostupná data.
  3. Jaká je předpověď pro 44. období?

Úkol 11

  1. jednoduchý obvod předpověď, kdy se hodnota za poslední týden bere jako předpověď na týden příští.
  2. Metoda klouzavého průměru (s počtem uzlů dle vašeho výběru). Zkuste použít několik různé významy uzly.

Úkol 12

Sešit Bank.xls zobrazuje výkonnost banky. Zvažte následující metody pro předpovídání hodnot této časové řady.

Jako prognóza se používá průměrná hodnota ukazatele za všechny předchozí týdny.

Metoda váženého klouzavého průměru (s počtem uzlů dle vašeho výběru). Zkuste použít několik různých hodnot uzlů. Pomocí nástroje Řešitel určete optimální hmotnosti.

Metoda exponenciálního vyhlazování. Najděte optimální hodnotu parametru α pomocí nástroje Řešitel.

Kterou z výše navržených prognostických metod byste doporučili pro predikci hodnot této časové řady?

Literatura


Podobné informace.


9 5. Metoda exponenciálního vyhlazování. Výběr konstanty vyhlazování

Při použití metody nejmenších čtverců k určení prediktivního trendu (trendu) se předem předpokládá, že všechna retrospektivní data (pozorování) mají stejný informační obsah. Logičtější by samozřejmě bylo vzít v úvahu proces diskontování výchozí informace, tedy nestejnou hodnotu těchto dat pro vypracování prognózy. Toho je dosaženo v metodě exponenciálního vyhlazování tím, že posledním pozorováním časové řady (tj. hodnotám bezprostředně předcházejícím předpovědnímu období prognózy) jsou ve srovnání s počátečními pozorováními přiděleny významnější „váhy“. Mezi výhody metody exponenciálního vyhlazování by měla patřit také jednoduchost výpočetních operací a flexibilita popisu různé dynamiky procesů. Metoda našla největší uplatnění pro realizaci střednědobých prognóz.

5.1. Podstata metody exponenciálního vyhlazování

Podstatou metody je vyhlazování časových řad pomocí váženého "klouzavého průměru", ve kterém se váhy řídí exponenciálním zákonem. Jinými slovy, čím dále od konce časové řady je bod, pro který je vážený klouzavý průměr vypočítán, tím menší „účast vyžaduje“ na vývoji prognózy.

Nechť se původní dynamická řada skládá z úrovní (složek řady) y t , t = 1 , 2 ,...,n . Pro každý m po sobě jdoucích úrovní této řady

(m

dynamická řada s krokem rovným jedné. Pokud je m liché číslo a je vhodnější použít lichý počet úrovní, protože v tomto případě bude vypočítaná hodnota úrovně ve středu vyhlazovacího intervalu a je snadné jí nahradit skutečnou hodnotu, pak pro určení klouzavého průměru lze napsat následující vzorec:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t−ξ

i= t−ξ

2ξ + 1

kde y t je hodnota klouzavého průměru pro okamžik t (t = 1, 2,...,n), y i je skutečná hodnota hladiny v okamžiku i;

i je pořadové číslo úrovně v intervalu vyhlazování.

Hodnota ξ je určena z doby trvání vyhlazovacího intervalu.

Protože

m = 2 ξ +1

pro liché m tedy

ξ = m 2 − 1 .

Výpočet klouzavého průměru pro velký počet úrovní lze zjednodušit definováním postupných hodnot klouzavého průměru rekurzivně:

y t = y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Ale vzhledem k tomu, že nejnovějším pozorováním je třeba přikládat větší „váhu“, je třeba klouzavý průměr interpretovat jinak. Spočívá v tom, že hodnota získaná průměrováním nenahrazuje centrální člen intervalu průměrování, ale jeho poslední člen. Podle toho může být poslední výraz přepsán jako

Mi = Mi + 1

y i− y i− m

Zde je klouzavý průměr, vztažený ke konci intervalu, označen novým symbolem Mi. V podstatě se Mi rovná y t posunuté o ξ kroků doprava, to znamená, M i = y t + ξ , kde i = t + ξ .

Vzhledem k tomu, že M i − 1 je odhadem y i − m , výraz (5.1)

lze přepsat do formuláře

y i + 1

M i − 1 ,

M i definované výrazem (5.1).

kde M i je odhad

Pokud se výpočty (5.2) opakují, když přicházejí nové informace

a přepsat do jiné formy, pak získáme vyhlazenou pozorovací funkci:

Q i= α y i+ (1 − α ) Q i− 1,

nebo v ekvivalentní formě

Q t= α y t+ (1 − α ) Q t− 1

Výpočty provedené výrazem (5.3) s každým novým pozorováním se nazývají exponenciální vyhlazování. V posledním výrazu je pro odlišení exponenciálního vyhlazování od klouzavého průměru zaveden zápis Q namísto M . Hodnota α , která je

analog m 1 se nazývá vyhlazovací konstanta. Hodnoty α leží v

interval [ 0 , 1 ] . Je-li α reprezentováno jako řada

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

je snadné vidět, že „váhy“ klesají exponenciálně v čase. Například pro α = 0 , 2 dostaneme

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Součet řady má tendenci k jednotě a členy součtu s časem klesají.

Hodnota Q t ve výrazu (5.3) je exponenciální průměr prvního řádu, tedy průměr získaný přímo z

vyhlazení pozorovaných dat (primární vyhlazení). Někdy je při vývoji statistických modelů užitečné uchýlit se k výpočtu exponenciálních průměrů vyšších řádů, tedy průměrů získaných opakovaným exponenciálním vyhlazováním.

Obecný zápis v rekurzivním tvaru exponenciálního průměru řádu k je

Q t (k) = α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Hodnota k se mění v rozmezí 1, 2, …, p ,p+1, kde p je řád prediktivního polynomu (lineární, kvadratický atd.).

Na základě tohoto vzorce, pro exponenciální průměr prvního, druhého a třetího řádu, výrazy

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Stanovení parametrů prediktivního modelu metodou exponenciálního vyhlazování

Je zřejmé, že pro vývoj prediktivních hodnot založených na dynamických řadách pomocí metody exponenciálního vyhlazování je nutné vypočítat koeficienty trendové rovnice prostřednictvím exponenciálních průměrů. Odhady koeficientů jsou určeny základní Brown-Meyerovou větou, která dává koeficienty prediktivního polynomu do vztahu k exponenciálním průměrům odpovídajících řádů:

(− 1 )

aˆp

α (1 − α )∞

−α )

j (p − 1 + j) !

∑ j

p=0

p! (k− 1) !j = 0

kde aˆ p jsou odhady koeficientů polynomu stupně p .

Koeficienty se zjistí řešením soustavy (p + 1 ) rovnic сp + 1

neznámý.

Tedy pro lineární model

aˆ 0 = 2 Q t (1 ) − Q t (2 ); aˆ 1 = 1 − α α (Q t (1 )− Q t (2 ));

pro kvadratický model

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Prognóza je realizována podle zvoleného polynomu, resp. pro lineární model

ˆyt + τ = aˆ0 + aˆ1 τ ;

pro kvadratický model

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2,

kde τ je krok predikce.

Je třeba poznamenat, že exponenciální průměry Q t (k ) lze vypočítat pouze se známým (zvoleným) parametrem při znalosti počátečních podmínek Q 0 (k ) .

Odhady počátečních podmínek, zejména pro lineární model

Q(1)=a

1 − α

Q(2 ) = a − 2 (1 − α ) a

pro kvadratický model

Q(1)=a

1 − α

+ (1 − α )(2 − α ) a

2(1−α)

(1− α ) (3− 2α )

Q 0(2) = a 0-

2α 2

Q(3)=a

3(1−α)

(1 − α ) (4 − 3 α ) a

kde koeficienty a 0 a a 1 jsou vypočteny metodou nejmenších čtverců.

Hodnota vyhlazovacího parametru α je přibližně vypočtena vzorcem

α ≈ m 2 + 1,

kde m je počet pozorování (hodnot) v intervalu vyhlazování. Posloupnost výpočtu prediktivních hodnot je uvedena v

Výpočet koeficientů řady metodou nejmenších čtverců

Stanovení intervalu vyhlazování

Výpočet vyhlazovací konstanty

Výpočet počátečních podmínek

Výpočet exponenciálních průměrů

Výpočet odhadů a 0 , a 1 atd.

Výpočet předpovědních hodnot řady

Rýže. 5.1. Posloupnost výpočtu předpovědních hodnot

Jako příklad zvažte postup pro získání prediktivní hodnoty doby provozuschopnosti produktu, vyjádřené dobou mezi poruchami.

Počáteční údaje jsou shrnuty v tabulce. 5.1.

Lineární předpovědní model volíme ve tvaru y t = a 0 + a 1 τ

Řešení je proveditelné s následujícími počátečními hodnotami:

a 0, 0 = 64, 2; ai,0 = 31,5; a = 0,305.

Tabulka 5.1. Počáteční údaje

Číslo pozorování, t

Délka kroku, předpověď, τ

MTBF, y (hodina)

Pro tyto hodnoty jsou vypočtené "vyhlazené" koeficienty pro

hodnoty y2 se budou rovnat

= α Q (1 )− Q (2 )= 97, 9 ;

[ Q (1) − Q (2)

31, 9 ,

1−α

za počátečních podmínek

1 − α

A 0, 0 -

1,0

= −7 , 6

1 − α

= −79 , 4

a exponenciální průměry

Q (1 ) = α y + (1 − α ) Q (1 )

25, 2;

Q(2)

= α Q (1)

+ (1 −α ) Q (2 ) = −47 , 5 .

„Vyhlazená“ hodnota y 2 se pak vypočítá podle vzorce

Q i (1)

Q i (2)

a 0,i

a 1,i

ˆyt

Lineární predikční model má tedy (tabulka 5.2) tvar

ˆy t + τ = 224,5+ 32τ .

Vypočítejme předpokládané hodnoty pro průběžné doby 2 roky (τ = 1 ), 4 roky (τ = 2 ) a tak dále, dobu mezi poruchami produktu (tabulka 5.3).

Tabulka 5.3. Předpovědní hodnotyˆy t

Rovnice

t+2

t+4

t+6

t+8

t+20

regrese

(τ = 1)

(τ=2)

(τ = 3)

(τ=5)

τ =

ˆy t = 224,5+ 32τ

Je třeba poznamenat, že celkovou „váhu“ posledních m hodnot časové řady lze vypočítat podle vzorce

c = 1 − (m (− 1) m) . m+ 1

Pro poslední dvě pozorování řady (m = 2 ) tedy hodnota c = 1 − (2 2 − + 1 1 ) 2 = 0. 667 .

5.3. Volba počátečních podmínek a stanovení vyhlazovací konstanty

Jak vyplývá z výrazu

Q t= α y t+ (1 − α ) Q t− 1,

při provádění exponenciálního vyhlazování je nutné znát počáteční (předchozí) hodnotu vyhlazované funkce. V některých případech lze za výchozí hodnotu brát první pozorování, častěji se počáteční podmínky určují podle výrazů (5.4) a (5.5). V tomto případě jsou hodnoty a 0, 0, a 1, 0

a a 2, 0 jsou určeny metodou nejmenších čtverců.

Pokud zvolené počáteční hodnotě opravdu nedůvěřujeme, pak tím, že vezmeme velkou hodnotu vyhlazovací konstanty α až k pozorování, přineseme

"váha" výchozí hodnoty až do hodnoty (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Volba vyhlazovací konstanty (nebo počtu pozorování v klouzavém průměru) tedy zahrnuje kompromis. Obvykle, jak ukazuje praxe, leží hodnota vyhlazovací konstanty v rozmezí od 0,01 do 0,3.

Je známo několik přechodů, které umožňují najít přibližný odhad α . První vyplývá z podmínky, že klouzavý průměr a exponenciální průměr jsou stejné

α \u003d m 2 + 1,

kde m je počet pozorování v intervalu vyhlazování. Další přístupy jsou spojeny s přesností předpovědi.

Takže je možné určit α na základě Meyerova vztahu:

α ≈ S y ,

kde S y je standardní chyba modelu;

S 1 je střední kvadratická chyba původní řady.

Použití posledně uvedeného poměru je však komplikováno skutečností, že je velmi obtížné spolehlivě určit S y a S 1 z výchozí informace.

Často parametr vyhlazování a zároveň koeficienty a 0 , 0 a a 0 , 1

jsou vybrány jako optimální v závislosti na kritériu

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j=0

řešením algebraické soustavy rovnic, kterou získáme přirovnáním derivací k nule

∂S2

∂S2

∂S2

∂a0, 0

∂ a 1,0

∂a2, 0

Takže pro model lineárního předpovědi je počáteční kritérium rovno

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0, 0 − a1, 0 τ ] 2 → min.

j=0

Řešení tohoto systému pomocí počítače nečiní žádné potíže.

Pro rozumnou volbu α můžete také použít postup zobecněného vyhlazování, který vám umožní získat následující vztahy týkající se rozptylu prognózy a parametru vyhlazování pro lineární model:

S p 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

pro kvadratický model

Sp 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

kde β = 1 α ;Sy– RMS aproximace počáteční dynamické řady.

1. Základní metodická ustanovení.

Jednoduchá metoda exponenciálního vyhlazování používá vážený (exponenciálně) klouzavý průměr všech předchozích pozorování. Nejčastěji se tento model aplikuje na data, ve kterých je potřeba vyhodnotit přítomnost vztahu mezi analyzovanými ukazateli (trend) nebo závislost analyzovaných dat. Účelem exponenciálního vyhlazování je odhadnout aktuální stav, jehož výsledky určí všechny budoucí predikce.

Exponenciální vyhlazování zajišťuje neustálá aktualizace modelu díky nejnovějším údajům. Tato metoda je založena na zprůměrování (vyhlazení) časové řady minulých pozorování směrem dolů (exponenciálně). To znamená, že pozdější události mají větší váhu. Váha je přiřazena následovně: pro poslední pozorování bude váha hodnota α, pro předposlední - (1-α), pro to, které bylo před ním - (1-α) 2 atd.

Ve vyhlazené podobě lze novou předpověď (pro časové období t + 1) znázornit jako vážený průměr posledního pozorování veličiny v čase t a její předchozí prognózy pro stejné období t. Navíc je pozorované hodnotě přiřazena váha α a prognóze váha (1- α); předpokládá se, že 0< α<1. Это правило в общем виде можно записать следующим образом.

Nová předpověď = [α*(poslední pozorování)]+[(1- α)*poslední předpověď]

kde je předpokládaná hodnota pro další období;

α je vyhlazovací konstanta;

Yt je pozorování hodnoty za běžné období t;

Předchozí vyhlazená předpověď této hodnoty pro období t.

Exponenciální vyhlazování je postup pro neustálou revizi předpovědních výsledků s ohledem na nejnovější vývoj.

Vyhlazovací konstanta α je vážený faktor. Jeho skutečná hodnota je určena tím, do jaké míry má aktuální pozorování ovlivnit predikovanou hodnotu. Pokud se α blíží 1, pak prognóza zohledňuje hodnotu chyby poslední prognózy. Naopak pro malé hodnoty α je předpovídaná hodnota nejblíže předchozí předpovědi. Lze si ho představit jako vážený průměr všech minulých pozorování s váhami klesajícími exponenciálně s „stářím“ dat.



Tabulka 2.1

Porovnání vlivu různých hodnot vyhlazovacích konstant

Konstanta α je klíčem k analýze dat. Pokud je požadováno, aby predikované hodnoty byly stabilní a náhodné odchylky byly vyhlazeny, je nutné zvolit malou hodnotu α. Velká hodnota konstanty α má smysl, pokud potřebujete rychlou reakci na změny v pozorovacím spektru.

2. Praktický příklad exponenciálního vyhlazování.

Jsou uvedeny údaje společnosti z hlediska objemu prodeje (v tisících jednotek) za sedm let, vyhlazovací konstanta je brána 0,1 a 0,6. Testovací část tvoří data za 7 let; na nich je nutné vyhodnotit účinnost každého z modelů. Pro exponenciální vyhlazení řady se bere počáteční hodnota rovna 500 (první hodnota skutečných dat nebo průměrná hodnota za 3-5 období je zaznamenána ve vyhlazené hodnotě za 2. čtvrtletí).

Tabulka 2.2

Počáteční údaje

Čas Skutečná hodnota (skutečná) Vyhlazená hodnota Chyba předpovědi
rok čtvrťák 0,1 0,1
vynikat podle vzorce
#N/A 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

Na Obr. 2.1 ukazuje predikci založenou na exponenciálním vyhlazování s konstantou vyhlazování 0,1.



Rýže. 2.1. Exponenciální vyhlazování

Řešení v Excelu.

1. Vyberte nabídku "Nástroje" - "Analýza dat". Ze seznamu Analytické nástroje vyberte Exponenciální vyhlazení. Pokud v nabídce "Nástroje" není žádná analýza dat, musíte nainstalovat "Analytický balíček". Chcete-li to provést, najděte položku "Nastavení" v části "Parametry" a v zobrazeném dialogovém okně zaškrtněte políčko "Analytický balíček" a klepněte na tlačítko OK.

2. Dialogové okno zobrazené na Obr. 2.2.

3. Do pole „interval vstupu“ zadejte hodnoty počátečních dat (plus jednu volnou buňku).

4. Zaškrtněte políčko „štítky“ (pokud vstupní rozsah obsahuje názvy sloupců).

5. Zadejte hodnotu (1-α) do pole faktoru tlumení.

6. Do pole „interval vstupu“ zadejte hodnotu buňky, ve které chcete vidět přijaté hodnoty.

7. Zaškrtnutím políčka "Možnosti" - "Výstup grafu" jej automaticky vytvoříte.

Rýže. 2.2. Dialogové okno pro exponenciální vyhlazování

3. Úloha laboratorní práce.

V tabulce 2.3 jsou uvedeny počáteční údaje o objemech produkce podniku produkujícího ropu za 2 roky:

Tabulka 2.3

Počáteční údaje

Proveďte exponenciální vyhlazení série. Vezměte koeficient exponenciálního vyhlazování rovný 0,1; 0,2; 0,3. Komentář k výsledkům. Můžete použít statistiky uvedené v příloze 1.

Jednoduchý a logicky přehledný model časové řady má následující podobu:

Kde b je konstantní a ε - náhodná chyba. Konstantní b relativně stabilní v každém časovém intervalu, ale může se také v průběhu času pomalu měnit. Jeden z intuitivních způsobů, jak extrahovat hodnotu b z dat je použít vyhlazování klouzavým průměrem, ve kterém jsou nejnovější pozorování vážena více než předposlední, předposlední jsou více vážena než předposlední a tak dále. Jednoduché exponenciální vyhlazování je právě to. Starším pozorováním jsou zde přiřazovány exponenciálně klesající váhy, přičemž na rozdíl od klouzavého průměru se berou v úvahu všechna předchozí pozorování řady a nejen ta, která spadla do určitého okna. Přesný vzorec pro jednoduché exponenciální vyhlazení je:

Když je tento vzorec aplikován rekurzivně, každá nová vyhlazená hodnota (která je také predikcí) se vypočítá jako vážený průměr aktuálního pozorování a vyhlazené řady. Je zřejmé, že výsledek vyhlazení závisí na parametru α . Li α je 1, předchozí pozorování jsou zcela ignorována. Pokud a je 0, pak jsou aktuální pozorování ignorována. Hodnoty α mezi 0 a 1 poskytují mezivýsledky. Empirické studie ukázaly, že jednoduché exponenciální vyhlazení často poskytuje poměrně přesnou předpověď.

V praxi se většinou doporučuje brát α méně než 0,30. Volba větší než 0,30 však někdy poskytuje přesnější předpověď. To znamená, že je lepší odhadnout optimální hodnotu α na reálných datech než použít obecná doporučení.

V praxi se optimální parametr vyhlazování často hledá pomocí postupu vyhledávání mřížky. Možný rozsah hodnot parametrů je rozdělen mřížkou s určitým krokem. Zvažte například mřížku hodnot z α = 0,1 až α = 0,9 s krokem 0,1. Poté se zvolí hodnota α , pro kterou je součet čtverců (nebo středních čtverců) reziduí (pozorované hodnoty mínus předpovědi na krok vpřed) minimální.

Aplikace Microsoft Excel poskytuje funkci exponenciálního vyhlazování, která se běžně používá k vyhlazení úrovní empirické časové řady na základě jednoduché metody exponenciálního vyhlazení. Chcete-li tuto funkci vyvolat, vyberte v pruhu nabídky Nástroje – Analýza dat. Na obrazovce se otevře okno Analýza dat, ve kterém byste měli vybrat hodnotu Exponenciální vyhlazování. V důsledku toho se zobrazí dialogové okno. Exponenciální vyhlazování znázorněno na Obr. 11.5.


V dialogovém okně Exponenciální vyhlazování se nastavují téměř stejné parametry jako v dialogovém okně klouzavý průměr popsaný výše.

1. Vstupní rozsah (Vstupní data) - do tohoto pole se zadává rozsah buněk obsahující hodnoty studovaného parametru.

2. Štítky (štítky) - tento příznak volby je nastaven, pokud první řádek (sloupec) ve vstupním rozsahu obsahuje nadpis. Pokud záhlaví chybí, zaškrtávací políčko by mělo být zrušeno. V tomto případě se pro data výstupního rozsahu automaticky vygenerují standardní názvy.

3. Faktor tlumení - do tohoto pole zadejte hodnotu vybraného faktoru exponenciálního vyhlazování α . Výchozí hodnota je α = 0,3.

4. Možnosti výstupu - v této skupině můžete kromě určení rozsahu buněk pro výstupní data v poli Rozsah výstupu také požadovat automatické vykreslení grafu, u kterého je potřeba zaškrtnout volbu Výstup grafu a vypočítat standard chyby zaškrtnutím volby Standardní chyby.

Použijme funkci Exponenciální vyhlazování k opětovnému vyřešení výše uvedeného problému, ale pomocí metody jednoduchého exponenciálního vyhlazování. Vybrané hodnoty parametrů vyhlazování jsou znázorněny na obr. 11.5. Na Obr. 11.6 ukazuje vypočtené ukazatele a na Obr. 11.7 - vykreslené grafy.



chyba: Obsah je chráněn!!