Konfidenzintervalle der Prognose. Beurteilung der Angemessenheit und Genauigkeit von Modellen

Eine der gebräuchlichsten Prognosemethoden ist die Extrapolation, d. h. bei der Vorhersage der Zukunft auf der Grundlage vergangener Daten.

Der Hochrechnung liegen folgende Annahmen zugrunde:

§ die Entwicklung des Phänomens kann vernünftigerweise durch einen gleichmäßigen Verlauf – einen Trend – charakterisiert werden;

§ Die Rahmenbedingungen, die den Entwicklungstrend der Vergangenheit bestimmen, werden sich in Zukunft nicht wesentlich ändern.

Somit liefert die Extrapolation eine Beschreibung einer allgemeinen zukünftigen Entwicklung des Prognoseobjekts. War zudem die Entwicklung in der Vergangenheit dauerhaft krampfhafter Natur, so erweisen sich die Sprünge bei ausreichend langem Beobachtungszeitraum als „fixiert“ im Trend selbst und dieser kann wieder prognostisch genutzt werden.

Lassen Sie uns eine Prognose auf der Grundlage von Extrapolation durchführen bessere Verfassung Trend (linear) für Exporte im Zeitraum 2001-2007:

Denken Sie daran, dass die aktuelle Variable 7 Stufen der Reihe hat, die durch natürliche Zahlen bezeichnet werden. Dementsprechend wird die Prognose der Exportdynamik im Jahr 2008 (t=8) wie folgt lauten:

(Milliarde Dollar)

Führen wir eine Prognose durch, die auf der Extrapolation der besten Trendform (linear) für Importe für den Zeitraum 2001-2007 basiert:

Denken Sie daran, dass die aktuelle Variable 7 Stufen der Reihe hat, die durch natürliche Zahlen bezeichnet werden. Dementsprechend wird die Prognose der Importdynamik im Jahr 2008 (t=8) wie folgt lauten:

(Milliarde Dollar)

Durch die Extrapolation ist es möglich, einen Punktwert der Prognose zu erhalten, der nur dann als zufriedenstellend angesehen werden kann, wenn eine funktionale Abhängigkeit besteht. Allerdings sind wirtschaftliche Phänomene durch Korrelationen gekennzeichnet und die Variablen sind in der Regel kontinuierlich. Folglich ist die Angabe der Punktwerte der Prognose streng genommen inhaltslos. Daraus folgt, dass die Prognose als Werteintervall angegeben werden sollte, d.h. Es ist notwendig, das Konfidenzintervall der Prognose zu bestimmen.

Prognose-Konfidenzintervalle

Bei der Erstellung einer Prognose hat der Fehler folgende Ursachen:

§ Die Wahl der Form der den Trend charakterisierenden Kurve enthält ein Element der Subjektivität. In jedem Fall gibt es oft keine sichere Grundlage für die Behauptung, dass die gewählte Kurvenform die einzig mögliche ist, geschweige denn die beste für die Extrapolation unter bestimmten spezifischen Bedingungen;

§ Die Schätzung von Kurvenparametern (mit anderen Worten die Trendschätzung) basiert auf einer begrenzten Menge von Beobachtungen, von denen jede eine Zufallskomponente enthält. Aus diesem Grund sind die Parameter der Kurve und damit ihre Position im Raum durch eine gewisse Unsicherheit gekennzeichnet;

§ Der Trend charakterisiert das durchschnittliche Niveau der Reihe zu jedem Zeitpunkt. Einzelne Beobachtungen weichen in der Vergangenheit tendenziell davon ab.

Es ist natürlich zu erwarten, dass es in Zukunft zu solchen Abweichungen kommen wird.

Es gibt durchaus Fälle, in denen die Form der den Trend beschreibenden Kurve falsch gewählt wird oder sich der Entwicklungstrend in der Zukunft erheblich ändert und nicht dem Kurventyp folgt, der bei der Ausrichtung übernommen wurde. Im letzteren Fall entspricht die Grundannahme der Extrapolation nicht der tatsächlichen Sachlage. Die gefundene Kurve gleicht lediglich die dynamische Reihe aus und charakterisiert den Trend nur innerhalb des von der Beobachtung abgedeckten Zeitraums. Die Extrapolation eines solchen Trends führt unweigerlich zu einem fehlerhaften Ergebnis, und ein solcher Fehler kann nicht im Voraus abgeschätzt werden. In diesem Zusammenhang können wir nur feststellen, dass offenbar mit zunehmender Vorlaufzeit mit einer Zunahme eines solchen Fehlers (bzw. der Wahrscheinlichkeit seines Auftretens) zu rechnen ist.

Der mit der zweiten und dritten Quelle verbundene Fehler kann sich in Form eines Konfidenzintervalls der Prognose widerspiegeln, wenn bestimmte Annahmen über die Eigenschaft der Reihe getroffen werden. Mit Hilfe eines solchen Intervalls wird eine Punktprognose in eine Intervallprognose umgewandelt.

In jedem Fall führt eine Verschiebung des Beobachtungszeitraums um nur einen Schritt oder das Hinzufügen oder Weglassen von Mitgliedern der Reihe aufgrund der Tatsache, dass jedes Mitglied der Reihe eine Zufallskomponente enthält, zu einer Änderung der numerischen Schätzungen der Parameter. Daher tragen die berechneten Werte die Last der Unsicherheit, die mit Fehlern im Wert der Parameter verbunden ist.

IN Gesamtansicht Das Konfidenzintervall für einen Trend ist definiert als:

Wo ist der quadratische Mittelwert des Trends?

Geschätzter Wert y t ;

T-Statistikwert des Schülers.

In STATISTICA beim Berechnen Vertrauensintervalle Prognose kann der Wert der Standardabweichung S y anhand der Tabelle ermittelt werden Varianzanalyse. Der in der Zelle „Residual Mean Squares“ berechnete Wert entspricht dem Wurzelausdruck in der Formel für S y , also der Restvarianz. Es bleibt nur noch die Quadratwurzel daraus zu ziehen.

Für den Export (siehe Tabelle 77), für den Import (siehe Tabelle 80).

Also für den Export S y = 18,11, für den Import S y = 25,45.

Der Wert des Konfidenzkoeffizienten t ergibt sich aus der Schülertabelle unter Berücksichtigung Vertrauensniveau 95 %. Bei Verwendung von linearen und Potenzfunktionen die Anzahl der Freiheitsgrade beträgt jeweils 4, der Wert des Kriteriums beträgt 2,776.

Somit ist das Konfidenzintervall der Exportprognose für 2008 wie folgt definiert:

Diese Prognose kann wie folgt interpretiert werden: Die Höhe der japanischen Exporte im Jahr 2008 wird mit einer Wahrscheinlichkeit von 95 % von 704,542 Milliarden Dollar auf 805,089 Milliarden Dollar steigen.

Das Konfidenzintervall der Importprognose für 2008 ist definiert als:

Diese Prognose kann wie folgt interpretiert werden: Die Höhe der Importe Japans im Jahr 2008 wird mit einer Wahrscheinlichkeit von 95 % von 596,072 Milliarden Dollar auf 737,371 Milliarden Dollar steigen.

Grafische Darstellung der Prognoseergebnisse

Die letzte Phase der Prognose ist die Erstellung grafischer Bilder, die einen Eindruck von der Genauigkeit der Prognose vermitteln und den Bereich der Konfidenzintervalle deutlich veranschaulichen.

Tabelle 89. Prognosedaten für den Export



Reis. 63.

Tabelle 90. Prognosedaten für den Export


Reis. 64.

Leider lagen in unserem Fall die realen Werte über dem Konfidenzintervall der Prognose, was noch einmal die Schwierigkeit der Auswahl eines Trendmodells unterstreicht.

Hochrechnung auf Basis der durchschnittlichen Wachstumsrate und des durchschnittlichen absoluten Wachstums

In diesem Absatz betrachten wir Prognosen auf der Grundlage der durchschnittlichen Wachstumsrate. Die Werte zukünftiger Perioden werden nach folgender Formel ermittelt:

Wo ist die durchschnittliche Wachstumsrate? - das der Extrapolation zugrunde gelegte Niveau.

Die durchschnittliche Wachstumsrate ist definiert als:

wo y n - Daten für Letztes Jahr Periode und y 1 - Daten für das erste Jahr im betrachteten Zeitraum.

Berechnen wir für den Export:

Konfidenzintervall:

Tabelle 91. Formelberechnungen, durchschnittliche Wachstumsrate für japanische Exporte

PRÜFUNG

Disziplin „Planung und Prognose“.

unter Marktbedingungen“

zum Thema: Konfidenzintervalle der Prognose

Beurteilung der Angemessenheit und Genauigkeit von Modellen


Kapitel 1. Theoretischer Teil

Konfidenzintervalle der Prognose. Beurteilung der Angemessenheit und Genauigkeit von Modellen

1.1 Prognose-Konfidenzintervalle

Der letzte Schritt bei der Anwendung von Wachstumskurven besteht darin, den Trend basierend auf der gewählten Gleichung zu extrapolieren. Die vorhergesagten Werte des untersuchten Indikators werden berechnet, indem Zeitwerte in die Kurvengleichung eingesetzt werden T entsprechend der Vorlaufzeit. Die so gewonnene Prognose wird als Punktprognose bezeichnet, da für jeden Zeitpunkt nur ein Wert des vorhergesagten Indikators ermittelt wird.

In der Praxis ist es zusätzlich zu einer Punktprognose wünschenswert, die Grenzen einer möglichen Änderung des vorhergesagten Indikators zu bestimmen, eine „Gabelung“ möglicher Werte des vorhergesagten Indikators festzulegen, d.h. Berechnen Sie die Intervallprognose.

Die Diskrepanz zwischen den tatsächlichen Daten und der Punktprognose, die durch Extrapolation des Trends aus Wachstumskurven erhalten wird, kann folgende Ursachen haben:

1. subjektiver Irrtum bei der Wahl des Kurventyps;

2. Fehler bei der Schätzung der Kurvenparameter;

3. der Fehler, der mit der Abweichung einzelner Beobachtungen vom Trend verbunden ist, der zu jedem Zeitpunkt ein bestimmtes Durchschnittsniveau der Reihe charakterisiert.

Der mit der zweiten und dritten Quelle verbundene Fehler kann in Form eines Konfidenzintervalls der Prognose widergespiegelt werden. Das Konfidenzintervall, das die mit der Position des Trends verbundene Unsicherheit und die Möglichkeit einer Abweichung von diesem Trend berücksichtigt, ist wie folgt definiert:


wobei n die Länge der Zeitreihe ist;

L – Vorlaufzeit;

y n + L -Punktprognose im Moment n+L;

t a – der Wert der Student-t-Statistik;

S p – quadratischer Mittelwertfehler der Prognose.

Nehmen wir an, dass der Trend durch eine gerade Linie gekennzeichnet ist:

Da die Parameterschätzungen bestimmt werden durch Stichprobenrahmen, dargestellt durch eine Zeitreihe, enthalten sie einen Fehler. Der Fehler des Parameters a o führt zu einer vertikalen Verschiebung der Geraden, der Fehler des Parameters a 1 - zu einer Änderung des Neigungswinkels der Geraden relativ zur x-Achse. Unter Berücksichtigung der Streuung spezifischer Implementierungen relativ zu den Trendlinien kann die Varianz wie folgt dargestellt werden:

(1.2.),

Wo ist die Varianz der Abweichungen tatsächlicher Beobachtungen von berechneten?

T 1 - Vorlaufzeit, für die eine Hochrechnung vorgenommen wird;

t 1 = n + L ;

T- Seriennummer der Ebenen der Serie, t = 1,2,..., n;

Die Seriennummer der Ebene in der Mitte der Zeile,

Dann kann das Konfidenzintervall wie folgt dargestellt werden:

(1.3.),

Bezeichnen wir die Wurzel im Ausdruck (1.3.) durch K. Der Wert von K hängt nur von n und L ab, d.h. von der Länge der Reihe und der Vorlaufzeit ab. Daher können Sie Tabellen mit den Werten K oder K * \u003d t a K erstellen. Dann sieht die Intervallschätzung so aus:

(1.4.),

Für ein Polynom zweiter Ordnung kann ein Ausdruck ähnlich (1.3.) erhalten werden:

(1.5.),

(1.6.),

Die Streuung der Abweichungen tatsächlicher Beobachtungen von berechneten wird durch den Ausdruck bestimmt:


(1.7.),

Wo y t- Istwerte der Serienstufen,

Geschätzte Werte der Stufen der Reihe,

N- die Länge der Zeitreihe,

k- Anzahl der geschätzten Parameter der Nivellierkurve.

Somit hängt die Breite des Konfidenzintervalls vom Signifikanzniveau, der Vorlaufzeit, der Standardabweichung vom Trend und dem Grad des Polynoms ab.

Je höher der Grad des Polynoms ist, desto breiter ist das Konfidenzintervall für denselben Wert Sy, da die Varianz der Trendgleichung als gewichtete Summe der Varianzen der entsprechenden Parameter der Gleichung berechnet wird

Abbildung 1.1. Prognostizieren Sie Konfidenzintervalle für einen linearen Trend

Auf ähnliche Weise werden Konfidenzintervalle für mithilfe der Exponentialgleichung ermittelte Vorhersagen bestimmt. Der Unterschied besteht sowohl bei der Berechnung der Parameter der Kurve als auch bei der Berechnung des Durchschnitts quadratischer Fehler Verwenden Sie nicht die Werte der Zeitreihenebenen selbst, sondern deren Logarithmen.

Das gleiche Schema kann verwendet werden, um Konfidenzintervalle für eine Reihe von Kurven mit Asymptoten zu bestimmen, wenn der Wert der Asymptote bekannt ist (z. B. für eine modifizierte Exponentialfunktion).

Tabelle 1.1. Werte werden angegeben ZU* abhängig von der Länge der Zeitreihe N und Vorlaufzeit L für Geraden und Parabeln. Offensichtlich ist die Länge der Serie ( N) Werte ZU* abnehmen, mit einer Erhöhung der Durchlaufzeit L Werte ZU* Zunahme. Gleichzeitig ist der Einfluss der Vorlaufzeit nicht gleich unterschiedliche Bedeutungen N: Je länger die Zeilenlänge, desto geringer ist der Einfluss der Vorlaufzeit L .

Tabelle 1.1.

K*-Werte zur Schätzung prognostizierter Konfidenzintervalle basierend auf einem linearen Trend und einem parabolischen Trend mit einem Konfidenzniveau von 0,9 (7).

Linearer Trend parabolischer Trend
Länge Zeile (n)

Vorlaufzeit (L)

Reihenlänge (p)

Vorlaufzeit (L)

7 2,6380 2,8748 3,1399 7 3,948 5,755 8,152
8 2,4631 2,6391 2,8361 8 3,459 4,754 6,461
9 2,3422 2,4786 2,6310 9 3,144 4,124 5,408
10 2,2524 2,3614 2,4827 10 2,926 3,695 4,698
11 2,1827 2,2718 2,3706 11 2,763 3,384 4,189
12 2,1274 2,2017 2,2836 12 2,636 3,148 3,808
13 2,0837 2,1463 2,2155 13 2,536 2,965 3,516
14 2,0462 2,1000 2,1590 14 2,455 2,830 3,286
15 2,0153 2,0621 2,1131 15 2,386 2,701 3,100
16 1,9883 2,0292 2,0735 16 2,330 2,604 2,950
17 1,9654 2,0015 2,0406 17 2,280 2,521 2,823
18 1,9455 1,9776 2,0124 18 2,238 2,451 2,717
19 1,9280 1,9568 1,9877 19 2,201 2,391 2,627
20 1,9117 1,9375 1,9654 20 2,169 2,339 2,549
21 1,8975 1,9210 1,9461 21 2,139 2,293 2,481
22 1,8854 1,9066 1,9294 22 2,113 2,252 2,422
23 1,8738 1,8932 1,9140 23 2,090 2,217 2,371
24 1,8631 1,8808 1,8998 24 2,069 2,185 2,325
25 1,8538 1,8701 1,8876 25 2,049 2,156 2,284

Kapitel 2. Praktischer Teil

Aufgabe 1.5. Verwendung adaptiver Methoden in der Wirtschaftsprognose

1. Berechnen Sie den exponentiellen Durchschnitt für die Zeitreihe des Aktienkurses des Unternehmens UM. Als Anfangswert des exponentiellen Durchschnitts nehmen Sie den Durchschnittswert der ersten 5 Stufen der Reihe. Der Wert des Anpassungsparameters a wird mit 0,1 angenommen.

Tabelle 1.2.

IBM-Aktienkurs

T y t T y t T y t
1 510 11 494 21 523
2 497 12 499 22 527
3 504 13 502 23 523
4 510 14 509 24 528
5 509 15 525 25 529
6 503 16 512 26 538
7 500 17 510 27 539
8 500 18 506 28 541
9 500 19 515 29 543
10 495 20 522 30 541

2. Berechnen Sie gemäß Aufgabe Nr. 1 den exponentiellen Durchschnitt mit dem Wert des Anpassungsparameters A gleich 0,5. Vergleichen Sie grafisch die ursprüngliche Zeitreihe und die mit erhaltene Reihe exponentieller Mittelwerte A=0,1 und A=0,5. Geben Sie an, welche Zeile glatter ist.

3. Die Prognose des Kurses der IBM-Aktie erfolgte auf Basis eines adaptiven Polynommodells zweiter Ordnung


,

Wo ist die Vorlaufzeit?

Im letzten Schritt werden die folgenden Koeffizientenschätzungen erhalten:

1 Tag im Voraus (=1);

2 Tage im Voraus (=2).

Lösung für Aufgabe 1.5

1. Definieren wir

Finden wir die Werte des exponentiellen Durchschnitts bei A =0,1.

. A=0,1 - je nach Bedingung;

; S 1 \u003d 0,1 x 510 + 0,9 x 506 \u003d 506,4;

; S 2 \u003d 0,1 x 497 + 0,9 x 506,4 \u003d 505,46;

; S 3 \u003d 0,1 x 504 + 0,9 x 505,46 \u003d 505,31 usw.

A=0,5 - je nach Bedingung.

; S 1 = 0,5 x 510 + 0,5 x 506 = 508;

; S 2 \u003d 0,5 x 497 + 0,5 x 508 \u003d 502,5 usw.

Die Berechnungsergebnisse sind in Tabelle 1.3 dargestellt.

Tabelle 1.3.

Exponentielle Durchschnittswerte

T Exponentieller Durchschnitt T Exponentieller Durchschnitt
A =0,1 A =0,5 A =0,1 A =0,5
1 506,4 508 16 505,7 513,3
2 505,5 502,5 17 506,1 511,7
3 505,3 503,2 18 506,1 508,8
4 505,8 506,6 19 507,0 511,9
5 506,1 507,8 20 508,5 517
6 505,8 505,4 21 509,9 520
7 505,2 502,7 22 511,6 523,5
8 504,7 501,4 23 512,8 523,2
9 504,2 500,7 24 514,3 525,6
10 503,4 497,8 25 515,8 527,3
11 502,4 495,9 26 518,0 532,7
12 502,0 497,5 27 520,1 525,8
13 502,0 499,7 28 522,2 538,4
14 502,7 504,4 29 524,3 540,7
15 505,0 514,7 30 525,9 540,9

Abbildung 1.2. Exponentielle Glättung Zeitreihe des Aktienkurses: A – tatsächliche Daten; B – exponentieller Durchschnitt bei Alpha = 0,1; C – exponentieller Durchschnitt bei Alpha = 0,5

Bei A=0,1 Der exponentielle Durchschnitt hat einen glatteren Charakter, weil in diesem Fall werden zufällige Schwankungen der Zeitreihe weitestgehend absorbiert.

3. Die Prognose für das adaptive Polynommodell zweiter Ordnung wird im letzten Schritt gebildet, indem die letzten Werte der Koeffizienten und der Wert der Vorlaufzeit in die Modellgleichung eingesetzt werden.

Vorhersage für 1 Tag im Voraus (= 1):

Vorhersage für 2 Tage im Voraus (= 2):

Literaturverzeichnis

1. Dubrova T.A. Statistische Prognosemethoden in den Wirtschaftswissenschaften: Lernprogramm/ Moskau Staatliche Universität Wirtschaftswissenschaften, Statistik und Informatik. - M.: MESI, 2003. - 52p.

2. Afanasiev V.N., Yuzbashev M.M. Zeitreihenanalyse und Prognose M.: Finanzen und Statistik, 2001.

3. Lukaschin Yu.P. Regression und adaptive Prognosemethoden. Lernprogramm. – M.: MESI, 1997.

Angenommen, wir möchten unser Modell auf andere Werte der unabhängigen Variablen erweitern und ein Mittelwertvorhersageproblem stellen bei entsprechend einem gegebenen Wert, der sowohl zwischen Stichprobenbeobachtungen liegen kann Vor , sowie außerhalb dieses Intervalls. Die Prognose kann punktuell oder intervallbasiert sein.

Punktvorhersage wird nach der Gleichung berechnet
Bedeutung .

Intervallvorhersage ist ein Konfidenzintervall, das mit einer gegebenen Zuverlässigkeit 1- abdeckt.
erwarteter Wert :

, (3.1.13)

. (3.1.14)


Sie können ein Konfidenzintervall für den Parameter erstellen
, der den wahren Wert des Parameters abdeckt
mit einer gegebenen Zuverlässigkeit 1-
:

. (3.1.16)

Konfidenzintervall für Korrelationskoeffizient werden durch die Formel (3.1.17) gefunden:

. (3.1.18)

Für nichtlineare Regressionen Berechnen Sie den Korrelationsindex, der der Quadratwurzel des nach Formel (3.1.10) berechneten Bestimmtheitskoeffizienten entspricht.

Die Zuverlässigkeit des Korrelationsindex wird anhand bewertet
-Statistik berechnet nach Formel (3.2.19):

, (3.1.19)

Wo M ist die Anzahl der Parameter in der Regressionsgleichung. Gemäß Fisher-Tabellen (Anhang E) für eine gegebene Zuverlässigkeit 1-
und die Anzahl der Freiheitsgrade (
) Und (
) Tabellenwert finden
. Wenn
, dann mit einer gegebenen Zuverlässigkeit 1-
Daraus kann geschlossen werden, dass der Korrelationsindex zuverlässig ist.

Die Eignung des konstruierten Modells für den untersuchten Prozess kann anhand des durchschnittlichen Näherungsfehlers (dem durchschnittlichen Prozentsatz der Abweichung zwischen theoretischen und tatsächlichen Werten) festgestellt werden:

. (3.1.20)

Bei der Modellierung von Wirtschaftsindikatoren wird am häufigsten ein Fehler von 5 % zugelassen (manchmal 7 %, selten 10 %). Das Modell gilt als angemessen (und daher geeignet), wenn
.

Da derselbe Trend durch unterschiedliche Modelle ausgedrückt werden kann, werden häufig mehrere Funktionen verwendet und dann die am besten geeignete ausgewählt. Die Auswahl des am meisten bevorzugten Modells kann anhand der Reststandardabweichung (Restvarianz) erfolgen:

, (3.1.21)

Wo
- Anzahl der Parameter in der Gleichung.

Die beste Funktion ist die mit weniger.

Beispiel 3.1. Untersuchen Sie die Abhängigkeit des Gewinnvolumens von der Anzahl der Filialen. Erstellen Sie eine Prognose unter der Annahme, dass die Anzahl der Filialen auf 25 erhöht wird.

Lösung. Um die Parameter der linearen Regressionsgleichung (3.1.1) mithilfe des Systems zu finden lineare Gleichungen Gauß (3.1.2) erstellen wir eine Hilfsberechnungstabelle 3.1.

§ 4.1. Prognose-Konfidenzintervalle

Der letzte Schritt bei der Anwendung von Wachstumskurven besteht darin, den Trend basierend auf der gewählten Gleichung zu extrapolieren. Die vorhergesagten Werte des untersuchten Indikators werden berechnet, indem die Werte der Zeit t, die der Vorlaufzeit entsprechen, in die Kurvengleichung eingesetzt werden. Die so gewonnene Prognose wird als Punktprognose bezeichnet, da für jeden Zeitpunkt nur ein Wert des vorhergesagten Indikators ermittelt wird.

In der Praxis ist es zusätzlich zu einer Punktprognose wünschenswert, die Grenzen einer möglichen Änderung des vorhergesagten Indikators zu bestimmen, eine „Gabelung“ möglicher Werte des vorhergesagten Indikators festzulegen, d.h. Berechnen Sie die Intervallprognose.

Die Diskrepanz zwischen den tatsächlichen Daten und der Punktprognose, die durch Extrapolation des Trends aus Wachstumskurven erhalten wird, kann folgende Ursachen haben:

1) subjektiver Irrtum bei der Wahl des Kurventyps;

2) der Fehler bei der Schätzung der Parameter der Kurven;

3) der Fehler, der mit der Abweichung einzelner Beobachtungen vom Trend verbunden ist, der zu jedem Zeitpunkt ein bestimmtes Durchschnittsniveau der Reihe charakterisiert.

Der mit der zweiten und dritten Quelle verbundene Fehler kann in Form eines Konfidenzintervalls der Prognose widergespiegelt werden. Das Konfidenzintervall, das die mit der Position des Trends verbundene Unsicherheit und die Möglichkeit einer Abweichung von diesem Trend berücksichtigt, ist wie folgt definiert:

(4.1.),

wobei n die Länge der Zeitreihe ist;

L – Vorlaufzeit;

Punktvorhersage für den Moment n+L;

T-Statistikwert des Schülers;

Der mittlere quadratische Fehler der Prognose.

Nehmen wir an, dass der Trend durch eine gerade Linie gekennzeichnet ist:

Da die Parameterschätzungen durch die durch die Zeitreihe dargestellte Stichprobenpopulation bestimmt werden, enthalten sie einen Fehler. Parameterfehler führt zu einer vertikalen Verschiebung der Geraden, dem Parameterfehler - um den Neigungswinkel der Geraden relativ zur Abszissenachse zu ändern. Unter Berücksichtigung der Streuung spezifischer Implementierungen relativ zu den Trendlinien kann die Varianz wie folgt dargestellt werden:

(4.2.),

Wo ist die Varianz der Abweichungen tatsächlicher Beobachtungen von berechneten?

Vorlaufzeit, für die eine Hochrechnung vorgenommen wird;

N+L ;

t ist die laufende Nummer der Ebenen der Reihe, t=1,2, ... , n;

Die Seriennummer der Ebene in der Mitte der Zeile,

=(n+1):2

Dann kann das Konfidenzintervall wie folgt dargestellt werden:

(4.3.)

Bezeichnen wir die Wurzel im Ausdruck (4.3.) durch K. Der Wert von K hängt nur von n und L ab, d.h. von der Länge der Reihe und der Vorlaufzeit ab. Daher können Sie Tabellen mit den Werten K oder K * \u003d t erstellen A K. Dann sieht die Intervallschätzung so aus:

(4.4.)

Für ein Polynom zweiter Ordnung kann ein Ausdruck ähnlich (4.3.) erhalten werden:

(4.5.)

oder

(4.6.)

Die Streuung der Abweichungen tatsächlicher Beobachtungen von berechneten wird durch den Ausdruck bestimmt:

(4.7.),

Wo - Istwerte der Serienstufen,

Geschätzte Werte der Stufen der Reihe,

n ist die Länge der Zeitreihe,

k ist die Anzahl der geschätzten Parameter der Nivellierkurve.

Somit hängt die Breite des Konfidenzintervalls vom Signifikanzniveau, der Vorlaufzeit, der Standardabweichung vom Trend und dem Grad des Polynoms ab.

Je höher der Grad des Polynoms ist, desto breiter ist das Konfidenzintervall für denselben Wert , da die Varianz der Trendgleichung als gewichtete Summe der Varianzen der entsprechenden Parameter der Gleichung berechnet wird

Abbildung 4.1. Prognostizieren Sie Konfidenzintervalle für einen linearen Trend

Auf ähnliche Weise werden Konfidenzintervalle für mithilfe der Exponentialgleichung ermittelte Vorhersagen bestimmt. Der Unterschied besteht darin, dass sowohl bei der Berechnung der Parameter der Kurve als auch bei der Berechnung des mittleren quadratischen Fehlers nicht die Werte der Zeitreihenebenen selbst, sondern deren Logarithmen verwendet werden.

Das gleiche Schema kann verwendet werden, um Konfidenzintervalle für eine Reihe von Kurven mit Asymptoten zu bestimmen, wenn der Wert der Asymptote bekannt ist (z. B. für eine modifizierte Exponentialfunktion).

Tabelle 4.1. die Werte von K* werden in Abhängigkeit von der Länge der Zeitreihe n und der Vorlaufzeit L für eine Gerade und eine Parabel angegeben. Offensichtlich nehmen mit zunehmender Länge der Zeilen (n) die Werte von K* ab, mit zunehmender Vorlaufzeit L nehmen die Werte von K* zu. Gleichzeitig ist die Wirkung der Vorlaufzeit für verschiedene Werte von n nicht gleich: Je länger die Zeilenlänge, desto geringer ist der Einfluss der Vorlaufzeit L.


Tabelle 4.1.

Werte K * zur Schätzung der Konfidenzintervalle der Prognose basierend auf einem linearen Trend und einem parabolischen Trend mit einem Konfidenzniveau von 0,9 (7).

Linearer Trend

parabolischer Trend

Zeilenlänge (n)

Vorlaufzeit (L)

Zeilenlänge (n)

Vorlaufzeit (L)

2,6380 2,8748 3,1399

2,4631 2,6391 2,8361

2,3422 2,4786 2,6310

2,2524 2,3614 2,4827

2,1827 2,2718 2,3706

2,1274 2,2017 2,2836

2,0837 2,1463 2,2155

2,0462 2,1000 2,1590

2,0153 2,0621 2,1131

1,9883 2,0292 2,0735

1,9654 2,0015 2,0406

1,9455 1,9776 2,0124

1,9280 1,9568 1,9877

1,9117 1,9375 1,9654

1,8975 1,9210 1,9461

1,8854 1,9066 1,9294

1,8738 1,8932 1,9140

1,8631 1,8808 1,8998

1,8538 1,8701 1,8876

3,948 5,755 8,152

3,459 4,754 6,461

3,144 4,124 5,408

2,926 3,695 4,698

2,763 3,384 4,189

2,636 3,148 3,808

2,536 2,965 3,516

2,455 2,830 3,286

2,386 2,701 3,100

2,330 2,604 2,950

2,280 2,521 2,823

2,238 2,451 2,717

2,201 2,391 2,627

2,169 2,339 2,549

2,139 2,293 2,481

2,113 2,252 2,422

2,090 2,217 2,371

2,069 2,185 2,325

2,049 2,156 2,284

§ 4.2. Überprüfung der Angemessenheit der ausgewählten Modelle

Die Überprüfung der Eignung der ausgewählten Modelle für den realen Prozess (insbesondere der Eignung der erhaltenen Wachstumskurve) basiert auf der Analyse einer Zufallskomponente. Die zufällige Restkomponente wird nach Auswahl der systematischen Komponente aus der untersuchten Reihe erhalten (der Trend und die periodische Komponente, falls sie in der Zeitreihe vorhanden ist). Nehmen wir an, dass die ursprüngliche Zeitreihe einen Prozess beschreibt, der keinen saisonalen Schwankungen unterliegt, d. h. Wir akzeptieren die Hypothese eines additiven Modells einer Reihe der Form:

(4.8.)

Dann wird eine Reihe von Residuen als Abweichungen der tatsächlichen Niveaus der Zeitreihe () von den ausgerichteten, berechneten () erhalten. ):

(4.9.)

Bei Verwendung von Wachstumskurven werden berechnet, indem die entsprechenden aufeinanderfolgenden Zeitwerte in die Gleichungen der ausgewählten Kurven eingesetzt werden.

Es ist allgemein anerkannt, dass das Modell dem beschriebenen Prozess angemessen ist, wenn die Werte der Restkomponente die Eigenschaften Zufälligkeit und Unabhängigkeit erfüllen und auch die Zufallskomponente dem Normalverteilungsgesetz gehorcht.

Bei richtige Wahl Je nach Art des Trends sind Abweichungen davon zufällig. Dies bedeutet, dass die Änderung der Restzufallsvariablen nicht mit einer zeitlichen Änderung verbunden ist. Somit wird anhand der für alle Zeitpunkte im untersuchten Intervall erhaltenen Stichprobe die Hypothese über die Abhängigkeit der Wertefolge von der Zeit oder, was dasselbe ist, über das Vorhandensein eines Trends in ihrer Änderung getestet . Zur Prüfung dieser Eigenschaft kann daher eines der in Abschnitt I besprochenen Kriterien, beispielsweise der Serientest, herangezogen werden.

Wenn der Typ der Funktion, die die systematische Komponente beschreibt, schlecht gewählt wird, haben die aufeinanderfolgenden Werte einer Reihe von Resten möglicherweise nicht die Eigenschaften der Unabhängigkeit, da sie können miteinander korrelieren. In diesem Fall spricht man von Autokorrelation der Fehler.

Unter Autokorrelationsbedingungen werden mit der Methode Schätzungen der Modellparameter ermittelt kleinsten Quadrate, wird die Eigenschaften Unvoreingenommenheit und Konsistenz haben (Sie werden diese Eigenschaften im Laufe der mathematischen Statistik kennenlernen). Gleichzeitig nimmt die Effektivität dieser Schätzungen ab und Konfidenzintervalle werden aufgrund ihrer Unzuverlässigkeit daher wenig aussagekräftig sein.

Es gibt verschiedene Techniken zur Erkennung von Autokorrelation. Am gebräuchlichsten ist die von D. vorgeschlagene Methode. Arbi ny und Watson. Kriterium D Arbi on-Watson ist mit der Hypothese der Existenz einer Autokorrelation erster Ordnung verbunden, d.h. Autokorrelationen zwischen benachbarten Resttermen der Reihe. Der Wert dieses Kriteriums wird durch die Formel bestimmt:

(4.10.)

Es kann gezeigt werden, dass der Wert von d ungefähr gleich ist:

d » 2(1- ) (4.11),

Wo ist der Autokorrelationskoeffizient erster Ordnung (d. h. Paarkoeffizient Korrelationen zwischen zwei Serien und ).

Aus der letzten Formel ist ersichtlich, dass bei einer starken positiven Autokorrelation in den Werten (» 1), dann ist der Wert d=0 , im Falle einer starken negativen Autokorrelation (» -1) d=4. In Abwesenheit einer Autokorrelation (» 0) d=2.

Für dieses Kriterium wurden kritische Grenzen gefunden, die es ermöglichen, die Hypothese des Fehlens einer Autokorrelation zu akzeptieren oder abzulehnen. Die Autoren des Kriteriums definierten die Grenzen für die Signifikanzniveaus 1, 2,5 und 5 %. Kriteriumswerte D Arbi zu Watson bei einem Signifikanzniveau von 5 % sind in Tabelle 4.2 dargestellt. In dieser Tabelle sind und jeweils die untere und obere Konfidenzgrenze des Kriteriums D Arby über Watson; - Anzahl der Variablen im Modell; n ist die Länge der Zeitreihe.

Tabelle 4.2.

Kriteriumswerte D Arbi auf Watson d 1 und d 2 auf einem Signifikanzniveau von 5 %

1,08

1,13

1,16

1,18

1,22

1,”4

1,26

1,27

1,29

1,32

1,33

1,34

1,35

1,36

1,37

1,38

1,49

1,41

1,36

1,37

1,38

1,39

1,41

1,42

1,43

1,44

1,45

1,45

1,46

1,47

1,48

1,48

1,49

1,51

1,51

1,52

1,52

0,95

0,98

1,02

1,05

1,08

1,13

1,15

1,17

1,19

1,21

1,22

1,24

1,26

1,27

1,28

1,31

1,32

1,33

1,34

1,35

1,54

1,54

1,54

1,53

1,53

1,54

1,54

1,54

1,54

1,55

1,55

1,55

1,56

1,56

1,56

1,57

1,57

1,57

1,58

1,58

1,58

1,59

0,82

0,86

0,93

0,97

1,03

1,05

1,08

1,12

1,14

1,16

1,18

1,21

1,23

1,24

1,26

1,27

1,28

1,29

1,75

1,73

1,71

1,69

1,68

1,68

1,67

1,66

1,66

1,66

1,66

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

Anwendung des Kriteriums D in der Praxis Arbi on-Watson basiert auf einem Vergleich des nach der Formel (4.10.) berechneten Wertes von d mit den theoretischen Werten von d 1 und d 2 aus der Tabelle. Beachten Sie, dass die meisten Softwarepakete zur statistischen Datenverarbeitung dieses Kriterium berechnen (z. B. die Softwarepakete Olympus, Mesozavr, Statistica usw.).

Beim Vergleich des Wertes von d mit und sind folgende Optionen möglich:

1) Wenn d< , то гипотеза о независимости случайных отклонений (отсутствие автокорреляции) отвергается;

2) Wenn d > , dann wird die Hypothese der Unabhängigkeit zufälliger Abweichungen nicht abgelehnt;

3) Wenn £ d £ , dann liegen keine ausreichenden Entscheidungsgründe vor, d.h. der Wert liegt im Bereich der „Unsicherheit“.

Die betrachteten Optionen beziehen sich auf den Fall, dass eine positive Autokorrelation in den Residuen vorliegt.

Wenn der berechnete Wert von d 2 überschreitet, können wir sagen, dass eine negative Autokorrelation vorliegt.

Um die negative Autokorrelation mit kritischen Werten zu testen, wird nicht der Koeffizient d selbst, sondern 4-d verglichen.

Um die Konfidenzintervalle des Modells zu bestimmen, ist die Eigenschaft der Normalverteilung der Residuen wichtig. Da die Zeitreihen der Wirtschaftsindikatoren in der Regel klein sind (<50), то проверка распределения на нормальность может быть произведена лишь приближенно, например, на основе исследования показателей асимметрии и эксцесса.

Bei einer Normalverteilung sind die Indikatoren für Asymmetrie (A) und Kurtosis (E) gleich Null. Da wir davon ausgehen, dass es sich bei den Abweichungen vom Trend um eine Stichprobe aus einer allgemeinen Grundgesamtheit handelt, können wir die Stichprobenmerkmale Schiefe und Wölbung sowie deren Standardfehler bestimmen.

Wenn mindestens eine der Ungleichungen

(4.17.),

dann wird die Hypothese einer Normalverteilung verworfen.

In anderen Fällen ist eine zusätzliche Überprüfung mit aussagekräftigeren Kriterien erforderlich.

Beispiel 4.1.

Das Programm ergab für eine Reihe von Rückständen die folgenden Merkmale:

Zeilenlänge n=20;

Asymmetriekoeffizient A = 0,6;

Kurtosis-Koeffizient E=0,7.

Aufgrund dieser Merkmale können wir davon ausgehen, dass:

a) die Zufallskomponente gehorcht dem Normalverteilungsgesetz;

b) die Zufallskomponente gehorcht nicht dem Normalverteilungsgesetz;

c) eine zusätzliche Überprüfung der Art der Verteilung der Zufallskomponente ist erforderlich.

Lösung:

Definieren wir:


Da beide Ungleichungen gleichzeitig gelten


§ 4.3. Modellgenauigkeitseigenschaften

Die wichtigsten Merkmale der Qualität des für die Prognose gewählten Modells sind Indikatoren für seine Genauigkeit. Sie beschreiben die Größe der zufälligen Fehler, die bei Verwendung des Modells auftreten. Um die Qualität des gewählten Modells beurteilen zu können, ist es daher notwendig, das System von Indikatoren zu analysieren, die sowohl die Angemessenheit des Modells als auch seine Genauigkeit charakterisieren.

In der Praxis wird häufig der relative Prognosefehler verwendet, ausgedrückt als Prozentsatz relativ zum tatsächlichen Wert des Indikators:

(4.19.)

Modulo-Mittelwertfehler (absolut und relativ) werden ebenfalls verwendet:

(4.20.),

Dabei ist n die Anzahl der Zeitreihenebenen, für die der Prognosewert ermittelt wurde.

Aus (4.18.), (4.19.) ist ersichtlich, dass wenn der absolute und relative Fehler größer als 0 ist, dies auf eine „überschätzte“ Prognoseschätzung hinweist, wenn - kleiner als 0, dann wurde die Prognose unterschätzt.

Offensichtlich können alle diese Merkmale berechnet werden, nachdem die Vorlaufzeit bereits abgelaufen ist und tatsächliche Daten zum prognostizierten Indikator vorliegen oder wenn der Indikator auf der retrospektiven Website berücksichtigt wird.

Im letzteren Fall werden die verfügbaren Informationen in zwei Teile geteilt: Nach dem ersten Teil werden die Parameter des Modells geschätzt und die Daten des zweiten Teils werden als sachlich betrachtet. Retrospektiv (im zweiten Abschnitt) ermittelte Prognosefehler charakterisieren die Genauigkeit des verwendeten Modells.

In der Praxis können bei der vergleichenden Bewertung von Modellen Qualitätsmerkmale wie Varianz () oder quadratischer Mittelwert-Prognosefehler (S) verwendet werden:

(4.21.).

Je kleiner die Werte dieser Merkmale sind, desto höher ist die Genauigkeit des Modells.

Die Genauigkeit des Modells kann nicht anhand eines einzelnen Wertes des Prognosefehlers beurteilt werden. Wenn beispielsweise die prognostizierte Schätzung des monatlichen Produktionsniveaus im Juni mit dem tatsächlichen Wert übereinstimmt, ist dies kein ausreichender Beweis für die hohe Genauigkeit des Modells. Dabei ist zu berücksichtigen, dass aus einem schlechten Modell eine einzige gute Prognose abgeleitet werden kann und umgekehrt.

Folglich kann die Qualität der verwendeten Modelle nur durch die Gesamtheit der Vergleiche von Prognosewerten mit tatsächlichen Werten beurteilt werden.

Ein einfaches Maß für die Qualität von Prognosen kann seinM-die relative Häufigkeit, mit der der tatsächliche Wert von der Intervallprognose abgedeckt wurde:

(4.22.),

wobei p die Anzahl der durch tatsächliche Daten bestätigten Prognosen ist;

q ist die Anzahl der Prognosen, die nicht durch tatsächliche Daten bestätigt werden.

Wenn alle Vorhersagen bestätigt sind, ist q=0 und m=1.

Wenn nicht alle Vorhersagen bestätigt wurden, dann ist p = 0 und m=0.

Beachten Sie, dass der Vergleich der Koeffizienten M kann für verschiedene Modelle sinnvoll sein, sofern die Konfidenzwahrscheinlichkeiten als gleich angenommen werden.

Berechnungen und Überprüfung der Zuverlässigkeit der erhaltenen Schätzungen der Regressionskoeffizienten sind kein Selbstzweck, sondern lediglich ein notwendiger Zwischenschritt. Die Hauptsache ist die Verwendung des Modells zur Analyse und Vorhersage des Verhaltens des untersuchten Wirtschaftsphänomens. Die Prognose erfolgt durch Substitution des Wertes des Faktors X in die resultierende Regressionsformel ein.

Wir verwenden die in Beispiel 2.1 erhaltene Regressionsgleichung, um das Handelsvolumen vorherzusagen. Lassen Sie die Eröffnung eines Ladens mit der Anzahl der Mitarbeiter planen X\u003d 140 Personen, dann sollte durch die Gleichung ein ausreichend vernünftiges Handelsvolumen ermittelt werden ŷ (X)= –0,974 + 0,01924×140=1,72 Milliarden Rubel

Konfidenzintervall für den Vorhersagewert bei(X)= a 0 + a 1 X wird durch die Formel bestimmt

wobei t p die kritische Grenze der Student-Verteilung mit n - 2 Freiheitsgraden ist, entsprechend dem Signifikanzniveau R. Um ein Konfidenzintervall zu erhalten, verwenden wir den Ausdruck (5.2).

Wir wählen ein Signifikanzniveau von 5 %. Die Anzahl der Freiheitsgrade, die wir haben, beträgt 8 – 2 = 6, dann finden wir gemäß der Student-Verteilungstabelle (Anhang 1).

t 0,05 (6)=2,447.s=Ö 0,008=0,089,

Daher liegen die wahren Werte des Handelsvolumens mit einer Wahrscheinlichkeit von 95 % darin

1,72 - 2,447×0,048<j(X)<1,72+2,447×0,048, или 1,60<j(X)<1,84.

5.8. Übungsblock

Beispiel. Erstellen Sie ein Modell der Beziehung zwischen den angegebenen Faktoren, überprüfen Sie seine Angemessenheit und erstellen Sie eine Punkt- und Intervallprognose mithilfe der Extrapolationsmethode.

1 . Erstellen Sie ein Streudiagramm in Excel und ziehen Sie eine vorläufige Schlussfolgerung über das Vorhandensein einer Verbindung.

Tabelle 5.6Diagramm 5.1

X Y
2,1 29,5
2,9 34,2
3,3 30,6
3,8 35,2
4,2 40,7
3,9 44,5
5,0 47,2
4,9 55,2
6,3 51,8
5,8 56,7

Fazit: Aus Diagramm 5.1 ist ersichtlich, dass der Zusammenhang zwischen Faktoren besteht X Und j

direkte starke lineare Beziehung.

2. Berechnen Sie den linearen Korrelationskoeffizienten. Überprüfen Sie mithilfe des Student-t-Tests die Signifikanz des Korrelationskoeffizienten. Machen Sie eine Schlussfolgerung über die Nähe der Beziehung zwischen den Faktoren X Und bei.

Tabelle 5.7

xy
2,1 29,5 4,41 870,25 61,95 27,91 1,59 0,054
2,9 34,2 8,41 1169,64 99,18 33,46 0,74 0,022
3,3 30,6 10,89 936,36 100,98 36,23 -5,63 0,184
3,8 35,2 14,44 1239,04 133,76 39,69 -4,49 0,128
4,2 40,7 17,64 1656,49 170,94 42,47 -1,77 0,043
3,9 44,5 15,21 1980,25 173,55 40,39 4,11 0,092
5,0 47,2 2227,84 48,01 -0,81 0,017
4,9 55,2 24,01 3047,04 270,48 47,32 7,88 0,143
6,3 51,8 39,69 2683,24 326,34 57,02 -5,22 0,101
5,8 56,7 33,64 3214,89 328,86 53,55 3,15 0,056
GESAMT: 42,2 193,34 19025,04 1902,04 0,840
Mittelwert 4,22 42,56 19,334 1902,504 190,204

2.1. Lassen Sie uns die Enge der Beziehung zwischen den Faktoren überprüfen:

;

Fazit: Verbindung stark.

2.2. Überprüfen wir die statistische Signifikanz anhand des Student-Kriteriums:

1) Kriterium des Schülers: tselect<=tкр

2) Nein: r=0 tcr=2,31

tselect=rselect*

Fazit: also, da tselect = 5,84

90 % Nullhypothese wird abgelehnt, dies weist auf das Vorhandensein hin starke lineare Verbindung.

3. Unter der Annahme, dass die Beziehung zwischen den Faktoren X Und bei durch eine lineare Funktion beschrieben werden kann, geben Sie unter Verwendung der Methode der kleinsten Quadrate das System der Normalgleichungen in Bezug auf die Koeffizienten der linearen Regressionsgleichung an. Berechnen Sie diese Koeffizienten auf beliebige Weise.

Durch konsequentes Einsetzen in die Regressionsgleichung aus Spalte (2) von Tabelle 5.7 berechnen wir die Werte und füllen Spalte (7) von Tabelle 5.7 aus.

4. Berechnen Sie für das resultierende Modell der Beziehung zwischen den Faktoren X und Y den durchschnittlichen Approximationsfehler. Machen Sie eine vorläufige Schlussfolgerung über die Akzeptanz des resultierenden Modells.

Füllen Sie für die Berechnung die 8. und 9. Spalte der Tabelle 5.7 aus.

<Екр=12%

Fazit: Das Modell sollte als zufriedenstellend angesehen werden.

5 . Überprüfen Sie die Signifikanz des Rea 1 basierend auf dem Student-t-Test.

Lösung: Tabelle 5.8

2,1 29,5 27,91 2,5281 214,623 170,5636
2,9 34,2 33,46 0,5476 82,81 69,8896
3,3 30,6 36,23 31,6969 40,069 143,0416
3,8 35,2 39,69 20,1601 8,237 54,1696
4,2 40,7 42,47 3,1329 0,008 3,4596
3,9 44,5 40,39 16,8921 4,709 3,7636
47,2 48,01 0,6561 29,703 21,5296
4,9 55,2 47,32 62,0944 22,658 159,7696
6,3 51,8 57,02 27,2484 209,092 85,3776
5,8 56,7 53,55 9,9225 120,78 199,9396
GESAMT: 42,2 425,6 426,1 174,8791 732,687 911,504
Durchschnitt 4,22 42,56

Statistische Prüfung:

Fazit: Mit einer Konfidenzwahrscheinlichkeit von 90 % ist der Koeffizient A 1 – statistisch signifikant, d. h. Die Nullhypothese wird abgelehnt.

6. Überprüfen Sie die Angemessenheit des Modells (Regressionsgleichung) als Ganzes anhand des Fisher-Snedekor-F-Tests.

Statistisches Überprüfungsverfahren:

: Das Modell ist nicht ausreichend

Fazit: weil Fselect>Fcr., dann wird mit einer Konfidenzwahrscheinlichkeit von 95 % die Nullhypothese abgelehnt (d. h. die Alternative wird akzeptiert). Das untersuchte Modell ist ausreichend und kann für Prognosen und Managemententscheidungen verwendet werden.

7. Berechnen Sie das empirische Bestimmtheitsmaß.

(Tab. 3)

Zeigt den Anteil der Variation an.

Fazit: d.h. 80 % der Variation werden durch einen im Modell enthaltenen Faktor erklärt und 20 % durch Faktoren, die nicht im Modell enthalten sind.

8. Berechnen Sie das Korrelationsverhältnis. Vergleichen Sie den erhaltenen Wert mit dem Wert des linearen Korrelationskoeffizienten.

Das empirische Korrelationsverhältnis gibt die Nähe der Beziehung zwischen zwei Faktoren für jede Beziehung an. Wenn die Beziehung linear ist, dann , d.h. der Korrelationskoeffizient stimmt mit dem Bestimmtheitsmaß überein.

9 . Führen Sie eine Punktvorhersage durch .

10-12 . Berechnen Sie die Konfidenzintervalle für die Regressionsgleichung und für das resultierende Merkmal bei einem Konfidenzniveau = 90 %. Zeichnen Sie in einem Koordinatensystem:

a) Ausgangsdaten,

b) Regressionsgerade,

c) Punktvorhersage,

d) 90 %-Konfidenzintervalle.

Formulieren Sie eine allgemeine Schlussfolgerung zum resultierenden Modell.

- Erwartung des Mittelwerts.

Um eine Intervallvorhersage durchzuführen, betrachten wir zwei Bereiche.

1) für j aus dem Bereich der Faktoränderung X Konfidenzgrenzen für die lineare Regressionsgleichung werden nach folgender Formel berechnet:

2) Für den vorhergesagten Wert wird das Konfidenzintervall nach folgender Formel berechnet:

Ausgangsdaten:

2) t=2,31(Tab.)

5) : 27,91 42,56 57,02 66,72

6) 19,334-4,22 2)=1,53.

Tabelle 5.9

1 2,1 -2,12 4,49 3,03 1,74 2,31 4,68 18,81 27,91 9,10 46,72
4,22 0,00 0,00 0,1 0,32 2,31 4,68 3,46 42,56 39,10 46,02
6,3 2,08 4,33 2,93 1,71 2,31 4,68 18,49 57,02 38,53 75,51
7,7 3,48 12,11 9,02 2,31 4,68 32,43 66,72 34,29 99,15

Fazit: Da 90 % der Beobachtungspunkte innerhalb des 90 %-Konfidenzintervalls lagen, können dieses Modell und seine Konfidenzgrenzen für Vorhersagen mit 90 %-Konfidenz verwendet werden.

Kontrollfragen

1. Lineare Regressionsmodelle mit heteroskedastischen und autokorrelierten Residuen.

2. Arten der Autokorrelation und ihre kurze Beschreibung.

3. Autokorrelation in Residuen und die Reihenfolge ihrer Erkennung.

4. Arten der Autokorrelation in Residuen.

5. Das Verfahren zur Verwendung des Durbin-Watson-Kriteriums.

6. Autokorrelation in den Ausgangsdaten und das Verfahren zur Bestimmung ihres Vorhandenseins.

7. Methoden zur Eliminierung des Einflusses der Autokorrelation auf die Prognoseergebnisse.

8. Verallgemeinerte Methode der kleinsten Quadrate (GLS).

9. Was versteht man unter Homoskedastizität?

10. Wie wird die Hypothese der Homoskedastizität mehrerer Reste getestet?

11. Bewertung der Qualität der Regression. Überprüfung der Angemessenheit und Zuverlässigkeit des Modells.

12. Die Bedeutung der Regressionskoeffizienten (Student-Kriterium).

13. Dispersionsanalyse. Validierung des Beziehungsmodells (nach Fishers F-Kriterium).

14. Koeffizienten und Korrelationsindizes. Multikollenialität.

15. Beurteilung der Signifikanz des Zusammenhangs. Festlegung.

16. Durchschnittlicher Näherungsfehler.

17. Entscheidungsfindung basierend auf Regressionsgleichungen.

18. Bei welchen Problemen der Ökonometrie wird die Fisher-Verteilung verwendet?

19. Welche Verteilungstabellen werden zur Bewertung der Qualität der linearen Regression verwendet?

20. Was zeichnet die praktische Anwendung von Regressionsmodellen aus?

21. Wie wird die Wirtschaftsleistung mithilfe linearer Regressionsmodelle vorhergesagt?

22. Wie kann die „natürliche“ Arbeitslosenquote mithilfe eines linearen Regressionsmodells geschätzt werden?

23. In welchen Fällen ist eine Verfeinerung des linearen Regressionsmodells erforderlich und wie wird diese durchgeführt?

24. Wann ist es notwendig, unbedeutende erklärende Variablen aus der Betrachtung zu entfernen und neue Variablen hinzuzufügen?

Aufgaben und Aufgaben

1 . Es liegen Daten zu den Aktivitäten der größten US-Unternehmen im Jahr 2006 vor.

Nr. p / p Nettoeinkommen, Milliarden US-Dollar, bei Kapitalumschlag, Milliarden US-Dollar, X 1 Eingesetztes Kapital, Milliarden US-Dollar, X 2 Anzahl der Mitarbeiter, Tausend Personen, X 3 Marktkapitalisierung des Unternehmens, Milliarden US-Dollar, X 4
0,9 31,3 18,9 43,0 40,9
1,7 13,4 13,7 64,7 40,5
0,7 4,5 18,5 24,0 38,9
1,7 10,0 4,8 50,2 38,5
2,6 20,0 21,8 106,0 37,3
1,3 15,0 5,8 96,6 26,5
4,1 137,1 99,0 347,0 37,0
1,6 17,9 20,1 85,6 36,8
6,9 165,4 60,6 745,0 36,3
0,4 2,0 1,4 4,1 35,3
1,3 6,8 8,0 26,8 35,3
1,9 27,1 18,9 42,7 35,0
1,9 13,4 13,2 61,8 26,2
1,4 9,8 12,6 212,0 33,1
0,4 19,5 12,2 105,0 32,7
0,8 6,8 3,2 33,5 32,1
1,8 27,0 13,0 142,0 30,5
0,9 12,4 6,9 96,0 29,8
1,1 17,7 15,0 140,0 25,4
1,9 12,7 11,9 59,3 29,3
-0,9 21,4 1,6 131,0 29,2
1,3 13,5 8,6 70,7 29,2
2,0 13,4 11,5 65,4 29,1
0,6 4,2 1,9 23,1 27,9
0,7 15,5 5.8 80,8 27,2

Berechnen Sie Matrizen gepaarter Korrelationskoeffizienten und wählen Sie darauf basierend informative Faktoren für das Modell aus. Erstellen Sie ein Modell nur mit informativen Faktoren und bewerten Sie seine Parameter.

Berechnen Sie die Fehler und das Konfidenzintervall der Prognose für
Signifikanzniveau von 5 oder 10 % (γ = 0,05; γ = 0,10).

2. Es liegen Daten zu den Aktivitäten der größten US-Unternehmen im Jahr 2006 vor.

Nr. p / p Nettoeinkommen, Milliarden Dollar bei Kapitalumschlag, Milliarden Dollar USA, X 1 Eingesetztes Kapital, Milliarden US-Dollar X 2 Zahl, tausend Menschen, X 3
6,6 6,9 83,6 222,0
3,0 18.0 6,5 32,0
6,5 107,9 50,4 82,0
3,3 16,7 15,4 45,2
0,1 79,6 29,6 299,3
3,6 16,2 13,3 41,6
1,5 5,9 5,9 17,8
5,5 53,1 27,1 151,0
2,4 18,8 11,2 82,3
3,0 35,3 16,4 103,0
4,2 71,9 32,5 225,4
2,7 93,6 25,4 675,0
1,6 10,0 6,4 43,8
2,4 31,5 12,5 102,3
3,3 36,7 14,3 105,0
1,8 13,8 6,5 49,1
2,4 64,8 22,7 50,4
1,6 30,4 15,8 480,0
1,4 12,1 9,3 71,0
0,9 31,3 18,9 43,0

Berechnen Sie die Parameter einer linearen multiplen Regressionsgleichung mit einer vollständigen Liste von Faktoren.

Geben Sie anhand von Elastizitätskoeffizienten eine vergleichende Einschätzung der Stärke des Zusammenhangs zwischen Faktoren und dem Ergebnis ab.

Berechnen Sie die Matrizen der Paar- und Teilkorrelationskoeffizienten und wählen Sie auf ihrer Grundlage informative Faktoren für das Modell aus. Erstellen Sie ein Modell nur mit informativen Faktoren und bewerten Sie seine Parameter.

Berechnen Sie den vorhergesagten Wert des Ergebnisses, wenn die vorhergesagten Werte der Faktoren 80 % ihrer Maximalwerte betragen.

Berechnen Sie die Vorhersagefehler und das Konfidenzintervall für ein Signifikanzniveau von 5 oder 10 % (α = 0,05; α = 0,10).


©2015-2019 Website
Alle Rechte liegen bei ihren Autoren. Diese Seite erhebt keinen Anspruch auf Urheberschaft, stellt die Nutzung jedoch kostenfrei zur Verfügung.
Erstellungsdatum der Seite: 16.02.2016



Fehler: Der Inhalt ist geschützt!!