Konstruieren Sie eine Matrix von Paarkorrelationskoeffizienten. Bestimmung mehrerer Korrelationskoeffizienten in MS Excel

Aufgabe 2

1. Konstruieren Sie eine Matrix von Paarkorrelationskoeffizienten. Auf Multikollinearität prüfen. Begründen Sie die Auswahl der Faktoren im Modell.

2. Konstruieren Sie eine Gleichung multiple Regression in linearer Form mit ausgewählten Faktoren.

3. Bewerten statistische Signifikanz Regressionsgleichung und ihre Parameter mithilfe von Fisher- und Student-Tests.

4. Konstruieren Sie eine Regressionsgleichung mit statistisch signifikanten Faktoren. Beurteilen Sie die Qualität der Regressionsgleichung anhand des Bestimmtheitsmaßes R2. Bewerten Sie die Genauigkeit des erstellten Modells.

5. Bewerten Sie die Prognose des Produktionsvolumens, wenn die Prognosewerte der Faktoren 75 % ihrer Maximalwerte betragen.

Problembedingungen (Option 21)

Gemäß den in Tabelle 1 dargestellten Daten (n = 17) wird die Abhängigkeit des Produktionsvolumens Y (Millionen Rubel) von folgenden Faktoren (Variablen) untersucht:

X 1 – Anzahl des industriellen Produktionspersonals, Personen.

X 2 – durchschnittliche jährliche Kosten des Anlagevermögens, Millionen Rubel.

X 3 – Abschreibung des Anlagevermögens, %

X 4 – Stromversorgung, kWh.

X 5 – technische Ausrüstung eines Arbeiters, Millionen Rubel.

X 6 – Produktion marktfähiger Produkte pro Arbeiter, Rubel.

Tabelle 1. Produktfreigabedaten

Y X 1 X 2 X 3 X 4 X 5 X 6
39,5 4,9 3,2
46,4 60,5 20,4
43,7 24,9 9,5
35,7 50,4 34,7
41,8 5,1 17,9
49,8 35,9 12,1
44,1 48,1 18,9
48,1 69,5 12,2
47,6 31,9 8,1
58,6 139,4 29,7
70,4 16,9 5,3
37,5 17,8 5,6
62,0 27,6 12,3
34,4 13,9 3,2
35,4 37,3 19,0
40,8 55,3 19,3
48,1 35,1 12,4


Konstruieren Sie eine Matrix von Paarkorrelationskoeffizienten. Auf Multikollinearität prüfen. Begründen Sie die Auswahl der Faktoren im Modell

Tabelle 2 zeigt Paarkorrelationskoeffizientenmatrix für alle an der Betrachtung beteiligten Variablen. Die Matrix wurde mit dem Tool erstellt Korrelation aus dem Paket Datenanalyse V Excel.

Tabelle 2. Matrix der Paarkorrelationskoeffizienten

Y X1 X2 X3 X4 X5 X6
Y
X1 0,995634
X2 0,996949 0,994947
X3 -0,25446 -0,27074 -0,26264
X4 0,12291 0,07251 0,107572 0,248622
X5 0,222946 0,166919 0,219914 -0,07573 0,671386
X6 0,067685 -0,00273 0,041955 -0,28755 0,366382 0,600899

Durch die visuelle Analyse der Matrix können Sie Folgendes feststellen:

1) U hat ziemlich hohe paarweise Korrelationen mit den Variablen X1, X2 (>0,5) und niedrig mit Variablen X3,X4,X5,X6 (<0,5);

2) Die Analysevariablen X1, X2 weisen ziemlich hohe paarweise Korrelationen auf, was eine Überprüfung der Faktoren auf das Vorhandensein von Multikollinearität zwischen ihnen erforderlich macht. Darüber hinaus ist eine der Bedingungen des klassischen Regressionsmodells die Annahme der Unabhängigkeit erklärender Variablen.

Um die Multikollinearität von Faktoren zu identifizieren, führen wir Folgendes durch: Farrar-Glouber-Test um die Faktoren X1, X2, X3,X4,X5,X6.

Die Überprüfung des Farrar-Glouber-Tests auf Multikollinearität von Faktoren umfasst mehrere Stufen.

1) Überprüfung auf Multikollinearität des gesamten Variablenarrays .

Eine der Bedingungen des klassischen Regressionsmodells ist die Annahme der Unabhängigkeit der erklärenden Variablen. Um die Multikollinearität zwischen Faktoren zu identifizieren, wird die Matrix der Interfaktorkorrelationen R mithilfe des Datenanalysepakets berechnet (Tabelle 3).

Tabelle 3. Matrix der Interfaktorkorrelationen R

X1 X2 X3 X4 X5 X6
X1 0,994947 -0,27074 0,07251 0,166919 -0,00273
X2 0,994947 -0,26264 0,107572 0,219914 0,041955
X3 -0,27074 -0,26264 0,248622 -0,07573 -0,28755
X4 0,07251 0,107572 0,248622 0,671386 0,366382
X5 0,166919 0,219914 -0,07573 0,671386 0,600899
X6 -0,00273 0,041955 -0,28755 0,366382 0,600899

Es besteht eine starke Abhängigkeit (>0,5) zwischen den Faktoren X1 und X2, X5 und X4, X6 und X5.

Die Determinante det (R) = 0,001488 wird mit der MOPRED-Funktion berechnet. Die Determinante der Matrix R tendiert gegen Null, was uns eine Annahme über die allgemeine Multikollinearität der Faktoren ermöglicht.

2) Überprüfung auf Multikollinearität jeder Variablen mit anderen Variablen:

· Berechnen wir die inverse Matrix R -1 mit der Excel-Funktion MOBR (Tabelle 4):

Tabelle 4. Inverse Matrix R -1

X1 X2 X3 X4 X5 X6
X1 150,1209 -149,95 3,415228 -1,70527 6,775768 4,236465
X2 -149,95 150,9583 -3,00988 1,591549 -7,10952 -3,91954
X3 3,415228 -3,00988 1,541199 -0,76909 0,325241 0,665121
X4 -1,70527 1,591549 -0,76909 2,218969 -1,4854 -0,213
X5 6,775768 -7,10952 0,325241 -1,4854 2,943718 -0,81434
X6 4,236465 -3,91954 0,665121 -0,213 -0,81434 1,934647

· Berechnung der F-Kriterien, wobei die Diagonalelemente der Matrix sind, n=17, k = 6 (Tabelle 5).

Tabelle 5. F-Testwerte

F1 (X1) F2 (X2) F3 (X3) F4 (X4) F5 (X5) F6 (X6)
89,29396 89,79536 0,324071 0,729921 1,163903 0,559669

· Tatsächliche F-Testwerte werden mit dem Tabellenwert verglichen F-Tabelle = 3,21(FDIST(0,05;6;10)) mit n1= 6 und n2 = n - k – 1=17-6-1=10 Freiheitsgrade und Signifikanzniveau α=0,05, wobei k die Anzahl der Faktoren ist.

· Die Werte der F-Kriterien für die Faktoren X1 und X2 sind größer als der Tabellenwert, was auf das Vorhandensein einer Multikollinearität zwischen diesen Faktoren hinweist. Faktor X3 hat den geringsten Einfluss auf die Gesamtmultikollinearität der Faktoren.

3) Überprüfung auf Multikollinearität jedes Variablenpaares

· Lassen Sie uns die partiellen Korrelationskoeffizienten mithilfe der Formel berechnen, wobei die Elemente der Matrix sind (Tabelle 6).

Tabelle 6. Matrix der partiellen Korrelationskoeffizienten

X1 X2 X3 X4 X5 X6
X1
X2 0,996086
X3 -0,22453 0,197329
X4 0,093432 -0,08696 0,415882
X5 -0,32232 0,337259 -0,1527 0,581191
X6 -0,24859 0,229354 -0,38519 0,102801 0,341239

· Berechnung T-Kriterien gemäß der Formel (Tabelle 7)

n - Anzahl der Daten = 17

K - Anzahl der Faktoren = 6

Tabelle 7.t-Tests für partielle Korrelationskoeffizienten

X1 X2 X3 X4 X5 X6
X1
X2 35,6355
X3 -0,72862 0,636526
X4 0,296756 -0,27604 1,446126
X5 -1,07674 1,13288 -0,4886 2,258495
X6 -0,81158 0,745143 -1,31991 0,326817 1,147999

t Tabelle = STUDARSOBR(0,05,10) = 2,23

Die tatsächlichen Werte der t-Tests werden mit dem Tabellenwert mit Freiheitsgraden n-k-1 = 17-6-1=10 und Signifikanzniveau α=0,05 verglichen;

t21 > ttable

t54 > ttable

Aus den Tabellen 6 und 7 geht hervor, dass zwei Faktorpaare X1 und X2, X4 und X5 eine hohe statistisch signifikante partielle Korrelation aufweisen, also multikollinear sind. Um die Multikollinearität zu beseitigen, können Sie eine der Variablen des kollinearen Paares ausschließen. Im Paar X1 und X2 verlassen wir X2, im Paar X4 und X5 verlassen wir X5.

Als Ergebnis der Überprüfung des Farrar-Glouber-Tests bleiben also folgende Faktoren übrig: X2, X3, X5, X6.

Bei der Durchführung der Korrelationsanalyseverfahren empfiehlt es sich, die Teilkorrelationen der ausgewählten Faktoren mit dem Ergebnis zu betrachten Y.

Erstellen wir eine Matrix gepaarter Korrelationskoeffizienten basierend auf den Daten in Tabelle 8.

Tabelle 8. Produktleistungsdaten mit ausgewählten Faktoren X2, X3, X5, X6.

Beobachtung Nr. Y X 2 X 3 X 5 X 6
39,5 3,2
46,4 20,4
43,7 9,5
35,7 34,7
41,8 17,9
49,8 12,1
44,1 18,9
48,1 12,2
47,6 8,1
58,6 29,7
70,4 5,3
37,5 5,6
12,3
34,4 3,2
35,4
40,8 19,3
48,1 12,4

Die letzte Spalte von Tabelle 9 zeigt die t-Testwerte für die Y-Spalte.

Tabelle 9. Matrix der partiellen Korrelationskoeffizienten mit dem Ergebnis Y

Y X2 X3 X5 X6 t-Kriterium (t-Tabelle (0,05;11)= 2,200985
Y 0,996949 -0,25446 0,222946 0,067685
X2 0,996949 -0,26264 0,219914 0,041955 44,31676
X3 -0,25446 -0,26264 -0,07573 -0,28755 0,916144
X5 0,222946 0,219914 -0,07573 0,600899 -0,88721
X6 0,067685 0,041955 -0,28755 0,600899 1,645749

Aus Tabelle 9 geht hervor, dass die Variable Y weist eine hohe und zugleich statistisch signifikante Teilkorrelation mit auf Faktor X2.

Matrix der Paarkorrelationskoeffizienten

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

Die Knoten der Matrix enthalten gepaarte Korrelationskoeffizienten, die den engen Zusammenhang zwischen den Faktormerkmalen charakterisieren. Bei der Analyse dieser Koeffizienten stellen wir fest, dass der Einfluss des entsprechenden Faktormerkmals auf das resultierende Faktormerkmal umso größer ist, je größer ihr absoluter Wert ist. Die Analyse der resultierenden Matrix erfolgt in zwei Schritten:

1. Wenn in der ersten Spalte der Matrix Korrelationskoeffizienten vorhanden sind, für die /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Bei der Analyse gepaarter Korrelationskoeffizienten von Faktormerkmalen untereinander (r XiXj), die die Nähe ihrer Beziehung charakterisieren, ist es notwendig, ihre Unabhängigkeit voneinander zu beurteilen, da dies der Fall ist notwendige Bedingung für weiter Regressionsanalyse. Angesichts der Tatsache, dass es in den Wirtschaftswissenschaften keine absolut unabhängigen Merkmale gibt, ist es notwendig, nach Möglichkeit die unabhängigsten hervorzuheben. Faktormerkmale, die eng miteinander korrelieren, werden als multikollinear bezeichnet. Die Einbeziehung multikollinearer Merkmale in das Modell macht dies unmöglich Ökonomische Interpretation Regressionsmodell, da eine Änderung eines Faktors eine Änderung der damit verbundenen Faktoren mit sich bringt, was zu einem „Zusammenbruch“ des Modells als Ganzes führen kann.

Das Kriterium für die Multisicherheit von Faktoren lautet wie folgt:

/r XiXj / > 0,8

In der resultierenden Matrix gepaarter Korrelationskoeffizienten wird dieses Kriterium durch zwei Indikatoren erfüllt, die sich am Schnittpunkt der Zeilen befinden Und . Von jedem Paar dieser Merkmale muss eines im Modell belassen werden; es sollte einen größeren Einfluss auf das resultierende Merkmal haben. Dadurch werden Faktoren und aus dem Modell ausgeschlossen, d.h. die Wachstumsrate der Herstellungskosten der verkauften Waren und die Wachstumsrate des Verkaufsvolumens.

Daher führen wir die Faktoren X1 und X2 in das Regressionsmodell ein.

Als nächstes wird eine Regressionsanalyse durchgeführt (Service, Datenanalyse, Regression). Auch hier wird eine Tabelle mit Ausgangsdaten mit den Faktoren X1 und X2 erstellt. Regression wird im Allgemeinen verwendet, um den Einfluss der Werte unabhängiger Variablen (Faktoren) auf eine einzelne abhängige Variable zu analysieren und ermöglicht die Darstellung der Korrelation zwischen Merkmalen in Form einer funktionalen Abhängigkeit, die als Regressionsgleichung oder Korrelationsregression bezeichnet wird Modell.

Als Ergebnis der Regressionsanalyse erhalten wir die Ergebnisse der Berechnung der multivariaten Regression. Lassen Sie uns die erzielten Ergebnisse analysieren.

Alle Regressionskoeffizienten sind gemäß Student-t-Test signifikant. Der Mehrfachkorrelationskoeffizient R betrug 0,925; das Quadrat dieses Wertes (Bestimmtheitsmaß) bedeutet, dass im Durchschnitt 85,5 % der Variation des effektiven Merkmals durch die Variation der im Modell enthaltenen Faktormerkmale erklärt werden. Der Determinismuskoeffizient charakterisiert die enge Beziehung zwischen der Menge der Faktormerkmale und dem effektiven Indikator. Je näher der R-Quadrat-Wert bei 1 liegt, desto stärker ist der Zusammenhang. In unserem Fall zeigt ein Indikator von 0,855 die richtige Auswahl der Faktoren und das Vorhandensein einer Beziehung zwischen den Faktoren und dem effektiven Indikator an.

Das betrachtete Modell ist angemessen, da der berechnete Wert des Fisher-F-Tests seinen tabellarischen Wert deutlich übersteigt (F obs =52,401; F tab =1,53).

Das allgemeine Ergebnis der Korrelations- und Regressionsanalyse ist eine multiple Regressionsgleichung, die die Form hat:

Die resultierende Regressionsgleichung entspricht dem Ziel der Korrelations-Regressionsanalyse und ist ein lineares Modell der Abhängigkeit des Bilanzgewinns des Unternehmens von zwei Faktoren: dem Wachstumskoeffizienten der Arbeitsproduktivität und dem Koeffizienten des gewerblichen Eigentums.

Basierend auf dem erhaltenen Modell können wir den Schluss ziehen, dass bei einer Steigerung der Arbeitsproduktivität um 1 % gegenüber dem Niveau der Vorperiode die Höhe des Bilanzgewinns um 0,95 Prozentpunkte steigen wird; Eine Erhöhung des Koeffizienten des gewerblichen Eigentums um 1 % führt zu einer Erhöhung des effektiven Indikators um 27,9 Prozentpunkte. Folglich wird der dominierende Einfluss auf die Entwicklung des Bilanzgewinns durch die Wertsteigerung des Eigentums für Produktionszwecke (Erneuerung und Wachstum des Anlagevermögens des Unternehmens) ausgeübt.

Mithilfe eines multiplen Regressionsmodells wird eine multifaktorielle Prognose des effektiven Merkmals durchgeführt. Es sei bekannt, dass X1 = 3,0 und X3 = 0,7. Setzen wir die Werte der Faktormerkmale in das Modell ein, erhalten wir Control = 0,95*3,0 + 27,9*0,7 – 19,4 = 2,98. Mit einer Steigerung der Arbeitsproduktivität und der Modernisierung des Anlagevermögens im Unternehmen steigt somit der Bilanzgewinn im 1. Quartal 2005 im Verhältnis zu Vorperiode(IV. Quartal 2004) wird um 2,98 % steigen.

Um den Grad der Abhängigkeit zwischen mehreren Indikatoren zu bestimmen, werden mehrere Korrelationskoeffizienten verwendet. Anschließend werden sie in einer separaten Tabelle zusammengefasst, die Korrelationsmatrix genannt wird. Die Namen der Zeilen und Spalten einer solchen Matrix sind die Namen der Parameter, deren Abhängigkeit voneinander festgestellt wird. Am Schnittpunkt von Zeilen und Spalten liegen die entsprechenden Korrelationskoeffizienten. Lassen Sie uns herausfinden, wie Sie eine ähnliche Berechnung mit Excel-Tools durchführen können.

Es ist üblich, den Grad der Beziehung zwischen verschiedenen Indikatoren in Abhängigkeit vom Korrelationskoeffizienten wie folgt zu bestimmen:

  • 0 – 0,3 – keine Verbindung;
  • 0,3 – 0,5 – schwache Verbindung;
  • 0,5 – 0,7 – durchschnittliche Verbindung;
  • 0,7 – 0,9 – hoch;
  • 0,9 – 1 – sehr stark.

Wenn Korrelationskoeffizient negativ, das bedeutet, dass die Beziehung zwischen den Parametern umgekehrt ist.

Um eine Korrelationsmatrix in Excel zu erstellen, verwenden Sie ein im Paket enthaltenes Tool „Datenanalyse“. So heißt es - "Korrelation". Erfahren Sie, wie es zur Berechnung mehrerer Korrelationsmetriken verwendet werden kann.

Schritt 1: Aktivieren Sie das Analysepaket

Es muss gleich gesagt werden, dass es sich um das Standardpaket handelt „Datenanalyse“ deaktiviert. Bevor Sie mit dem Verfahren zur direkten Berechnung der Korrelationskoeffizienten fortfahren, müssen Sie es daher aktivieren. Leider weiß nicht jeder Benutzer, wie das geht. Daher werden wir uns mit diesem Thema befassen.


Nach der angegebenen Aktion das Toolpaket „Datenanalyse“ wird aktiviert.

Stufe 2: Koeffizientenberechnung

Jetzt können Sie direkt mit der Berechnung fortfahren Mehrfachkoeffizient Zusammenhänge. Lassen Sie uns am Beispiel der folgenden Tabelle der Indikatoren für Arbeitsproduktivität, Kapital-Arbeits-Verhältnis und Energie-Arbeits-Verhältnis bei verschiedenen Unternehmen den multiplen Korrelationskoeffizienten dieser Faktoren berechnen.


Stufe 3: Analyse des erzielten Ergebnisses

Lassen Sie uns nun herausfinden, wie wir das Ergebnis verstehen, das wir bei der Datenverarbeitung mit dem Tool erhalten haben "Korrelation" V Excel-Programm.

Wie wir der Tabelle entnehmen können, ist der Korrelationskoeffizient des Kapital-Arbeits-Verhältnisses (Spalte 2) und Energieverfügbarkeit ( Spalte 1) beträgt 0,92, was einem sehr starken Zusammenhang entspricht. Zwischen Arbeitsproduktivität ( Spalte 3) und Energieverfügbarkeit ( Spalte 1) Dieser Indikator beträgt 0,72, was einem hohen Grad an Abhängigkeit entspricht. Der Korrelationskoeffizient zwischen Arbeitsproduktivität ( Spalte 3) und Kapital-Arbeits-Verhältnis ( Spalte 2) beträgt 0,88, was ebenfalls einem hohen Grad an Abhängigkeit entspricht. Somit können wir sagen, dass der Zusammenhang zwischen allen untersuchten Faktoren ziemlich stark ist.

Wie Sie sehen können, das Paket „Datenanalyse“ in Excel ist ein sehr praktisches und relativ einfach zu verwendendes Tool zur Bestimmung des multiplen Korrelationskoeffizienten. Mit seiner Hilfe können Sie auch den üblichen Zusammenhang zwischen zwei Faktoren berechnen.

Wirtschaftsdaten stellen quantitative Merkmale beliebiger Wirtschaftsobjekte oder Prozesse dar. Sie entstehen unter dem Einfluss vieler Faktoren, von denen nicht alle verfügbar sind externe Steuerung. Es können unkontrollierbare Faktoren auftreten Zufallswerte aus einem bestimmten Wertesatz und bestimmen dadurch die Zufälligkeit der von ihnen definierten Daten. Eine der Hauptaufgaben der Wirtschaftsforschung ist Analyse von Abhängigkeiten zwischen Variablen.

Bei der Betrachtung von Abhängigkeiten zwischen Merkmalen müssen zunächst zwei Arten von Zusammenhängen unterschieden werden:

  • funktional - zeichnen sich durch eine vollständige Übereinstimmung zwischen der Änderung des Faktormerkmals und der Änderung des resultierenden Wertes aus: Jeder Wert eines Faktormerkmals entspricht ganz bestimmten Werten des resultierenden Merkmals. Diese Art von Beziehung wird als formelhafte Beziehung ausgedrückt. Die funktionale Abhängigkeit kann ein effektives Merkmal mit einem oder mehreren Faktormerkmalen verbinden. Also der Wert Löhne beim Zeitlohn kommt es auf die Anzahl der geleisteten Arbeitsstunden an;
  • korrelativ- Es besteht keine vollständige Übereinstimmung zwischen der Änderung zweier Vorzeichen; der Einfluss einzelner Faktoren zeigt sich nur im Durchschnitt bei Massenbeobachtung tatsächlicher Daten. Gleichzeitiger Einfluss auf das untersuchte Merkmal große Menge Verschiedene Faktoren führen dazu ein und derselbe Wert eines Faktormerkmals entspricht einer ganzen Werteverteilung des resultierenden Merkmals, da im Einzelfall andere Faktoreigenschaften die Stärke und Richtung ihrer Wirkung verändern können.

Es ist zu beachten, dass bei einem funktionalen Zusammenhang zwischen den Merkmalen eine genaue Bestimmung möglich ist, wenn man den Wert des Faktormerkmals kennt der Wert des resultierenden Vorzeichens. Nur bei Vorliegen einer Korrelationsabhängigkeit Trend der Änderung des resultierenden Merkmals wenn sich der Wert des Faktormerkmals ändert.

Bei der Untersuchung der Beziehungen zwischen Zeichen werden diese nach Richtung, Form und Anzahl der Faktoren klassifiziert:

  • in die Richtung Verbindungen sind unterteilt in gerade Und umkehren. Bei einem direkten Zusammenhang stimmt die Änderungsrichtung des resultierenden Merkmals mit der Änderungsrichtung des Faktormerkmals überein. Bei der Rückkopplung ist die Änderungsrichtung der resultierenden Kennlinie entgegengesetzt zur Änderungsrichtung der Faktorkennlinie. Je höher beispielsweise die Qualifikation des Arbeitnehmers ist, desto höher ist die Produktivität seiner Arbeit (direkte Beziehung). Je höher die Arbeitsproduktivität, desto niedriger sind die Kosten pro Produktionseinheit ( Rückmeldung);
  • je nach Formular(Art der Funktion) Verbindungen werden unterteilt in linear(gerade Linie) und nichtlinear(krummlinig). Ein linearer Zusammenhang wird durch eine Gerade dargestellt, ein nichtlinearer Zusammenhang durch eine Kurve (Parabel, Hyperbel etc.). In einer linearen Beziehung kommt es mit einer Zunahme des Wertes eines Faktormerkmals zu einer gleichmäßigen Zunahme (Abnahme) des Wertes des resultierenden Merkmals;
  • durch die Anzahl der Faktoren, die auf die effektive Kennlinie einwirken, Verbindungen sind unterteilt in Einfaktor(gepaart) und multifaktoriell.

Die Untersuchung der Abhängigkeit der Merkmalsvariation von Umweltbedingungen ist Inhalt der Korrelationstheorie.

Bei der Korrelationsanalyse wird der gesamte Datensatz als eine Reihe von Variablen (Faktoren) betrachtet, die jeweils Folgendes enthalten N Beobachtungen.

Bei der Untersuchung der Beziehung zwischen zwei Faktoren werden diese üblicherweise bezeichnet X=(x S x 2,...,x n) Und Y= (y ( , y 2 ,..., y und).

Kovarianz - das ist statistisch Maß der Interaktion zwei Variablen. Zum Beispiel ein positiver Wert der Kovarianz der Renditen von zwei Wertpapiere zeigt, dass sich die Renditen dieser Wertpapiere tendenziell in eine Richtung ändern.

Kovarianz zwischen zwei Variablen X Und Y wie folgt berechnet:

Wo sind die tatsächlichen Werte der Variablen?

X Und G;

Wenn Zufallsvariablen Chi Y Unabhängig davon ist die theoretische Kovarianz Null.

Die Kovarianz hängt von den Einheiten ab, in denen die Variablen gemessen werden Hihi Y, es handelt sich um eine nicht standardisierte Größe. Daher messen Verbindungsstärke Zwischen zwei Variablen wird eine weitere Statistik namens Korrelationskoeffizient verwendet.

Für zwei Variablen X Und Korrelationskoeffizient des Y-Paares

ist wie folgt definiert:

Wo SSy- Schätzungen von Mengenvarianzen Hee Y. Diese Schätzungen charakterisieren Grad der Streuung Werte x (, x 2, ..., x n (y 1, y 2, y n) ungefähr Ihrem Durchschnitt x(y bzw.) bzw Variabilität(Variabilität) dieser Variablen über eine Reihe von Beobachtungen.

Streuung(Varianzschätzung) wird durch die Formel bestimmt

IN allgemeiner Fall Um eine unverzerrte Schätzung der Varianz zu erhalten, sollte die Summe der Quadrate durch die Anzahl der Freiheitsgrade der Schätzung geteilt werden (p-r), Wo P - Stichprobengröße, R - Anzahl der der Probe überlagerten Verbindungen. Da die Stichprobe bereits einmal zur Mittelwertermittlung herangezogen wurde X, dann ist die Anzahl der überlagerten Verbindungen in diesem Fall gleich eins (p = 1) und die Anzahl der Freiheitsgrade der Schätzung (d. h. die Anzahl unabhängiger Stichprobenelemente) ist gleich (P - 1).

Es ist natürlicher, den Grad der Streuung von Variablenwerten in denselben Einheiten zu messen, in denen die Variable selbst gemessen wird. Dieses Problem wird durch einen Indikator namens gelöst Standardabweichung (Standardabweichung) oder Standardfehler Variable X(Variable J) und durch die Relation bestimmt

Die Terme im Zähler der Formel (3.2.1) drücken die Wechselwirkung zweier Variablen aus und bestimmen das Vorzeichen der Korrelation (positiv oder negativ). Wenn beispielsweise eine starke positive Beziehung zwischen Variablen besteht (ein Anstieg einer Variablen, während die andere zunimmt), ist jeder Term eine positive Zahl. Wenn zwischen Variablen eine starke negative Beziehung besteht, sind alle Terme im Zähler negative Zahlen, was zu einem negativen Korrelationswert führt.

Der Nenner des Ausdrucks für den paarweisen Korrelationskoeffizienten [siehe Formel (3.2.2)] normalisiert einfach den Zähler so, dass der Korrelationskoeffizient eine leicht interpretierbare Zahl ohne Dimension ist und Werte von -1 bis +1 annimmt.

Der Zähler des Ausdrucks für den Korrelationskoeffizienten, der aufgrund der ungewöhnlichen Maßeinheiten schwer zu interpretieren ist, lautet Kovarianz HiU. Obwohl er manchmal als eigenständiges Merkmal verwendet wird (z. B. in der Finanztheorie zur Beschreibung der gemeinsamen Änderung der Aktienkurse an zwei Börsen), ist es bequemer, den Korrelationskoeffizienten zu verwenden. Korrelation und Kovarianz stellen im Wesentlichen die gleichen Informationen dar, aber die Korrelation stellt diese Informationen in einer nützlicheren Form dar.

Für qualitative Beurteilung Für den Korrelationskoeffizienten werden verschiedene Skalen verwendet, am häufigsten die Chaddock-Skala. Abhängig vom Wert des Korrelationskoeffizienten kann die Beziehung eine der folgenden Bewertungen haben:

  • 0,1-0,3 - schwach;
  • 0,3–0,5 – spürbar;
  • 0,5–0,7 – mäßig;
  • 0,7–0,9 – hoch;
  • 0,9-1,0 - sehr hoch.

Die Beurteilung des Grades der Nähe eines Zusammenhangs anhand des Korrelationskoeffizienten erfolgt in der Regel auf der Grundlage mehr oder weniger begrenzter Informationen über das untersuchte Phänomen. In diesem Zusammenhang besteht die Notwendigkeit, die Wesentlichkeit zu beurteilen linearer Koeffizient Korrelation, die es ermöglicht, Schlussfolgerungen basierend auf den Ergebnissen der Stichprobe auf die Gesamtbevölkerung auszudehnen.

Die Beurteilung der Signifikanz des Korrelationskoeffizienten für kleine Stichprobengrößen erfolgt mithilfe des Student-7-Tests. In diesem Fall wird der tatsächliche (beobachtete) Wert dieses Kriteriums durch die Formel bestimmt

Der nach dieser Formel berechnete Wert / obs wird mit dem kritischen Wert des 7-Kriteriums verglichen, der unter Berücksichtigung des angegebenen Signifikanzniveaus oc und der Zahl aus der Tabelle der Schüler- /-Testwerte (siehe Anlage 2) entnommen wird von Freiheitsgraden (P - 2).

Wenn 7 obs > 7 tabs, dann wird der resultierende Wert des Korrelationskoeffizienten als signifikant angesehen (d. h. die Nullhypothese, die besagt, dass der Korrelationskoeffizient gleich Null ist, wird abgelehnt). Daraus lässt sich schließen, dass zwischen den untersuchten Variablen ein enger statistischer Zusammenhang besteht.

Wenn der Wert g y x nahe Null ist die Beziehung zwischen den Variablen schwach. Wenn die Korrelation zwischen Zufallsvariablen:

  • positiv, wenn eine Zufallsvariable zunimmt, tendiert die andere dazu, im Durchschnitt zuzunehmen;
  • negativ, dann tendiert die andere dazu, im Durchschnitt zu sinken, wenn eine Zufallsvariable zunimmt. Ein praktisches grafisches Tool zur Analyse gepaarter Daten ist Streudiagramm, das jede Beobachtung in einem zweidimensionalen Raum darstellt, der zwei Faktoren entspricht. Man spricht auch von einem Streudiagramm, das eine Menge von Werten zweier Merkmale darstellt Korrelationsfeld. Jeder Punkt in diesem Diagramm hat die Koordinaten x (. und y g Mit zunehmender Stärke der linearen Beziehung liegen die Punkte im Diagramm näher an der Geraden und dem Betrag G wird der Einheit näher kommen.

Paarweise Korrelationskoeffizienten werden verwendet, um die Stärke linearer Beziehungen zwischen verschiedenen Merkmalspaaren aus einem Satz von Merkmalen zu messen. Für viele Features bekommt man Matrix der Paarkorrelationskoeffizienten.

Lassen Sie den gesamten Datensatz aus einer Variablen bestehen Y = =(y p Jahr 2, ..., y p) Und T Variablen (Faktoren) X, Jedes davon enthält N Beobachtungen. Variable Werte Y Und X, Die in der beobachteten Population enthaltenen Substanzen werden in einer Tabelle erfasst (Tabelle 3.2.1).

Tabelle 3.2.1

Variable

Nummer

Beobachtungen

X TZ

X tp

Berechnen Sie anhand der in dieser Tabelle enthaltenen Daten Matrix der Paarkorrelationskoeffizienten R, es ist symmetrisch zur Hauptdiagonale:


Die Analyse der Matrix der Paarkorrelationskoeffizienten wird bei der Erstellung mehrerer Regressionsmodelle verwendet.

Eine Korrelationsmatrix kann die Abhängigkeiten zwischen Größen nicht vollständig beschreiben. In dieser Hinsicht in mehrdimensionaler Hinsicht Korrelationsanalyse Es werden zwei Probleme betrachtet:

  • 1. Bestimmung der engen Beziehung einer Zufallsvariablen mit der Gesamtheit der anderen in die Analyse einbezogenen Variablen.
  • 2. Bestimmung der Nähe des Zusammenhangs zwischen zwei Größen unter Festlegung oder Ausschluss des Einflusses anderer Größen.

Diese Probleme werden mithilfe multipler bzw. partieller Korrelationskoeffizienten gelöst.

Die Lösung des ersten Problems (Bestimmung der engen Beziehung einer Zufallsvariablen mit der Gesamtheit der anderen in die Analyse einbezogenen Variablen) erfolgt mit Probe mehrerer Korrelationskoeffizienten nach der Formel

Wo R- R[cm. Formel (3.2.6)]; Rjj- algebraisches Komplement eines Elements derselben Matrix R.

Quadratischer multipler Korrelationskoeffizient SCHj 2 J _J J+l m normalerweise aufgerufen Probe mit mehreren Bestimmtheitsmaßen; Es zeigt den Anteil der Variation (zufällige Streuung) des untersuchten Werts Xj erklärt die Variation des Restes Zufallsvariablen X ( , X 2 ,..., X t.

Die Koeffizienten der Mehrfachkorrelation und -bestimmung sind positive Größen und nehmen Werte im Bereich von 0 bis 1 an. Bei der Annäherung an den Koeffizienten R 2 zur Einheit können wir schließen, dass die Beziehung zwischen Zufallsvariablen eng ist, aber nicht über ihre Richtung. Der Mehrfachkorrelationskoeffizient kann sich nur erhöhen, wenn zusätzliche Variablen in das Modell einbezogen werden, und erhöht sich nicht, wenn eines der vorhandenen Merkmale ausgeschlossen wird.

Die Überprüfung der Signifikanz des Bestimmtheitsmaßes erfolgt durch Vergleich des berechneten Wertes des Fisher-/'-Kriteriums

mit tabellarisch F rabl. Der tabellarische Wert des Kriteriums (siehe Anhang 1) wird durch das gegebene Signifikanzniveau a und die Freiheitsgrade bestimmt v l = mnv 2 = n-m-l. Koeffizient R 2 ist signifikant von Null verschieden, wenn die Ungleichung gilt

Wenn die Zufallsvariablen berücksichtigt werden miteinander korrelieren dann wird der Wert des Paarkorrelationskoeffizienten teilweise durch den Einfluss anderer Größen beeinflusst. In diesem Zusammenhang besteht die Notwendigkeit, die teilweise Korrelation zwischen Größen zu untersuchen und dabei den Einfluss anderer Zufallsvariablen (einer oder mehrerer) auszuschließen.

Beispiel für einen partiellen Korrelationskoeffizienten durch die Formel bestimmt

Wo R Jk , Rjj, R kk - algebraische Ergänzungen zu den entsprechenden Matrixelementen R[cm. Formel (3.2.6)].

Der partielle Korrelationskoeffizient sowie Paarkoeffizient Die Korrelation variiert zwischen -1 und +1.

Ausdruck (3.2.9) unterliegt t = 3 wird aussehen

Der Koeffizient r 12(3) heißt Korrelationskoeffizient zwischen x ( Und x 2 für festes x y Er ist symmetrisch bezüglich der Primärindizes 1, 2. Sein Sekundärindex 3 bezieht sich auf eine feste Variable.

Beispiel 3.2.1. Berechnung der Paarquoten,

Mehrfach- und Teilkorrelation.

In der Tabelle 3.2.2 gibt Auskunft über Umsatzvolumen und Werbekosten eines Unternehmens sowie den Konsumausgabenindex für mehrere laufende Jahre.

  • 1. Erstellen Sie ein Streudiagramm (Korrelationsfeld) für die Variablen „Umsatz“ und „Konsumausgabenindex“.
  • 2. Bestimmen Sie den Grad des Einflusses des Konsumausgabenindex auf das Verkaufsvolumen (berechnen Sie den Paarkorrelationskoeffizienten).
  • 3. Bewerten Sie die Signifikanz des berechneten Paarkorrelationskoeffizienten.
  • 4. Konstruieren Sie eine Matrix paarweiser Korrelationskoeffizienten für drei Variablen.
  • 5. Finden Sie eine Schätzung des multiplen Korrelationskoeffizienten.
  • 6. Finden Sie Schätzungen partieller Korrelationskoeffizienten.

1. In unserem Beispiel hat das Streudiagramm die in Abb. gezeigte Form. 3.2.1. Die Ausdehnung der Punktwolke im Streudiagramm entlang der geneigten Linie lässt die Annahme zu, dass eine objektive Tendenz zu einem direkten linearen Zusammenhang zwischen den Werten der Variablen besteht X 2 Y(Umsatzvolumen).

Reis. 3.2.1.

2. Zwischenberechnungen bei der Berechnung des Korrelationskoeffizienten zwischen Variablen X 2(Verbraucherausgabenindex) und Y(Verkaufsvolumen) sind in der Tabelle angegeben. 3.2.3.

Durchschnittswerte Zufallsvariablen X 2 Und Y, welches die einfachsten Indikatoren sind, die die Folgen jCj charakterisieren, x 2,..., x 16 und y v y 2 ,..., y 16, berechnen Sie mit den folgenden Formeln:


Verkaufsvolumen Y, Tausend Rubel.

Index

verbrauchen

Telsky

Kosten

Verkaufsvolumen Y, Tausend Rubel.

Index

verbrauchen

Telsky

Kosten

Tabelle 3.2.3

l:, - X

(UND - U)(x, - x)

(x, - x) 2

(y, - - y) 2

Streuung charakterisiert den Grad der Wertestreuung x v x 2,x:

Betrachten wir nun die Lösung zu Beispiel 3.2.1 in Excel.

Um die Korrelation mit Excel zu berechnen, können Sie die Funktion verwenden =correl(), das die Adressen von zwei Zahlenspalten angibt, wie in Abb. 3.2.2. Die Antwort wird in D8 platziert und beträgt 0,816.

Reis. 3.2.2.

(Hinweis: Funktionsargumente Korrelationen müssen Zahlen oder Namen, Arrays oder Referenzen sein, die Zahlen enthalten. Wenn das Argument, bei dem es sich um ein Array oder eine Referenz handelt, Text, boolesche Werte oder leere Zellen enthält, werden diese Werte ignoriert; Allerdings werden Zellen gezählt, die Nullwerte enthalten.

Wenn Array! und array2 eine unterschiedliche Anzahl von Datenpunkten haben, dann die Funktion correl gibt den Fehlerwert #n/a zurück.

Wenn Array1 oder Array2 leer ist oder wenn o ( Standardabweichung) ihre Werte gleich Null sind, dann ist die Funktion correl gibt den Fehlerwert #div/0! zurück.)

Der kritische Wert der Student-t-Statistik kann auch mithilfe der Funktion ermittelt werden Studienverteilung von 1 Excel-Paket. Als Funktionsargumente müssen Sie die Anzahl der Freiheitsgrade angeben N- 2 (in unserem Beispiel 16 - 2= 14) und Signifikanzniveau a (in unserem Beispiel a = 0,1) (Abb. 3.2.3). Wenn tatsächlicher Wert/-statistics Modulo ist größer kritisch, dann ist der Korrelationskoeffizient mit der Wahrscheinlichkeit (1 - a) deutlich von Null verschieden.


Reis. 3.2.3. Der kritische Wert der /-Statistik beträgt 1,7613

Excel enthält eine Reihe von Datenanalysetools (das sogenannte Analysepaket), die zur Lösung verschiedener statistischer Probleme entwickelt wurden. Berechnung der Matrix der Paarkorrelationskoeffizienten R Sie sollten das Korrelationstool (Abb. 3.2.4) verwenden und die Analyseparameter im entsprechenden Dialogfeld festlegen. Die Antwort wird auf einem neuen Arbeitsblatt platziert (Abbildung 3.2.5).

1 In Excel 2010 der Name der Funktion studrasprobr wurde in stu- geändert

DENT.OBR.2X.

Reis. 3.2.4.


Reis. 3.2.5.

  • Als Begründer der Korrelationstheorie gelten die englischen Statistiker F. Galton (1822-1911) und K. Pearson (1857-1936). Der Begriff „Korrelation“ ist der Naturwissenschaft entlehnt und bedeutet „Korrelation, Korrespondenz“. Die Idee der Korrelation als Interdependenz zwischen Zufallsvariablen liegt der mathematisch-statistischen Korrelationstheorie zugrunde.

Daten für 2011 werden für die Gebiete des Südlichen Föderationskreises der Russischen Föderation bereitgestellt

Gebiete des Bundesdistrikts

Bruttoregionalprodukt, Milliarden Rubel, Y

Investitionen in das Anlagevermögen, Milliarden Rubel, X1

1. Rep. Adygea

2. Rep. Dagestan

3. Rep. Inguschetien

4. Kabardino-Balkarische Republik

5. Rep. Kalmückien

6. Republik Karatschai-Tscherkess

7. Rep. Nordossetien- Alanya

8. Region Krasnodar)

9. Region Stawropol

10. Region Astrachan.

11. Wolgograder Gebiet.

12. Gebiet Rostow.

  • 1. Berechnen Sie die Matrix der Paarkorrelationskoeffizienten; Bewerten Sie die statistische Signifikanz der Korrelationskoeffizienten.
  • 2. Konstruieren Sie ein Korrelationsfeld zwischen dem effektiven Merkmal und dem Faktor, der am engsten damit zusammenhängt.
  • 3. Berechnen Sie die Parameter der linearen Paarregression für jeden Faktor X.
  • 4. Bewerten Sie die Qualität jedes Modells anhand des Bestimmtheitsmaßes, des durchschnittlichen Näherungsfehlers und des Fisher-F-Tests. Wählen Sie das beste Modell.

wird 80 % seines Maximalwerts betragen. Grafisch darstellen: Ist- und Modellwerte, Prognosepunkte.

  • 6. Erstellen Sie mithilfe der schrittweisen multiplen Regression (Ausschlussmethode oder Einschlussmethode) ein Modell der Wohnungspreisbildung aufgrund wesentlicher Faktoren. Geben Sie eine wirtschaftliche Interpretation der Regressionsmodellkoeffizienten.
  • 7. Bewerten Sie die Qualität des konstruierten Modells. Hat sich die Qualität des Modells im Vergleich zum Einfaktormodell verbessert? Bewerten Sie den Einfluss wesentlicher Faktoren auf das Ergebnis anhand der Elastizitätskoeffizienten in - und -? Koeffizienten

Bei der Lösung dieses Problems werden Berechnungen und die Erstellung von Grafiken und Diagrammen mithilfe der Einstellung durchgeführt Excel-Analyse Daten.

1. Berechnen Sie die Matrix der Paarkorrelationskoeffizienten und bewerten Sie die statistische Signifikanz der Korrelationskoeffizienten

Geben Sie im Dialogfeld „Korrelation“ im Feld „Eingabeintervall“ den Zellbereich ein, der die Quelldaten enthält. Da wir auch die Spaltenüberschriften ausgewählt haben, aktivieren wir in der ersten Zeile das Kontrollkästchen Beschriftungen.

Wir haben folgende Ergebnisse erhalten:

Tabelle 1.1 Matrix der Paarkorrelationskoeffizienten

Die Analyse der Matrix der paarweisen Korrelationskoeffizienten zeigt, dass die abhängige Variable Y, also das Bruttoregionalprodukt, eine engere Beziehung zu X1 (Investitionen in Anlagekapital) hat. Der Korrelationskoeffizient beträgt 0,936. Das bedeutet, dass die abhängige Variable Y (Bruttoregionalprodukt) zu 93,6 % vom Indikator X1 (Anlageinvestitionen) abhängt.

Die statistische Signifikanz der Korrelationskoeffizienten wird mithilfe des Student-t-Tests bestimmt. Wir vergleichen den Tabellenwert mit den berechneten Werten.

Berechnen wir den Tabellenwert mit der Funktion STUDISCOVER.

t Tisch = 0,129 at Konfidenzwahrscheinlichkeit gleich 0,9 und Freiheitsgrade (n-2).

Faktor X1 ist statistisch signifikant.

2. Erstellen wir ein Korrelationsfeld zwischen dem effektiven Attribut (Bruttoregionalprodukt) und dem damit am engsten verbundenen Faktor (Investition in Anlagekapital).

Dazu verwenden wir das Excel-Streudiagramm-Tool.

Als Ergebnis erhalten wir das Korrelationsfeld des Preises des Bruttoregionalprodukts, Milliarden Rubel. und Investitionen in das Anlagevermögen, Milliarden Rubel. (Abbildung 1.1.).

Abbildung 1.1

3. Berechnen Sie die Parameter der linearen Paarregression für jeden Faktor X

Um die Parameter der linearen paarweisen Regression zu berechnen, verwenden wir das Regressionstool, das in der Einstellung „Datenanalyse“ enthalten ist.

Geben Sie im Dialogfeld „Regression“ im Feld „Eingabeintervall Y“ die Adresse des Zellbereichs ein, den die abhängige Variable darstellt. Auf dem Feld

Geben Sie im Eingabeintervall X die Adresse des Bereichs ein, der die Werte der unabhängigen Variablen enthält. Berechnen wir die Parameter der gepaarten Regression für Faktor X.

Für X1 haben wir die folgenden in Tabelle 1.2 dargestellten Daten erhalten:

Tabelle 1.2

Die Regressionsgleichung für die Abhängigkeit des Preises des Bruttoregionalprodukts von den Investitionen in Anlagekapital hat die Form:

4. Lassen Sie uns die Qualität jedes Modells anhand des Bestimmtheitsmaßes, des durchschnittlichen Näherungsfehlers und des Fisher-F-Tests bewerten. Lassen Sie uns herausfinden, welches Modell das beste ist.

Das Bestimmtheitsmaß, den durchschnittlichen Näherungsfehler, haben wir als Ergebnis der in Absatz 3 durchgeführten Berechnungen erhalten. Die erhaltenen Daten sind in den folgenden Tabellen dargestellt:

X1-Daten:

Tabelle 1.3a

Tabelle 1.4b

A) Das Bestimmtheitsmaß bestimmt, welcher Anteil der Variation des Merkmals Y im Modell berücksichtigt wird und auf den Einfluss des Faktors X zurückzuführen ist. Je größer der Wert des Bestimmtheitsmaßes, desto enger ist die Beziehung zwischen den Eigenschaften im Konstruierten mathematisches Modell.

Excel bezeichnet R-Quadrat.

Basierend auf diesem Kriterium ist das am besten geeignete Modell die Regressionsgleichung der Abhängigkeit des Preises des Bruttoregionalprodukts von Investitionen in Anlagekapital (X1).

B) Wir berechnen den durchschnittlichen Approximationsfehler nach der Formel:

wobei der Zähler die Summe der Quadrate der Abweichung der berechneten Werte von den tatsächlichen ist. In Tabellen befindet es sich in der Spalte SS, der Zeile „Remaining“.

Den durchschnittlichen Preis einer Wohnung berechnen wir in Excel mit der Funktion DURCHSCHNITT. = 24,18182 Milliarden Rubel.

Bei wirtschaftlichen Berechnungen gilt das Modell als ausreichend genau, wenn durchschnittlicher Fehler Wenn die Näherung weniger als 5 % beträgt, gilt das Modell als akzeptabel, wenn der durchschnittliche Näherungsfehler weniger als 15 % beträgt.

Nach diesem Kriterium ist das mathematische Modell für die Regressionsgleichung der Abhängigkeit des Preises des Bruttoregionalprodukts von Investitionen in Anlagekapital (X1) am geeignetsten.

C) Mit dem F-Test wird die Signifikanz des Regressionsmodells getestet. Dazu werden auch die kritischen (tabellarischen) Werte des Fisher-F-Tests verglichen.

Die berechneten Werte sind in den Tabellen 1.4b angegeben (gekennzeichnet durch den Buchstaben F).

Wir berechnen den Tabellenwert des Fisher-F-Tests in Excel mithilfe der FDIST-Funktion. Nehmen wir eine Wahrscheinlichkeit von 0,05. Erhalten: = 4,75

Die berechneten Werte des Fisher-F-Tests für jeden Faktor sind mit dem Tabellenwert vergleichbar:

71,02 > = 4,75 Das Modell ist gemäß diesem Kriterium angemessen.

Nachdem wir die Daten nach allen drei Kriterien analysiert haben, können wir zu dem Schluss kommen, dass das beste mathematische Modell für den Bruttoregionalproduktfaktor ist, der durch die lineare Gleichung beschrieben wird

5. Für das gewählte Modell der Abhängigkeit des Preises vom Bruttoregionalprodukt

Wir werden den Durchschnittswert des Indikators auf einem Signifikanzniveau vorhersagen, wenn der vorhergesagte Wert des Faktors 80 % seines Maximalwerts beträgt. Stellen wir es grafisch dar: Ist- und Modellwerte, Prognosepunkte.

Berechnen wir den vorhergesagten Wert von X gemäß der Bedingung. Er beträgt 80 % des Maximalwerts.

Berechnen wir X max in Excel mit der MAX-Funktion.

0,8 *52,8 = 42,24

Um prädiktive Schätzungen der abhängigen Variablen zu erhalten, setzen wir den erhaltenen Wert der unabhängigen Variablen in die lineare Gleichung ein:

5,07+2,14*42,24 = 304,55 Milliarden Rubel.

Bestimmen wir das Konfidenzintervall der Prognose, das die folgenden Grenzen haben wird:

Berechnen Konfidenzintervall Für den vorhergesagten Wert berechnen wir die Abweichung von der Regressionsgeraden.

Für ein gepaartes Regressionsmodell wird der Abweichungswert berechnet:

diese. Bedeutung Standardfehler aus Tabelle 1.5a.

(Da die Anzahl der Freiheitsgrade gleich eins ist, ist der Nenner gleich n-2). Korrelationspaar-Regressionsprognose

Um den Koeffizienten zu berechnen, verwenden wir Excel-Funktion STUDISPOSIB, nehmen wir die Wahrscheinlichkeit gleich 0,1, die Anzahl der Freiheitsgrade beträgt 38.

Wir berechnen den Wert mit Excel und erhalten 12294.


Bestimmen wir die obere und untere Grenze des Intervalls.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Somit liegt der prognostizierte Wert = 304,55 Tausend Dollar zwischen der Untergrenze von 277,078 Tausend Dollar. und eine Obergrenze von 332,022 Milliarden. Reiben.

Ist- und Modellwerte sowie Prognosepunkte werden in Abbildung 1.2 grafisch dargestellt.


Abbildung 1.2

6. Mithilfe der schrittweisen multiplen Regression (Eliminationsmethode) erstellen wir ein Modell zur Bildung des Preises des Bruttoregionalprodukts aufgrund wesentlicher Faktoren

Um eine multiple Regression zu erstellen, verwenden wir die Regressionsfunktion von Excel, einschließlich aller Faktoren. Als Ergebnis erhalten wir die Ergebnistabellen, aus denen wir den Student-t-Test benötigen.

Tabelle 1.8a

Tabelle 1.8b

Tabelle 1.8c.

Wir erhalten ein Modell wie:

Seit< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Wählen wir den kleinsten Absolutwert des Student-t-Tests, er beträgt 8,427, vergleichen ihn mit dem Tabellenwert, den wir in Excel berechnen, nehmen das Signifikanzniveau gleich 0,10 und die Anzahl der Freiheitsgrade n-m-1= 12-4=8: =1,8595

Da 8,427 > 1,8595, sollte das Modell als ausreichend angesehen werden.

7. Um den signifikanten Faktor des resultierenden mathematischen Modells zu beurteilen, berechnen wir die Elastizitätskoeffizienten und -koeffizienten

Der Elastizitätskoeffizient gibt an, um wie viel Prozent sich das effektive Attribut ändert, wenn sich das Faktorattribut um 1 % ändert:

E X4 = 2,137 * (10,69/24,182) = 0,94 %

Das heißt, bei einer Erhöhung der Anlageinvestitionen um 1 % steigen die Kosten im Durchschnitt um 0,94 %.

Der Koeffizient gibt an, um welchen Teil der Standardabweichung sich der Durchschnittswert der abhängigen Variablen ändert, wenn sich die unabhängige Variable um eine Standardabweichung ändert.

2,137* (14.736/33,632) = 0,936.

Die Daten zur Standardabweichung stammen aus Tabellen, die mit dem Tool „Deskriptive Statistik“ erstellt wurden.

Tabelle 1.11 Deskriptive Statistik (Y)

Tabelle 1.12 Deskriptive Statistik (X4)

Der Koeffizient bestimmt den Anteil des Einflusses des Faktors am Gesamteinfluss aller Faktoren:

Um Paarkorrelationskoeffizienten zu berechnen, berechnen wir die Matrix der Paarkorrelationskoeffizienten in Excel mithilfe des Korrelationstools der Datenanalyseeinstellungen.

Tabelle 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Fazit: Aus den erhaltenen Berechnungen können wir schließen, dass das effektive Attribut Y (Bruttoregionalprodukt) eine große Abhängigkeit vom Faktor X1 (Investition in Anlagekapital) aufweist (um 100 %).

Referenzen

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ökonometrie. Anfängerkurs. Anleitung. 2. Aufl. - M.: Delo, 1998. - S. 69 - 74.
  • 2. Workshop zur Ökonometrie: Lehrbuch / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko et al. 2002. - S. 49 - 105.
  • 3. Dougherty K. Einführung in die Ökonometrie: Transl. aus dem Englischen - M.: INFRA-M, 1999. - XIV, S. 262 - 285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Angewandte Mathematik und Grundlagen der Ökonometrie. -1998., S. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Ökonometrie. -2007. von 175-251.




Fehler: Inhalt geschützt!!