Erstellen einer Regressionsgleichung auf einer standardisierten Skala. Große Enzyklopädie über Öl und Gas

27.09.2019 | Dokumentation

Der Beta-Koeffizient von 0,074 (Tabelle 3.2.1) zeigt, dass wenn der reale Lohn sich um den Wert seiner Standardabweichung (σx1) ändert, dann ändert sich der Koeffizient des natürlichen Bevölkerungswachstums um durchschnittlich 0,074 σy. Der Beta-Koeffizient von 0,02 zeigt, dass sich die natürliche Bevölkerungswachstumsrate um durchschnittlich 0,02 σy ändert, wenn sich die Gesamtheiratsrate um den Wert ihrer Standardabweichung (um σx2) ändert. Ebenso führt eine Änderung der Anzahl der Straftaten pro 1000 Einwohner um den Wert ihrer Standardabweichung (um σх3) zu einer Änderung des effektiven Merkmals um durchschnittlich 0,366 σy und zu einer Änderung der Eingabe von Quadratmetern Wohnfläche Räumlichkeiten pro Person und Jahr um den Wert seiner Standardabweichung (um σх4) führt zu einer Änderung des effektiven Merkmals um durchschnittlich 1,32σу.

Der Elastizitätskoeffizient gibt an, um wie viel Prozent sich y im Durchschnitt bei einer Änderung des Vorzeichenfaktors um 1 % ändert. Aus der Analyse der Dynamikreihe ist bekannt, dass der Wert von 1 % des Anstiegs des effektiven Indikators negativ ist, da in allen Bevölkerungseinheiten ein natürlicher Bevölkerungsrückgang zu verzeichnen ist. Daher bedeutet die Erhöhung tatsächlich eine Verringerung des Verlusts. Die negativen Elastizitätskoeffizienten spiegeln in diesem Fall also die Tatsache wider, dass bei einer Erhöhung jedes Faktormerkmals um 1 % der natürliche Abnutzungskoeffizient um die entsprechende Prozentzahl abnimmt. Bei einem Anstieg der Reallöhne um 1 % wird die natürliche Fluktuationsrate bei einem Anstieg um 0,219 % sinken Gesamtkoeffizient Heiratsrate um 1 % – wird um 0,156 % sinken. Ein Anstieg der Zahl der Straftaten pro 1.000 Einwohner um 1 % ist durch eine Verringerung des natürlichen Bevölkerungsrückgangs um 0,564 gekennzeichnet. Dies bedeutet natürlich nicht, dass durch eine Erhöhung der Kriminalität eine Verbesserung der demografischen Situation möglich ist. Die erhaltenen Ergebnisse deuten darauf hin, dass die mehr Leute bleibt pro 1.000 Einwohner, entsprechend mehr Straftaten pro Tausend. Erhöhung der Input-Quadratmeter. Wohnraum pro Person und Jahr um 1 % führt zu einer Reduzierung des natürlichen Verlusts um 0,482 %

Die Analyse der Elastizitätskoeffizienten und Betakoeffizienten zeigt dies größten Einfluss Der Koeffizient des natürlichen Bevölkerungswachstums wird durch den Faktor der Inbetriebnahme von Quadratmetern Wohnraum pro Kopf beeinflusst, da er entspricht Höchster Wert Beta - Koeffizient (1,32). Dies bedeutet jedoch nicht, dass die größten Chancen zur Änderung des natürlichen Bevölkerungswachstumskoeffizienten mit einer Änderung dieses der betrachteten Faktoren verbunden sind. Das erzielte Ergebnis spiegelt die Tatsache wider, dass die Nachfrage auf dem Wohnungsmarkt dem Angebot entspricht, d. h. je größer das natürliche Bevölkerungswachstum ist, desto größer ist der Bedarf dieser Bevölkerung an Wohnraum und desto mehr wird gebaut.

Der zweitgrößte Beta (0,366) entspricht der Zahl der Straftaten pro 1000 Einwohner. Dies bedeutet natürlich nicht, dass durch eine Erhöhung der Kriminalität eine Verbesserung der demografischen Situation möglich ist. Die erhaltenen Ergebnisse zeigen, dass je mehr Menschen pro 1000 Einwohner gerettet werden, desto mehr Straftaten fallen auf diese Tausend.

Das größte der verbleibenden Merkmale, der Beta-Koeffizient (0,074), entspricht dem Reallohnindikator. Die größten Chancen zur Änderung des natürlichen Bevölkerungswachstumskoeffizienten sind mit einer Änderung dieses der betrachteten Faktoren verbunden. Der Indikator der allgemeinen Heiratsquote ist in dieser Hinsicht schlechter als der Reallohn, da der natürliche Bevölkerungsrückgang in Russland in erster Linie darauf zurückzuführen ist hohe Sterblichkeit eine Bevölkerung, deren Wachstumsrate eher durch materielle Sicherheit als durch eine Erhöhung der Zahl der Ehen verringert werden kann.

3.3 Kombinierte Gruppierung der Oblaste nach Reallöhnen und Gesamtheiratsrate

Eine kombinierte oder mehrdimensionale Gruppierung ist eine Gruppierung, die auf zwei oder mehr Merkmalen basiert. Der Wert dieser Gruppierung liegt darin, dass sie nicht nur den Einfluss der einzelnen Faktoren auf das Ergebnis zeigt, sondern auch den Einfluss ihrer Kombination.

Bestimmen wir den Einfluss des Wertes der Reallöhne und der Gesamtheiratsrate auf die Geburtenrate pro 1000 Einwohner.

Wir unterscheiden typische Gruppen anhand der skizzierten Merkmale. Dazu erstellen und analysieren wir die Rangfolge und Intervallreihe auf Faktorbasis (Lohnwert) ermitteln wir die Anzahl der Gruppen und die Größe des Intervalls; Anschließend erstellen wir innerhalb jeder Gruppe eine Rang- und Intervallreihe entsprechend dem zweiten Vorzeichen (Heiratsrate) und legen außerdem die Anzahl der Gruppen und das Intervall fest. Das Verfahren zur Durchführung dieser Arbeit wird in Kapitel 2 vorgestellt. Daher präsentieren wir die Ergebnisse, indem wir die Berechnungen weglassen. Für die Höhe des Reallohns werden 3 typische Gruppen unterschieden, für die Gesamtheiratsquote 2 Gruppen.

Wir erstellen ein Layout einer Kombinationstabelle, in der wir die Einteilung der Bevölkerung in Gruppen und Untergruppen sowie Spalten zur Erfassung der Anzahl der Regionen und der Geburtenrate pro 1000 Personen der Bevölkerung vorsehen. Für die ausgewählten Gruppen und Untergruppen berechnen wir die Geburtenraten (Tabelle 3.3.1)

Tabelle 3.3.1

Der Einfluss des Reallohns und der Gesamtheiratsrate auf die Geburtenrate.

Analysieren wir die erhaltenen Daten zur Abhängigkeit der Geburtenrate vom Reallohn und der Heiratsrate. Da ein Zeichen untersucht wird – die Geburtenrate – werden wir die Daten dazu in eine Schachkombinationstabelle der folgenden Form schreiben (Tabelle 3.3.2).

Durch die kombinierte Gruppierung können Sie den Grad des Einflusses jedes Faktors auf die Geburtenrate einzeln und deren Wechselwirkung beurteilen.

Tabelle 3.3.2

Abhängigkeit der Geburtenrate vom Reallohn und der Heiratsrate

Untersuchen wir zunächst die Auswirkung des Wertes des Reallohns auf die Geburtenrate mit einem festen Wert eines anderen Gruppierungsmerkmals – der Heiratsrate. Bei einer Heiratsrate von 13,2 auf 25,625 steigt also die durchschnittliche Geburtenrate mit steigenden Löhnen von 9,04 in der 1. Gruppe auf 9,16 in der 2. Gruppe und 9,56 in der 3. Gruppe; der Anstieg der Geburtenrate aus dem Lohn in der 3. Gruppe im Vergleich zur 1. beträgt: 9,56-9,04 = 0,52 Personen pro 1000 Einwohner. Bei einer Heiratsquote von 25,625-38,05 beträgt die Erhöhung bei gleicher Lohnhöhe: 10,27-9,49 = 0,78 Personen pro 1000 Einwohner. Der Anstieg aus dem Zusammenspiel der Faktoren beträgt: 0,78-0,52=0,26 Personen pro 1000 Einwohner. Daraus ergibt sich eine völlig natürliche Schlussfolgerung: Eine Steigerung des Wohlbefindens motiviert bzw. ermöglicht es, den Wunsch eines Menschen, zu heiraten und eine Familie mit Kindern zu gründen, mit Zuversicht in die Zukunft zu verwirklichen. Dies zeigt das Zusammenspiel der Faktoren.

Auf die gleiche Weise schätzen wir die Auswirkung der Heiratsrate auf die Geburtenrate bei einem festen Lohnniveau. Dazu vergleichen wir die Geburtenrate der Gruppen „a“ und „b“ innerhalb jeder Gruppe im Hinblick auf die Reallöhne. Der Anstieg der Geburtenrate mit einem Anstieg der Heiratsrate auf 25,625-38,05 pro 1000 Einwohner im Vergleich zur Gruppe „a“ beträgt: in der 1. Gruppe mit einem Gehalt von 5707,9 – 6808,7 Rubel. pro Monat - 9,49-9,04 = 0,45 Personen pro 1000 Einwohner, in der 2. Gruppe - 10,01-9,16 = 0,85 Personen pro 1000 Einwohner und in der 3. Gruppe - 10,27- 9,56=0,71 Personen pro 1000 Einwohner. Wie Sie sehen, hängt die Entscheidung, ein Kind zu bekommen, davon ab Familienstand, d.h. Es gibt ein Zusammenspiel verschiedener Faktoren, was zu einem Anstieg von 0,26 Personen pro 1000 Einwohnern führt.

Bei einem gemeinsamen Anstieg beider Faktoren erhöht sich die Geburtenrate von 9,04 in der Untergruppe 1 „a“ auf 10,27 Personen pro 1000 Einwohner in der Untergruppe 3 „b“.

Vertreter der Wirtschaftskommission der Vereinten Nationen für Europa erklärten kürzlich, dass das Alter bei der ersten Ehe in europäische Länder um fünf Jahre verlängert. Männer und Mädchen heiraten lieber und heiraten nach dem 30. Lebensjahr. Russen wagen es nicht, vor dem 24. bis 26. Lebensjahr den Bund fürs Leben zu schließen. Auch in Europa und Russland ist ein Trend zu einer Verringerung der Zahl der Ehepartnerschaften zu beobachten. Junge Menschen bevorzugen zunehmend Karriere und persönliche Freiheit. Inländische Experten sehen in diesen Prozessen Anzeichen einer tiefen Krise der traditionellen Familie. Ihnen zufolge lebt sie buchstäblich letzten Tage. Soziologen argumentieren, dass sich das Privatleben derzeit in einer Phase der Umstrukturierung befinde. Die Familie im üblichen Sinne des Wortes, das Leben nach dem „Mama-Papa-Kinder“-Schema, gehört nach und nach der Vergangenheit an. IN Privatsphäre Die Russen experimentieren immer häufiger und erfinden immer neue Familienformen, die den Anforderungen der Zeit gerecht werden. „Heute wechselt ein Mensch häufiger den Arbeitsplatz, den Beruf, die Interessen und den Wohnort“, sagte Anatoly Vishnevsky, Direktor des Zentrums für Humandemographie und Ökologie, gegenüber Novye Izvestia. „Er wechselt auch häufig den Ehepartner, was vor 20 Jahren als inakzeptabel galt.“ .“

Soziologen stellen fest, dass einer der Gründe für die Zunahme der Scheidungen in Russland der niedrige Lebensstandard der Bevölkerung ist. „Laut Statistik gibt es in Russland etwa 10–15 % mehr Scheidungen als in Europa“, sagte Herr Gontmakher gegenüber NI ( wissenschaftlicher Leiter Zentrum für Sozialforschung und Innovation). - Aber die Scheidungsgründe sind für uns und für sie unterschiedlich. Unsere Überlegenheit beruht vor allem auf der Tatsache, dass wirtschaftliche Probleme das Leben der Russen zunehmend beeinträchtigen. Ehepartner streiten häufiger, wenn ihre Wohnverhältnisse beengt sind. Junge Menschen schaffen es nicht immer, unabhängig zu leben. Zudem trinken in den Regionen viele Männer, arbeiten nicht und können ihre Familien nicht ernähren. Dies führt auch zur Scheidung.

Abschluss

In dieser Arbeit wird eine statistische und wirtschaftliche Analyse der Auswirkungen des Lebensstandards der Bevölkerung auf die Prozesse des natürlichen Wachstums durchgeführt.

Eine Analyse der Zeitreihen ergab, dass es in den letzten 10 Jahren zu einem Anstieg der Reallöhne und des Existenzminimums kam. Im Allgemeinen ist das effektive Vorzeichen – der natürliche Anstiegskoeffizient – über diese 10 Jahre stationär. Die Stabilität der sich abzeichnenden Veränderungsprozesse der ausgewählten Merkmale ist so groß, dass Prognosen nur für den Wert der Reallöhne und die Sterblichkeitsrate möglich sind. Gemäß dem bis 2010 aufgebauten parabolischen Trend wird der prognostizierte Wert des durchschnittlichen Reallohns 17473,5 Rubel betragen und die Sterblichkeitsrate wird auf 12,75 Menschen pro 1000 sinken.

Die analytische Gruppierung zeigte einen direkten Zusammenhang zwischen den Indikatoren: Mit dem Lohnwachstum verbessern sich die Indikatoren des natürlichen Anstiegs.

Allerdings eine zweiköpfige Arbeiterfamilie mit einem Durchschnitt Gehalt kann ein Mindestverbrauchsniveau für 2 Kinder in der niedrigsten typischen Gruppe, 3 Kinder in der mittleren und höchsten typischen Gruppe bereitstellen. Bedenkt man, dass zwei Kinder in Zukunft das Leben ihrer Eltern „ersetzen“, ist ein leichter Bevölkerungszuwachs nur in den mittleren und höchsten typischen Gruppen und dann auch nur unter der Voraussetzung einer im Vergleich zur Geburtenrate niedrigen Sterblichkeitsrate möglich. Das Fruchtbarkeitspotenzial, das in Russland durch die Löhne bestimmt wird, ist gering, um die demografische Situation im Land zu verbessern. Dies zeigt nur die Notwendigkeit der Einführung eines demografischen nationalen Projekts in Russland. Eine Lohnerhöhung wirkt sich günstiger auf die Sterberate aus als auf die Geburtenrate.

Die Konstruktion eines Korrelations-Regressionsmodells ergab, dass der gleichzeitige Einfluss von Faktorzeichen (Löhne, Heiratsraten, Kriminalitätsraten und Wohnungsbeauftragung) auf die Produktivität (natürliche Steigerung) bei einer durchschnittlichen Verbindungsstärke beobachtet wird. Die Variation des Koeffizienten des natürlichen Bevölkerungswachstums um 44,9 % ist durch den Einfluss ausgewählter Faktoren und 55,1 % durch andere unerklärte und zufällige Ursachen gekennzeichnet. Die größten Chancen zur Änderung des natürlichen Bevölkerungswachstumskoeffizienten sind mit einer Änderung des Wertes der Reallöhne verbunden.

Die kombinierte Gruppierung bestätigte, dass eine Zunahme des Wohlstands die Verwirklichung des Wunsches einer Person, zu heiraten und eine Familie mit Kindern zu gründen, mit Zuversicht in die Zukunft motiviert bzw. ermöglicht.

Und schließlich ist es notwendig, die Wirksamkeit der Lösung des Demografieproblems in unserem Land zu bewerten. Generell ist die positive und wirksame Wirkung materieller Anreize auf den Prozess der natürlichen Bevölkerungsbewegung nachgewiesen. Zum anderen gibt es einen Komplex sozialpsychologischer Probleme (Alkoholismus, Gewalt, Selbstmord), die die Zahl unserer Bevölkerung unaufhaltsam verringern. Ihr Hauptgrund ist die Einstellung eines Menschen zu sich selbst und anderen. Doch diese Probleme können nicht allein vom Staat gelöst werden; Zivilgesellschaft, bildend Moralvorstellungen konzentrierte sich darauf, eine wohlhabende Familie zu gründen.

Und der Staat kann und sollte alles tun, um das Niveau und die Lebensqualität im Land zu verbessern. Man kann nicht sagen, dass unser Staat diese Pflichten vernachlässigt. Sie ist bestrebt, verschiedene Wege aus der demografischen Krise zu finden und auszuprobieren.

Liste der verwendeten Literatur

1) Borisov E.F. Wirtschaftstheorie: Lehrbuch – 2. Aufl., überarbeitet. und zusätzlich - M.: TK Velby, Verlag Prospekt, 2005. - 544 S.

2) Belousova S. Analyse des Armutsniveaus.// Economist.-2006, Nr. 10.-S.67

3) Davydova L. A. Theorie der Statistik. Lernprogramm. Moskau. Allee. 2005. 155 Seiten;

4) Demographie: Lehrbuch / Unter dem General. Hrsg. AUF DER. Wolgin. M.: Verlag der RAGS, 2003 – 384 S.

5) Efimova E. P. Sozialstatistik. Moskau. Finanzen und Statistik. 2003. 559 Seiten;

6) Efimova E.P., Ryabtsev V.M. Allgemeine Theorie der Statistik. Bildungsausgabe. Moskau. Finanzen und Statistik. 1991. 304 Seiten;

7) Zinchenko A.P. Workshop zur allgemeinen Theorie der Statistik und Agrarstatistik. Moskau. Finanzen und Statistik. 1988. 328 Seiten;

8) Kadomtseva S. Sozialpolitik und Bevölkerung.// Economist.-2006, Nr. 7.-S.49

9) Kozyrev V.M. Grundlagen der modernen Ökonomie: Lehrbuch. -2. Aufl., überarbeitet. und zusätzlich –M.: Finanzen und Statistik, 2001.-432p.

10) Konygina N. Brintseva G. Demograph Anatoly Vishnevsky darüber, was einen Russen dazu bringt, sich zwischen Kindern und Komfort zu entscheiden. 7

11) Nazarova N.G. Kurs der Sozialstatistik. Moskau. Finstatinform. 2000. 770 Seiten;

13) Grundlagen der Demographie: Lehrbuch / N.V. Zvereva, I.N. Veselkova, V.V. Elizarov.-M.: Höher. Shk., 2004.-374 S.: Abb.

14) Botschaft des Präsidenten Russische Föderation Bundesversammlung Russische Föderation vom 26. April 2007.

15) Raisberg B.A., Lozovsky L.Sh., Starodubtseva E.B. Modernes Wirtschaftswörterbuch. –4. Aufl., überarbeitet. und zusätzlich -M.: INFRA-M, 2005.-480er Jahre.

16) Rudakova R.P., Bukin L.L., Gavrilov V.I. Workshop zum Thema Statistik. - St. Petersburg: Peter, 2007.-288p.

17) Website Bundesdienst Statistiken www.gks.ru

18) Shaikin D.N. Prospektive Einschätzung der Bevölkerung Russlands mittelfristig.// Fragen der Statistik.-2007, Nr. 4 -S.47

ERGEBNIS (SCHLÜSSEL ZU CHIPS)

1-durchschnittlicher monatlicher Nominallohn im Jahr 2006 (in Rubel)

2-Indizes Verbraucherpreise für alle Arten von Waren und entgeltlichen Dienstleistungen im Jahr 2006 in Prozent vom Dezember des Vorjahres

3- durchschnittlicher monatlicher Reallohn im Jahr 2006 (in Rubel)

4 - Bevölkerung Anfang 2006

5 - Bevölkerung Ende 2006

6 - durchschnittliche jährliche Bevölkerung im Jahr 2006

7 - die Zahl der Geburten im Jahr 2006, Personen

8 - die Zahl der Todesfälle im Jahr 2006, Menschen

9 - Geburtenrate im Jahr 2006 pro 1000 Einwohner

10 - Sterblichkeitsrate im Jahr 2006 pro 1000 Einwohner

11 - Koeffizient des natürlichen Wachstums im Jahr 2006 pro 1000 Einwohner

12 - der Wert des Existenzminimums für 2006 (in Rubel)

13 - die Zahl der begangenen Straftaten pro 1000 Einwohner

14 - Inbetriebnahme von Quadratmetern Wohnraum pro Person und Jahr

15 – Gesamtheiratsrate pro 1000 Einwohner

Anhang 1

Tisch

Reallöhne, Rubel.

Anlage 2

Existenzminimum, reiben.

Anhang 3

Allgemeine Intensivkoeffizienten (Fruchtbarkeit, Mortalität, Kindersterblichkeit, Morbidität usw.) spiegeln die Häufigkeit von Ereignissen beim Vergleich nur dann korrekt wider, wenn die Zusammensetzung der verglichenen Populationen homogen ist. Wenn sie eine heterogene Alters-Geschlechts- oder Berufszusammensetzung, einen Unterschied in der Schwere der Erkrankung, in nosologischen Formen oder aus anderen Gründen aufweisen, können Sie sich auf allgemeine Indikatoren konzentrieren und diese vergleichen falsche Schlussfolgerungüber die Trends der untersuchten Phänomene und die wahren Gründe für den Unterschied in den allgemeinen Indikatoren der verglichenen Populationen.

Beispielsweise betrug die Krankenhaussterblichkeit in der therapeutischen Abteilung Nr. 1 im Berichtsjahr 3 % und in der therapeutischen Abteilung Nr. 2 im selben Jahr 6 %. Wenn wir die Aktivitäten dieser Abteilungen anhand allgemeiner Indikatoren bewerten, können wir auf ein Problem in der 2. therapeutischen Abteilung schließen. Und wenn wir davon ausgehen, dass sich die Zusammensetzung der in diesen Abteilungen Behandelten in nosologischen Formen oder in der Schwere der Erkrankungen der Krankenhauspatienten unterscheidet, dann am meisten der richtige Weg Die Analyse ist ein Vergleich spezieller Koeffizienten, die für jede Gruppe von Patienten mit denselben nosologischen Formen oder Schweregraden der Erkrankungen separat berechnet werden, den sogenannten „altersspezifischen Koeffizienten“.

In den verglichenen Populationen werden jedoch häufig widersprüchliche Daten beobachtet. Darüber hinaus ist es nicht immer praktisch, eine Reihe von Indikatoren zu verwenden, selbst wenn in allen verglichenen Gruppen derselbe Trend zu beobachten ist, sondern es ist vorzuziehen, eine einzige zusammenfassende Schätzung zu erhalten. In all diesen Fällen greifen sie auf die Standardisierungsmethode zurück, das heißt, den Einfluss der Zusammensetzung (Struktur) der Aggregate auf den gesamten Endindikator zu eliminieren (zu eliminieren).

Daher wird die Standardisierungsmethode verwendet, wenn die bestehenden Unterschiede in der Zusammensetzung der verglichenen Populationen die Größe der Gesamtkoeffizienten beeinflussen können.

Um den Einfluss der Heterogenität der Zusammensetzungen der verglichenen Populationen auf den Wert der erhaltenen Koeffizienten zu eliminieren, werden diese auf einen einzigen Standard gebracht, d. h. es wird bedingt angenommen, dass die Zusammensetzung der verglichenen Populationen gleich ist. Als Standard kann man die Zusammensetzung einer im Wesentlichen nahe beieinander liegenden dritten Population, die durchschnittliche Zusammensetzung zweier verglichener Gruppen oder, am einfachsten, die Zusammensetzung einer der verglichenen Gruppen nehmen.

Die standardisierten Koeffizienten zeigen, wie die allgemeinen Intensivindikatoren (Fruchtbarkeit, Morbidität, Mortalität, Mortalität usw.) aussehen würden, wenn ihr Wert nicht durch die Heterogenität in der Zusammensetzung der verglichenen Gruppen beeinflusst würde. Standardisierte Koeffizienten sind fiktive Werte und werden ausschließlich zu Analysezwecken und zum Vergleich verwendet.

Es gibt drei Methoden der Standardisierung: direkte, indirekte und umgekehrte (Kerridge).

Betrachten wir die Anwendung dieser drei Standardisierungsmethoden anhand von Beispielen aus der Statistik bösartiger Neubildungen. Wie Sie wissen, steigt die Sterblichkeitsrate durch bösartige Neubildungen mit zunehmendem Alter deutlich an. Daraus folgt, dass, wenn in einer Stadt der Anteil älterer Menschen relativ hoch ist und in einer anderen die Bevölkerung mittleren Alters vorherrscht, dies auch bei völliger Gleichheit der sanitären Lebensbedingungen der Fall ist medizinische Versorgung In beiden verglichenen Städten wird die Gesamtsterblichkeitsrate der Bevölkerung aufgrund bösartiger Neubildungen in der ersten Stadt zwangsläufig höher sein als in der zweiten Stadt.

Um den Einfluss des Alters auf die Gesamtsterblichkeitsrate der Bevölkerung durch bösartige Neubildungen auszugleichen, ist eine Standardisierung erforderlich. Erst danach ist es möglich, die erhaltenen Koeffizienten zu vergleichen und eine vernünftige Schlussfolgerung über eine höhere oder niedrigere Sterblichkeitsrate durch bösartige Neubildungen im Allgemeinen in den verglichenen Städten zu ziehen.

Direkte Methode der Standardisierung. In unserem Beispiel kann es verwendet werden, wenn die Alterszusammensetzung der Bevölkerung bekannt ist und Informationen zur Berechnung der altersspezifischen Sterblichkeitsraten der Bevölkerung aufgrund bösartiger Neubildungen (die Anzahl der Todesfälle aufgrund bösartiger Neubildungen in jedem Fall) vorliegen Altersgruppe).

Berechnungstechnik standardisierte Koeffizienten Die direkte Methode besteht aus vier aufeinanderfolgenden Stufen (Tabelle 5.1).

Erste Stufe. Berechnung „altersspezifischer“ Sterblichkeitsraten durch bösartige Neubildungen (getrennt für jede Altersgruppe).

Zweite Phase. Die Wahl des Standards ist willkürlich. In unserem Beispiel wird die Alterszusammensetzung der Bevölkerung in der Stadt „A“ als Maßstab genommen.

Tabelle 5.1

Standardisierung der Sterblichkeitsraten durch bösartige Neubildungen in den Städten „A“ und „B“ (direkte Methode)

Dritter Abschnitt. Berechnung „erwarteter“ Zahlen. Wir ermitteln, wie viele Menschen in jeder Altersgruppe der Bevölkerung der Stadt „B“ an bösartigen Neubildungen sterben würden, wenn man die altersspezifischen Sterblichkeitsraten durch bösartige Neubildungen in dieser Stadt berücksichtigt, jedoch mit der Alterszusammensetzung der Stadt „A“ (Standard).

Beispielsweise in der Altersgruppe „bis 30 Jahre“:

oder in der Altersgruppe „40-49 Jahre“:

Vierte Stufe. Berechnung standardisierter Koeffizienten. Wir schlagen vor, die Summe der „erwarteten“ Zahlen (1069,0) aus der Gesamtbevölkerung der Stadt „A“ (700000) zu ermitteln. Und wie viele Todesfälle durch bösartige Neubildungen pro 100.000 Einwohner?

Aus unseren Ergebnissen können wir folgende Schlussfolgerung ziehen: Wenn die Alterszusammensetzung der Bevölkerung „B“ die gleiche wäre wie in der Stadt „A“ (Standard), dann wäre die Sterblichkeit der Bevölkerung durch bösartige Neubildungen in der Stadt „B.“ " wäre deutlich höher (152,7 %ooo gegenüber 120,2 %ooo).

Indirekte Methode der Standardisierung. Es wird verwendet, wenn die speziellen Koeffizienten in den verglichenen Gruppen unbekannt oder bekannt, aber nicht sehr zuverlässig sind. Dies ist beispielsweise dann zu beobachten, wenn die Fallzahlen sehr gering sind und daher die berechneten Koeffizienten je nach Hinzunahme eines oder mehrerer Krankheitsfälle erheblich variieren.

Die Berechnung standardisierter Koeffizienten auf indirektem Weg kann in drei Stufen unterteilt werden (siehe Tabelle 5.2).

Erste Stufe. Es besteht in der Auswahl eines Standards. Da uns die Sonderkoeffizienten der verglichenen Gruppen (Kollektive) in der Regel nicht bekannt sind, werden die Sonderkoeffizienten einiger gut untersuchter Kollektive als Standard herangezogen. Im betrachteten Beispiel können altersspezifische Sterblichkeitsraten durch bösartige Neubildungen in der Stadt „C“ als solche dienen.

Zweite Phase beinhaltet die Berechnung der „erwarteten“ Anzahl von Todesfällen durch bösartige Neubildungen. Unter der Annahme, dass die altersspezifischen Sterblichkeitsraten in beiden Vergleichsstädten den Standardraten entsprechen, ermitteln wir, wie viele Menschen in jeder Altersgruppe an bösartigen Neubildungen sterben würden.

In der dritten Stufe Es werden standardisierte Sterblichkeitsraten der Bevölkerung durch bösartige Neubildungen berechnet. Dazu wird die tatsächliche Zahl der Todesfälle auf die „erwartete“ Gesamtzahl bezogen und das Ergebnis mit der Gesamtsterblichkeitsrate des Standards multipliziert.

Die tatsächliche Zahl der Todesfälle Allgemeine Quoten Sterblichkeitsstandard

„Erwartete“ Zahl der Todesfälle

4.2 Aufbau einer Regressionsgleichung auf einer standardisierten Skala

Optionen multiple Regression kann auf andere Weise definiert werden, wenn eine Regressionsgleichung auf der Grundlage einer Matrix gepaarter Korrelationskoeffizienten auf einer standardisierten Skala erstellt wird:

Wenn wir das LSM auf einer standardisierten Skala auf die multiple Regressionsgleichung anwenden, erhalten wir nach entsprechenden Transformationen ein System von Normalgleichungen der Form:

wobei rux1, rux2 gepaarte Korrelationskoeffizienten sind.

Paarkorrelationskoeffizienten können durch die Formeln ermittelt werden:

Das Gleichungssystem hat die Form:

Nachdem wir das System mit der Determinantenmethode gelöst hatten, erhielten wir die Formeln:

Die Gleichung auf einer standardisierten Skala lautet:

Bei einem Anstieg der Armutsquote um 1 Sigma und einem konstanten durchschnittlichen Pro-Kopf-Einkommen der Bevölkerung sinkt die Gesamtfruchtbarkeitsrate also um 0,075 Sigma; und bei einem Anstieg des durchschnittlichen Pro-Kopf-Einkommens der Bevölkerung um 1 Sigma bei unverändertem Armutsniveau wird die Gesamtfruchtbarkeitsrate um 0,465 Sigma steigen.

Bei der multiplen Regression stehen die „reinen“ Regressionskoeffizienten bi wie folgt in Beziehung zu den standardisierten Regressionskoeffizienten βi:

5. Partielle Regressionsgleichungen

5.1 Konstruktion partieller Regressionsgleichungen

Partielle Regressionsgleichungen verbinden das resultierende Attribut mit den entsprechenden Faktoren x und fixieren andere in der multiplen Regression berücksichtigte Faktoren auf der Durchschnittsebene. Besondere Gleichungen haben die Form:

Im Gegensatz zur gepaarten Regression charakterisieren partielle Regressionsgleichungen den isolierten Einfluss eines Faktors auf das Ergebnis, da andere Faktoren sind auf einem konstanten Niveau fixiert.

In diesem Problem haben Teilgleichungen die Form:

5.2 Bestimmung partieller Elastizitäten

Basierend auf partiellen Regressionsgleichungen ist es möglich, partielle Elastizitätskoeffizienten für jede Region mithilfe der Formel zu bestimmen:

Berechnen wir die partiellen Elastizitätskoeffizienten für die Regionen Kaliningrad und Leningrad.

Für die Region Kaliningrad х1=11,4, х2=12,4, dann:

Für die Region Leningrad x1 = 10,6, x2 = 12,6:

So wird in der Region Kaliningrad bei einem Anstieg der Armutsrate um 1 % die Gesamtfruchtbarkeitsrate um 0,07 % sinken, und bei einem Anstieg des Pro-Kopf-Einkommens um 1 % wird die Gesamtfruchtbarkeitsrate um 0,148 % steigen. In der Region Leningrad wird bei einem Anstieg der Armutsquote um 1 % die Gesamtfruchtbarkeitsrate um 0,065 % sinken, und bei einem Anstieg des Pro-Kopf-Einkommens um 1 % wird die Gesamtfruchtbarkeitsrate um 0,15 % steigen.

5.3 Bestimmung durchschnittlicher Elastizitätskoeffizienten

Wir ermitteln die durchschnittlichen Elastizitätsindikatoren nach der Formel:

Für diese Aufgabe sind sie gleich:

Bei einem Anstieg der Armutsquote um 1 % sinkt somit die Gesamtfruchtbarkeitsrate der Bevölkerung im Durchschnitt um 0,054 %, während das durchschnittliche Pro-Kopf-Einkommen unverändert bleibt. Bei einem Anstieg des Pro-Kopf-Einkommens um 1 % steigt die Gesamtfruchtbarkeitsrate im Durchschnitt der untersuchten Bevölkerung um 0,209 %, bei unverändertem Armutsniveau.

6. Mehrfachkorrelation

6.1 Koeffizient Mehrfachkorrelation

Die praktische Bedeutung der multiplen Regressionsgleichung wird anhand des multiplen Korrelationsindikators und seines Quadrats – dem Bestimmtheitsmaß – beurteilt. Der multiple Korrelationsindikator charakterisiert die Nähe des Zusammenhangs zwischen dem betrachteten Faktorensatz und dem untersuchten Merkmal, d.h. bewertet die Nähe des Zusammenhangs zwischen dem gemeinsamen Einfluss von Faktoren auf das Ergebnis.

Der Wert des Mehrfachkorrelationsindex muss größer oder gleich dem maximalen paarweisen Korrelationsindex sein. Bei lineare Abhängigkeit Merkmale, die Korrelationsindexformel kann durch den folgenden Ausdruck dargestellt werden:

Daher ist der Zusammenhang zwischen der Gesamtfruchtbarkeitsrate und dem Grad der Armut sowie dem durchschnittlichen Pro-Kopf-Einkommen schwach.

Und alle Korrelationskoeffizienten sind gleich 1, dann ist die Determinante einer solchen Matrix 0: . Je näher die Determinante der interfaktoriellen Korrelationsmatrix bei 0 liegt, desto stärker ist die Multikollinearität der Faktoren und desto unzuverlässiger sind die Ergebnisse der multiplen Regression. Und umgekehrt: Je näher die Determinante der Matrix der interfaktoriellen Korrelation an 1 liegt, desto geringer ist die Multikollinearität der Faktoren. Die Überprüfung auf Multikollinearität von Faktoren kann ...

In der Ökonometrie wird häufig ein anderer Ansatz verwendet, um die Parameter der multiplen Regression (2.13) mit dem ausgeschlossenen Koeffizienten zu bestimmen:

Teilen Sie beide Seiten der Gleichung durch die Standardabweichung der zu erklärenden Variablen S Y und stellen Sie es in der Form dar:

Teilen und multiplizieren Sie jeden Term durch die Standardabweichung der entsprechenden Fakultätsvariablen, um die standardisierten (zentrierten und normalisierten) Variablen zu erhalten:

wobei die neuen Variablen als bezeichnet werden

Alle standardisierten Variablen haben einen Mittelwert von Null und die gleiche Varianz von Eins.

Die Regressionsgleichung in standardisierter Form lautet:

Wo
- standardisierte Regressionskoeffizienten.

Standardisierte Regressionskoeffizienten von den Koeffizienten abweichen die übliche, natürliche Form, da ihr Wert nicht vom Messmaßstab der erklärten und erklärenden Variablen des Modells abhängt. Darüber hinaus besteht eine einfache Beziehung zwischen ihnen:

, (3.2)

Dies bietet eine andere Möglichkeit, die Koeffizienten zu berechnen nach bekannten Werten , was beispielsweise im Fall eines Zwei-Faktor-Regressionsmodells praktischer ist.

5.2. Normales System der kleinsten Quadratgleichungen in standardisierter Form

Variablen

Es stellt sich heraus, dass Sie zur Berechnung der Koeffizienten der standardisierten Regression nur die paarweisen Koeffizienten der linearen Korrelation kennen müssen. Um zu zeigen, wie das geht, schließen wir die Unbekannte aus dem normalen System der Gleichungen der kleinsten Quadrate aus unter Verwendung der ersten Gleichung. Multiplikation der ersten Gleichung mit (
) und Term für Term mit der zweiten Gleichung addieren, erhalten wir:

Ersetzen der Ausdrücke in Klammern durch die Notation für Varianz und Kovarianz

Schreiben wir die zweite Gleichung in eine Form um, die zur weiteren Vereinfachung geeignet ist:

Teilen Sie beide Seiten dieser Gleichung durch die Standardabweichung der Variablen S Y Und ` S X 1 , und jeder Term wird durch die Standardabweichung der Variablen dividiert und multipliziert, die der Nummer des Termes entspricht:

Einführung in die Merkmale einer linearen statistischen Beziehung:

und standardisierte Regressionskoeffizienten

wir bekommen:

Nach ähnlichen Transformationen aller anderen Gleichungen nimmt das Normalsystem linearer LSM-Gleichungen (2.12) die folgende, einfachere Form an:

(3.3)

5.3. Standardisierte Regressionsoptionen

Die normierten Regressionskoeffizienten im Einzelfall eines Modells mit zwei Faktoren werden aus folgendem Gleichungssystem ermittelt:

(3.4)

Wenn wir dieses Gleichungssystem lösen, finden wir:

, (3.5)

. (3.6)

Wenn wir die gefundenen Werte der Paarkorrelationskoeffizienten in die Gleichungen (3.4) und (3.5) einsetzen, erhalten wir Und . Mithilfe der Formeln (3.2) ist es dann einfach, die Schätzungen für die Koeffizienten zu berechnen Und , und berechnen Sie dann ggf. die Schätzung nach der Formel

6. Möglichkeiten der ökonomischen Analyse auf Basis eines multifaktoriellen Modells

6.1. Standardisierte Regressionskoeffizienten

Standardisierte Regressionskoeffizienten zeigen, wie viele Standardabweichungen es gibt Veränderung im Durchschnitt der erklärten Variablen Y wenn die entsprechende erklärende Variable X ich wird sich um den Betrag ändern
einer von ihr Standardabweichung unter Beibehaltung der gleichen Werte des Durchschnittsniveaus aller anderen Faktoren.

Aufgrund der Tatsache, dass bei der standardisierten Regression alle Variablen als zentrierte und normalisierte Zufallsvariablen angegeben werden, sind die Koeffizienten miteinander vergleichbar. Indem Sie sie miteinander vergleichen, können Sie die entsprechenden Faktoren einstufen X ich durch die Stärke des Einflusses auf die zu erklärende Variable Y. Dies ist der Hauptvorteil standardisierter Regressionskoeffizienten aus den Koeffizienten Regressionen in natürlicher Form, die untereinander unvergleichlich sind.

Dieses Merkmal der standardisierten Regressionskoeffizienten ermöglicht die Verwendung beim Aussortieren der am wenigsten signifikanten Faktoren X ich mit nahezu Nullwerten ihrer Stichprobenschätzungen . Die Entscheidung, sie aus der Modellgleichung auszuschließen lineare Regression wird akzeptiert, nachdem die statistischen Hypothesen über die Gleichheit seines Durchschnittswerts mit Null getestet wurden.

Schätzung der Parameter der Regressionsgleichung auf einer standardisierten Skala

Die Parameter der multiplen Regressionsgleichung bei ökonometrischen Problemen werden mit dieser Methode ähnlich wie bei der Paarregression geschätzt kleinsten Quadrate(MNK). Bei der Anwendung dieser Methode wird ein System von Normalgleichungen aufgebaut, dessen Lösung es ermöglicht, Schätzungen der Regressionsparameter zu erhalten.

Bei der Bestimmung der Parameter der multiplen Regressionsgleichung basierend auf der Matrix gepaarter Korrelationskoeffizienten bauen wir die Regressionsgleichung auf einer standardisierten Skala auf:

in der Gleichung standardisierte Variablen

Wenn wir die Methode der kleinsten Quadrate auf mehrere Regressionsmodelle auf einer standardisierten Skala anwenden, erhalten wir nach bestimmten Transformationen ein System von Normalgleichungen der Form

Wenn wir Systeme mit der Determinantenmethode lösen, finden wir die Parameter – standardisierte Regressionskoeffizienten (Beta-Koeffizienten). Durch den Vergleich der Koeffizienten untereinander ist es möglich, die Faktoren nach der Stärke ihres Einflusses auf das Ergebnis zu ordnen. Dies ist der Hauptvorteil standardisierter Koeffizienten im Gegensatz zu herkömmlichen Regressionskoeffizienten, die nicht miteinander vergleichbar sind.

In einer Paarbeziehung steht der standardisierte Regressionskoeffizient durch die Abhängigkeit mit dem entsprechenden Koeffizienten der Gleichung in Beziehung

Dadurch können Sie von einer Gleichung auf einer standardisierten Skala zu einer Regressionsgleichung auf einer natürlichen Variablenskala wechseln:

Der Parameter a wird aus der folgenden Gleichung bestimmt

Die standardisierten Regressionskoeffizienten geben an, um wie viele Sigmas sich das Ergebnis im Durchschnitt ändert, wenn sich der entsprechende Faktor xj um ein Sigma ändert, während das durchschnittliche Niveau der anderen Faktoren unverändert bleibt. Da alle Variablen zentriert und normalisiert eingestellt sind, sind die standardisierten Regressionskoeffizienten untereinander vergleichbar.

Die berücksichtigte Bedeutung der standardisierten Koeffizienten ermöglicht deren Verwendung beim Herausfiltern von Faktoren, wobei die Faktoren mit dem kleinsten Wert aus dem Modell ausgeschlossen werden.

Computerprogramme zur Erstellung einer multiplen Regressionsgleichung ermöglichen es, entweder nur eine Regressionsgleichung für die Originaldaten oder eine Regressionsgleichung auf einer standardisierten Skala zu erhalten.

19. Charakteristik der Elastizität nach dem Modell der multiplen Regression. STR 132-136

http://math.semester.ru/regress/mregres.php

20. Zusammenhang zwischen standardisierten Regressionskoeffizienten und Elastizitätskoeffizienten. STR 120-124

21. Indikatoren für multiple und partielle Korrelationen. Ihre Rolle bei der Konstruktion ökonometrischer Modelle

Korrelation -Das statistische Beziehung zwischen zwei oder mehr zufällige Variablen(oder Werte, die mit einiger akzeptabler Genauigkeit als solche betrachtet werden können). Gleichzeitig führen Änderungen einer oder mehrerer dieser Größen zu einer systematischen Änderung der anderen oder anderen Größen. Der Korrelationskoeffizient dient als mathematisches Maß für die Korrelation zweier Zufallsvariablen. Konzept Zusammenhänge erschien Mitte des 19. Jahrhunderts in den Werken der englischen Statistiker F. Galton und K. Pearson.

Mehrfacher Korrelationskoeffizient(R) charakterisiert die Enge der Beziehung zwischen dem Leistungsindikator und einer Reihe von Faktorindikatoren:

wo σ 2 - die Gesamtstreuung der empirischen Reihe, die die allgemeine Streuung des Ergebnisindikators charakterisiert (y) aufgrund von Faktoren

σ Ost 2 – Restvarianz in der Reihe ja, spiegelt den Einfluss aller Faktoren außer x wider;

bei- der Durchschnittswert des effektiven Indikators, berechnet auf der Grundlage der ersten Beobachtungen;

S- der Durchschnittswert des effektiven Indikators, berechnet durch die Regressionsgleichung.

Der Mehrfachkorrelationskoeffizient nimmt nur positive Werte im Bereich von 0 bis 1 an. Je näher der Wert des Koeffizienten an 1 liegt, desto enger ist die Beziehung. Umgekehrt gilt: Je näher an 0, desto geringer ist die Abhängigkeit. Mit R-Wert< 0,3 говорят о малой зависимости между величинами. При значении 0,3 < R< 0,6 gibt die durchschnittliche Dichtheit der Verbindung an. Bei R > 0,6 besteht ein signifikanter Zusammenhang.

Das Quadrat des multiplen Korrelationskoeffizienten wird aufgerufen Bestimmungskoeffizient (D): D=R2. Das Bestimmtheitsmaß gibt an, welcher Anteil der Variation des Effektivindikators mit der Variation der Faktorindikatoren zusammenhängt. Die Berechnung des Bestimmungskoeffizienten und des Mbasiert auf der Regel zur Addition von Varianzen, nach der die Gesamtvarianz (σ 2) gleich der Summe der Intergruppenvarianz (δ 2) und dem Durchschnitt der Gruppenvarianzen ist σ i 2):

σ2 = δ 2 + σ i 2 .

Die Intergruppenvarianz charakterisiert die Schwankung des effektiven Indikators aufgrund des untersuchten Faktors und des Durchschnitts davon Gruppenvarianzen spiegelt die Schwankung des effektiven Indikators aufgrund aller anderen Faktoren mit Ausnahme des untersuchten wider.

Partielle Korrelationsindikatoren. Basierend auf dem Verhältnis der Verringerung der Restvariation aufgrund des zusätzlich in das Modell einbezogenen Faktors zur Restvariation vor der Aufnahme des entsprechenden Faktors in das Modell

Die betrachteten Indikatoren können auch zum Vergleich von Faktoren verwendet werden, d. h. Sie können die Faktoren in eine Rangfolge bringen (d. h. der 2. Faktor ist enger miteinander verbunden).

Partielle Koeffizienten können im Verfahren zum Screening von Faktoren beim Aufbau eines Modells verwendet werden.

Die oben diskutierten Indikatoren sind Korrelationskoeffizienten erster Ordnung, d. h. sie charakterisieren die Beziehung zwischen zwei Faktoren bei der Festlegung eines Faktors (yx1). . x2). Sie können jedoch Koeffizienten zweiter oder höherer Ordnung bilden (yx1 . x2x3, yx1 . x2x3x4).

22. Bewertung der Zuverlässigkeit der Ergebnisse der multiplen Regression.

Strukturmodellkoeffizienten können je nach Art der simultanen Gleichungen auf unterschiedliche Weise geschätzt werden.
Methoden zur Schätzung der Koeffizienten eines Strukturmodells:
1) Indirekter MNC (CMNC)

2) Zweistufiger MNC (DMNC)

3)Dreistufiges MNK(TMNK)

4) MNP mit vollständigen Informationen

5) MNP im begrenzten Umfang. Information

Anwendung von CMNC:

Zur genauen Identifizierung des Strukturmodells kommt CMLS zum Einsatz.

CMNC-Bewerbungsverfahren:
1. Strukturell Konvertierungsmodell. in Führung Modellform.

2. Für jede Gleichung wird die reduzierte Form des Modells durch die Methode der kleinsten Quadrate geschätzt. Koeffizient

3. Die Koeffizienten der reduzierten Form des Modells werden in die Parameter des Strukturmodells transformiert.

Wenn das System überidentifizierbar ist, wird QLS nicht verwendet, da es keine eindeutigen Schätzungen für die Parameter des Strukturmodells liefert. In diesem Fall können Sie verwenden verschiedene Bewertungsmethoden, von denen DMNC am häufigsten vorkommt.
Die Hauptidee von DMNC auf der Grundlage des obigen Modells besteht darin, eine Überidentifikation zu erhalten. Theoriegleichungen. Werte endogener Variablen, enthaltend. auf der rechten Seite der Gleichung. Darüber hinaus werden beim Ersetzen der gefundenen Werte anstelle der tatsächlichen Werte die üblichen kleinsten Quadrate und Strukturwerte verwendet. Superidentform. ur-tion.
1. Schritt: bei der Antriebsbestimmung. die Form des Modells und das Finden von Schätzungen der Theorie auf seiner Grundlage. Werte der endogenen Variablen

Schritt 2: Wie auf die strukturelle Überidentifizierungsgleichung angewendet, wenn die Strukturkoeffizienten des Modells gemäß den theoretischen Werten endogener Variablen bestimmt werden.

23. Varianzanalyse der Ergebnisse der multiplen Regression.

Aufgabe Varianzanalyse bei der Überprüfung der Hypothesen H0 über die Fremdartigkeit der Regressionsgleichungen insgesamt und werden enge Zusammenhänge aufzeigen. Es wird auf der Grundlage eines Vergleichs der Fakten und Tabellenwerte durchgeführt. F-Krit-Katze wird aus dem Verhältnis der Faktor- und Restvarianzen bestimmt, berechnet für einen Freiheitsgrad

Analyse der Varianztabelle
Varu	df	RMS,S	Disp pro df,S 2	Tatsache
gemeinsam	n-1	d y 2 * n	-	-
Tatsache	M	d y 2 * n*R 2 yx1x2
Ost	n-m-1	d y 2 * n*(1-R 2 yx 1 x 2) =Stotal-Sfact		-

Sie können auch eine Tabelle erstellen private Varianzanalyse, und finden Sie den privaten F-Krit, der die Machbarkeit der Einbeziehung des Faktors in das Modell nach Einbeziehung der dr-Variablen bewertet

24. Teilweiser F-Test nach Fisher, t-Test nach Student. Ihre Rolle beim Aufbau von Regressionsmodellen.

Fishers F-Kriterium.

Um die statistische Zweckmäßigkeit des Hinzufügens neuer Faktoren zum Regressionsmodell zu beurteilen, verwenden Sie ein bestimmtes Fisher-Kriterium, da die Ergebnisse der Regressionsanalyse nicht nur von der Zusammensetzung der Faktoren beeinflusst werden, sondern auch von der Reihenfolge, in der der Faktor in das Modell einbezogen wird . Dies liegt an der Beziehung zwischen den Faktoren.

F xj =((R 2 mal yx1x2...xm – R 2 mal yx1x2…xj-1,хj+1…xm)/(1- R 2 mal yx1x2...xm))*((n-m-1) /1)

F-Tabelle (alpha,1, n-m-1) F xj ist größer als F-Tabelle – es empfiehlt sich, den Faktor x j nach anderen Faktoren in das Modell einzubeziehen.

Betrachtet man die Gleichung y=a+b1x1+b2+b3x3+e, so wird das F-Kriterium für die Gleichung mit einem Faktor x1 sequentiell ermittelt, dann das F-Kriterium für die zusätzliche Einbeziehung des Faktors x2 in das Modell, d.h. für den Übergang von der Ein-Faktor-Regressionsgleichung zur Zwei-Faktor-Regressionsgleichung und schließlich der F-Test für die zusätzliche Einbeziehung des x3-Faktors in das Modell, d. h. Eine Schätzung der Signifikanz des Faktors x3 erfolgt nach Einbeziehung der Faktoren x1 x2 in das Modell. In diesem Fall ist das F-Kriterium für die zusätzliche Einbeziehung des Faktors x2 nach x1 sequentiell, im Gegensatz zum F-Kriterium für die zusätzliche Einbeziehung des Faktors x3 in das Modell, das ein besonderes F-Kriterium ist, weil es bewertet die Signifikanz des Faktors unter der Annahme, dass er zuletzt in das Modell einbezogen wird. Es ist der spezielle F-Test, der mit dem Student-t-Test verknüpft ist. Ein konsistenter F-Test kann für einen Forscher in der Phase der Modellbildung von Interesse sein. Für die Gleichung y=a+b1x1+b2+b3x3+e umfasst die Beurteilung der Signifikanz der Regressionskoeffizienten b1, b2, b3 die Berechnung von drei interfaktoriellen Bestimmtheitskoeffizienten.

Zum Preis statistische Signifikanz Regressions- und Korrelationskoeffizienten berechnet T -Kriterium des Schülers Und Vertrauensintervalle jeden der Indikatoren.

Vergleich der tatsächlichen und kritischen (tabellarischen) Werte von T-Statistik und Tabl. eine Hypothese annehmen oder ablehnen H0 . Verbindung zwischen Fishers F-Test Und T-Statistik des Schülers wird durch die Gleichheit ausgedrückt

Wenn t-Registerkarte.< tфакт ., Das H0 weicht ab, d.h. a, b Und r xy Es ist kein Zufall, dass sie von Null abweichen und unter dem Einfluss eines systematisch wirkenden Faktors entstanden sind X.

Wenn, t tab.> Takt. dann die Hypothese H0 wird nicht abgelehnt und die Zufälligkeit der Entstehung wird anerkannt a, b oder r xy.

25. Bewertung der Qualität von Regressionsmodellen. Der Standardfehler der Regressionslinie.

Bewertung der Qualität der linearen Regression: Bestimmtheitsmaß R 2

Aufgrund der linearen Beziehung von und erwarten wir, dass sich diese ändert, und nennen diese Variation, die auf Regression zurückzuführen ist oder durch diese erklärt wird. Die Restvariation sollte möglichst gering sein.

Wenn ja, wird der größte Teil der Variation durch die Regression erklärt und die Punkte liegen nahe an der Regressionslinie, d. h. Die Linie passt gut zu den Daten.

Aktie Gesamtvarianz, was durch Regression erklärt wird, heißt Bestimmungskoeffizient, normalerweise als Prozentsatz ausgedrückt und bezeichnet R2(Bei der gepaarten linearen Regression ist dies der Wert r2, das Quadrat des Korrelationskoeffizienten), ermöglicht eine subjektive Beurteilung der Qualität der Regressionsgleichung.

Der Unterschied ist der Prozentsatz der Varianz, der nicht durch Regression erklärt werden kann.

Da es keinen formalen Test zur Auswertung gibt, sind wir gezwungen, uns auf die subjektive Beurteilung zu verlassen, um die Qualität der Anpassung der Regressionsgeraden zu bestimmen.

Anwenden einer Regressionslinie auf eine Prognose

Anwenden einer Regressionslinie auf eine Prognose

Sie können eine Regressionslinie verwenden, um einen Wert aus einem Wert innerhalb des beobachteten Bereichs vorherzusagen (extrapolieren Sie niemals über diese Grenzen hinaus).

Wir sagen den Mittelwert für Observablen voraus, die einen bestimmten Wert haben, indem wir diesen Wert in die Regressionsgeradengleichung einsetzen.

Wenn wir also vorhersagen, verwenden wir diesen vorhergesagten Wert und seinen Standart Fehler, zu bewerten Konfidenzintervall für den wahren Bevölkerungsmittelwert.

Durch Wiederholen dieses Vorgangs für verschiedene Werte können Sie Vertrauensgrenzen für diese Linie erstellen. Dies ist ein Band oder Bereich, der beispielsweise eine echte Linie mit einem Konfidenzniveau von 95 % enthält.

26. Wechselbeziehung zwischen privatem F-Test, Student-T-Test und partiellem Korrelationskoeffizienten.

Aufgrund der Korrelation der m/y-Faktoren ist die Bedeutung desselben Faktors m/b je nach Reihenfolge seiner Einführung in das Modell unterschiedlich. Das Maß zur Beurteilung der Einbeziehung eines Faktors in das Modell ist häufiger F-Test, d.h. Fx ich. IN Gesamtansicht für Faktor x ich Der häufige F-Test ist definiert als:

Wenn wir die Gleichung betrachten y=a+b 1 x 1 +b 2 +b 3 x 3 +e, dann wird nacheinander das F-Kriterium für eine Gleichung mit einem Faktor x 1 bestimmt, dann das F-Kriterium für die zusätzliche Einbeziehung des Faktors x 2 in das Modell, also für den Übergang von einer Ein-Faktor-Regressionsgleichung zu einer Zwei-Faktor-Regressionsgleichung -Faktor eins und schließlich ein F-Kriterium für eine zusätzliche Einbeziehung des Faktors x 3 in das Modell, d das Model. In diesem Fall lautet das F-Kriterium für die zusätzliche Einbeziehung des Faktors x 2 nach x 1 konsistent im Gegensatz zum F-Kriterium für die zusätzliche Einbeziehung des Faktors x 3 in das Modell, der ist Privat F-Kriterium, da es die Signifikanz eines Faktors unter der Annahme bewertet, dass er zuletzt in das Modell aufgenommen wird. Es ist der spezielle F-Test, der mit dem Student-t-Test verknüpft ist. Ein konsistenter F-Test kann für einen Forscher in der Phase der Modellbildung von Interesse sein. Für die Gleichung y=a+b 1 x 1 +b 2 +b 3 x 3 +e Einschätzung der Bedeutung von Regressionskoeffizienten b 1 ,b 2,b 3 beinhaltet die Berechnung von drei interfaktoriellen Bestimmtheitskoeffizienten, nämlich:

Basierend auf dem Verhältnis b i und wir erhalten:

27. Optionen zum Aufbau eines Regressionsmodells. Ihre kurze Beschreibung.

28. Interpretation linearer und nichtlinearer Regressionsparameter.

		B	A
Dampfraum	linear	Regressionskoeffizienten b zeigt die durchschnittliche Änderung des effektiven Indikators (in Maßeinheiten y) bei einer Zunahme oder Abnahme des Wertes des Faktors x pro Maßeinheit. Die Beziehung zwischen y und x bestimmt das Vorzeichen des Regressionskoeffizienten b (wenn > 0 - direkte Beziehung, andernfalls - inverse).	nicht interpretiert, nur das Vorzeichen >0 - das Ergebnis ändert sich langsamer als der Faktor,<0 рез-т изм быстрее фактора
nichtlinear	im Potenzgesetz der Elastizitätskoeffizient, d.h. auf sk % meas rez-t im Durchschnitt, wenn sich der Faktor um 1 % ändert, ist die Umkehrfunktion dieselbe wie im linearen,	nicht interpretiert
Plural	linear	Bei der linearen multiplen Regression charakterisieren die Koeffizienten bei хi die durchschnittliche Änderung des Ergebnisses bei einer Änderung des entsprechenden Faktors um eins, wobei unveränderte Werte anderer Faktoren auf dem Durchschnittsniveau fixiert werden	nicht interpretiert

29. Matrix von Paar- und Teilkorrelationskoeffizienten bei der Konstruktion von Regressionsmodellen.

30. Voraussetzungen der Methode der kleinsten Quadrate.

Voraussetzungen der Methode der kleinsten Quadrate (Gauss-Markov-Bedingungen)

1. Die mathematische Erwartung einer zufälligen Abweichung ist für alle Beobachtungen Null. Diese Bedingung bedeutet, dass die zufällige Abweichung im Durchschnitt keinen Einfluss auf die abhängige Variable hat. In jeder gegebenen Beobachtung kann der Zufallsterm entweder positiv oder negativ sein, er darf jedoch nicht systematisch verzerrt sein.

2. Die Streuung zufälliger Abweichungen ist für alle Beobachtungen konstant. Diese Bedingung impliziert, dass, obwohl die zufällige Abweichung für eine bestimmte Beobachtung entweder groß oder klein sein kann, es keine a priori Ursache geben darf, die einen großen Fehler (Abweichung) verursacht.

Die Machbarkeit dieser Prämisse wird Homoskedastizität (Konstanz der Varianz von Abweichungen) genannt. Die Unmöglichkeit dieser Prämisse wird Heteroskedastizität (Variabilität der Varianz von Abweichungen) genannt.

3. Zufällige Abweichungen u i und u j sind für i¹j unabhängig voneinander. Die Machbarkeit dieser Prämisse geht davon aus, dass zwischen zufälligen Abweichungen kein systematischer Zusammenhang besteht. Mit anderen Worten: Die Größe und das eindeutige Vorzeichen einer zufälligen Abweichung dürfen nicht die Ursache für die Größe und das Vorzeichen einer anderen Abweichung sein. Die Machbarkeit dieser Prämisse bringt die folgende Beziehung mit sich:

Wenn diese Bedingung erfüllt ist, sagen wir daher, dass keine Autokorrelation vorliegt.

4. Die zufällige Abweichung muss unabhängig von den erklärenden Variablen sein.

Diese Bedingung ist normalerweise automatisch erfüllt, wenn die erklärenden Variablen im gegebenen Modell nicht zufällig sind. Diese Bedingung impliziert die Machbarkeit der folgenden Beziehung:

5. Das Modell ist bezüglich der Parameter linear.

Satz von Gauß-Markov. Wenn die Voraussetzungen 1–5 erfüllt sind, haben die durch die Methode der kleinsten Quadrate erhaltenen Schätzungen die folgenden Eigenschaften:

Die Schätzungen sind erwartungstreu, d. h. M(b 0) = b 0 , M(b 1) = b 1 , wobei b 0 , b 1) die Koeffizienten der empirischen Regressionsgleichung und b 0 , b 1 deren Koeffizienten sind theoretische Prototypen. Dies ergibt sich aus der ersten Prämisse und weist darauf hin, dass bei der Bestimmung der Position der Regressionsgeraden kein systematischer Fehler vorliegt.
Die Schätzungen sind konsistent, da die Varianz der Parameterschätzungen mit zunehmender Anzahl n der Beobachtungen gegen Null tendiert. Mit anderen Worten: Mit zunehmender Stichprobengröße steigt die Zuverlässigkeit der Schätzungen (die Koeffizienten der theoretischen und empirischen Regressionsgleichungen stimmen praktisch überein).
Die Schätzungen sind effizient, das heißt, sie weisen die geringste Varianz im Vergleich zu allen Schätzungen dieser Parameter auf, die in Bezug auf die Werte von y i linear sind.

Wenn die Voraussetzungen 2 und 3 verletzt werden, das heißt, die Varianz der Abweichungen ist nicht konstant und (oder) die Werte der zufälligen Abweichungen stehen in Beziehung zueinander, dann bleiben die Eigenschaften der Unvoreingenommenheit und der Konsistenz erhalten, die Effizienzeigenschaft jedoch nicht.

Neben der Machbarkeit dieser Voraussetzungen werden bei der Konstruktion klassischer linearer Regressionsmodelle noch einige weitere Annahmen getroffen. Zum Beispiel:

erklärende Variablen sind keine Lebensläufe;
zufällige Abweichungen haben eine Normalverteilung;
Die Anzahl der Beobachtungen ist deutlich größer als die Anzahl der erklärenden Variablen.

ANDERE TICKET-OPTION 30.

Die Methode der kleinsten Quadrate ist eine der Methoden der Regressionsanalyse zur Schätzung unbekannter Werte aus Messungen mit zufälligen Fehlern.

LSM wird auch verwendet, um eine bestimmte Funktion durch andere (einfachere) Funktionen anzunähern, und ist häufig bei der Verarbeitung von Beobachtungen nützlich.

Wenn der gewünschte Wert direkt gemessen werden kann, beispielsweise die Länge eines Segments oder ein Winkel, wird zur Erhöhung der Genauigkeit die Messung mehrmals durchgeführt und als Endergebnis das arithmetische Mittel aller Einzelmessungen gebildet. Diese Regel des arithmetischen Mittels basiert auf Überlegungen aus der Wahrscheinlichkeitstheorie; Es lässt sich leicht zeigen, dass die Summe der quadrierten Abweichungen der Einzelmessungen vom arithmetischen Mittel kleiner sein wird als die Summe der quadrierten Abweichungen der Einzelmessungen von jeder anderen Größe. Die Regel des arithmetischen Mittels selbst ist daher der einfachste Fall der Methode der kleinsten Quadrate.

Mit LSM können Sie solche Schätzungen der Parameter für Kat. erhalten. Summe der quadrierten Abweichungen der tatsächlichen Werte ergibt. Zeichen aus dem Theoretischen minimal.

Modell d.b. linear in den Parametern

X – Zufallsvariable

Der Wert des Fehlers ist zufällig, ihre Änderungen bilden kein spezifisches Modell (Restmodelle)

Anzahl der Beobachtungen z.B. mehr numerische Parameter (in 5-6r)

Die Werte der x-Variablen sollten nicht sein das gleiche

Die Sammlung muss homogen sein.

Fehlende Beziehung zwischen m / y f-rum x und dem Rest

Das Regressionsmodell d.b. richtig angegeben

Das Modell sollte nicht. enge Beziehung m / y fac-mi (für multiple Regression)

Grundvoraussetzungen für MNCs:

 Zufällige Natur der Rückstände

 Nulldurchschnitt der Residuen, unabhängig vom Faktor x

 Homoskedastizität (die Varianz jeder Abweichung ist für alle x-Werte gleich)

 keine Autokorrelation von Residuen

Residuen müssen einer Normalverteilung folgen

 Wenn das Regressionsmodell y = a + bx + E die Gauß-Markov-Bedingung erfüllt, weisen die OLS-Schätzungen a und b die beste Varianz in der Klasse aller linearen, erwartungstreuen Schätzungen auf.

31. Untersuchung der Residuen der multiplen Regressionsgleichung.

Rückstandsstudien prüfen das Vorhandensein der folgenden fünf OLS-Prämissen:

1) die zufällige Natur der Rückstände;

2) Nulldurchschnittswert der Residuen, unabhängig von ;

3) Homoskedastizität – die Varianz jeder Abweichung ist für alle Werte von gleich;

4) das Fehlen einer Autokorrelation der Residuen – die Werte der Residuen sind unabhängig voneinander verteilt;

5) Die Residuen folgen einer Normalverteilung.

Wenn die Verteilung der zufälligen Residuen einige der OLS-Annahmen nicht erfüllt, sollte das Modell korrigiert werden.

Zunächst wird die Zufälligkeit der Residuen überprüft – die erste Prämisse der kleinsten Quadrate. Zu diesem Zweck gibt es eine grafische Darstellung der Abhängigkeit der Residuen von den theoretischen Werten des effektiven Attributs (Abb. 2.1). Wenn im Diagramm ein horizontaler Balken erhalten wird, handelt es sich bei den Residuen um Zufallsvariablen und die Methode der kleinsten Quadrate ist gerechtfertigt. Die theoretischen Werte nähern sich den tatsächlichen Werten gut an.

32. Heteroskedastizität und ihre Berücksichtigung beim Aufbau eines multiplen Regressionsmodells. Qualitative Schätzung der Greteroskedastizität.

Heteroskedastizität manifestiert sich, wenn der Ausgangsdatensatz Folgendes umfasst qualitativ heterogen Bereiche. Heteroskedastizität bedeutet ungleiche Varianz Residuen für verschiedene Werte von x. Wenn Heteroskedastizität vorliegt, dann:

OLS-Schätzungen werden es tun unwirksam.
Kann sein versetzt Regressionskoeffizientenschätzungen und sie werden es tun unwirksam.
Es ist schwierig, die Standardfehlerformel zu verwenden, da sie eine gleichmäßige Varianz der Residuen annimmt.

Maßnahmen zur Beseitigung der Heteroskedastizität

p Erhöhung der Anzahl der Beobachtungen

p Ändern der funktionalen Form des Modells

p Aufteilung der Ausgangspopulation in qualitativ homogene Gruppen und Analyse in jeder Gruppe

p Die Verwendung von Dummy-Variablen, die die Heterogenität berücksichtigen

p Ausschluss aus der Menge der Einheiten, die Heterogenität verleihen

Tests zur Erkennung von Heteroskedastizität

p Goldfeld-Quandt

p Glaser

p Spearman-Rangkorrelation

33. Autokorrelation von Residuen und ihre Rolle beim Aufbau eines Regressionsmodells.

Abhängigkeit zwischen aufeinanderfolgenden Zeitebenen. Zeile aufgerufen Autokorrelation Zeilenebene. In der Ökonometrie In Studien kommt es häufig vor, dass die Varianz der Residuen konstant ist, ihre Kovarianz jedoch beobachtet wird. Dieses Phänomen nennt man Autokorrelation von Residuen.

Eine der gebräuchlichsten Methoden zur Bestimmung der Autokorrelation in Residuen ist − Durbin-Watson-Kriterium:

d= ;

d ist das Verhältnis der Quadratsumme der Differenzen aufeinanderfolgender Werte zur Restquadratsumme gemäß dem Regressionsmodell.

Es gibt eine Spur. das Verhältnis zwischen dem D-U-Kriterium „d“ und dem Autokorrelationskoeffizienten der Residuen 1. Ordnung r 1:

d = 2 * (1-r 1) .

Wenn in den Überresten ein vollständiger Zustand vorliegt. Autokorrelation und r 1 = 1, dann d = 0.

Wenn die Salden vollständig negativ sind. Autokorrelation, dann r 1 = -1 und d = 4.

Wenn keine Autokorrelation vorliegt, dann ist r 1 = 0 und d = 2.

Diese. 0≤d≤4.

Betrachten Sie einen Algorithmus zur Erkennung der Autokorrelation von Residuen basierend auf dem D-U-Kriterium.

vorgebracht wird Hypothese H 0 über das Fehlen einer Autokorrelation von Residuen . Alternativhypothesen H 1 und H 1 * gehen vom Vorhandensein einer positiven oder negativen Autokorrelation in den Residuen aus. Dann im Sonderangebot Tabellen sind definiert kritische Werte des Durbin-Watson-Kriteriums d L und d u für eine gegebene Anzahl von Beobachtungen n, die Anzahl der modellunabhängigen Variablen k auf einem Signifikanzniveau ɑ (normalerweise 0,95). Entsprechend dieser Werte wird das Intervall in fünf Segmente unterteilt. Die Annahme oder Ablehnung jeder der Hypothesen mit der Wahrscheinlichkeit (1-ɑ) ist in der folgenden Abbildung dargestellt:

+ ja	?	NEIN	?	- Es gibt
	d L	du		4-du	4-d L

Wenn die tatsächliche der Wert des Durbin-Watson-Kriteriums sinkt in die Zone der Unsicherheit, dann wird in der Praxis die Existenz einer Autokorrelation von Residuen angenommen und die Hypothese H 0 abgelehnt.

34. Auswahl der besten Version des Regressionsmodells.

35. Nichtlineare multiple Regressionsmodelle, ihre allgemeinen Eigenschaften.

Wenn zwischen wirtschaftlichen Phänomenen nichtlineare Zusammenhänge bestehen, werden diese durch die entsprechenden nichtlinearen Funktionen ausgedrückt: zum Beispiel eine gleichseitige Hyperbel , Parabeln zweiten Grades usw.

Es gibt zwei Klassen nichtlinearer Regressionen:

Regressionen, die nichtlinear in Bezug auf die in die Analyse einbezogenen erklärenden Variablen, aber linear in Bezug auf die geschätzten Parameter sind;

Regressionen, die in den geschätzten Parametern nichtlinear sind.
Die folgenden Funktionen können als Beispiel für eine nichtlineare Regression auf die darin enthaltenen erklärenden Variablen dienen:

Polynome unterschiedlichen Grades
gleichseitige Übertreibung

Nichtlineare Regressionen nach geschätzten Parametern umfassen die folgenden Funktionen:

Leistung
Demonstration
exponentiell ICH

36. Modelle vom hyperbolischen Typ. Engel-Kurven, Phillips-Kurven und andere Beispiele für die Verwendung von Modellen dieses Typs.

Engel-Kurven (Engel-Kurve) veranschaulichen den Zusammenhang zwischen dem Konsumvolumen von Gütern ( C) und Verbrauchereinkommen ( ICH) zu konstanten Preisen und Präferenzen. Benannt ist es nach dem deutschen Statistiker Ernst Engel, der die Auswirkungen von Einkommensänderungen auf die Struktur der Konsumausgaben analysierte.

Die Abszisse zeigt das Einkommensniveau des Verbrauchers und die Ordinate zeigt die Kosten für den Konsum dieses Gutes.

Die Grafik zeigt eine ungefähre Ansicht der Engel-Kurven:

E 1 - Kurve für normale Güter;
E 2 – Kurve für Luxusgüter;
E 3 - Kurve für minderwertige Ware.

Die Philips-Kurve spiegelt den Zusammenhang zwischen Inflation und Arbeitslosigkeit wider.

Das keynesianische Wirtschaftsmodell zeigt, dass eine Volkswirtschaft entweder Arbeitslosigkeit (verursacht durch einen Produktionsrückgang und damit einen Rückgang der Nachfrage nach Arbeitskräften) oder Inflation (wenn in der Wirtschaft Vollbeschäftigung herrscht) erleben kann.

Hohe Inflation und hohe Arbeitslosigkeit können nicht gleichzeitig existieren.

Die Philips-Kurve wurde von A.U. gebaut. Phillips basiert auf britischen Lohn- und Arbeitslosendaten von 1861 bis 1957.

Der Phillips-Kurve folgend kann der Staat seine Wirtschaftspolitik gestalten. Durch die Stimulierung der Gesamtnachfrage kann der Staat die Inflation erhöhen und die Arbeitslosigkeit senken und umgekehrt.

Bis Mitte der 70er Jahre war die Phillips-Kurve völlig korrekt. In diesem Zeitraum kam es zu einer Stagnation (gleichzeitiger Anstieg von Inflation und Arbeitslosigkeit), die mit der Phillips-Kurve nicht erklärt werden konnte.

Anwendung der Philips-Kurve

©2015-2019 Website
Alle Rechte liegen bei ihren Autoren. Diese Seite erhebt keinen Anspruch auf Urheberschaft, stellt die Nutzung jedoch kostenfrei zur Verfügung.
Erstellungsdatum der Seite: 16.02.2016

Erstellen einer Regressionsgleichung auf einer standardisierten Skala. Große Enzyklopädie über Öl und Gas

5.2. Normales System der kleinsten Quadratgleichungen in standardisierter Form

5.3. Standardisierte Regressionsoptionen

6. Möglichkeiten der ökonomischen Analyse auf Basis eines multifaktoriellen Modells

6.1. Standardisierte Regressionskoeffizienten

Rezepte für Füllungen für Törtchen – von Salaten und Pasteten bis hin zu gebackenen heißen Vorspeisen

Fleischröllchen mit Pilzen

Kohlrabikohl: Beschreibung, Nutzen und Schaden für den Körper, Kochrezepte

Hinweis für Hausfrauen: Rinderherzsalat mit Gurken Rezept für Rinderherzsalat zu Hause

Kategorien