Beispiel für eine Intervallvariationsreihe. Algorithmus zur Konstruktion einer Intervallvariationsreihe mit gleichen Intervallen

Der einfachste Weg, statistisches Material zu verallgemeinern, ist die Erstellung von Reihen. Das Ergebnis einer Zusammenfassung einer statistischen Studie können Verteilungsreihen sein. Eine Verteilungsreihe in der Statistik ist eine geordnete Verteilung von Bevölkerungseinheiten in Gruppen nach einem beliebigen Merkmal: qualitativ oder quantitativ. Wenn die Reihe auf qualitativer Basis aufgebaut ist, wird sie als attributiv bezeichnet, und wenn sie quantitativ ist, wird sie als Variation bezeichnet.

Die Variationsreihe ist durch zwei Elemente gekennzeichnet: Variante (X) und Häufigkeit (f). Eine Variante ist ein separater Wert eines Zeichens einer separaten Bevölkerungseinheit oder -gruppe. Die Zahl, die angibt, wie oft ein bestimmter Merkmalswert auftritt, wird als Häufigkeit bezeichnet. Wird die Häufigkeit als relative Zahl ausgedrückt, spricht man von Häufigkeit. Variationsreihe Es kann ein Intervall sein, wenn die Grenzen „von“ und „bis“ definiert sind, und es kann diskret sein, wenn das untersuchte Merkmal durch eine bestimmte Zahl gekennzeichnet ist.

Wir werden die Konstruktion von Variationsreihen anhand von Beispielen betrachten.

Beispiel. und es liegen Daten über die Lohnkategorien von 60 Arbeitern in einer der Werkstätten vor.

Verteilen Sie die Arbeitnehmer nach Tarifkategorien und erstellen Sie eine Variationsreihe.

Dazu schreiben wir alle Werte des Attributs in aufsteigender Reihenfolge aus und berechnen die Anzahl der Arbeiter in jeder Gruppe.

Tabelle 1.4

Verteilung der Arbeitnehmer nach Kategorie

Arbeiterrang (X)

Anzahl der Arbeiter

Person (w)

in % der Gesamtsumme (insbesondere)

Wir haben eine Variante diskrete Reihe, bei dem das untersuchte Merkmal (der Rang des Arbeitnehmers) durch eine bestimmte Zahl dargestellt wird. Der Übersichtlichkeit halber ist die Variationsreihe grafisch dargestellt. Basierend auf dieser Verteilerreihe wurde eine Verteilerfläche konstruiert.

Reis. 1.1. Polygon zur Verteilung der Arbeitnehmer nach Lohnkategorien

Wir betrachten die Konstruktion einer Intervallreihe mit gleichen Intervallen anhand des folgenden Beispiels.

Beispiel. Bekannte Daten zu den Anlagekapitalkosten von 50 Unternehmen in Millionen Rubel. Es ist erforderlich, die Verteilung der Unternehmen nach den Anlagekosten aufzuzeigen.

Um die Verteilung der Unternehmen nach den Anlagekosten darzustellen, entscheiden wir zunächst über die Anzahl der Gruppen, die wir unterscheiden möchten. Angenommen, wir beschließen, fünf Unternehmensgruppen herauszugreifen. Dann bestimmen wir die Größe des Intervalls in der Gruppe. Dazu verwenden wir die Formel

Nach unserem Beispiel.

Indem wir den Wert des Intervalls zum Mindestwert des Attributs addieren, erhalten wir Unternehmensgruppen nach den Anlagekosten.

Eine Einheit mit einem Double-Wert gehört zu der Gruppe, in der sie als Obergrenze fungiert (d. h. der Merkmalswert 17 geht in die erste Gruppe, 24 in die zweite usw.).

Zählen wir die Anzahl der Pflanzen in jeder Gruppe.

Tabelle 1.5

Verteilung der Unternehmen nach Wert des Anlagekapitals (Millionen Rubel)

Kosten des Anlagekapitals
in Millionen Rubel (X)

Anzahl der Firmen
(Frequenz) (f)

Kumulierte Frequenzen
(kumulativ)

Gemäß dieser Verteilung wurde eine Variationsintervallreihe erhalten, aus der hervorgeht, dass 36 Unternehmen über ein Anlagekapital im Wert von 10 bis 24 Millionen Rubel verfügen. usw.

Intervallverteilungsreihen können grafisch als Histogramm dargestellt werden.

Die Ergebnisse der Datenverarbeitung werden dokumentiert statistische Tabellen. Statistische Tabellen enthalten ihr Subjekt und ihr Prädikat.

Das Subjekt ist die Menge oder der Teil der Menge, die dem Merkmal unterliegt.

Das Prädikat ist ein Indikator, der das Subjekt charakterisiert.

Es werden Tabellen unterschieden: einfache und Gruppentabellen, kombinatorische Tabellen mit einfacher und komplexer Entwicklung des Prädikats.

Eine einfache Tabelle im Betreff enthält eine Liste der einzelnen Einheiten.

Wenn das Subjekt eine Gruppierung von Einheiten enthält, wird eine solche Tabelle als Gruppentabelle bezeichnet. Beispielsweise eine Gruppe von Unternehmen nach der Anzahl der Arbeitnehmer, Bevölkerungsgruppen nach Geschlecht.

Der Betreff der Kombinationstabelle enthält eine Gruppierung nach zwei oder mehr Kriterien. Beispielsweise wird die Bevölkerung nach Geschlecht in Gruppen nach Bildung, Alter usw. eingeteilt.

Kombinationstabellen enthalten Informationen, mit denen Sie die Beziehung einer Reihe von Indikatoren und das Muster ihrer räumlichen und zeitlichen Änderungen identifizieren und charakterisieren können. Damit die Tabelle bei der Entwicklung ihres Themas visuell ist, sind sie auf zwei oder drei Zeichen beschränkt und bilden für jedes von ihnen eine begrenzte Anzahl von Gruppen.

Das Prädikat in den Tabellen kann auf unterschiedliche Weise entwickelt werden. Bei einer einfachen Entwicklung des Prädikats sind alle seine Indikatoren unabhängig voneinander lokalisiert.

Bei einer komplexen Entwicklung des Prädikats werden die Indikatoren miteinander kombiniert.

Bei der Erstellung einer Tabelle muss man von den Zielen der Studie und dem Inhalt des verarbeiteten Materials ausgehen.

Statistiken verwenden neben Tabellen auch Grafiken und Diagramme. Diagramm – statistische Daten werden mit angezeigt geometrische Formen. Diagramme sind in Linien- und Balkendiagramme unterteilt, es können jedoch auch geschweifte Diagramme (Zeichnungen und Symbole) und Kreisdiagramme (der Kreis wird als Größe der Gesamtbevölkerung angenommen und die Flächen einzelner Sektoren werden angezeigt) vorhanden sein spezifisches Gewicht oder ein Teil davon Bestandteile), Radialdiagramme (basierend auf Polarkoordinaten). Das Kartogramm ist eine Kombination Konturkarte oder ein Lageplan mit Diagramm.

Anzahl der Gruppen (Intervalle) wird näherungsweise durch die Sturgess-Formel bestimmt:

m = 1 + 3,322 × log(n)

wo n - Gesamtzahl Beobachtungseinheiten (die Gesamtzahl der Elemente in der Population usw.), lg(n) ist der dezimale Logarithmus von n.

erhalten Nach der Sturgess-Formel wird der Wert in der Regel auf eine ganze Zahl aufgerundet Zahlen, da die Anzahl der Gruppen keine Bruchzahl sein kann.

Wenn eine Reihe von Intervallreihen mit einer solchen Anzahl von Gruppen bestimmte Kriterien nicht erfüllt, kann durch Runden eine andere Intervallreihe erstellt werden M auf eine ganzzahlige kleinere Zahl und wählen Sie die am besten geeignete der beiden Zeilen aus.

Die Anzahl der Gruppen sollte 15 nicht überschreiten.

Sie können die folgende Tabelle auch verwenden, wenn die Berechnung des dezimalen Logarithmus überhaupt nicht möglich ist.

    Bestimmen der Breite des Intervalls

Intervallbreite für eine Intervallvariationsreihe mit gleichen Intervallen wird durch die Formel bestimmt:

wobei X max der Maximalwert von x i ist, X min der Minimalwert von x i ist; m - Anzahl der Gruppen (Intervalle).

Der Intervallwert (ich ) werden normalerweise auf die nächste ganze Zahl gerundet, Ausnahmen bilden lediglich Fälle, in denen kleinste Schwankungen eines Merkmals untersucht werden (z. B. bei der Gruppierung von Teilen nach der Größe der Abweichungen vom Nennwert, gemessen in Bruchteilen eines Millimeters).

Häufig gilt folgende Regel:

Anzahl der Dezimalstellen

Mehrere Symbole nach dem Komma

Ein Beispiel für die Intervallbreite gemäß der Formel

Auf welches Vorzeichen runden wir?

Beispiel für abgerundete Abstandsbreite

    Wir definieren die Grenzen der Intervalle

untere Grenze erstes Intervall wird gleich dem Mindestwert des Attributs angenommen (meistens wird er vorab auf eine kleinere Ganzzahl mit derselben Ziffer wie die Breite des Intervalls gerundet). Zum Beispiel: x min = 15, i=130, x n des ersten Intervalls = 10.

x n1 ≈ x min

Obere Grenze das erste Intervall entspricht dem Wert (Xmin + ich).

Die untere Grenze des zweiten Intervalls ist immer gleich der oberen Grenze des ersten Intervalls. Für nachfolgende Gruppen werden die Grenzen auf ähnliche Weise bestimmt, d. h. der Wert des Intervalls wird sukzessive addiert.

X V ich = x N ich +ich

X N ich = x V i-1

    Wir bestimmen die Häufigkeiten der Intervalle.

Wir überlegen, wie viele Werte in jedes Intervall fielen. Denken Sie gleichzeitig daran, dass eine Einheit, deren Merkmalswert dem Wert der Obergrenze des Intervalls entspricht, dem nächsten Intervall zugeordnet werden sollte.

    Wir erstellen eine Intervallreihe in Form einer Tabelle.

    Bestimmen Sie die Mittelpunkte der Intervalle.

Für die weitere Analyse der Intervallreihe müssen Sie für jedes Intervall einen Merkmalswert auswählen. Dieser Merkmalswert gilt für alle Beobachtungseinheiten, die in dieses Intervall fallen. Diese. einzelne Elemente „verlieren“ ihre individuellen charakteristischen Werte und ihnen wird ein gemeinsamer charakteristischer Wert zugewiesen. So allgemeine Bedeutung Ist Mitte des Intervalls, was bezeichnet wird X" ich .

Überlegen Sie anhand eines Beispiels mit dem Wachstum von Kindern, wie Sie eine Intervallreihe mit gleichen Intervallen erstellen.

Es liegen erste Daten vor.

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

Laborarbeit №1. Primäre Verarbeitung statistischer Daten

Aufbau von Vertriebsreihen

Die geordnete Verteilung von Bevölkerungseinheiten in Gruppen nach einem beliebigen Attribut wird aufgerufen in der Nähe der Verteilung . In diesem Fall kann das Vorzeichen sowohl quantitativ sein, dann heißt die Reihe Variation , und qualitativ, dann heißt die Reihe attributiv . Beispielsweise kann die Bevölkerung einer Stadt nach verteilt werden Altersgruppen in eine Variationsreihe, oder je nach Berufszugehörigkeit in eine attributive Reihe (selbstverständlich können noch viele weitere qualitative und quantitative Zeichen zur Konstruktion von Verteilungsreihen angeboten werden, die Wahl eines Zeichens wird durch die Aufgabe der statistischen Forschung bestimmt).

Jede Vertriebsreihe zeichnet sich durch zwei Elemente aus:

- Möglichkeit(x i) sind die Einzelwerte der Charakteristik von Einheiten Stichprobenrahmen. Bei einer Variationsreihe nimmt die Variante numerische Werte an, bei einer attributiven Reihe - qualitative (z. B. x = „Beamter“);

- Frequenz(N ich) ist eine Zahl, die angibt, wie oft dieser oder jener Merkmalswert vorkommt. Wenn die Häufigkeit als relative Zahl ausgedrückt wird (d. h. der Anteil der entsprechenden Bevölkerungselemente). gegebener Wert Optionen, im Gesamtvolumen der Bevölkerung), dann heißt es relative Frequenz oder Frequenz.

Variationsreihen können sein:

- diskret wenn das untersuchte Merkmal durch eine bestimmte Zahl (normalerweise eine ganze Zahl) gekennzeichnet ist.

- Intervall wenn die Grenzen „von“ und „bis“ für ein kontinuierlich veränderliches Merkmal definiert werden. Intervallreihe auch bauen, wenn die Wertemenge eines diskret variablen Attributs groß ist.

Eine Intervallreihe kann wie bei Intervallen konstruiert werden Gleiche Länge(Reihen mit gleichen Intervallen) und mit ungleichen Intervallen, wenn dies durch die Bedingungen der statistischen Untersuchung erforderlich ist. Beispielsweise kann eine Reihe der Einkommensverteilung der Bevölkerung mit folgenden Intervallen betrachtet werden:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



Dabei ist k die Anzahl der Intervalle und n die Stichprobengröße. (Natürlich gibt die Formel normalerweise eine Bruchzahl an, und als Anzahl der Intervalle wird die ganze Zahl gewählt, die der resultierenden Zahl am nächsten kommt.) Die Länge des Intervalls wird in diesem Fall durch die Formel bestimmt

.

Grafisch können Variationsreihen dargestellt werden als Histogramme(Über jedem Intervall der Intervallreihe wird eine „Spalte“ mit einer Höhe entsprechend der Häufigkeit in diesem Intervall erstellt.) Verbreitungsgebiet(gestrichelte Linie verbindet Punkte ( x i;n ich) oder kumuliert(Konstruiert nach den akkumulierten Häufigkeiten, d. h. für jeden Wert des Attributs wird die Häufigkeit des Auftretens in der Menge von Objekten mit einem Wert des Attributs kleiner als der angegebene Wert genommen).

Bei der Arbeit in Excel können die folgenden Funktionen zum Erstellen von Variationsreihen verwendet werden:

ÜBERPRÜFEN( Datenarray) – zur Bestimmung der Stichprobengröße. Das Argument ist der Zellbereich, der die Beispieldaten enthält.

ZÄHLENWENN( Bereich; Kriterium) – kann zum Erstellen einer Attribut- oder Variationsreihe verwendet werden. Die Argumente sind der Bereich des Attributbeispielwertearrays und das Kriterium – der numerische oder Textwert des Attributs oder die Nummer der Zelle, in der es sich befindet. Das Ergebnis ist die Häufigkeit des Auftretens dieses Werts in der Stichprobe.

FREQUENZ( Datenarray; Intervall-Array) – um eine Variationsreihe zu erstellen. Die Argumente sind der Bereich des Beispieldatenarrays und die Intervallspalte. Wenn es erforderlich ist, eine diskrete Reihe zu erstellen, werden hier die Werte der Optionen angezeigt, wenn es sich um Intervalle handelt, dann die oberen Grenzen der Intervalle (sie werden auch „Taschen“ genannt). Da das Ergebnis eine Spalte mit Häufigkeiten ist, muss die Einführung der Funktion durch Drücken der Tastenkombination STRG+UMSCHALT+EINGABE abgeschlossen werden. Beachten Sie, dass beim Festlegen eines Arrays von Intervallen beim Einführen einer Funktion der letzte Wert darin weggelassen werden kann – alle Werte, die nicht in die vorherigen „Taschen“ gefallen sind, werden in die entsprechende „Tasche“ eingefügt. Dies hilft manchmal, den Fehler zu vermeiden, dass der größte Stichprobenwert nicht automatisch in die letzte „Tasche“ gelegt wird.

Darüber hinaus kommt für komplexe Gruppierungen (nach mehreren Kriterien) das Tool „Pivot-Tabellen“ zum Einsatz. Sie können auch zum Aufbau von Attribut- und Variationsreihen verwendet werden, was die Aufgabe jedoch unnötig verkompliziert. Um eine Variationsreihe und ein Histogramm zu erstellen, gibt es außerdem eine „Histogramm“-Prozedur aus dem „Analysis Package“-Add-In (um Add-Ins in Excel zu verwenden, müssen Sie diese zuerst herunterladen, sie sind nicht standardmäßig installiert).

Anhand der folgenden Beispiele veranschaulichen wir den Prozess der Primärdatenverarbeitung.

Beispiel 1.1. Es liegen Daten zur quantitativen Zusammensetzung von 60 Familien vor.

Erstellen Sie eine Variationsreihe und ein Verteilungspolygon

Lösung.

Öffnen wir die Excel-Tabellen. Geben wir ein Datenarray im Bereich A1:L5 ein. Wenn Sie ein Dokument in elektronischer Form (z. B. im Word-Format) studieren, müssen Sie lediglich eine Tabelle mit Daten auswählen und in die Zwischenablage kopieren. Anschließend wählen Sie Zelle A1 aus und fügen die Daten ein – diese werden automatisch belegt entsprechenden Bereich. Berechnen wir die Stichprobengröße n – die Anzahl der Stichprobendaten. Geben Sie dazu in Zelle B7 die Formel = COUNT (A1: L5) ein. Beachten Sie, dass es zum Eingeben des gewünschten Bereichs in die Formel nicht erforderlich ist, seine Bezeichnung über die Tastatur einzugeben, es reicht aus, ihn auszuwählen. Bestimmen wir die Mindest- und Höchstwerte in der Stichprobe, indem wir die Formel =MIN(A1:L5) in Zelle B8 und in Zelle B9 eingeben: =MAX(A1:L5).

Abb.1.1 Beispiel 1. Primärverarbeitung statistischer Daten in Excel-Tabellen

Als Nächstes bereiten wir eine Tabelle zum Erstellen einer Variationsreihe vor, indem wir Namen für die Intervallspalte (Variantenwerte) und die Häufigkeitsspalte eingeben. Geben Sie in der Intervallspalte die Werte des Attributs vom Minimum (1) bis zum Maximum (6) ein und belegen Sie den Bereich B12:B17. Wählen Sie die Häufigkeitsspalte aus, geben Sie die Formel =FREQUENCY(A1:L5;B12:B17) ein und drücken Sie die Tastenkombination STRG+UMSCHALT+ENTER

Abb.1.2 Beispiel 1. Konstruktion einer Variationsreihe

Zur Kontrolle berechnen wir die Summe der Häufigkeiten mithilfe der SUMME-Funktion (das S-Funktionssymbol in der Gruppe „Bearbeiten“ auf der Registerkarte „Startseite“). Die berechnete Summe muss mit der zuvor berechneten Stichprobengröße in Zelle B7 übereinstimmen.

Lassen Sie uns nun ein Polygon erstellen: Nachdem Sie den resultierenden Frequenzbereich ausgewählt haben, wählen Sie auf der Registerkarte „Einfügen“ den Befehl „Grafik“. Standardmäßig sind die Werte auf der horizontalen Achse Ordnungszahlen – in unserem Fall von 1 bis 6, was mit den Werten der Optionen (Nummern der Tarifkategorien) übereinstimmt.

Der Name der Reihe des Diagramms „Reihe 1“ kann entweder mit der gleichen Option „Daten auswählen“ auf der Registerkarte „Designer“ geändert oder einfach gelöscht werden.

Abb.1.3. Beispiel 1. Erstellen eines Frequenzpolygons

Beispiel 1.2. Es liegen Daten zu Schadstoffemissionen aus 50 Quellen vor:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Stellen Sie eine Reihe gleicher Intervalle zusammen und erstellen Sie ein Histogramm

Lösung

Fügen wir einer Excel-Tabelle ein Datenarray hinzu, das den Bereich A1:J5 einnimmt. Wie in der vorherigen Aufgabe bestimmen wir die Stichprobengröße n, die Mindest- und Höchstwerte in der Stichprobe. Da wir nun keine diskrete, sondern eine Intervallreihe benötigen und die Anzahl der Intervalle im Problem nicht angegeben ist, berechnen wir die Anzahl der Intervalle k mit der Sturgess-Formel. Geben Sie dazu in Zelle B10 die Formel =1+3,322*LOG10(B7) ein.

Abb.1.4. Beispiel 2. Konstruktion einer Reihe gleicher Intervalle

Der resultierende Wert ist keine Ganzzahl, sondern beträgt etwa 6,64. Da für k=7 die Länge der Intervalle als ganze Zahl ausgedrückt wird (im Gegensatz zu k=6), wählen wir k=7, indem wir diesen Wert in Zelle C10 eingeben. Wir berechnen die Länge des Intervalls d in Zelle B11, indem wir die Formel = (B9-B8) / C10 eingeben.

Definieren wir ein Array von Intervallen und geben die Obergrenze für jedes der sieben Intervalle an. Berechnen Sie dazu in Zelle E8 die Obergrenze des ersten Intervalls, indem Sie die Formel =B8+B11; Geben Sie in Zelle E9 die Obergrenze des zweiten Intervalls ein, indem Sie die Formel =E8+B11 eingeben. Um die verbleibenden Werte der Obergrenzen der Intervalle zu berechnen, fixieren wir die Nummer der Zelle B11 in der eingegebenen Formel mit dem $-Zeichen, sodass die Formel in Zelle E9 =E8+B$11 wird, und kopieren den Inhalt von Zelle E9 in die Zellen E10-E14. Der zuletzt erhaltene Wert entspricht dem Maximalwert in der zuvor in Zelle B9 berechneten Stichprobe.

Abb.1.5. Beispiel 2. Konstruktion einer Reihe gleicher Intervalle


Füllen wir nun das Array der „Taschen“ mit der Funktion FREQUENCY, wie in Beispiel 1 gemacht.

Abb.1.6. Beispiel 2. Konstruktion einer Reihe gleicher Intervalle

Basierend auf der resultierenden Variationsreihe erstellen wir ein Histogramm: Wählen Sie die Häufigkeitsspalte aus und wählen Sie „Histogramm“ auf der Registerkarte „Einfügen“. Nachdem wir das Histogramm erhalten haben, ändern wir die Beschriftungen der horizontalen Achse darin in Werte im Intervallbereich. Dazu wählen wir die Option „Daten auswählen“ auf der Registerkarte „Designer“. Wählen Sie im erscheinenden Fenster den Befehl „Ändern“ für den Abschnitt „Horizontale Achsenbeschriftungen“ und geben Sie den Wertebereich der Varianten ein, indem Sie ihn mit der „Maus“ auswählen.

Abb.1.7. Beispiel 2. Erstellen eines Histogramms

Abb.1.8. Beispiel 2. Erstellen eines Histogramms

Beim Aufbau einer Intervallverteilungsreihe werden drei Fragen gelöst:

  • 1. Wie viele Intervalle sollte ich nehmen?
  • 2. Wie lang sind die Intervalle?
  • 3. Wie werden Bevölkerungseinheiten in die Intervallgrenzen einbezogen?
  • 1. Anzahl der Intervalle kann bestimmt werden durch Sturgess-Formel:

2. Intervalllänge oder Intervallschritt, wird normalerweise durch die Formel bestimmt

Wo R- Variationsbreite.

3. Die Reihenfolge der Einbeziehung von Bevölkerungseinheiten in die Grenzen des Intervalls

kann unterschiedlich sein, aber beim Aufbau einer Intervallreihe ist die Verteilung notwendigerweise streng definiert.

Zum Beispiel dies: [), bei dem die Einheiten der Grundgesamtheit in den unteren Grenzen enthalten sind und nicht in den oberen Grenzen, sondern in das nächste Intervall übertragen werden. Die Ausnahme von dieser Regel ist das letzte Intervall, dessen Obergrenze die letzte Zahl der Rangfolge umfasst.

Die Grenzen der Intervalle sind:

  • geschlossen – mit zwei Extremwerten des Attributs;
  • offen - mit einem Extremwert des Merkmals (Vor irgendeine Zahl oder über eine solche Zahl).

Um das theoretische Material zu assimilieren, stellen wir vor Hintergrundinformation für Lösungen durch Aufgaben.

Es liegen bedingte Daten über die durchschnittliche Anzahl der Vertriebsleiter, die Anzahl der von ihnen verkauften gleichwertigen Waren, den individuellen Marktpreis für dieses Produkt sowie das Verkaufsvolumen von 30 Unternehmen in einer der Regionen der Russischen Föderation vor das erste Quartal des Berichtsjahres (Tabelle 2.1).

Tabelle 2.1

Erste Informationen zu einer Querschnittsaufgabe

Bevölkerung

Manager

Preis, tausend Rubel

Verkaufsvolumen, Millionen Rubel

Bevölkerung

Manager

Menge der verkauften Waren, Stk.

Preis, tausend Rubel

Verkaufsvolumen, Millionen Rubel

Auf Basis der Erstinformationen sowie zusätzlicher Informationen erstellen wir individuelle Aufgabenstellungen. Anschließend stellen wir die Methodik zu ihrer Lösung und die Lösungen selbst vor.

Querschnittsaufgabe. Aufgabe 2.1

Verwendung der Originaldatentabelle. 2.1 erforderlich Erstellen Sie eine diskrete Reihe von Unternehmensverteilungen nach der Anzahl der verkauften Waren (Tabelle 2.2).

Lösung:

Tabelle 2.2

Diskrete Verteilungsreihe von Unternehmen nach der Anzahl der in einer der Regionen der Russischen Föderation im ersten Quartal des Berichtsjahres verkauften Waren

Querschnittsaufgabe. Aufgabe 2.2

erforderlich Erstellen Sie eine Rangliste von 30 Unternehmen nach der durchschnittlichen Anzahl von Managern.

Lösung:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Querschnittsaufgabe. Aufgabe 2.3

Verwendung der Originaldatentabelle. 2.1, erforderlich:

  • 1. Konstruieren Sie eine Intervallreihe für die Verteilung von Unternehmen nach der Anzahl der Manager.
  • 2. Berechnen Sie die Häufigkeiten der Verteilungsreihen der Unternehmen.
  • 3. Ziehen Sie Schlussfolgerungen.

Lösung:

Berechnen Sie mit der Sturgess-Formel (2.5) Anzahl der Intervalle:

Wir nehmen also 6 Intervalle (Gruppen).

Intervalllänge, oder Intervallschritt, berechnen Sie nach der Formel

Notiz. Die Reihenfolge der Einbeziehung von Bevölkerungseinheiten in die Grenzen des Intervalls ist wie folgt: I), wobei die Bevölkerungseinheiten in die unteren Grenzen einbezogen werden und nicht in die oberen, sondern auf die nächsten übertragen werden Intervall. Die Ausnahme von dieser Regel ist das letzte Intervall I ], dessen Obergrenze die letzte Zahl der Rangfolge einschließt.

Wir erstellen eine Intervallreihe (Tabelle 2.3).

Intervallreihe der Unternehmensverteilung, aber die durchschnittliche Anzahl der Manager in einer der Regionen der Russischen Föderation im ersten Quartal des Berichtsjahres

Abschluss. Die zahlreichste Firmengruppe ist die Gruppe mit einer durchschnittlichen Anzahl von Führungskräften von 25–30 Personen, zu der 8 Firmen (27 %) gehören; Die kleinste Gruppe mit einer durchschnittlichen Anzahl von Führungskräften von 40–45 Personen umfasst nur ein Unternehmen (3 %).

Verwendung der Originaldatentabelle. 2.1 sowie die Intervallreihe der Verteilung der Unternehmen nach Anzahl der Manager (Tabelle 2.3), erforderlich Erstellen Sie eine analytische Gruppierung des Zusammenhangs zwischen der Anzahl der Manager und dem Umsatzvolumen der Unternehmen und ziehen Sie darauf basierend eine Schlussfolgerung über das Vorhandensein (oder Fehlen) eines Zusammenhangs zwischen den angegebenen Zeichen.

Lösung:

Die analytische Gruppierung basiert auf Faktoren. In unserem Problem ist das Faktorzeichen (x) die Anzahl der Manager und das resultierende Vorzeichen (y) das Verkaufsvolumen (Tabelle 2.4).

Lasst uns jetzt bauen analytische Gruppierung(Tabelle 2.5).

Abschluss. Basierend auf den Daten der erstellten analytischen Gruppierung kann gesagt werden, dass mit einer Erhöhung der Anzahl der Vertriebsleiter auch das durchschnittliche Umsatzvolumen des Unternehmens in der Gruppe steigt, was auf das Vorhandensein eines direkten Zusammenhangs zwischen diesen Merkmalen hinweist.

Tabelle 2.4

Hilfstabelle zum Aufbau einer analytischen Gruppierung

Anzahl der Führungskräfte, Personen,

Firmennummer

Verkaufsvolumen, Millionen Rubel, y

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

bei = ’ =10,31 30

Tabelle 2.5

Abhängigkeit des Umsatzvolumens von der Anzahl der Unternehmensleiter in einer der Regionen der Russischen Föderation im ersten Quartal des Berichtsjahres

Kontrollfragen
  • 1. Was ist das Wesen der statistischen Beobachtung?
  • 2. Benennen Sie die Phasen der statistischen Beobachtung.
  • 3. Welche Organisationsformen gibt es für die statistische Beobachtung?
  • 4. Nennen Sie die Arten der statistischen Beobachtung.
  • 5. Was ist eine statistische Zusammenfassung?
  • 6. Benennen Sie die Arten von statistischen Berichten.
  • 7. Was ist eine statistische Gruppierung?
  • 8. Benennen Sie die Arten statistischer Gruppierungen.
  • 9. Was ist eine Vertriebsreihe?
  • 10. Benennen Sie die Strukturelemente der Verteilungsreihe.
  • 11. Wie wird eine Verteilungsreihe erstellt?

Sie werden in Form von Vertriebsreihen präsentiert und haben das Format .

Eine Verteilungsreihe ist eine Art der Gruppierung.

Verbreitungsgebiet- stellt eine geordnete Verteilung von Einheiten der untersuchten Bevölkerung in Gruppen entsprechend einem bestimmten variierenden Attribut dar.

Abhängig von dem Merkmal, das der Bildung einer Verteilungsreihe zugrunde liegt, gibt es Attributiv und Variation Verteilungsränge:

  • attributiv- Nennen Sie die nach qualitativen Gesichtspunkten aufgebaute Vertriebsreihe.
  • Es werden Verteilungsreihen genannt, die in aufsteigender oder absteigender Reihenfolge der Werte eines quantitativen Attributs aufgebaut sind Variation.
Die Variationsreihe der Verteilung besteht aus zwei Spalten:

Die erste Spalte enthält die quantitativen Werte des Variablenmerkmals, die aufgerufen werden Optionen und sind gekennzeichnet. Diskrete Variante – ausgedrückt als Ganzzahl. Die Intervalloption liegt im Bereich von und bis. Abhängig von der Art der Varianten ist es möglich, eine diskrete oder intervallmäßige Variationsreihe zu erstellen.
Die zweite Spalte enthält Anzahl der spezifischen Optionen, ausgedrückt in Frequenzen oder Frequenzen:

Frequenzen– Hierbei handelt es sich um absolute Zahlen, die angeben, wie oft der angegebene Wert des Merkmals insgesamt vorkommt, was bedeutet. Die Summe aller Häufigkeiten sollte der Anzahl der Einheiten der Gesamtpopulation entsprechen.

Frequenzen() sind die Häufigkeiten, ausgedrückt als Prozentsatz der Gesamtzahl. Die Summe aller Häufigkeiten, ausgedrückt als Prozentsatz, muss in Bruchteilen von eins 100 % betragen.

Grafische Darstellung von Verteilungsreihen

Die Verteilreihen werden anhand grafischer Bilder visualisiert.

Die Verteilungsreihen werden wie folgt angezeigt:
  • Polygon
  • Histogramme
  • Kumuliert
  • Ogiven

Polygon

Beim Aufbau eines Polygons werden auf der horizontalen Achse (Abszisse) die Werte des Variablenattributs aufgetragen und auf der vertikalen Achse (Ordinate) - Häufigkeiten bzw. Häufigkeiten.

Das Polygon in Abb. 6.1 wurde gemäß der Mikrozählung der Bevölkerung Russlands im Jahr 1994 gebaut.

6.1. Verteilung der Haushalte nach Größe

Zustand: Es werden Angaben zur Verteilung von 25 Mitarbeitern eines der Unternehmen nach Tarifkategorien gemacht:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Aufgabe: Erstellen Sie eine diskrete Variationsreihe und stellen Sie sie grafisch als Verteilungspolygon dar.
Lösung:
In diesem Beispiel handelt es sich bei den Optionen um die Lohnkategorie des Arbeitnehmers. Um die Häufigkeiten zu ermitteln, ist es notwendig, die Anzahl der Arbeitnehmer mit der entsprechenden Lohnkategorie zu berechnen.

Das Polygon wird für diskrete Variationsreihen verwendet.

Um ein Verteilungspolygon zu erstellen (Abb. 1), zeichnen wir entlang der Abszisse (X) die quantitativen Werte der variierenden Merkmalsvarianten und entlang der Ordinate die Häufigkeiten oder Häufigkeiten auf.

Werden die charakteristischen Werte als Intervalle ausgedrückt, dann nennt man eine solche Reihe Intervallreihe.
Intervallreihe Verteilungen werden grafisch als Histogramm, Kumulierung oder Ogive dargestellt.

Statistische Tabelle

Zustand: Daten zur Höhe der Einlagen von 20 Personen bei einer Bank (in Tausend Rubel) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Aufgabe: Erstellen Sie eine Intervallvariationsreihe mit gleichen Intervallen.
Lösung:

  1. Die Anfangspopulation besteht aus 20 Einheiten (N = 20).
  2. Mithilfe der Sturgess-Formel ermitteln wir die erforderliche Anzahl der verwendeten Gruppen: n=1+3,322*lg20=5
  3. Berechnen wir den Wert des gleichen Intervalls: i=(152 - 2) /5 = 30.000 Rubel
  4. Wir teilen die Anfangspopulation in 5 Gruppen im Abstand von 30.000 Rubel ein.
  5. Die Gruppierungsergebnisse sind in der Tabelle dargestellt:

Wenn bei einer solchen Aufzeichnung eines kontinuierlichen Merkmals derselbe Wert zweimal auftritt (als obere Grenze eines Intervalls und als untere Grenze eines anderen Intervalls), dann gehört dieser Wert zu der Gruppe, in der dieser Wert als obere Grenze fungiert.

Balkendiagramm

Um ein Histogramm entlang der Abszisse zu erstellen, geben Sie die Werte der Grenzen der Intervalle an und konstruieren Sie auf dieser Grundlage Rechtecke, deren Höhe proportional zu den Frequenzen (oder Frequenzen) ist.

Auf Abb. 6.2. Dargestellt ist das Histogramm der Verteilung der Bevölkerung Russlands im Jahr 1997 nach Altersgruppen.

Reis. 6.2. Verteilung der Bevölkerung Russlands nach Altersgruppen

Zustand: Angegeben ist die Verteilung von 30 Mitarbeitern des Unternehmens nach der Höhe des Monatsgehalts

Aufgabe: Die Intervallvariationsreihe grafisch als Histogramm anzeigen und kumulieren.
Lösung:

  1. Die unbekannte Grenze des offenen (ersten) Intervalls wird durch den Wert des zweiten Intervalls bestimmt: 7000 - 5000 = 2000 Rubel. Bei gleichem Wert finden wir die Untergrenze des ersten Intervalls: 5000 - 2000 = 3000 Rubel.
  2. Um ein Histogramm in einem rechteckigen Koordinatensystem zu erstellen, legen wir entlang der Abszissenachse Segmente beiseite, deren Werte den Intervallen der Variantenreihe entsprechen.
    Diese Segmente dienen als untere Basis und die entsprechende Frequenz (Frequenz) dient als Höhe der gebildeten Rechtecke.
  3. Lassen Sie uns ein Histogramm erstellen:

Um die Summe zu bilden, ist es notwendig, die akkumulierten Häufigkeiten (Frequenzen) zu berechnen. Sie werden durch sukzessive Summation der Häufigkeiten (Häufigkeiten) der vorherigen Intervalle ermittelt und mit S bezeichnet. Die akkumulierten Häufigkeiten geben an, wie viele Einheiten der Grundgesamtheit einen Merkmalswert haben, der nicht größer als der betrachtete ist.

Kumulieren

Die Verteilung eines Merkmals in einer Variationsreihe entsprechend der akkumulierten Häufigkeiten (Häufigkeiten) wird anhand des Kumulats dargestellt.

Kumulieren oder die Summenkurve wird im Gegensatz zum Polygon auf den akkumulierten Häufigkeiten bzw. Häufigkeiten aufgebaut. Gleichzeitig werden auf der Abszissenachse die Werte des Merkmals und auf der Ordinatenachse die akkumulierten Häufigkeiten bzw. Häufigkeiten aufgetragen (Abb. 6.3).

Reis. 6.3. Kumulierte Verteilung der Haushalte nach Größe

4. Berechnen Sie die akkumulierten Häufigkeiten:
Die Kniefrequenz des ersten Intervalls berechnet sich wie folgt: 0 + 4 = 4, für das zweite: 4 + 12 = 16; für den dritten: 4 + 12 + 8 = 24 usw.

Bei der Bildung des Kumulats wird die akkumulierte Häufigkeit (Häufigkeit) des entsprechenden Intervalls seiner Obergrenze zugeordnet:

Ogiva

Ogiva ist ähnlich wie das Kumulieren aufgebaut, mit dem einzigen Unterschied, dass die akkumulierten Häufigkeiten auf der Abszissenachse und die Merkmalswerte auf der Ordinatenachse platziert werden.

Eine Variation des Kumulats ist die Konzentrationskurve oder Lorenz-Kurve. Um die Konzentrationskurve darzustellen, werden beide Achsen des rechteckigen Koordinatensystems prozentual von 0 bis 100 skaliert. In diesem Fall geben die Abszissenachsen die akkumulierten Häufigkeiten und die Ordinatenachsen die akkumulierten Werte des Anteils (in) an Prozent) durch das Volumen des Features.

Die gleichmäßige Verteilung des Vorzeichens entspricht der Diagonale des Quadrats im Diagramm (Abb. 6.4). Bei ungleichmäßiger Verteilung ist das Diagramm abhängig vom Konzentrationsgrad des Merkmals eine konkave Kurve.

6.4. Konzentrationskurve


Fehler: Der Inhalt ist geschützt!!