4 jak zbudowane są dyskretne szeregi zmienności przedziałów Podsumowanie statystyczne i grupowanie

Przykład rozwiązania testu ze statystyki matematycznej

Problem 1

Wstępne dane : uczniowie pewnej grupy 30 osób zdali egzamin z kursu „Informatyka”. Oceny otrzymane przez uczniów układają się w następujący ciąg liczb:

I. Skomponujmy serię wariacyjną

m x

w x

m x nak

w x nak

Całkowity:

II. Graficzna prezentacja informacji statystycznych.

III. Charakterystyki liczbowe próbki.

1. Średnia arytmetyczna

2. Średnia geometryczna

3. Moda

4. Mediana

222222333333333 | 3 34444444445555

5. Wariancja próbki

7. Współczynnik zmienności

8. Asymetria

9. Współczynnik asymetrii

10. Nadmiar

11. Współczynnik kurtozy

Zadanie 2

Wstępne dane : uczniowie określonej grupy napisali test końcowy. Grupa składa się z 30 osób. Punkty zdobyte przez uczniów układają się w następujący ciąg liczb

Decyzja

I. Ponieważ cecha przyjmuje wiele różnych wartości, skonstruujemy dla niej przedziałową serię zmienności. Aby to zrobić, najpierw ustaw wartość interwału h... Wykorzystamy formułę Stairgera

Skomponujmy skalę interwałów. W tym przypadku jako górną granicę pierwszego przedziału przyjmiemy wartość określoną wzorem:

Górne granice kolejnych przedziałów wyznacza następujący wzór rekurencyjny:

następnie

Kończymy budowanie skali przedziałów, ponieważ górna granica następnego przedziału stała się większa lub równa maksymalnej wartości próbki
.

II. Graficzne wyświetlanie serii zmienności interwałów

III. Charakterystyki liczbowe próbki

Aby określić numeryczną charakterystykę próbki, skomponujemy tabelę pomocniczą

Ilość:

1. Średnia arytmetyczna

2. Średnia geometryczna

3. Moda

4. Mediana

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Wariancja próbki

6. Odchylenie standardowe próbki

7. Współczynnik zmienności

8. Asymetria

9. Współczynnik asymetrii

10. Nadmiar

11. Współczynnik kurtozy

Problem 3

Stan: schorzenie : podziałka skali amperomierza wynosi 0,1 A. Odczyty są zaokrąglane do najbliższej pełnej działki. Znajdź prawdopodobieństwo, że błąd przekracza 0,02 A.

Decyzja.

Błąd zaokrąglenia można uznać za wartość losową. X, który jest rozłożony równomiernie w przedziale między dwiema sąsiednimi podziałami całkowitymi. Gęstość równomiernego rozkładu

Gdzie
- długość przedziału, w którym zawarte są możliwe wartości X; poza tym przedziałem
W tym zadaniu długość przedziału zawierającego możliwe wartości X, jest równe 0,1, zatem

Błąd zliczania przekroczy 0,02, jeśli zostanie zawarty w przedziale (0,02; 0,08). Następnie

Odpowiedź: R=0,6

Problem 4

Wstępne dane: oczekiwanie matematyczne i odchylenie standardowe cechy o rozkładzie normalnym X są odpowiednio równe 10 i 2. Znajdź prawdopodobieństwo, że w wyniku testu X przyjmie wartość zawartą w przedziale (12, 14).

Decyzja.

Użyjmy formuły

I teoretyczne częstotliwości

Decyzja

Dla X jej wartość oczekiwana M (X) i wariancja D (X). Decyzja... Znajdźmy rozkład F(x) zmiennej losowej ... błąd próbkowania). Skomponujmy wariacja rząd Rozpiętość będzie: Dla każdej wartości Liczba z policzmy ile...

  • Rozwiązanie: Równanie rozdzielne

    Decyzja

    W formularzu Znajdź prywatny rozwiązania równanie niejednorodne makijaż system Rozwiążmy powstały system...; +47; +61; +10; -osiem. Konstruuj interwał wariacja rząd... Dawać szacunki statystyczneśrednia ...

  • Rozwiązanie: Obliczmy łańcuchowe i podstawowe przyrosty bezwzględne, stopy wzrostu, stopy wzrostu. Uzyskane wartości zestawiono w tabeli 1

    Decyzja

    Wielkość produkcji. Decyzja: Średnia arytmetyczna przedziału wariacja Liczba z oblicza się w następujący sposób: dla ... Błąd krańcowy próby z prawdopodobieństwem 0,954 (t = 2) będzie: Δ w = t * μ = 2 * 0,0146 = 0,02927 Określ granice ...

  • Decyzja. Znak

    Decyzja

    O czyim doświadczeniu zawodowym i składający się próba. Przykładowy średni staż pracy ... dnia roboczego tych pracowników i składający się próba. Średni czas trwania próby wynosi ... 1,16, poziom istotności to α = 0,05. Decyzja. Wariacja rząd tej próbki ma postać: 0,71 ...

  • Program zajęć z biologii dla klas 10-11 Opracował: Polikarpova S.V

    Pracujący program treningowy

    Najprostsze schematy skrzyżowań „5 LR. " Decyzja elementarne problemy genetyczne „6 L. r. " Decyzja elementarne problemy genetyczne ”7 L. r. „..., 110, 115, 112, 110. Makijaż wariacja rząd, remis wariacja krzywa, znajdź średnią wartość cechy ...

  • Grupowanie- To jest podział populacji na grupy, które są w jakiś sposób jednorodne.

    Cel usługi... Korzystając z kalkulatora online możesz:

    • zbuduj serię wariacji, zbuduj histogram i wielokąt;
    • znaleźć wskaźniki zmienności (średnia, tryb (w tym i graficznie), mediana, zakres zmienności, kwartyle, decyle, kwartylowy współczynnik zróżnicowania, współczynnik zmienności i inne wskaźniki);

    Instrukcja. Aby pogrupować serię, należy wybrać typ wynikowej serii zmienności (dyskretna lub przedziałowa) i wskazać ilość danych (liczbę wierszy). Wynikowe rozwiązanie jest zapisywane w pliku Word (patrz przykład statystyki grupowania).

    Ilość surowych danych
    ",0);">

    Jeśli grupowanie zostało już przeprowadzone i podane dyskretna seria wariacji lub serie interwałowe, musisz skorzystać z kalkulatora internetowego Wskaźniki zmienności. Testowanie hipotezy o rodzaju rozkładu odbywa się za pomocą usługi Studium formy dystrybucji.

    Rodzaje grupowań statystycznych

    Seria wariacyjna... W przypadku obserwacji dyskretnej zmiennej losowej można wielokrotnie spotkać tę samą wartość. Takie wartości x i zmiennej losowej są rejestrowane wskazując n i ile razy występuje w n obserwacjach, jest to częstość tej wartości.
    W przypadku zmiennej losowej ciągłej w praktyce stosuje się grupowanie.
    1. Grupowanie typologiczne- Jest to podział badanej populacji niejednorodnej jakościowo na klasy, typy społeczno-ekonomiczne, jednorodne grupy jednostek. Aby zbudować to grupowanie, użyj parametru serii odmian dyskretnych.
    2. Grupowanie strukturalne nazywa się, w którym jednorodną populację dzieli się na grupy, które charakteryzują jej strukturę według jakiejś odmiennej cechy. Aby zbudować to grupowanie, użyj parametru Interval series.
    3. Grupowanie identyfikujące związek między badanymi zjawiskami a ich cechami nazywa się grupa analityczna(patrz grupowanie analityczne serii).

    Zasady budowania zgrupowań statystycznych

    Szereg obserwacji, uszeregowanych w porządku rosnącym, nazywany jest szeregiem wariacyjnym. Znak grupujący nazywana jest atrybutem, według którego populacja dzieli się na odrębne grupy. Nazywa się to bazą grupy. Grupowanie może opierać się zarówno na cechach ilościowych, jak i jakościowych.
    Po ustaleniu podstawy grupowania należy rozstrzygnąć kwestię liczby grup, na które należy podzielić badaną populację.

    W przypadku wykorzystywania komputerów osobistych do przetwarzania danych statystycznych, grupowanie jednostek obiektów odbywa się za pomocą standardowych procedur.
    Jedna z tych procedur opiera się na wykorzystaniu formuły Sturgess do określenia optymalnej liczby grup:

    k = 1 + 3,322 * log (N)

    Gdzie k to liczba grup, N to liczba jednostek w populacji.

    Długość przedziałów częściowych obliczana jest jako h = (x max -x min) / k

    Następnie policz liczbę trafień obserwacji w tych przedziałach, które przyjmuje się jako częstości n i. Małe częstotliwości, których wartości są mniejsze niż 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
    Punkty środkowe przedziałów x i = (c i-1 + c i) / 2 są przyjmowane jako nowe wartości dla wariantu.

    Seria dyskretnych odmian jest skonstruowana dla dyskretnych funkcji.

    W celu zbudowania dyskretnego szeregu zmienności należy wykonać następujące czynności: 1) uporządkować jednostki obserwacji w porządku rosnącym badanej wartości cechy,

    2) określić wszystkie możliwe wartości atrybutu x i, uporządkować je rosnąco,

    wartość cechy, ja .

    częstotliwość wartości charakterystycznej i oznaczają fa ja . Suma wszystkich częstości szeregu jest równa liczbie elementów w badanej populacji.

    Przykład 1 .

    Lista ocen uzyskanych przez studentów na egzaminach: 3; cztery; 3; pięć; cztery; 2; 2; cztery; cztery; 3; pięć; 2; cztery; pięć; cztery; 3; cztery; 3; 3; cztery; cztery; 2; 2; pięć; pięć; cztery; pięć; 2; 3; cztery; cztery; 3; cztery; pięć; 2; pięć; pięć; cztery; 3; 3; cztery; 2; cztery; cztery; pięć; cztery; 3; pięć; 3; pięć; cztery; cztery; pięć; cztery; cztery; pięć; cztery; pięć; pięć; pięć.

    Tutaj numer X - oszacowaniejest dyskretny zmienna losowa, a wynikowa lista ocen todane statystyczne (obserwowane) .

      uporządkować jednostki obserwacji w porządku rosnącym badanej wartości atrybutu:

    2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

    2) określić wszystkie możliwe wartości atrybutu x i, ułożyć je w kolejności rosnącej:

    W tym przykładzie wszystkie oceny można podzielić na cztery grupy o następujących wartościach: 2; 3; cztery; pięć.

    Wartość zmiennej losowej odpowiadającej oddzielnej grupie obserwowanych danych nazywa się wartość cechy, wariant (wariant) i oznaczają x ja .

    Liczba, która pokazuje, ile razy odpowiednia wartość atrybutu występuje w wielu obserwacjach, nazywa się częstotliwość wartości charakterystycznej i oznaczają fa ja .

    Dla naszego przykładu

    wynik 2 występuje - 8 razy,

    wynik 3 występuje - 12 razy,

    wynik 4 występuje - 23 razy,

    wynik 5 występuje - 17 razy.

    Łącznie 60 szacunków.

    4) zapisz otrzymane dane w tabeli dwóch wierszy (kolumn) - x i oraz fi.

    Na podstawie tych danych można skonstruować szereg zmienności dyskretnej

    Seria odmian dyskretnych - jest to tabela, w której napotkane wartości badanej cechy są wskazane jako osobne wartości w porządku rosnącym i ich częstotliwość

    1. Budowanie serii zmienności interwałowej

    Oprócz dyskretnych szeregów zmienności często istnieje taki sposób grupowania danych, jak szeregi zmienności przedziałowej.

    Seria interwałowa jest budowana, jeśli:

      znak ma ciągły charakter zmiany;

      Istnieje wiele dyskretnych wartości (ponad 10)

      częstości wartości dyskretnych są bardzo małe (nie przekraczają 1-3 przy stosunkowo dużej liczbie jednostek obserwacyjnych);

      wiele dyskretnych wartości cechy o tych samych częstotliwościach.

    Seria zmienności interwałowej to metoda grupowania danych w postaci tabeli, która posiada dwie kolumny (wartości atrybutów w postaci interwału wartości oraz częstotliwość każdego interwału).

    W przeciwieństwie do szeregu dyskretnego, wartości charakterystyki szeregu przedziałów są reprezentowane nie przez oddzielne wartości, ale przez przedział wartości („od - do”).

    Liczba, która pokazuje, ile jednostek obserwacji wpadło do każdego wybranego przedziału, nazywa się częstotliwość wartości charakterystycznej i oznaczają fa ja . Suma wszystkich częstości szeregu jest równa liczbie elementów (jednostek obserwacji) w badanej populacji.

    Jeżeli jednostka ma wartość cechy równą wartości górnej granicy przedziału, to należy ją odnieść do następnego przedziału.

    Na przykład dziecko o wzroście 100 cm wpadnie do drugiego przedziału, a nie do pierwszego; a dziecko o wzroście 130 cm wpadnie do ostatniego przedziału, a nie do trzeciego.

    Na podstawie tych danych można skonstruować szeregi zmienności przedziałowej.

    Każdy przedział ma dolną granicę (x h), górną granicę (x h) i szerokość przedziału ( ja).

    Granica przedziału to charakterystyczna wartość, która leży na granicy dwóch przedziałów.

    wzrost dzieci (cm)

    wzrost dzieci (cm)

    ilość dzieci

    ponad 130

    Jeśli przedział ma górną i dolną granicę, nazywa się to zamknięty przedział... Jeśli przedział ma tylko dolną lub tylko górną granicę, to jest - otwarty interwał. Tylko pierwszy lub ostatni interwał może być otwarty. W powyższym przykładzie ostatni interwał jest otwarty.

    Szerokość przedziału (ja) - różnica między górną i dolną granicą.

    ja = x n - x in

    Zakłada się, że szerokość otwartego pojemnika jest taka sama jak szerokość sąsiedniego zamkniętego pojemnika.

    wzrost dzieci (cm)

    ilość dzieci

    Szerokość przedziału (i)

    dla obliczeń 130 + 20 = 150

    20 (ponieważ szerokość sąsiedniego przedziału zamkniętego wynosi 20)

    Wszystkie serie interwałowe są podzielone na serie interwałowe w równych odstępach i serie interwałowe w nierównych odstępach ... W rzędach przedziałów o równych przedziałach szerokość wszystkich przedziałów jest taka sama. W rzędach interwałów o nierównych interwałach szerokość interwałów jest inna.

    W tym przykładzie seria przedziałów z nierównymi przedziałami.

    W wielu przypadkach populacja statystyczna obejmuje dużą lub nawet bardziej nieskończoną liczbę opcji, co najczęściej spotyka się z ciągłą zmiennością, prawie niemożliwe i niepraktyczne jest utworzenie grupy jednostek dla każdej opcji. W takich przypadkach agregacja jednostek statystycznych w grupy jest możliwa tylko na podstawie przedziału, tj. taka grupa, która ma określone limity wartości atrybutu zmiennej. Granice te są oznaczone dwiema liczbami wskazującymi górną i dolną granicę każdej grupy. Zastosowanie interwałów prowadzi do powstania szeregu rozkładów interwałowych.

    Interwał zadowolony to seria wariacyjna, której warianty przedstawione są w formie interwałów.

    Szeregi przedziałowe mogą być tworzone z równymi i nierównymi przedziałami, natomiast wybór zasady konstruowania tego szeregu zależy głównie od stopnia reprezentatywności i wygody populacji statystycznej. Jeżeli populacja jest wystarczająco duża (reprezentatywna) pod względem liczby jednostek i jest całkowicie jednorodna w swoim składzie, to wskazane jest przyjęcie równości przedziałów jako podstawy tworzenia szeregu przedziałowego. Zwykle, zgodnie z tą zasadą, szeregi przedziałowe tworzy się dla tych populacji, w których zakres zmienności jest stosunkowo niewielki, tj. opcje maksymalne i minimalne zwykle różnią się kilka razy. W tym przypadku wartość równych przedziałów jest obliczana przez stosunek zakresu zmienności cechy do danej liczby utworzonych przedziałów. Aby określić równe i W przedziale można zastosować wzór Sturgess (zwykle z niewielką zmiennością cech przedziału i dużą liczbą jednostek w populacji statystycznej):

    gdzie x ja - wielkość równy przedział; X max, X min – opcje maksymalne i minimalne w populacji statystycznej; nie . - liczba jednostek w agregacie.

    Przykład. Wskazane jest obliczenie wielkości równego przedziału pod względem gęstości skażenia radioaktywnego cezem - 137 w 100 osadach obwodu krasnopolskiego obwodu mohylewskiego, jeśli wiadomo, że początkowa (minimalna) opcja jest równa I km / km 2, finał ( maksymalna) - 65 ki / km 2. Korzystając ze wzoru 5.1. otrzymujemy:

    W konsekwencji, aby utworzyć serię przedziałową o równych przedziałach pod względem gęstości zanieczyszczenia cezem - 137 osad regionu Krasnopolska, wielkość równego przedziału może wynosić 8 cu / km 2.

    W warunkach nierównomiernego rozkładu tj. gdy maksymalne i minimalne warianty są setki razy, zasada może być zastosowana przy tworzeniu szeregu przedziałowego nierówny interwały. Nierówne interwały zwykle zwiększają się, gdy przechodzisz do większych wartości charakterystycznych.

    Przedziały mogą być zamknięte i otwarte w kształcie. Zamknięte zwyczajowo wywoływane są przedziały, dla których wskazane są zarówno dolna, jak i górna granica. otwarty interwały mają tylko jedną granicę: w pierwszym przedziale - górną, w ostatnim - dolną.

    Ocena serie interwałowe, szczególnie w nierównych odstępach czasu, wskazane jest, aby wziąć pod uwagę gęstość dystrybucji, najprostszy sposób na obliczenie, jaki jest stosunek częstotliwości lokalnej (lub częstotliwości) do rozmiaru interwału.

    Do praktycznego tworzenia serii interwałów możesz użyć układu tabeli. 5.3.

    Tabela 5.3. Kolejność tworzenia szeregu przedziałowego rozliczenia Okręg Krasnopolski według gęstości skażenia radioaktywnego cezem -137

    Główną zaletą serii interwałowej jest jej ekstremalność ścisłość. jednocześnie w przedziałowych szeregach rozkładu poszczególne warianty cechy są ukryte w odpowiednich przedziałach

    Podczas graficznego przedstawiania serii przedziałów w prostokątnym układzie współrzędnych, górne granice przedziałów są wykreślane na osi odciętej, a lokalne częstotliwości serii są wykreślane na osi rzędnych. Graficzne wykreślanie szeregu przedziałów różni się od wykreślania wielokąta rozkładu tym, że każdy przedział ma dolną i górną granicę, a dwie odcięte odpowiadają dowolnej wartości rzędnej. Dlatego na wykresie szeregu przedziałowego nie zaznaczono punktu, jak w wieloboku, ale linię łączącą dwa punkty. Te poziome linie są połączone ze sobą pionowymi liniami i uzyskuje się kształt wielokąta schodkowego, który zwykle nazywa się histogram rozkład (rysunek 5.3).

    Podczas graficznego wykreślania serii przedziałów dla wystarczająco dużej populacji statystycznej histogram zbliża sięogram symetryczny formularz dystrybucji. W przypadkach, gdy populacja statystyczna jest niewielka, z reguły asymetryczny wykres słupkowy.

    W niektórych przypadkach wskazane jest utworzenie kilku skumulowanych częstotliwości, tj. łączny rząd. Szereg skumulowany można utworzyć na podstawie szeregu dyskretnego lub przedziałowego rozkładu. Podczas graficznego przedstawiania skumulowanej serii w prostokątnym układzie współrzędnych, opcje są układane na osi odciętej, a skumulowane częstotliwości (częstotliwości) są wykreślane na osi rzędnych. Powstała zakrzywiona linia jest zwykle nazywana łączny rozkład (rysunek 5.4).

    Formacja i reprezentacja graficzna różne rodzaje szeregi zmienności przyczyniają się do uproszczonego obliczania głównych cech statystycznych, które zostały szczegółowo omówione w rozdziale 6, pomagają lepiej zrozumieć istotę praw rozkładu populacji statystycznej. Analiza szeregów zmienności ma szczególne znaczenie w przypadkach, gdy konieczne jest zidentyfikowanie i prześledzenie zależności między wariantami a częstotliwościami (częstotliwościami). Zależność ta przejawia się w tym, że liczba przypadków przypadających na wariant jest w pewien sposób powiązana z wielkością tego wariantu, tj. wraz ze wzrostem wartości atrybutu zmiennej częstotliwość (częstotliwość) tych wartości ulega pewnym, systematycznym zmianom. Oznacza to, że liczby w kolumnie częstotliwości (częstotliwości) nie podlegają chaotycznym wahaniom, lecz zmieniają się w określonym kierunku, w określonej kolejności i kolejności.

    Jeśli częstotliwości w ich zmianach wykazują pewną systematyczność, oznacza to, że jesteśmy na drodze do identyfikacji wzorców. Układ, porządek, kolejność w zmieniających się częstotliwościach jest odzwierciedleniem wspólnych przyczyn, ogólnych warunków charakterystycznych dla całego zbioru.

    Nie należy zakładać, że schemat dystrybucji jest zawsze podawany w formie gotowej. Istnieje wiele serii wariacji, w których częstotliwości dziwnie skaczą, czasem rosną, czasem maleją. W takich przypadkach wskazane jest, aby dowiedzieć się, z jakim rozkładem ma do czynienia badacz: albo ten rozkład wcale nie jest związany z prawidłowościami, to jego natura nie została jeszcze ujawniona: pierwszy przypadek jest rzadki, drugi, a drugi przypadek jest dość częstym i bardzo powszechnym zjawiskiem.

    Tak więc podczas tworzenia serii przedziałów całkowita liczba jednostek statystycznych może być niewielka, a niewielka liczba wariantów przypada na każdy przedział (na przykład 1-3 jednostki). W takich przypadkach nie trzeba liczyć na przejaw jakiejkolwiek prawidłowości. Aby na podstawie przypadkowych obserwacji uzyskać logiczny wynik, musi wejść w życie prawo wielkich liczb, czyli tak, aby dla każdego przedziału było nie kilka, ale dziesiątki i setki jednostek statystycznych. W tym celu należy starać się maksymalnie zwiększyć liczbę obserwacji. To najpewniejszy sposób wykrywania wzorców w procesach masowych. Jeżeli nie ma realnej możliwości zwiększenia liczby obserwacji, to identyfikację wzorca można osiągnąć poprzez zmniejszenie liczby przedziałów w szeregach rozkładu. Zmniejszenie liczby interwałów w serii wariacji, a tym samym zwiększenie liczby częstotliwości w każdym interwale. Oznacza to, że losowe fluktuacje każdej jednostki statystycznej nakładają się na siebie, „wygładzają”, zamieniając się w prawidłowość.

    Formowanie i konstrukcja szeregów wariacyjnych pozwala uzyskać jedynie ogólny, przybliżony obraz rozkładu populacji statystycznej. Na przykład histogram tylko z grubsza wyraża związek między wartościami cechy a jej częstotliwościami (częstotliwościami). seria wariacji w istocie są one jedynie podstawą do dalszych, pogłębionych badań wewnętrznych praw rozkładu statycznego.

    PYTANIA KONTROLNE DO TEMATU 5

    1. Co to jest odmiana? Co powoduje zmienność cechy w populacji statystycznej?

    2. Jakie różne cechy mogą mieć miejsce w statystykach?

    3. Co to jest seria wariacyjna? Jakie mogą być rodzaje serii odmian?

    4. Co to jest seria rankingowa? Jakie są jego zalety i wady?

    5. Co to jest seria dyskretna i jakie są jej zalety i wady?

    6. Jaka jest kolejność tworzenia szeregu przedziałowego, jakie są jego zalety i wady?

    7. Co to jest graficzna reprezentacja szeregowego, dyskretnego, przedziałowego rozkładu szeregów?

    8. Czym jest skumulowany rozkład i co on charakteryzuje?

    Mając dane z obserwacji statystycznych, które charakteryzują to lub inne zjawisko, przede wszystkim należy je uporządkować, tj. nadać charakter konsystencji

    Statystyk angielski. UJ Reichman, mówiąc o nieuporządkowanych agregatach, powiedział w przenośni, że zmierzenie się z masą nieuogólnionych danych jest równoznaczne z sytuacją, w której człowiek zostaje wrzucony w gąszcz bez kompasu. Na czym polega systematyzacja danych statystycznych w postaci szeregów dystrybucyjnych?

    Szeregi statystyczne rozkłady są uporządkowanymi populacjami statystycznymi (tab. 17). Najprostszą formą szeregów statystycznych jest rozkład szeregu rankingowego, tj. szereg liczb w porządku rosnącym lub opadającym według różnych znaków. Taki szereg nie pozwala nam ocenić prawidłowości tkwiących w dystrybuowanych danych: dla jakiej wartości zgrupowana jest większość wskaźników, jakie są odchylenia od tej wartości; jako ogólny obraz dystrybucji. W tym celu dane są pogrupowane, pokazując jak często poszczególne obserwacje występują w ich łącznej liczbie (rysunek 1a 1).

    ... Tabela 17

    . Ogólna forma szeregi rozkładu statystycznego

    ... Schemat 1. Schemat statystyczny seria dystrybucyjna

    Nazywa się rozkład jednostek populacji według cech, nie ma wyrażenia ilościowego szeregi atrybutywne(na przykład dystrybucja przedsiębiorstw według ich linii produkcyjnej)

    Nazywa się szeregi rozkładu jednostek populacji według cech, mają wyrażenie ilościowe rzędy odmian... W takich szeregach wartości cechy (opcji) są w porządku rosnącym lub malejącym

    W serii wariacyjnej rozkładu wyróżnia się dwa elementy: opcje i częstotliwość ... Opcja jest odrębną wartością cechy grupującej częstotliwość- liczba, która pokazuje, ile razy występuje każda opcja

    W statystyce matematycznej obliczany jest jeszcze jeden element szeregu zmienności - część... Ta ostatnia określana jest jako stosunek częstości wystąpień danego przedziału do sumy częstotliwości, część określana jest w ułamkach jednostki, procent (%) w ppm (% o)

    Tak więc szereg wariacji rozkładu jest szeregiem, w którym warianty są ułożone w porządku rosnącym lub malejącym, wskazane są ich częstotliwości lub częstotliwości. Szeregi wariacyjne są dyskretne (nadrzędne) i inne przedziały (ciągłe).

    ... Dyskretna seria wariacyjna- są to szeregi rozkładowe, w których wariant jako wielkość cechy ilościowej może przyjąć tylko określoną wartość. Opcje różnią się od siebie o jedną lub więcej jednostek

    Tak więc liczba części wyprodukowanych na zmianę przez konkretnego pracownika może być wyrażona tylko jedną konkretną liczbą (6, 10, 12 itd.). Przykładem dyskretnej serii zmienności może być rozkład pracowników na liczbę wyprodukowanych części (tabela 18-18).

    ... Tabela 18

    . Seria dyskretna dystrybucja _

    ... Przedziałowe (ciągłe) serie zmienności- takie szeregi rozkładowe, w których wartości opcji podane są w postaci przedziałów, tj. wartości cech mogą różnić się od siebie o dowolnie małą wartość. Podczas konstruowania serii wariacyjnej NEP nie można wskazać każdej wartości opcji, dlatego agregat jest rozłożony w przedziałach. Te ostatnie mogą być równe i nierówne. Dla każdego z nich wskazane są częstotliwości lub częstotliwości (Tabela 1 9 19).

    W przedziałowych szeregach rozkładów o nierównych przedziałach obliczane są takie cechy matematyczne, jak gęstość rozkładu i względna gęstość rozkładu w danym przedziale. Pierwsza charakterystyka została określona stosunkiem częstotliwości do wartości tego samego przedziału, druga - stosunkiem częstotliwości do wartości tego samego przedziału. Dla powyższego przykładu gęstość rozkładu w pierwszym przedziale będzie wynosić 3:5 = 0,6, a gęstość względna w tym przedziale to 7,5:5 = 1,55%.

    ... Tabela 19

    ... Serie dystrybucji interwałowej _



    błąd: Treść jest chroniona !!