ประเภทของชุดความแปรผันในสถิติ ชุดการกระจายเชิงแปรผันและเชิงสถิติ

(คำจำกัดความของอนุกรมความแปรผัน ส่วนประกอบของอนุกรมความแปรผัน รูปแบบสามรูปแบบของอนุกรมความแปรผัน ความเป็นไปได้ในการสร้างอนุกรมช่วง ข้อสรุปที่สามารถดึงได้จากอนุกรมที่สร้างขึ้น)

ซีรีย์รูปแบบคือลำดับขององค์ประกอบตัวอย่างทั้งหมดที่จัดเรียงแบบไม่ลดลง องค์ประกอบที่เหมือนกันถูกทำซ้ำ

ซีรีส์แบบแปรผันคือซีรีส์ที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ

อนุกรมการแจกแจงแบบแปรผันประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่:

ตัวแปรคือค่าตัวเลขของคุณลักษณะเชิงปริมาณในชุดการแจกแจงแบบแปรผัน อาจเป็นค่าบวกและค่าลบ ค่าสัมบูรณ์และค่าสัมพัทธ์ ดังนั้นเมื่อจัดกลุ่มวิสาหกิจตามผลลัพธ์ กิจกรรมทางเศรษฐกิจตัวเลขบวกหมายถึงกำไร และตัวเลขติดลบหมายถึงขาดทุน

ความถี่คือจำนวนของแต่ละตัวเลือกหรือแต่ละกลุ่มของชุดรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงให้เห็นว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของประชากรและถูกกำหนดโดยจำนวนองค์ประกอบของประชากรทั้งหมด

ความถี่คือความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วนของหน่วยหรือเปอร์เซ็นต์) ผลรวมของความถี่เท่ากับหนึ่งหรือ 100% การแทนที่ความถี่ด้วยความถี่ทำให้สามารถเปรียบเทียบอนุกรมความแปรผันกับจำนวนการสังเกตที่ต่างกันได้

ซีรี่ส์รูปแบบต่างๆ มีสามรูปแบบ:อนุกรมอันดับ อนุกรมแยก และอนุกรมช่วง

อนุกรมอันดับคือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของคุณลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มๆ ได้อย่างง่ายดาย ตรวจจับข้อมูลที่เล็กที่สุดและทันที มูลค่าสูงสุดลักษณะเด่นเน้นค่าที่ซ้ำกันบ่อยที่สุด

ซีรีส์รูปแบบอื่นคือตารางกลุ่มที่รวบรวมตามลักษณะของการเปลี่ยนแปลงในค่าของคุณลักษณะที่กำลังศึกษา ตามลักษณะของการแปรผันจะแยกแยะลักษณะที่ไม่ต่อเนื่อง (ไม่ต่อเนื่อง) และต่อเนื่อง

ซีรีส์แยก- นี่คือซีรีส์รูปแบบต่างๆ ซึ่งการก่อสร้างขึ้นอยู่กับคุณลักษณะที่มีการเปลี่ยนแปลงไม่ต่อเนื่อง (ลักษณะเฉพาะที่ไม่ต่อเนื่อง) หลังรวมถึงหมวดหมู่ภาษีจำนวนเด็กในครอบครัวจำนวนพนักงานในองค์กร ฯลฯ คุณลักษณะเหล่านี้สามารถรับค่าเฉพาะจำนวนจำกัดเท่านั้น

ชุดรูปแบบที่ไม่ต่อเนื่องแสดงถึงตารางที่ประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าเฉพาะของแอตทริบิวต์ และคอลัมน์ที่สองระบุจำนวนหน่วยในประชากรที่มีค่าเฉพาะของแอตทริบิวต์

หากลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่อง (จำนวนรายได้ระยะเวลาในการให้บริการต้นทุนของสินทรัพย์ถาวรขององค์กร ฯลฯ ซึ่งอาจใช้กับมูลค่าใด ๆ ภายในขอบเขตที่กำหนด) ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา



ตารางกลุ่มที่นี่มีสองคอลัมน์ด้วย อันแรกระบุค่าของแอตทริบิวต์ในช่วงเวลา "จาก - ถึง" (ตัวเลือก) อันที่สองระบุจำนวนหน่วยที่รวมอยู่ในช่วงเวลา (ความถี่)

ความถี่ (ความถี่การทำซ้ำ) - จำนวนการซ้ำของตัวแปรเฉพาะของค่าแอตทริบิวต์ซึ่งแสดงถึง fi และผลรวมของความถี่เท่ากับปริมาตรของประชากรที่อยู่ระหว่างการศึกษาจะแสดงแทน

โดยที่ k คือจำนวนตัวเลือกสำหรับค่าแอตทริบิวต์

บ่อยครั้งที่ตารางเสริมด้วยคอลัมน์ที่คำนวณความถี่สะสม S ซึ่งแสดงจำนวนหน่วยในประชากรที่มีค่าลักษณะเฉพาะไม่เกินค่านี้

อนุกรมการแจกแจงแบบแปรผันแบบไม่ต่อเนื่องคืออนุกรมที่กลุ่มต่างๆ ถูกประกอบขึ้นตามคุณลักษณะที่เปลี่ยนแปลงแบบไม่ต่อเนื่องและรับเฉพาะค่าจำนวนเต็มเท่านั้น

อนุกรมการแจกแจงแบบแปรผันตามช่วงเวลาคืออนุกรมที่ลักษณะการจัดกลุ่มที่เป็นพื้นฐานของการจัดกลุ่มสามารถรับค่าใดๆ รวมถึงค่าเศษส่วนในช่วงเวลาหนึ่งได้

ช่วงเวลา ซีรีย์การเปลี่ยนแปลงคือชุดของช่วงเวลาที่เรียงลำดับของค่าที่ต่างกัน ตัวแปรสุ่มด้วยความถี่ที่สอดคล้องกันหรือความถี่ของการเกิดขึ้นของค่าค่าในแต่ละค่า

ซีรีย์ช่วงเวลาประการแรกขอแนะนำให้สร้างการแจกแจงสำหรับการแปรผันอย่างต่อเนื่องของลักษณะเฉพาะ และหากการแปรผันแบบไม่ต่อเนื่องแสดงออกมาในวงกว้าง เช่น จำนวนตัวแปรของลักษณะที่ไม่ต่อเนื่องกันนั้นค่อนข้างมาก

สามารถสรุปข้อสรุปหลายประการได้จากซีรี่ส์นี้ ตัวอย่างเช่น องค์ประกอบตรงกลางของชุดรูปแบบ (ค่ามัธยฐาน) อาจเป็นค่าประมาณของผลการวัดที่น่าจะเป็นไปได้มากที่สุด องค์ประกอบแรกและสุดท้ายของชุดรูปแบบ (เช่น องค์ประกอบขั้นต่ำและสูงสุดของตัวอย่าง) แสดงการแพร่กระจายขององค์ประกอบตัวอย่าง บางครั้งหากองค์ประกอบแรกหรือสุดท้ายแตกต่างจากตัวอย่างที่เหลือมาก องค์ประกอบเหล่านั้นจะถูกแยกออกจากผลการวัด โดยพิจารณาว่าค่าเหล่านี้ได้มาอันเป็นผลมาจากความล้มเหลวขั้นต้นบางประเภท เช่น เทคโนโลยี

ชุดการกระจายทางสถิติ– นี่คือการกระจายหน่วยประชากรออกเป็นกลุ่มตามลักษณะเฉพาะที่แตกต่างกันตามลำดับ
ขึ้นอยู่กับลักษณะเฉพาะที่เป็นรากฐานของการก่อตัวของชุดการจัดจำหน่าย ชุดการแจกแจงแบบระบุแหล่งที่มาและแบบแปรผัน.

การมีลักษณะทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของประชากรทางสถิติซึ่งแสดงถึงผลลัพธ์ของคำอธิบายหรือการวัด คุณสมบัติทั่วไปวัตถุวิจัย

หัวข้อการศึกษาทางสถิติมีลักษณะการเปลี่ยนแปลง (แปรผัน) หรือลักษณะทางสถิติ

ประเภทของลักษณะทางสถิติ.

ชุดการแจกจ่ายเรียกว่าแอตทริบิวต์สร้างขึ้นตามเกณฑ์คุณภาพ แอตทริบิวต์– นี่คือสัญลักษณ์ที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า, ครู ฯลฯ )
โดยทั่วไปชุดการแจกจ่ายจะแสดงในรูปแบบของตาราง ในตาราง 2.8 แสดงชุดการแจกแจงแอตทริบิวต์
ตารางที่ 2.8 - การกระจายความช่วยเหลือทางกฎหมายประเภทต่างๆ ที่จัดทำโดยนักกฎหมายให้กับพลเมืองในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซีย

ซีรี่ส์รูปแบบต่างๆ– นี่คือค่าของคุณลักษณะ (หรือช่วงเวลาของค่า) และความถี่
ชุดรูปแบบคือชุดการจัดจำหน่ายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ซีรีย์รูปแบบใดๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่
ตัวแปรถือเป็นค่าเฉพาะของคุณลักษณะที่ใช้ในชุดรูปแบบต่างๆ
ความถี่คือจำนวนของแต่ละตัวเลือกหรือแต่ละกลุ่มของชุดรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงให้เห็นว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน
ความถี่คือความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100% ชุดรูปแบบต่างๆ ช่วยให้สามารถประมาณรูปแบบของกฎการกระจายตามข้อมูลจริงได้

ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของลักษณะที่มีอยู่ อนุกรมความแปรผันแบบไม่ต่อเนื่องและช่วงเวลา.
ตัวอย่างของชุดรูปแบบที่แยกจากกันแสดงไว้ในตาราง 2.9.
ตารางที่ 2.9 - การกระจายของครอบครัวตามจำนวนห้องที่ถูกครอบครองในแต่ละอพาร์ทเมนต์ในปี 1989 ในสหพันธรัฐรัสเซีย

คอลัมน์แรกของตารางแสดงตัวเลือกสำหรับชุดรูปแบบที่แยกจากกัน คอลัมน์ที่สองประกอบด้วยความถี่ของชุดรูปแบบต่างๆ และคอลัมน์ที่สามประกอบด้วยตัวบ่งชี้ความถี่

ซีรี่ส์รูปแบบต่างๆ

ใน ประชากรกำลังตรวจสอบลักษณะเชิงปริมาณบางอย่าง ตัวอย่างปริมาตรจะถูกสุ่มออกมา nนั่นคือจำนวนองค์ประกอบตัวอย่างเท่ากับ n- ในขั้นตอนแรกของการประมวลผลทางสถิติ ตั้งแต่ตัวอย่างเช่น การสั่งจำนวน x 1 , x 2 , …, xnจากน้อยไปมาก แต่ละค่าที่สังเกตได้ x ฉันเรียกว่า ตัวเลือก- ความถี่ ฉันคือจำนวนการสังเกตค่า x ฉันในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) ฉันคืออัตราส่วนความถี่ ฉันถึงขนาดตัวอย่าง n: .
เมื่อศึกษาอนุกรมความแปรผัน ก็จะใช้แนวคิดเรื่องความถี่สะสมและความถี่สะสมด้วย อนุญาต xหมายเลขบางอย่าง จากนั้นจำนวนตัวเลือก , ซึ่งมีค่าน้อยกว่า xเรียกว่าความถี่สะสม: สำหรับ x i nเรียกว่าความถี่สะสม w i max
ลักษณะที่เรียกว่าตัวแปรแบบไม่ต่อเนื่องหากค่าแต่ละค่า (ตัวแปร) แตกต่างจากกันด้วยค่าจำกัดที่แน่นอน (โดยปกติจะเป็นจำนวนเต็ม) อนุกรมความแปรผันของคุณลักษณะดังกล่าวเรียกว่าอนุกรมความแปรผันแบบไม่ต่อเนื่อง

ตารางที่ 1 มุมมองทั่วไปของชุดความถี่ที่แปรผันไม่ต่อเนื่อง

ค่าลักษณะเฉพาะx ฉัน x1 x2 เอ็กซ์เอ็น
ความถี่ฉัน ม. 1 ม. 2

ลักษณะที่เรียกว่าเปลี่ยนแปลงอย่างต่อเนื่องหากค่าของมันแตกต่างกันด้วยจำนวนเล็กน้อยโดยพลการเช่น คุณลักษณะสามารถรับค่าใดก็ได้ในช่วงเวลาหนึ่ง อนุกรมความแปรผันต่อเนื่องสำหรับคุณลักษณะดังกล่าวเรียกว่าช่วงเวลา

ตารางที่ 2 มุมมองทั่วไปของชุดความถี่ที่แปรผันตามช่วงเวลา

ตารางที่ 3. ภาพกราฟิกของซีรีย์รูปแบบต่างๆ

แถวรูปหลายเหลี่ยมหรือฮิสโตแกรมฟังก์ชันการกระจายเชิงประจักษ์
ไม่ต่อเนื่อง
ช่วงเวลา
โดยการทบทวนผลลัพธ์ของการสังเกต จะกำหนดจำนวนค่าของตัวเลือกที่อยู่ในแต่ละช่วงเวลาเฉพาะ สันนิษฐานว่าแต่ละช่วงเวลาเป็นของปลายด้านใดด้านหนึ่ง: ไม่ว่าในกรณีทั้งหมดจะเหลือ (บ่อยกว่า) หรือถูกต้องในทุกกรณี และความถี่หรือความถี่จะแสดงจำนวนตัวเลือกที่อยู่ภายในขอบเขตที่ระบุ ความแตกต่าง ฉัน – ฉัน +1เรียกว่าช่วงบางส่วน เพื่อให้การคำนวณในภายหลังง่ายขึ้น คุณสามารถแทนที่ชุดความแปรผันของช่วงเวลาด้วยชุดข้อมูลที่ไม่ต่อเนื่องตามเงื่อนไขได้ ในกรณีนี้คือค่าเฉลี่ย ฉัน- ช่วงเวลาถือเป็นตัวเลือก x ฉันและความถี่ช่วงที่สอดคล้องกัน ฉัน– สำหรับความถี่ของช่วงเวลานี้
สำหรับการแสดงอนุกรมการแปรผันแบบกราฟิก มักใช้รูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และฟังก์ชันการแจกแจงเชิงประจักษ์

ในตาราง 2.3 (การจัดกลุ่มประชากรรัสเซียโดยรายได้ต่อหัวเฉลี่ยในเดือนเมษายน 2537) อนุกรมการเปลี่ยนแปลงช่วงเวลา.
สะดวกในการวิเคราะห์อนุกรมการแจกแจงโดยใช้ภาพกราฟิก ซึ่งช่วยให้สามารถตัดสินรูปร่างของการแจกแจงได้ การแสดงภาพธรรมชาติของการเปลี่ยนแปลงความถี่ของชุดรูปแบบต่างๆ จะได้รับจาก รูปหลายเหลี่ยมและฮิสโตแกรม.
รูปหลายเหลี่ยมจะใช้เมื่อแสดงชุดรูปแบบที่แยกจากกัน.
ตัวอย่างเช่น ให้เราอธิบายการกระจายสต็อกที่อยู่อาศัยตามประเภทของอพาร์ทเมนต์แบบกราฟิก (ตารางที่ 2.10)
ตารางที่ 2.10 - การกระจายสต็อกที่อยู่อาศัยในเขตเมืองตามประเภทของอพาร์ทเมนต์ (ตัวเลขตามเงื่อนไข)


ข้าว. พื้นที่จำหน่ายที่อยู่อาศัย


ไม่เพียงแต่ค่าความถี่เท่านั้น แต่ยังรวมถึงความถี่ของอนุกรมการเปลี่ยนแปลงบนแกนพิกัดอีกด้วย
ฮิสโตแกรมใช้เพื่อแสดงถึงชุดการแปรผันตามช่วงเวลา- เมื่อสร้างฮิสโตแกรมค่าของช่วงเวลาจะถูกพล็อตบนแกน abscissa และความถี่จะถูกแสดงด้วยสี่เหลี่ยมที่สร้างขึ้นในช่วงเวลาที่สอดคล้องกัน ความสูงของคอลัมน์ในกรณีที่มีระยะห่างเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมคือกราฟที่แสดงชุดข้อมูลเป็นแท่งที่อยู่ติดกัน
ให้เราพรรณนาชุดการแจกแจงช่วงเวลาที่กำหนดในตารางเป็นภาพกราฟิก 2.11.
ตารางที่ 2.11 - การกระจายของครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน (ตัวเลขตามเงื่อนไข)
ยังไม่มีข้อความ กลุ่มครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน จำนวนครอบครัวที่มีขนาดพื้นที่ใช้สอยที่กำหนด จำนวนครอบครัวสะสม
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ทั้งหมด 115 ----


ข้าว. 2.2. ฮิสโตแกรมการกระจายตัวของครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน


เราสร้างโดยใช้ข้อมูลของอนุกรมที่สะสม (ตาราง 2.11) กระจายสะสม


ข้าว. 2.3. การกระจายครอบครัวสะสมตามขนาดพื้นที่อยู่อาศัยต่อคน


การแทนอนุกรมรูปแบบต่างๆ ในรูปแบบของการสะสมจะมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับอนุกรมรูปแบบต่างๆ ซึ่งความถี่จะแสดงเป็นเศษส่วนหรือเปอร์เซ็นต์ของผลรวมของความถี่อนุกรม
หากเราเปลี่ยนแกนเมื่อแสดงชุดรูปแบบต่างๆ ในรูปแบบสะสม เราจะได้ โอกิวา- ในรูป 2.4 แสดง ogive ที่สร้างขึ้นบนพื้นฐานของข้อมูลในตาราง 2.11.
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการแจกแจงได้โดยการค้นหาจุดกึ่งกลางของด้านข้างของสี่เหลี่ยม แล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายผลลัพธ์จะแสดงในรูปที่ 1 2.2 มีเส้นประ
เมื่อสร้างฮิสโตแกรมของการแจกแจงของอนุกรมความแปรผันที่มีช่วงเวลาที่ไม่เท่ากัน ไม่ใช่ความถี่ที่ถูกพล็อตตามแนวแกนกำหนด แต่เป็นความหนาแน่นของการกระจายของลักษณะเฉพาะในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการแจกแจงคือความถี่ที่คำนวณต่อความกว้างช่วงหน่วย เช่น แต่ละกลุ่มมีกี่หน่วยต่อหน่วยของค่าช่วง ตัวอย่างการคำนวณความหนาแน่นของการกระจายแสดงไว้ในตาราง 1 2.12.
ตารางที่ 2.12 - การกระจายตัวของวิสาหกิจตามจำนวนพนักงาน (ตัวเลขตามเงื่อนไข)
ยังไม่มีข้อความ กลุ่มวิสาหกิจแยกตามจำนวนพนักงานคน จำนวนวิสาหกิจ ขนาดช่วงคน ความหนาแน่นของการกระจาย
1 2 3=1/2
1 มากถึง 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ทั้งหมด 147 ---- ----

ยังสามารถใช้เพื่อแสดงอนุกรมรูปแบบต่างๆ แบบกราฟิกได้ เส้นโค้งสะสม- การใช้กราฟสะสม (เส้นโค้งผลรวม) จะแสดงชุดความถี่สะสม ความถี่สะสมถูกกำหนดโดยการรวมความถี่ตามลำดับระหว่างกลุ่มและแสดงจำนวนหน่วยในประชากรที่มีค่าแอตทริบิวต์ไม่เกินค่าที่พิจารณา


ข้าว. 2.4. การกระจายครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน

เมื่อสร้างการสะสมของอนุกรมความแปรผันตามช่วงเวลา ความแปรผันของอนุกรมจะถูกพล็อตไปตามแกนแอบซิสซา และความถี่สะสมจะถูกพล็อตไปตามแกนกำหนด

การเปลี่ยนแปลงเป็นตัวกำหนดความแตกต่างในค่าของคุณลักษณะใด ๆ ในหน่วยต่าง ๆ ของประชากรที่กำหนดในช่วงเวลาเดียวกัน (จุดเวลา) ความแปรปรวนเกิดจากเงื่อนไขการดำรงอยู่ที่แตกต่างกันของหน่วยประชากรที่แตกต่างกัน ตัวอย่างเช่น แม้แต่ฝาแฝดในชีวิตก็ยังมีความสูง น้ำหนัก รวมถึงลักษณะเฉพาะ เช่น ระดับการศึกษา รายได้ จำนวนลูก เป็นต้น

ความแปรปรวนเกิดขึ้นอันเป็นผลมาจากความจริงที่ว่าค่าของคุณลักษณะนั้นถูกสร้างขึ้นภายใต้อิทธิพลทั้งหมดของเงื่อนไขต่าง ๆ ซึ่งรวมกันในรูปแบบที่แตกต่างกันในแต่ละกรณี ดังนั้นมูลค่าของตัวเลือกใดๆ จึงเป็นวัตถุประสงค์

การเปลี่ยนแปลงเป็นลักษณะเฉพาะต่อปรากฏการณ์ทั้งหมดของธรรมชาติและสังคมโดยไม่มีข้อยกเว้น ยกเว้นความหมายเชิงบรรทัดฐานที่กำหนดไว้ตามกฎหมายของลักษณะทางสังคมส่วนบุคคล การศึกษาความแปรผันของสถิติมีความสำคัญอย่างยิ่ง ช่วยให้เข้าใจแก่นแท้ของปรากฏการณ์ที่กำลังศึกษาอยู่ การค้นหาความแปรผัน การค้นหาสาเหตุ การระบุอิทธิพลของปัจจัยแต่ละอย่าง ให้ข้อมูลที่สำคัญสำหรับการดำเนินการตัดสินใจด้านการจัดการตามหลักวิทยาศาสตร์

ค่าเฉลี่ยให้ลักษณะทั่วไปของลักษณะของประชากร แต่ไม่เปิดเผยโครงสร้างของประชากร ค่าเฉลี่ยไม่ได้แสดงว่าตัวแปรของลักษณะเฉพาะโดยเฉลี่ยอยู่รอบๆ อย่างไร ไม่ว่าจะกระจายใกล้ค่าเฉลี่ยหรือเบี่ยงเบนไปจากค่าเฉลี่ยก็ตาม ค่าเฉลี่ยในสองประชากรอาจจะเท่ากัน แต่ในเวอร์ชันหนึ่งค่าของแต่ละบุคคลมีความแตกต่างกันเล็กน้อยและในอีกเวอร์ชันหนึ่งความแตกต่างเหล่านี้มีขนาดใหญ่เช่น ในกรณีแรกความแปรผันของคุณลักษณะมีขนาดเล็ก และในกรณีที่สองจะมีขนาดใหญ่ นี่เป็นสิ่งสำคัญมากในการระบุลักษณะนัยสำคัญของค่าเฉลี่ย

เพื่อให้หัวหน้าองค์กร ผู้จัดการ หรือนักวิจัยศึกษาความแปรผันและจัดการมัน สถิติได้พัฒนาวิธีการพิเศษในการศึกษาความแปรผัน (ระบบตัวบ่งชี้) ด้วยความช่วยเหลือจะพบรูปแบบและคุณสมบัติของมัน ตัวชี้วัดการเปลี่ยนแปลง ได้แก่ : ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าสัมประสิทธิ์ของการแปรผัน

ชุดรูปแบบและรูปแบบต่างๆ

ซีรี่ส์รูปแบบต่างๆ- นี่คือการกระจายแบบเรียงลำดับของหน่วยประชากรซึ่งมักจะเป็นไปตามค่าที่เพิ่มขึ้น (ลดลงน้อยกว่า) ของลักษณะและการนับจำนวนหน่วยที่มีค่าเฉพาะของลักษณะเฉพาะ เมื่อจำนวนหน่วยประชากรมีขนาดใหญ่ ซีรีส์จัดอันดับจะยุ่งยากและการก่อสร้างใช้เวลานาน ในสถานการณ์เช่นนี้ ชุดรูปแบบจะถูกสร้างขึ้นโดยการจัดกลุ่มหน่วยประชากรตามค่าของคุณลักษณะที่กำลังศึกษา

มีดังต่อไปนี้ แบบฟอร์มชุดรูปแบบต่างๆ :

  1. ซีรี่ย์ติดอันดับแสดงถึงรายชื่อหน่วยแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามาก (มากไปหาน้อย) ของคุณลักษณะที่กำลังศึกษา
  2. ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง - นี่คือตารางที่ประกอบด้วยสองบรรทัดหรือกราฟ: ค่าเฉพาะของคุณลักษณะที่แตกต่างกัน x และจำนวนหน่วยของประชากรที่มีค่าที่กำหนด f - ลักษณะความถี่ มันถูกสร้างขึ้นเมื่อแอตทริบิวต์รับค่าจำนวนมากที่สุด
  3. ซีรีย์ช่วงเวลา.

มีการกำหนดช่วงของการเปลี่ยนแปลงเป็นค่าสัมบูรณ์ของความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุด (ตัวแปร) ของคุณลักษณะ:

ช่วงของการเปลี่ยนแปลงแสดงให้เห็น เฉพาะการเบี่ยงเบนอย่างมากของคุณลักษณะและไม่ได้สะท้อนถึงการเบี่ยงเบนส่วนบุคคลของตัวเลือกทั้งหมดในซีรีส์ เป็นการกำหนดขอบเขตของการเปลี่ยนแปลงในลักษณะที่แตกต่างกันและขึ้นอยู่กับความผันผวนของตัวเลือกสุดขั้วสองตัวและไม่เกี่ยวข้องกับความถี่ในชุดรูปแบบต่างๆ อย่างแน่นอน กล่าวคือ กับลักษณะของการแจกแจงซึ่งทำให้ค่านี้เป็นอักขระแบบสุ่ม ในการวิเคราะห์ความแปรผัน คุณต้องมีตัวบ่งชี้ที่สะท้อนถึงความผันผวนทั้งหมดในลักษณะความแปรผันและให้ลักษณะทั่วไป ตัวบ่งชี้ที่ง่ายที่สุดของประเภทนี้คือค่าเบี่ยงเบนเชิงเส้นเฉลี่ย

แถวที่สร้าง บนพื้นฐานเชิงปริมาณเรียกว่า แปรผัน.

ชุดการจัดจำหน่ายประกอบด้วย ตัวเลือก(ค่าลักษณะเฉพาะ) และ ความถี่(จำนวนกลุ่ม) ความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วน, เปอร์เซ็นต์) เรียกว่า ความถี่- ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของอนุกรมการแจกแจง

โดยแบ่งตามประเภทชุดการจำหน่ายออกเป็น ไม่ต่อเนื่อง(สร้างตามค่าที่ไม่ต่อเนื่องของคุณลักษณะ) และ ช่วงเวลา(ขึ้นอยู่กับค่าต่อเนื่องของคุณลักษณะ)

ซีรี่ส์รูปแบบต่างๆแสดงถึงสองคอลัมน์ (หรือแถว) หนึ่งในนั้นให้ค่าแต่ละค่าของคุณลักษณะที่แตกต่างกันเรียกว่าตัวแปรและเขียนแทนด้วย X; และอีกประการหนึ่งคือตัวเลขสัมบูรณ์ที่แสดงจำนวนครั้ง (บ่อยแค่ไหน) แต่ละตัวเลือกเกิดขึ้น ตัวบ่งชี้ในคอลัมน์ที่สองเรียกว่าความถี่และเขียนแทนด้วย f ตามอัตภาพ ให้เราทราบอีกครั้งว่าในคอลัมน์ที่สองสามารถใช้ตัวบ่งชี้สัมพัทธ์ได้โดยระบุส่วนแบ่งความถี่ของแต่ละตัวเลือกในผลรวมของความถี่ ตัวบ่งชี้สัมพัทธ์เหล่านี้เรียกว่าความถี่และแสดงตามอัตภาพด้วย ω ผลรวมของความถี่ทั้งหมดในกรณีนี้เท่ากับหนึ่ง อย่างไรก็ตาม ความถี่สามารถแสดงเป็นเปอร์เซ็นต์ได้ จากนั้นผลรวมของความถี่ทั้งหมดจะเป็น 100%

ถ้าตัวแปรของอนุกรมความแปรผันแสดงในรูปของปริมาณที่ไม่ต่อเนื่องกัน ก็จะเรียกว่าอนุกรมความแปรผันดังกล่าว ไม่ต่อเนื่อง

สำหรับคุณลักษณะต่อเนื่อง อนุกรมของรูปแบบจะถูกสร้างขึ้นเป็น ช่วงเวลานั่นคือค่าของแอตทริบิวต์จะแสดงเป็น "จาก... ถึง..." ในกรณีนี้ค่าต่ำสุดของคุณลักษณะในช่วงเวลาดังกล่าวเรียกว่าขีด จำกัด ล่างของช่วงเวลาและค่าสูงสุด - ขีด จำกัด บน

ซีรีย์ความแปรผันของช่วงยังถูกสร้างขึ้นสำหรับคุณลักษณะที่ไม่ต่อเนื่องซึ่งแตกต่างกันไปในช่วงขนาดใหญ่ ซีรีย์ช่วงเวลาสามารถอยู่กับ เท่ากันและ ไม่เท่ากันเป็นระยะ

ลองพิจารณาว่าค่าของช่วงเวลาที่เท่ากันถูกกำหนดอย่างไร ให้เราแนะนำสัญกรณ์ต่อไปนี้:

ฉัน– ขนาดช่วง;

- ค่าสูงสุดของคุณลักษณะสำหรับหน่วยประชากร

– ค่าต่ำสุดของคุณลักษณะสำหรับหน่วยประชากร

ไม่มี –จำนวนกลุ่มที่ได้รับการจัดสรร

, ถ้าทราบ n

หากยากต่อการกำหนดจำนวนกลุ่มที่จะแยกแยะล่วงหน้า ดังนั้นเพื่อคำนวณค่าที่เหมาะสมที่สุดของช่วงเวลาที่มีขนาดประชากรเพียงพอ สามารถแนะนำสูตรที่เสนอโดย Sturgess ในปี 1926 ได้:

n = 1+ 3.322 log N โดยที่ N คือจำนวนหน่วยในการรวม

ขนาดของช่วงเวลาที่ไม่เท่ากันจะถูกกำหนดในแต่ละกรณี โดยคำนึงถึงลักษณะของวัตถุประสงค์ของการศึกษา

การกระจายตัวอย่างทางสถิติเรียกรายการตัวเลือกและความถี่ที่เกี่ยวข้อง (หรือความถี่สัมพัทธ์)

การกระจายทางสถิติของตัวอย่างสามารถระบุได้ในรูปแบบของตารางในคอลัมน์แรกซึ่งมีตัวเลือกอยู่และในคอลัมน์ที่สอง - ความถี่ที่สอดคล้องกับตัวเลือกเหล่านี้ พรรณีหรือความถี่สัมพัทธ์ พาย .

การกระจายตัวทางสถิติของกลุ่มตัวอย่าง

อนุกรมช่วงเป็นอนุกรมรูปแบบซึ่งค่าของคุณลักษณะที่เป็นรากฐานของการก่อตัวจะแสดงภายในขอบเขตที่กำหนด (ช่วงเวลา) ความถี่ในกรณีนี้ไม่ได้อ้างอิงถึงค่าแต่ละค่าของแอตทริบิวต์ แต่รวมถึงช่วงเวลาทั้งหมด

อนุกรมการแจกแจงแบบช่วงเวลาถูกสร้างขึ้นตามคุณลักษณะเชิงปริมาณที่ต่อเนื่อง เช่นเดียวกับคุณลักษณะแบบแยกส่วนที่แตกต่างกันภายในขีดจำกัดที่มีนัยสำคัญ

อนุกรมช่วงเวลาสามารถแสดงได้ด้วยการกระจายทางสถิติของกลุ่มตัวอย่างที่ระบุช่วงเวลาและความถี่ที่สอดคล้องกัน ในกรณีนี้ ผลรวมของความถี่ของตัวแปรที่อยู่ภายในช่วงเวลานี้จะถือเป็นความถี่ของช่วงเวลา

เมื่อจัดกลุ่มตามคุณลักษณะต่อเนื่องเชิงปริมาณ การกำหนดขนาดของช่วงเวลาเป็นสิ่งสำคัญ

นอกจากค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างแล้ว ยังใช้คุณลักษณะอื่นๆ ของชุดรูปแบบต่างๆ อีกด้วย

แฟชั่นเรียกว่าตัวแปรที่มีความถี่สูงสุด





ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!