ตัวอย่างชุดความแปรผันของช่วง อัลกอริทึมสำหรับการสร้างอนุกรมความแปรผันตามช่วงเวลาโดยมีช่วงเวลาที่เท่ากัน
วิธีที่ง่ายที่สุดในการสรุปเนื้อหาทางสถิติคือการสร้างอนุกรม ผลลัพธ์ของการสรุปผลการศึกษาทางสถิติสามารถเป็นชุดการแจกแจงได้ ชุดการแจกแจงในสถิติคือการแจกแจงตามลำดับของหน่วยประชากรออกเป็นกลุ่มตามคุณลักษณะใดลักษณะหนึ่ง ได้แก่ เชิงคุณภาพหรือเชิงปริมาณ ถ้าอนุกรมถูกสร้างขึ้นในเชิงคุณภาพ จะเรียกว่า การระบุแหล่งที่มา และหากบนพื้นฐานเชิงปริมาณ จะเรียกว่า แปรผัน
ซีรีส์รูปแบบต่างๆ มีลักษณะเป็นสององค์ประกอบ: รูปแบบ (X) และความถี่ (f) ตัวแปรคือค่าที่แยกจากกันของคุณลักษณะเฉพาะของแต่ละหน่วยหรือกลุ่มของประชากร ตัวเลขที่แสดงจำนวนครั้งที่ค่าแอตทริบิวต์ที่กำหนดเกิดขึ้นเรียกว่าความถี่ ถ้าความถี่แสดงเป็นจำนวนสัมพัทธ์ จะเรียกว่าความถี่ ซีรี่ส์รูปแบบต่างๆอาจเป็นช่วงเวลาเมื่อมีการกำหนดขอบเขต "จาก" และ "ถึง" หรืออาจแยกจากกันก็ได้เมื่อคุณลักษณะที่กำลังศึกษามีลักษณะเป็นจำนวนที่แน่นอน
ลองดูที่การสร้างอนุกรมรูปแบบโดยใช้ตัวอย่าง
ตัวอย่าง- และมีข้อมูลเกี่ยวกับประเภทภาษีของคนงาน 60 คนในโรงงานแห่งหนึ่งของโรงงาน
กระจายคนงานตามประเภทภาษี สร้างชุดรูปแบบต่างๆ
ในการทำเช่นนี้เราจะเขียนค่าทั้งหมดของคุณลักษณะตามลำดับจากน้อยไปหามากและนับจำนวนคนงานในแต่ละกลุ่ม
ตารางที่ 1.4
การกระจายตัวของคนงานตามประเภท
อันดับคนงาน (X) |
จำนวนคนงาน |
|
บุคคล (ฉ) |
เป็น % ของทั้งหมด (โดยเฉพาะ) |
|
เรามีรูปแบบ ซีรีส์ไม่ต่อเนื่องซึ่งคุณลักษณะที่กำลังศึกษา (อันดับคนงาน) จะแสดงด้วยตัวเลขที่แน่นอน เพื่อความชัดเจน ซีรีส์ของรูปแบบต่างๆ จะแสดงเป็นภาพกราฟิก จากซีรีย์การกระจายนี้ มีการสร้างพื้นผิวการกระจาย
ข้าว. 1.1. รูปหลายเหลี่ยมสำหรับการกระจายคนงานตามประเภทภาษี
เราจะพิจารณาการสร้างอนุกรมช่วงเวลาด้วยช่วงเวลาที่เท่ากันโดยใช้ตัวอย่างต่อไปนี้
ตัวอย่าง- ข้อมูลเป็นที่รู้จักเกี่ยวกับมูลค่าของทุนคงที่ของ 50 บริษัท ในล้านรูเบิล จำเป็นต้องแสดงการกระจายของบริษัทตามต้นทุนของทุนถาวร
เพื่อแสดงการกระจายตัวของบริษัทตามต้นทุนทุนคงที่ ขั้นแรกเราจะแก้คำถามเกี่ยวกับจำนวนกลุ่มที่เราต้องการเน้น สมมติว่าเราตัดสินใจระบุกลุ่มวิสาหกิจ 5 กลุ่ม จากนั้นเราจะกำหนดขนาดของช่วงเวลาในกลุ่ม เมื่อต้องการทำเช่นนี้ เราใช้สูตร
ตามตัวอย่างของเรา
โดยการเพิ่มมูลค่าของช่วงเวลาเข้ากับค่าต่ำสุดของคุณลักษณะ เราจะได้กลุ่มของบริษัทตามต้นทุนของทุนคงที่
หน่วยที่มีค่าสองเท่าอยู่ในกลุ่มที่ทำหน้าที่เป็นขีดจำกัดบน (เช่น ค่าของแอตทริบิวต์ 17 จะไปที่กลุ่มแรก 24 ไปยังกลุ่มที่สอง เป็นต้น)
เรามานับจำนวนโรงงานในแต่ละกลุ่มกันดีกว่า
ตารางที่ 1.5
การกระจายของ บริษัท ตามมูลค่าทุนถาวร (ล้านรูเบิล)
ต้นทุนของทุนคงที่ |
จำนวนบริษัท |
ความถี่สะสม |
ตามการกระจายนี้ ได้รับชุดช่วงเวลาแบบแปรผัน ซึ่งตามมาด้วยบริษัท 36 แห่งที่มีทุนคงที่มูลค่าตั้งแต่ 10 ถึง 24 ล้านรูเบิล ฯลฯ
ชุดการแจกแจงแบบช่วงสามารถแสดงเป็นกราฟิกในรูปแบบของฮิสโตแกรม
ผลลัพธ์ของการประมวลผลข้อมูลแสดงไว้ใน ตารางสถิติ- ตารางสถิติประกอบด้วยหัวเรื่องและภาคแสดงของตนเอง
เรื่องคือจำนวนทั้งสิ้นหรือส่วนหนึ่งของจำนวนทั้งสิ้นที่ได้รับการกำหนดลักษณะ
ภาคแสดงเป็นตัวบ่งชี้ที่แสดงลักษณะของเรื่อง
ตารางมีความโดดเด่น: แบบง่ายและแบบกลุ่มแบบผสมผสานพร้อมการพัฒนาเพรดิเคตแบบง่ายและซับซ้อน
ตารางอย่างง่ายในเรื่องประกอบด้วยรายการของแต่ละหน่วย
ถ้าหัวเรื่องมีการจัดกลุ่มหน่วย ตารางดังกล่าวจะเรียกว่าตารางกลุ่ม เช่น กลุ่มวิสาหกิจตามจำนวนคนงาน กลุ่มประชากรตามเพศ
เรื่องของตารางรวมประกอบด้วยการจัดกลุ่มตามลักษณะตั้งแต่สองรายการขึ้นไป เช่น ประชากรแบ่งตามเพศออกเป็นกลุ่มตามการศึกษา อายุ ฯลฯ
ตารางรวมประกอบด้วยข้อมูลที่ช่วยในการระบุและกำหนดลักษณะความสัมพันธ์ของตัวบ่งชี้จำนวนหนึ่งและรูปแบบของการเปลี่ยนแปลงทั้งในด้านอวกาศและเวลา เพื่อให้ตารางชัดเจนเมื่อพัฒนาหัวเรื่อง ให้จำกัดตัวเองให้เหลือคุณลักษณะสองหรือสามประการ โดยสร้างกลุ่มในจำนวนที่จำกัดสำหรับแต่ละคุณลักษณะ
ภาคแสดงในตารางสามารถพัฒนาได้หลายวิธี ด้วยการพัฒนาเพรดิเคตอย่างง่าย ตัวชี้วัดทั้งหมดจะอยู่อย่างเป็นอิสระจากกัน
ด้วยการพัฒนาที่ซับซ้อนของภาคแสดง ตัวชี้วัดจะรวมเข้าด้วยกัน
เมื่อสร้างโต๊ะใด ๆ จะต้องดำเนินการตามวัตถุประสงค์ของการศึกษาและเนื้อหาของวัสดุที่ประมวลผล
นอกจากตารางแล้ว สถิติยังใช้กราฟและไดอะแกรมอีกด้วย แผนภูมิ – ใช้แสดงข้อมูลทางสถิติ รูปทรงเรขาคณิต- แผนภูมิแบ่งออกเป็นแผนภูมิเส้นและแผนภูมิแท่ง แต่อาจมีแผนภูมิคิด (ภาพวาดและสัญลักษณ์) แผนภูมิวงกลม (วงกลมถือเป็นมูลค่าของประชากรทั้งหมด และพื้นที่ของแต่ละภาคส่วนจะแสดงขึ้น ความถ่วงจำเพาะหรือส่วนแบ่งของมัน ส่วนประกอบ) แผนภาพแนวรัศมี (สร้างบนพื้นฐานของพิกัดเชิงขั้ว) Cartogram คือการรวมกัน แผนที่รูปร่างหรือแผนผังไซต์พร้อมไดอะแกรม
จำนวนกลุ่ม (ช่วง)ถูกกำหนดโดยประมาณโดยสูตรสเตอเจส:
m = 1 + 3.322 × บันทึก(n)
ที่ไหน n - จำนวนทั้งหมดหน่วยการสังเกต (จำนวนองค์ประกอบทั้งหมดในประชากร ฯลฯ) lg(n) – ลอการิทึมฐานสิบของ n
ได้รับ ตามสูตรสเตอเจส ค่ามักจะปัดเศษเป็นจำนวนเต็มที่ใกล้ที่สุดตัวเลข เนื่องจากจำนวนกลุ่มไม่สามารถเป็นจำนวนเศษส่วนได้
หากชุดช่วงเวลาที่มีกลุ่มจำนวนมากไม่เป็นที่พอใจสำหรับเกณฑ์บางอย่าง คุณสามารถสร้างชุดช่วงอื่นได้โดยการปัดเศษ มเป็นจำนวนเต็มที่น้อยกว่าแล้วเลือกจำนวนที่เหมาะสมกว่าจากสองแถว
จำนวนกลุ่มไม่ควรเกิน 15 กลุ่ม
คุณยังสามารถใช้ตารางต่อไปนี้ได้หากไม่สามารถคำนวณลอการิทึมทศนิยมได้เลย
การกำหนดความกว้างของช่วงเวลา
ความกว้างช่วงสำหรับชุดการแปรผันช่วงเวลาที่มีช่วงเวลาเท่ากันจะถูกกำหนดโดยสูตร:
โดยที่ X max คือค่าสูงสุดของ x i, X min คือค่าต่ำสุดของค่า x i; ม. - จำนวนกลุ่ม (ช่วงเวลา)
ขนาดของช่วงเวลา (ฉัน ) โดยปกติจะปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดข้อยกเว้นเพียงอย่างเดียวคือกรณีที่ศึกษาความผันผวนเพียงเล็กน้อยของคุณลักษณะ (ตัวอย่างเช่น เมื่อจัดกลุ่มชิ้นส่วนตามขนาดของส่วนเบี่ยงเบนจากค่าที่ระบุ ซึ่งวัดเป็นเศษส่วนของมิลลิเมตร)
มักใช้กฎต่อไปนี้:
จำนวนตำแหน่งทศนิยม |
จำนวนตำแหน่งทศนิยม |
ตัวอย่างความกว้างของช่วงโดยใช้สูตร |
เราปัดเศษไปที่เครื่องหมายอะไร? |
ตัวอย่างความกว้างของระยะห่างแบบโค้งมน |
การกำหนดขอบเขตของช่วงเวลา
ขีดจำกัดล่าง ช่วงแรกจะถูกนำมาเท่ากับค่าต่ำสุดของแอตทริบิวต์ (ส่วนใหญ่มักจะถูกปัดเศษเป็นจำนวนเต็มที่น้อยกว่าโดยมีอันดับเดียวกันกับความกว้างของช่วงเวลา) ตัวอย่างเช่น x นาที = 15, i=130, x n ของช่วงแรก = 10
x n1 หยาบคาย x นาที
ขีดจำกัดบนช่วงแรกสอดคล้องกับค่า (Xmin + ฉัน).
ขีดจำกัดล่างของช่วงที่สองจะเท่ากับขีดจำกัดบนของช่วงแรกเสมอ สำหรับกลุ่มที่ตามมา ขอบเขตจะถูกกำหนดในทำนองเดียวกัน นั่นคือค่าช่วงเวลาจะถูกเพิ่มอย่างต่อเนื่อง
x วี ฉัน = x n ฉัน +ฉัน
x n ฉัน = x วี ฉัน-1
กำหนดความถี่ของช่วงเวลา
เรานับจำนวนค่าในแต่ละช่วงเวลา ในเวลาเดียวกัน เราจำได้ว่าหากหน่วยมีค่าลักษณะเฉพาะเท่ากับค่าของขีดจำกัดบนของช่วงเวลา ก็ควรกำหนดหน่วยนั้นให้กับช่วงเวลาถัดไป
เราสร้างอนุกรมช่วงเวลาในรูปแบบของตาราง
กำหนดจุดกึ่งกลางของช่วงเวลา
สำหรับการวิเคราะห์อนุกรมช่วงเวลาเพิ่มเติม คุณจะต้องเลือกค่าลักษณะเฉพาะสำหรับแต่ละช่วงเวลา ค่าแอตทริบิวต์นี้จะเหมือนกันกับหน่วยการสังเกตทั้งหมดที่อยู่ในช่วงเวลานี้ เหล่านั้น. แต่ละองค์ประกอบ "สูญเสีย" ค่าแอตทริบิวต์แต่ละรายการและได้รับการกำหนดค่าแอตทริบิวต์ทั่วไปหนึ่งค่า ดังนั้น ความหมายทั่วไปเป็น ตรงกลางของช่วงเวลาซึ่งแสดงแทน เอ็กซ์" ฉัน .
จากตัวอย่างการเติบโตของเด็ก เรามาดูวิธีสร้างอนุกรมช่วงเวลาที่มีระยะห่างเท่ากันกัน
ข้อมูลเบื้องต้นที่มีอยู่
90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148
งานห้องปฏิบัติการหมายเลข 1 การประมวลผลข้อมูลทางสถิติเบื้องต้น
การก่อสร้างชุดจำหน่าย
การกระจายหน่วยประชากรตามลำดับตามลักษณะใดลักษณะหนึ่งเรียกว่า ใกล้กระจาย - ในกรณีนี้ คุณลักษณะอาจเป็นเชิงปริมาณก็ได้ จากนั้นจึงเรียกอนุกรม แปรผัน และเชิงคุณภาพแล้วจึงได้ชื่อว่าเป็นซีรีย์ เนื่องมาจาก - ตัวอย่างเช่น ประชากรของเมืองสามารถกระจายตามได้ กลุ่มอายุในชุดรูปแบบหรือตามความเกี่ยวข้องทางวิชาชีพในชุดคุณลักษณะ (แน่นอนว่าสามารถเสนอคุณลักษณะเชิงคุณภาพและเชิงปริมาณอีกมากมายสำหรับการสร้างชุดการแจกแจง การเลือกคุณลักษณะจะถูกกำหนดโดยงานของการศึกษาทางสถิติ)
ชุดการจัดจำหน่ายใด ๆ มีลักษณะเป็นสององค์ประกอบ:
- ตัวเลือก(x ฉัน) – นี่คือค่าแต่ละค่าของแอตทริบิวต์หน่วย ประชากรตัวอย่าง- สำหรับซีรีย์รูปแบบ ตัวเลือกจะใช้ค่าตัวเลขสำหรับซีรีย์ที่แสดงคุณสมบัติ – เชิงคุณภาพ (เช่น x = “ข้าราชการ”)
- ความถี่(น ฉัน) – ตัวเลขที่แสดงจำนวนครั้งที่ค่าแอตทริบิวต์เฉพาะเกิดขึ้น หากความถี่แสดงเป็นจำนวนสัมพัทธ์ (เช่น สัดส่วนขององค์ประกอบประชากรที่สอดคล้องกัน มูลค่าที่กำหนดในปริมาตรรวมของประชากร) จึงเรียกว่า ความถี่สัมพัทธ์หรือ ความถี่.
ซีรี่ส์รูปแบบอาจเป็น:
- ไม่ต่อเนื่องเมื่อลักษณะที่กำลังศึกษามีลักษณะเป็นจำนวนหนึ่ง (โดยปกติจะเป็นจำนวนเต็ม)
- ช่วงเวลาเมื่อมีการกำหนดขอบเขต “จาก” และ “ถึง” สำหรับลักษณะที่เปลี่ยนแปลงอย่างต่อเนื่อง ซีรีย์ช่วงเวลาสร้างขึ้นด้วยหากชุดของค่าของคุณลักษณะที่แตกต่างกันแบบไม่ต่อเนื่องมีขนาดใหญ่
สามารถสร้างอนุกรมช่วงเวลาด้วยช่วงเวลาก็ได้ ความยาวเท่ากัน(อนุกรมช่วงเท่ากัน) และมีช่วงห่างไม่เท่ากัน หากกำหนดโดยเงื่อนไขของการศึกษาทางสถิติ ตัวอย่างเช่น ชุดการกระจายรายได้ของประชากรที่มีช่วงต่อไปนี้สามารถนำมาพิจารณาได้<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:
โดยที่ k คือจำนวนช่วงเวลา n คือขนาดตัวอย่าง (แน่นอนว่าสูตรมักจะให้จำนวนเศษส่วน และเลือกจำนวนเต็มที่ใกล้เคียงที่สุดกับจำนวนผลลัพธ์เป็นจำนวนช่วง) ความยาวของช่วงเวลาในกรณีนี้ถูกกำหนดโดยสูตร
.
ในรูปแบบกราฟิก สามารถนำเสนอชุดรูปแบบต่างๆ ในรูปแบบได้ ฮิสโตแกรม(เหนือแต่ละช่วงเวลาของซีรีย์ช่วงเวลาจะมีการสร้าง "คอลัมน์" ความสูงที่สอดคล้องกับความถี่ในช่วงเวลานี้) รูปหลายเหลี่ยมการกระจาย(เส้นขาดที่เชื่อมจุด ( x ฉัน;ฉัน) หรือ สะสม(สร้างตามความถี่สะสม เช่น สำหรับแต่ละค่าคุณลักษณะ ความถี่ของการเกิดขึ้นในชุดของวัตถุที่มีค่าแอตทริบิวต์น้อยกว่าค่าที่กำหนดจะถูกนำมาใช้)
เมื่อทำงานใน Excel คุณสามารถใช้ฟังก์ชันต่อไปนี้เพื่อสร้างซีรี่ส์รูปแบบต่างๆ:
ตรวจสอบ( อาร์เรย์ข้อมูล) – เพื่อกำหนดขนาดตัวอย่าง อาร์กิวเมนต์คือช่วงของเซลล์ที่มีข้อมูลตัวอย่างอยู่
นับ พิสัย; เกณฑ์) – สามารถใช้เพื่อสร้างแอตทริบิวต์หรืออนุกรมรูปแบบต่างๆ อาร์กิวเมนต์คือช่วงของอาร์เรย์ของค่าตัวอย่างของแอตทริบิวต์และเกณฑ์ - ค่าตัวเลขหรือข้อความของแอตทริบิวต์หรือจำนวนเซลล์ที่มีอยู่ ผลลัพธ์คือความถี่ของการเกิดค่านั้นในกลุ่มตัวอย่าง
ความถี่( อาร์เรย์ของข้อมูล อาร์เรย์ของช่วงเวลา) – สำหรับการสร้างซีรี่ส์รูปแบบต่างๆ อาร์กิวเมนต์คือช่วงของอาร์เรย์ข้อมูลตัวอย่างและคอลัมน์ช่วงเวลา หากคุณต้องการสร้างซีรีย์แยกกันค่าของตัวเลือกจะถูกระบุที่นี่ หากเป็นซีรีย์ช่วงเวลา ขอบเขตบนของช่วงเวลา (เรียกอีกอย่างว่า "กระเป๋า") เนื่องจากผลลัพธ์คือคอลัมน์ความถี่ คุณต้องป้อนข้อมูลฟังก์ชันให้สมบูรณ์โดยการกด CTRL+SHIFT+ENTER โปรดทราบว่าเมื่อระบุอาร์เรย์ของช่วงเวลาเมื่อแนะนำฟังก์ชันคุณไม่จำเป็นต้องระบุค่าสุดท้ายในนั้น - ค่าทั้งหมดที่ไม่รวมอยู่ใน "กระเป๋า" ก่อนหน้าจะถูกวางไว้ใน "กระเป๋า" ที่เกี่ยวข้อง บางครั้งสิ่งนี้สามารถช่วยหลีกเลี่ยงข้อผิดพลาดที่ว่าค่าตัวอย่างที่ใหญ่ที่สุดไม่ได้ถูกวางลงในช่องสุดท้ายโดยอัตโนมัติ
นอกจากนี้ สำหรับการจัดกลุ่มที่ซับซ้อน (ตามคุณลักษณะหลายประการ) ให้ใช้เครื่องมือ "ตารางสรุปข้อมูล" นอกจากนี้ยังสามารถใช้เพื่อสร้างชุดแอตทริบิวต์และชุดรูปแบบต่างๆ ได้ แต่จะทำให้งานยุ่งยากโดยไม่จำเป็น นอกจากนี้ ในการสร้างซีรีย์รูปแบบและฮิสโตแกรม มีขั้นตอน "ฮิสโตแกรม" จาก Add-in "แพ็คเกจการวิเคราะห์" (หากต้องการใช้ Add-in ใน Excel คุณต้องดาวน์โหลดก่อน โดยไม่ได้ติดตั้งไว้ตามค่าเริ่มต้น)
ให้เราอธิบายกระบวนการประมวลผลข้อมูลหลักด้วยตัวอย่างต่อไปนี้
ตัวอย่างที่ 1.1- มีข้อมูลองค์ประกอบเชิงปริมาณ 60 ครอบครัว
สร้างชุดรูปแบบและรูปหลายเหลี่ยมการกระจาย
สารละลาย.
มาเปิดตาราง Excel กัน ลองใส่อาร์เรย์ข้อมูลลงในช่วง A1:L5 หากคุณกำลังศึกษาเอกสารในรูปแบบอิเล็กทรอนิกส์ (เช่นในรูปแบบ Word) ในการดำเนินการนี้เพียงเลือกตารางที่มีข้อมูลแล้วคัดลอกไปยังคลิปบอร์ดจากนั้นเลือกเซลล์ A1 แล้ววางข้อมูล - พวกเขาจะครอบครองโดยอัตโนมัติ ช่วงที่เหมาะสม มาคำนวณปริมาตรตัวอย่าง n - จำนวนข้อมูลตัวอย่าง โดยป้อนสูตร =COUNT(A1:L5) ในเซลล์ B7 โปรดทราบว่าในการป้อนช่วงที่ต้องการลงในสูตร ไม่จำเป็นต้องป้อนการกำหนดจากแป้นพิมพ์ ก็เพียงพอแล้วที่จะเลือก มากำหนดค่าต่ำสุดและค่าสูงสุดในตัวอย่างโดยป้อนสูตร =MIN(A1:L5) ในเซลล์ B8 และในเซลล์ B9: =MAX(A1:L5)
รูปที่ 1.1 ตัวอย่างที่ 1 การประมวลผลข้อมูลทางสถิติเบื้องต้นในตาราง Excel
ต่อไป เราจะเตรียมตารางสำหรับสร้างชุดรูปแบบต่างๆ โดยการป้อนชื่อสำหรับคอลัมน์ช่วงเวลา (ค่าตัวแปร) และคอลัมน์ความถี่ ในคอลัมน์ช่วงเวลา ให้ป้อนค่าคุณลักษณะจากค่าต่ำสุด (1) ถึงค่าสูงสุด (6) โดยอยู่ในช่วง B12:B17 เลือกคอลัมน์ความถี่ ป้อนสูตร =FREQUENCY(A1:L5,B12:B17) แล้วกดคีย์ผสม CTRL+SHIFT+ENTER
รูปที่ 1.2 ตัวอย่างที่ 1 การสร้างชุดรูปแบบต่างๆ
ในการควบคุม ให้คำนวณผลรวมของความถี่โดยใช้ฟังก์ชัน SUM (ไอคอนฟังก์ชัน S ในกลุ่ม "การแก้ไข" บนแท็บ "หน้าแรก") ผลรวมที่คำนวณได้ควรตรงกับปริมาตรตัวอย่างที่คำนวณไว้ก่อนหน้านี้ในเซลล์ B7
ทีนี้มาสร้างรูปหลายเหลี่ยมกัน: เมื่อเลือกช่วงความถี่ผลลัพธ์แล้ว ให้เลือกคำสั่ง "กราฟ" บนแท็บ "แทรก" ตามค่าเริ่มต้น ค่าบนแกนนอนจะเป็นเลขลำดับ - ในกรณีของเราตั้งแต่ 1 ถึง 6 ซึ่งตรงกับค่าของตัวเลือก (จำนวนประเภทภาษี)
ชื่อของชุดแผนภูมิ "ชุดที่ 1" สามารถเปลี่ยนแปลงได้โดยใช้ตัวเลือก "เลือกข้อมูล" เดียวกันกับแท็บ "ออกแบบ" หรือเพียงแค่ลบออกก็ได้
รูปที่.1.3. ตัวอย่างที่ 1 การสร้างรูปหลายเหลี่ยมความถี่
ตัวอย่างที่ 1.2- มีข้อมูลการปล่อยมลพิษจาก 50 แหล่ง:
10,4 | 18,6 | 10,3 | 26,0 | 45,0 | 18,2 | 17,3 | 19,2 | 25,8 | 18,7 |
28,2 | 25,2 | 18,4 | 17,5 | 41,8 | 14,6 | 10,0 | 37,8 | 10,5 | 16,0 |
18,1 | 16,8 | 38,5 | 37,7 | 17,9 | 29,0 | 10,1 | 28,0 | 12,0 | 14,0 |
14,2 | 20,8 | 13,5 | 42,4 | 15,5 | 17,9 | 19, | 10,8 | 12,1 | 12,4 |
12,9 | 12,6 | 16,8 | 19,7 | 18,3 | 36,8 | 15,0 | 37,0 | 13,0 | 19,5 |
เขียนอนุกรมที่มีช่วงเท่ากัน สร้างฮิสโตแกรม
สารละลาย
มาใส่อาร์เรย์ข้อมูลลงในแผ่นงาน Excel โดยจะอยู่ในช่วง A1:J5 เช่นเดียวกับในงานก่อนหน้านี้ เราจะกำหนดขนาดตัวอย่าง n ค่าต่ำสุดและสูงสุดในตัวอย่าง เนื่องจากตอนนี้เราไม่ต้องการอนุกรมแยกกัน แต่ต้องใช้อนุกรมช่วงเวลา และไม่ได้ระบุจำนวนช่วงเวลาในปัญหา เราจึงคำนวณจำนวนช่วงเวลา k โดยใช้สูตร Sturgess เมื่อต้องการทำเช่นนี้ ให้ใส่สูตร =1+3.322*LOG10(B7) ในเซลล์ B10
รูปที่.1.4. ตัวอย่างที่ 2 การสร้างอนุกรมที่มีช่วงเท่ากัน
ค่าผลลัพธ์ไม่ใช่จำนวนเต็ม แต่จะมีค่าประมาณ 6.64 เนื่องจาก k=7 ความยาวของช่วงเวลาจะแสดงเป็นจำนวนเต็ม (ไม่เหมือนกับกรณีของ k=6) เราจึงเลือก k=7 โดยการป้อนค่านี้ในเซลล์ C10 เราคำนวณความยาวของช่วงเวลา d ในเซลล์ B11 โดยป้อนสูตร =(B9-B8)/C10
เรามากำหนดอาร์เรย์ของช่วงเวลา โดยระบุขีดจำกัดบนสำหรับแต่ละช่วงเวลาจาก 7 ช่วง เมื่อต้องการทำเช่นนี้ ในเซลล์ E8 เราจะคำนวณขีดจำกัดบนของช่วงแรกโดยการป้อนสูตร =B8+B11; ในเซลล์ E9 ขีดจำกัดบนของช่วงที่สองโดยการป้อนสูตร =E8+B11 ในการคำนวณค่าที่เหลือของขอบเขตด้านบนของช่วงเวลา เราจะแก้ไขจำนวนเซลล์ B11 ในสูตรที่ป้อนโดยใช้เครื่องหมาย $ เพื่อให้สูตรในเซลล์ E9 ใช้แบบฟอร์ม =E8+B$11 และคัดลอก เนื้อหาของเซลล์ E9 ถึงเซลล์ E10-E14 ค่าสุดท้ายที่ได้รับจะเท่ากับค่าสูงสุดในตัวอย่างที่คำนวณไว้ก่อนหน้าในเซลล์ B9
รูปที่.1.5. ตัวอย่างที่ 2 การสร้างอนุกรมที่มีช่วงเท่ากัน
ตอนนี้เรามาเติมอาร์เรย์ของ "pockets" โดยใช้ฟังก์ชัน FREQUENCY ดังที่ทำในตัวอย่างที่ 1
รูปที่ 1.6. ตัวอย่างที่ 2 การสร้างอนุกรมที่มีช่วงเท่ากัน
เราจะสร้างฮิสโตแกรมโดยใช้อนุกรมรูปแบบผลลัพธ์: เลือกคอลัมน์ความถี่และเลือก "ฮิสโตแกรม" บนแท็บ "แทรก" เมื่อได้รับฮิสโตแกรมแล้ว ให้เปลี่ยนป้ายกำกับของแกนนอนในนั้นให้เป็นค่าในช่วงช่วงเวลา โดยเลือกตัวเลือก "เลือกข้อมูล" ของแท็บ "ผู้ออกแบบ" ในหน้าต่างที่ปรากฏขึ้นให้เลือกคำสั่ง "เปลี่ยน" สำหรับส่วน "ป้ายกำกับแกนนอน" และป้อนช่วงของค่าสำหรับตัวเลือกโดยเลือกด้วยเมาส์
รูปที่ 1.7. ตัวอย่างที่ 2 การสร้างฮิสโตแกรม
รูปที่.1.8. ตัวอย่างที่ 2 การสร้างฮิสโตแกรม
เมื่อสร้างอนุกรมการแจกแจงตามช่วงเวลา คำถามสามข้อได้รับการแก้ไข:
- 1. ควรเว้นช่วงกี่ช่วง?
- 2. ระยะห่างเป็นเท่าใด?
- 3. ขั้นตอนการรวมหน่วยประชากรภายในขอบเขตของช่วงเป็นอย่างไร
- 1. จำนวนช่วงเวลาสามารถกำหนดได้โดย สูตรสเตอร์เจส:
2. ความยาวช่วงหรือขั้นตอนช่วงมักจะถูกกำหนดโดยสูตร
ที่ไหน ร-ช่วงของการเปลี่ยนแปลง
3. ลำดับการรวมหน่วยประชากรภายในขอบเขตของช่วงเวลา
อาจแตกต่างกัน แต่เมื่อสร้างอนุกรมช่วงเวลา จะต้องกำหนดการแจกแจงอย่างเคร่งครัด
ตัวอย่างเช่น สิ่งนี้: [) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของลำดับอันดับด้วย
ขอบเขตของช่วงเวลาคือ:
- ปิด - ด้วยค่าแอตทริบิวต์สุดขั้วสองค่า
- เปิด - ด้วยค่าแอตทริบิวต์ที่มากสุดหนึ่งค่า (ถึงดังกล่าวและจำนวนดังกล่าวหรือ เกินดังกล่าวและจำนวนดังกล่าว)
เพื่อที่จะซึมซับเนื้อหาทางทฤษฎี เราจึงขอแนะนำ ข้อมูลความเป็นมาที่จะแก้ปัญหา งานจากต้นจนจบ
มีข้อมูลแบบมีเงื่อนไขเกี่ยวกับจำนวนผู้จัดการฝ่ายขายโดยเฉลี่ย ปริมาณของสินค้าที่คล้ายกันที่ขาย ราคาตลาดแต่ละรายการสำหรับผลิตภัณฑ์นี้ รวมถึงปริมาณการขายของ 30 บริษัท ในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในครั้งแรก ไตรมาสของปีรายงาน (ตาราง 2.1)
ตารางที่ 2.1
ข้อมูลเบื้องต้นสำหรับงานตัดขวาง
ตัวเลข ผู้จัดการ |
ราคาพันรูเบิล |
ปริมาณการขายล้านรูเบิล |
||
ตัวเลข ผู้จัดการ |
จำนวนสินค้าที่ขาย ชิ้น |
ราคาพันรูเบิล |
ปริมาณการขายล้านรูเบิล |
|
เราจะจัดเตรียมงานแต่ละงานตามข้อมูลเบื้องต้นตลอดจนข้อมูลเพิ่มเติม จากนั้นเราจะนำเสนอวิธีการในการแก้ปัญหาและวิธีแก้ปัญหาด้วยตนเอง
งานตัดขวาง งาน 2.1
การใช้ข้อมูลเบื้องต้นจากตาราง 2.1 จำเป็นสร้างชุดการกระจายของบริษัทแยกตามปริมาณสินค้าที่ขาย (ตารางที่ 2.2)
สารละลาย:
ตารางที่ 2.2
การกระจายตัวของ บริษัท แบบแยกส่วนตามปริมาณสินค้าที่ขายในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน
งานตัดขวาง งาน 2.2
ที่จำเป็นสร้างบริษัทที่ได้รับการจัดอันดับ 30 บริษัทตามจำนวนผู้จัดการโดยเฉลี่ย
สารละลาย:
15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.
งานตัดขวาง งาน 2.3
การใช้ข้อมูลเริ่มต้นจากตาราง 2.1, ที่จำเป็น:
- 1. สร้างชุดการกระจายของบริษัทตามจำนวนผู้จัดการ
- 2. คำนวณความถี่ของชุดการจำหน่ายของบริษัท
- 3. วาดข้อสรุป
สารละลาย:
ลองคำนวณโดยใช้สูตรสเตอเจส (2.5) จำนวนช่วงเวลา:
ดังนั้นเราจึงใช้เวลา 6 ช่วง (กลุ่ม)
ความยาวช่วง, หรือ ขั้นตอนช่วงเวลาให้คำนวณโดยใช้สูตร
บันทึก.ลำดับการรวมหน่วยประชากรในขอบเขตของช่วงมีดังนี้: I) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย I ] ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของซีรีส์การจัดอันดับด้วย
เราสร้างอนุกรมช่วงเวลา (ตารางที่ 2.3)
การกระจายตัวของ บริษัท และจำนวนผู้จัดการโดยเฉลี่ยในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในช่วงไตรมาสแรกของปีที่รายงาน
บทสรุป.กลุ่มบริษัทที่ใหญ่ที่สุดคือกลุ่มที่มีจำนวนผู้จัดการโดยเฉลี่ย 25-30 คน ซึ่งรวมถึง 8 บริษัท (27%) กลุ่มที่เล็กที่สุดซึ่งมีผู้จัดการโดยเฉลี่ย 40-45 คน มีเพียงบริษัทเดียวเท่านั้น (3%)
การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 เช่นเดียวกับชุดการกระจายของ บริษัท ตามจำนวนผู้จัดการ (ตารางที่ 2.3) ที่จำเป็นสร้างการจัดกลุ่มเชิงวิเคราะห์ของความสัมพันธ์ระหว่างจำนวนผู้จัดการและปริมาณการขายของ บริษัท และสรุปเกี่ยวกับการมีอยู่ (หรือไม่มี) ของความสัมพันธ์ระหว่างลักษณะเหล่านี้
สารละลาย:
การจัดกลุ่มการวิเคราะห์ขึ้นอยู่กับลักษณะของปัจจัย ในปัญหาของเรา ลักษณะปัจจัย (x) คือจำนวนผู้จัดการ และลักษณะผลลัพธ์ (y) คือปริมาณการขาย (ตารางที่ 2.4)
มาสร้างกันเลย การจัดกลุ่มเชิงวิเคราะห์(ตารางที่ 2.5)
บทสรุป.จากข้อมูลของการจัดกลุ่มการวิเคราะห์ที่สร้างขึ้น เราสามารถพูดได้ว่าเมื่อจำนวนผู้จัดการฝ่ายขายเพิ่มขึ้น ปริมาณการขายเฉลี่ยของบริษัทในกลุ่มก็เพิ่มขึ้นเช่นกัน ซึ่งบ่งบอกถึงความเชื่อมโยงโดยตรงระหว่างลักษณะเหล่านี้
ตารางที่ 2.4
ตารางเสริมสำหรับการสร้างกลุ่มการวิเคราะห์
จำนวนผู้จัดการ คน |
หมายเลขบริษัท |
ปริมาณการขายล้านรูเบิล y |
|
" = 59 ฉ = 9.97 |
|||
ฉัน-™ 4 -ย.22 |
|||
74'25 1PY1 ยู4 = 7 = 10,61 |
ที่ = ’ =10,31 30 |
ตารางที่ 2.5
การพึ่งพาปริมาณการขายกับจำนวนผู้จัดการบริษัทในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน
คำถามทดสอบ- 1. สาระสำคัญของการสังเกตทางสถิติคืออะไร?
- 2. ตั้งชื่อขั้นตอนการสังเกตทางสถิติ
- 3. รูปแบบการสังเกตทางสถิติขององค์กรมีรูปแบบใดบ้าง?
- 4. ตั้งชื่อประเภทการสังเกตทางสถิติ
- 5. สรุปทางสถิติคืออะไร?
- 6. ตั้งชื่อประเภทของรายงานทางสถิติ
- 7. การจัดกลุ่มทางสถิติคืออะไร?
- 8. ตั้งชื่อประเภทของการจัดกลุ่มทางสถิติ
- 9. ซีรีย์การจัดจำหน่ายคืออะไร?
- 10. ตั้งชื่อองค์ประกอบโครงสร้างของแถวการแจกจ่าย
- 11. ขั้นตอนการสร้างซีรีย์การจัดจำหน่ายมีขั้นตอนอย่างไร?
นำเสนอในรูปแบบของชุดการจัดจำหน่ายและนำเสนอในรูปแบบ
ซีรี่ส์การแจกจ่ายเป็นหนึ่งในประเภทของการจัดกลุ่ม
ช่วงการจัดจำหน่าย- แสดงถึงการกระจายอย่างเป็นระเบียบของหน่วยประชากรที่กำลังศึกษาออกเป็นกลุ่มตามลักษณะเฉพาะที่แตกต่างกัน
ขึ้นอยู่กับลักษณะเฉพาะที่เป็นรากฐานของการก่อตัวของซีรีย์การจัดจำหน่าย ที่มาและการเปลี่ยนแปลงแถวการแจกจ่าย:
- แอตทริบิวต์- เรียกว่าชุดการจำหน่ายที่สร้างขึ้นตามลักษณะเชิงคุณภาพ
- เรียกว่าชุดการแจกแจงที่สร้างขึ้นตามลำดับจากน้อยไปมากหรือจากมากไปหาน้อยของค่าลักษณะเชิงปริมาณ แปรผัน.
คอลัมน์แรกระบุค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันซึ่งเรียกว่า ตัวเลือกและถูกกำหนดไว้ ตัวเลือกแบบไม่ต่อเนื่อง - แสดงเป็นจำนวนเต็ม ตัวเลือกช่วงเวลามีตั้งแต่และถึง คุณสามารถสร้างชุดความแปรผันแบบแยกหรือแบบช่วงเวลาได้ ขึ้นอยู่กับประเภทของตัวเลือก
คอลัมน์ที่สองประกอบด้วย จำนวนตัวเลือกเฉพาะแสดงในรูปของความถี่หรือความถี่:
ความถี่- เป็นตัวเลขสัมบูรณ์ที่แสดงจำนวนครั้งที่ค่าที่กำหนดของจุดสนใจเกิดขึ้นทั้งหมด ซึ่งหมายถึง ผลรวมของความถี่ทั้งหมดจะต้องเท่ากับจำนวนหน่วยในประชากรทั้งหมด
ความถี่() คือความถี่ที่แสดงเป็นเปอร์เซ็นต์ของทั้งหมด ผลรวมของความถี่ทั้งหมดที่แสดงเป็นเปอร์เซ็นต์จะต้องเท่ากับ 100% ในเศษส่วนของหนึ่ง
การแสดงกราฟิกของซีรีย์การจัดจำหน่าย
ชุดการจัดจำหน่ายจะถูกนำเสนอด้วยภาพโดยใช้ภาพกราฟิก
ชุดการจัดจำหน่ายมีดังต่อไปนี้:- รูปหลายเหลี่ยม
- ฮิสโตแกรม
- สะสม
- โอกิฟส์
รูปหลายเหลี่ยม
เมื่อสร้างรูปหลายเหลี่ยม ค่าของคุณลักษณะที่แตกต่างกันจะถูกพล็อตบนแกนนอน (แกน x) และความถี่หรือความถี่จะถูกพล็อตบนแกนตั้ง (แกน y)
รูปหลายเหลี่ยมในรูป 6.1 อิงตามข้อมูลจากการสำรวจสำมะโนประชากรขนาดเล็กของรัสเซียในปี 1994
6.1. การกระจายขนาดครัวเรือนเงื่อนไข: ข้อมูลมีไว้เพื่อการกระจายพนักงาน 25 คนของหนึ่งในองค์กรตามประเภทภาษี:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
งาน: สร้างชุดรูปแบบที่แยกจากกัน และแสดงภาพเป็นรูปหลายเหลี่ยมการกระจายแบบกราฟิก
สารละลาย:
ในตัวอย่างนี้ ตัวเลือกคือเกรดค่าจ้างของพนักงาน ในการกำหนดความถี่จำเป็นต้องคำนวณจำนวนพนักงานด้วยหมวดหมู่ภาษีที่เกี่ยวข้อง
รูปหลายเหลี่ยมใช้สำหรับอนุกรมรูปแบบที่ไม่ต่อเนื่อง
ในการสร้างรูปหลายเหลี่ยมการกระจาย (รูปที่ 1) เราจะพล็อตค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกัน - ตัวเลือก - บนแกน abscissa (X) และความถี่หรือความถี่บนแกนกำหนด
หากค่าของคุณลักษณะแสดงในรูปแบบของช่วงเวลา อนุกรมดังกล่าวจะเรียกว่าช่วงเวลา
ซีรีย์ช่วงเวลาการแจกแจงจะแสดงเป็นภาพกราฟิกในรูปแบบของฮิสโตแกรม แบบสะสมหรือแบบโอกิฟ
ตารางสถิติ
เงื่อนไข: ข้อมูลมีให้เกี่ยวกับขนาดเงินฝากของบุคคล 20 คนในธนาคารเดียว (พันรูเบิล) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
งาน: สร้างอนุกรมความแปรผันตามช่วงเวลาโดยมีช่วงเวลาที่เท่ากัน
สารละลาย:
- ประชากรเริ่มแรกประกอบด้วย 20 หน่วย (N = 20)
- เมื่อใช้สูตร Sturgess เราจะกำหนดจำนวนกลุ่มที่ต้องการที่ใช้: n=1+3.322*lg20=5
- ลองคำนวณค่าของช่วงเวลาที่เท่ากัน: i=(152 - 2) /5 = 30,000 รูเบิล
- แบ่งประชากรเริ่มต้นออกเป็น 5 กลุ่มด้วยช่วง 30,000 รูเบิล
- เรานำเสนอผลลัพธ์การจัดกลุ่มในตาราง:
ด้วยการบันทึกคุณลักษณะต่อเนื่องดังกล่าว เมื่อค่าเดียวกันเกิดขึ้นสองครั้ง (เป็นขีดจำกัดบนของช่วงหนึ่งและขีดจำกัดล่างของอีกช่วงหนึ่ง) ค่านี้จะอยู่ในกลุ่มที่ค่านี้ทำหน้าที่เป็นขีดจำกัดบน
ฮิสโตแกรม
ในการสร้างฮิสโตแกรมค่าของขอบเขตของช่วงเวลาจะถูกระบุบนแกน abscissa และสร้างสี่เหลี่ยมขึ้นอยู่กับความสูงซึ่งเป็นสัดส่วนกับความถี่ (หรือความถี่)
ในรูป 6.2. แสดงฮิสโตแกรมการกระจายตัวของประชากรรัสเซียในปี 1997 ตามกลุ่มอายุ
ข้าว. 6.2. การกระจายตัวของประชากรรัสเซียตามกลุ่มอายุเงื่อนไข: จะมีการจัดสรรพนักงานของบริษัทจำนวน 30 คน ตามเงินเดือนต่อเดือน
งาน: แสดงชุดการเปลี่ยนแปลงช่วงเวลาเป็นกราฟิกในรูปแบบของฮิสโตแกรมและสะสม
สารละลาย:
- ขอบเขตที่ไม่รู้จักของช่วงเปิด (แรก) ถูกกำหนดโดยค่าของช่วงที่สอง: 7,000 - 5,000 = 2,000 รูเบิล ด้วยค่าเดียวกันเราจะพบขีด จำกัด ล่างของช่วงแรก: 5,000 - 2,000 = 3,000 รูเบิล
- ในการสร้างฮิสโตแกรมในระบบพิกัดสี่เหลี่ยมเราจะพล็อตตามแกน abscissa ส่วนที่มีค่าสอดคล้องกับช่วงเวลาของอนุกรม varicose
ส่วนเหล่านี้ทำหน้าที่เป็นฐานด้านล่าง และความถี่ (ความถี่) ที่สอดคล้องกันทำหน้าที่เป็นความสูงของสี่เหลี่ยมที่เกิดขึ้น - มาสร้างฮิสโตแกรมกัน:
ในการสร้างสะสมจำเป็นต้องคำนวณความถี่สะสม (ความถี่) ถูกกำหนดโดยการรวมความถี่ (ความถี่) ของช่วงเวลาก่อนหน้าตามลำดับและกำหนดให้เป็น S ความถี่สะสมจะแสดงจำนวนหน่วยของประชากรที่มีค่าลักษณะเฉพาะไม่เกินค่าที่อยู่ระหว่างการพิจารณา
สะสม
การกระจายคุณลักษณะในชุดรูปแบบต่างๆ บนความถี่สะสม (ความถี่) จะแสดงโดยใช้การสะสม
สะสมหรือเส้นโค้งสะสมซึ่งแตกต่างจากรูปหลายเหลี่ยมที่ถูกสร้างขึ้นจากความถี่หรือความถี่สะสม ในกรณีนี้ค่าของคุณลักษณะจะถูกวางไว้บนแกน abscissa และวางความถี่หรือความถี่สะสมไว้บนแกนกำหนด (รูปที่ 6.3)
ข้าว. 6.3. การกระจายขนาดครัวเรือนสะสม4. มาคำนวณความถี่สะสมกัน:
ความถี่สะสมของช่วงแรกคำนวณดังนี้ 0 + 4 = 4 สำหรับช่วงที่สอง: 4 + 12 = 16; สำหรับอันที่สาม: 4 + 12 + 8 = 24 เป็นต้น
เมื่อสร้างการสะสม ความถี่สะสม (ความถี่) ของช่วงเวลาที่สอดคล้องกันจะถูกกำหนดให้กับขีดจำกัดบน:
โอกิวา
โอกิวาถูกสร้างขึ้นในลักษณะเดียวกับการสะสมโดยมีความแตกต่างเพียงอย่างเดียวคือความถี่สะสมจะถูกวางไว้บนแกนแอบซิสซาและค่าลักษณะเฉพาะจะถูกวางไว้บนแกนกำหนด
ประเภทของการสะสมคือกราฟความเข้มข้นหรือพล็อตลอเรนซ์ ในการสร้างเส้นโค้งความเข้มข้น มาตราส่วนเป็นเปอร์เซ็นต์ตั้งแต่ 0 ถึง 100 จะถูกพล็อตบนแกนทั้งสองของระบบพิกัดสี่เหลี่ยม ในเวลาเดียวกัน ความถี่สะสมจะถูกระบุบนแกน abscissa และค่าสะสมของส่วนแบ่ง (เป็นเปอร์เซ็นต์) โดยปริมาตรของลักษณะเฉพาะที่ระบุบนแกนกำหนด
การกระจายลักษณะสม่ำเสมอสอดคล้องกับเส้นทแยงมุมของสี่เหลี่ยมจัตุรัสบนกราฟ (รูปที่ 6.4) ด้วยการกระจายที่ไม่สม่ำเสมอ กราฟจะแสดงเส้นโค้งเว้า ขึ้นอยู่กับระดับความเข้มข้นของลักษณะนั้น
6.4. เส้นโค้งความเข้มข้น