วิธีพิจารณาความแปรปรวนของผลิตภัณฑ์ที่ไม่ได้มาตรฐาน การกระจายตัว ชนิด และสมบัติของการกระจายตัว

ทฤษฎีความน่าจะเป็นเป็นสาขาพิเศษของคณิตศาสตร์ที่ศึกษาโดยนักศึกษาสถาบันอุดมศึกษาเท่านั้น คุณชอบการคำนวณและสูตรหรือไม่? คุณไม่กลัวโอกาสในการทำความคุ้นเคยกับการแจกแจงแบบปกติ เอนโทรปีทั้งมวล ความคาดหวังทางคณิตศาสตร์ และการกระจายตัวแบบไม่ต่อเนื่อง ตัวแปรสุ่ม- แล้ววิชานี้จะน่าสนใจมากสำหรับคุณ มาทำความคุ้นเคยกับแนวคิดพื้นฐานที่สำคัญที่สุดหลายประการของสาขาวิทยาศาสตร์นี้กันดีกว่า

เรามาจำพื้นฐานกัน

แม้ว่าคุณจะจำแนวคิดที่ง่ายที่สุดของทฤษฎีความน่าจะเป็นได้ แต่อย่าละเลยย่อหน้าแรกของบทความ ประเด็นก็คือหากไม่มีความเข้าใจพื้นฐานที่ชัดเจน คุณจะไม่สามารถทำงานกับสูตรที่กล่าวถึงด้านล่างได้

จึงมีเหตุการณ์สุ่มเกิดขึ้น การทดลองบางอย่าง จากการกระทำที่เราทำ เราจึงสามารถได้รับผลลัพธ์หลายประการ - บางอย่างเกิดขึ้นบ่อยกว่า และบางอย่างไม่บ่อยนัก ความน่าจะเป็นของเหตุการณ์คืออัตราส่วนของจำนวนผลลัพธ์จริงที่ได้รับจริงประเภทหนึ่งต่อ จำนวนทั้งหมดเป็นไปได้. เพียงรู้คำจำกัดความคลาสสิกของแนวคิดนี้คุณก็สามารถเริ่มศึกษาได้ ความคาดหวังทางคณิตศาสตร์และความแปรปรวนของตัวแปรสุ่มต่อเนื่อง

ค่าเฉลี่ยเลขคณิต

ย้อนกลับไปในโรงเรียน ระหว่างเรียนคณิตศาสตร์ คุณเริ่มทำงานกับค่าเฉลี่ยเลขคณิต แนวคิดนี้ใช้กันอย่างแพร่หลายในทฤษฎีความน่าจะเป็น ดังนั้นจึงไม่สามารถละเลยได้ สิ่งสำคัญสำหรับเราคือ ในขณะนี้คือเราจะพบมันในสูตรสำหรับความคาดหวังทางคณิตศาสตร์และการกระจายตัวของตัวแปรสุ่ม

เรามีลำดับของตัวเลขและต้องการหาค่าเฉลี่ยเลขคณิต สิ่งเดียวที่เราต้องการก็คือสรุปทุกอย่างที่มีอยู่แล้วหารด้วยจำนวนองค์ประกอบในลำดับ ขอให้เรามีตัวเลขตั้งแต่ 1 ถึง 9 ผลรวมขององค์ประกอบจะเท่ากับ 45 และเราจะหารค่านี้ด้วย 9 คำตอบ: - 5

การกระจายตัว

การพูด ภาษาวิทยาศาสตร์, การกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบนของค่าลักษณะเฉพาะที่ได้รับจากค่าเฉลี่ยเลขคณิต มันถูกเขียนแทนด้วยอักษรละตินตัวพิมพ์ใหญ่ D ตัวหนึ่ง สิ่งที่จำเป็นในการคำนวณคืออะไร? สำหรับแต่ละองค์ประกอบของลำดับ เราจะคำนวณความแตกต่างระหว่างตัวเลขที่มีอยู่กับค่าเฉลี่ยเลขคณิตแล้วยกกำลังสอง จะมีคุณค่ามากที่สุดเท่าที่จะเป็นไปได้สำหรับเหตุการณ์ที่เรากำลังพิจารณา ต่อไปเราจะสรุปทุกอย่างที่ได้รับและหารด้วยจำนวนองค์ประกอบในลำดับ หากเรามีผลลัพธ์ที่เป็นไปได้ห้ารายการ ให้หารด้วยห้า

การกระจายตัวยังมีคุณสมบัติที่ต้องจดจำเพื่อใช้ในการแก้ปัญหา ตัวอย่างเช่น เมื่อเพิ่มตัวแปรสุ่ม X ครั้ง ความแปรปรวนจะเพิ่มขึ้น X กำลังสองคูณ (เช่น X*X) มันไม่เคยน้อยกว่าศูนย์และไม่ขึ้นอยู่กับการเลื่อนค่าขึ้นหรือลงด้วยจำนวนที่เท่ากัน นอกจากนี้สำหรับ การทดสอบอิสระความแปรปรวนของผลรวมเท่ากับผลรวมของผลต่าง

ตอนนี้เราต้องพิจารณาตัวอย่างการกระจายตัวของตัวแปรสุ่มแบบไม่ต่อเนื่องและความคาดหวังทางคณิตศาสตร์อย่างแน่นอน

สมมติว่าเราทำการทดลอง 21 ครั้ง และได้ผลลัพธ์ที่แตกต่างกัน 7 แบบ เราสังเกตแต่ละครั้ง 1, 2, 2, 3, 4, 4 และ 5 ครั้งตามลำดับ ความแปรปรวนจะเท่ากับอะไร?

ขั้นแรก มาคำนวณค่าเฉลี่ยเลขคณิต แน่นอนว่าผลรวมขององค์ประกอบคือ 21 หารด้วย 7 จะได้ 3 จากนั้นให้ลบ 3 ออกจากแต่ละตัวเลขในลำดับเดิม ยกกำลังสองแต่ละค่า แล้วบวกผลลัพธ์เข้าด้วยกัน ผลลัพธ์คือ 12 ตอนนี้สิ่งที่เราต้องทำคือหารตัวเลขด้วยจำนวนองค์ประกอบ และดูเหมือนว่าก็แค่นั้นแหละ แต่ก็มีสิ่งที่จับได้! มาหารือกัน

ขึ้นอยู่กับจำนวนการทดลอง

ปรากฎว่าเมื่อคำนวณความแปรปรวน ตัวส่วนสามารถมีตัวเลขหนึ่งในสองจำนวน: N หรือ N-1 โดยที่ N คือจำนวนการทดลองที่ทำหรือจำนวนองค์ประกอบในลำดับ (ซึ่งโดยพื้นฐานแล้วคือสิ่งเดียวกัน) สิ่งนี้ขึ้นอยู่กับอะไร?

ถ้าจำนวนการทดสอบวัดเป็นร้อย เราต้องใส่ N ในตัวส่วน ถ้าเป็นหน่วยแล้ว N-1 นักวิทยาศาสตร์ตัดสินใจวาดเส้นขอบในเชิงสัญลักษณ์: วันนี้มันผ่านเลข 30 หากเราทำการทดลองน้อยกว่า 30 ครั้ง เราจะหารจำนวนด้วย N-1 และถ้ามากกว่านั้นก็หารด้วย N

งาน

กลับมาที่ตัวอย่างการแก้ปัญหาความแปรปรวนและความคาดหวังทางคณิตศาสตร์กัน เราได้เลขกลาง 12 ซึ่งต้องหารด้วย N หรือ N-1 เนื่องจากเราทำการทดลอง 21 ครั้ง ซึ่งน้อยกว่า 30 ครั้ง เราจะเลือกตัวเลือกที่สอง คำตอบคือ: ความแปรปรวนคือ 12/2 = 2

ความคาดหวัง

เรามาดูแนวคิดที่สองกันดีกว่าซึ่งเราต้องพิจารณาในบทความนี้ ความคาดหวังทางคณิตศาสตร์เป็นผลมาจากการบวกผลลัพธ์ที่เป็นไปได้ทั้งหมดคูณด้วยความน่าจะเป็นที่สอดคล้องกัน สิ่งสำคัญคือต้องเข้าใจว่าค่าที่ได้รับตลอดจนผลลัพธ์ของการคำนวณความแปรปรวนนั้นได้มาเพียงครั้งเดียวสำหรับ งานทั้งหมดไม่ว่าจะพิจารณากี่ผลลัพธ์ก็ตาม

สูตรสำหรับความคาดหวังทางคณิตศาสตร์นั้นค่อนข้างง่าย: เรานำผลลัพธ์มาคูณด้วยความน่าจะเป็นของมันบวกกับผลลัพธ์ที่สองและสามเป็นต้น ทุกอย่างที่เกี่ยวข้องกับแนวคิดนี้คำนวณได้ไม่ยาก เช่น ผลรวมของค่าที่คาดหวังจะเท่ากับค่าที่คาดหวังของผลรวม เช่นเดียวกับการทำงาน ไม่ใช่ทุกปริมาณในทฤษฎีความน่าจะเป็นที่จะอนุญาตให้คุณดำเนินการง่ายๆ เช่นนั้นได้ ลองใช้ปัญหาและคำนวณความหมายของสองแนวคิดที่เราศึกษาพร้อมกัน นอกจากนี้เรายังถูกรบกวนจากทฤษฎี - ถึงเวลาฝึกฝนแล้ว

อีกตัวอย่างหนึ่ง

เราทำการทดลอง 50 ครั้งและได้รับผลลัพธ์ 10 ประเภท - ตัวเลขตั้งแต่ 0 ถึง 9 - ปรากฏเป็นเปอร์เซ็นต์ที่แตกต่างกัน เหล่านี้คือตามลำดับ: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18% โปรดจำไว้ว่าเพื่อให้ได้ความน่าจะเป็นคุณต้องหารค่าเปอร์เซ็นต์ด้วย 100 ดังนั้นเราจึงได้ 0.02 0.1 เป็นต้น ให้เรานำเสนอตัวอย่างการแก้ปัญหาความแปรปรวนของตัวแปรสุ่มและความคาดหวังทางคณิตศาสตร์

เราคำนวณค่าเฉลี่ยเลขคณิตโดยใช้สูตรที่เราจำได้ตั้งแต่ชั้นประถมศึกษา: 50/10 = 5

ทีนี้มาแปลงความน่าจะเป็นเป็นจำนวนผลลัพธ์ "เป็นชิ้น ๆ" เพื่อให้นับได้ง่ายขึ้น เราได้ 1, 5, 2, 7, 1, 9, 3, 8, 5 และ 9 จากแต่ละค่าที่ได้รับ เราจะลบค่าเฉลี่ยเลขคณิต หลังจากนั้นเราจะยกกำลังสองผลลัพธ์แต่ละรายการที่ได้รับ ดูวิธีดำเนินการโดยใช้องค์ประกอบแรกเป็นตัวอย่าง: 1 - 5 = (-4) ถัดไป: (-4) * (-4) = 16 สำหรับค่าอื่นๆ ให้ดำเนินการเหล่านี้ด้วยตนเอง ถ้าคุณทำทุกอย่างถูกต้องแล้ว เมื่อรวมทั้งหมดแล้วคุณจะได้ 90

มาคำนวณความแปรปรวนและค่าคาดหวังต่อไปโดยหาร 90 ด้วย N ทำไมเราจึงเลือก N มากกว่า N-1 ถูกต้อง เนื่องจากจำนวนการทดลองที่ทำเกิน 30 ครั้ง ดังนั้น: 90/10 = 9 เราได้ความแปรปรวน หากได้เลขอื่นอย่าหมดหวัง เป็นไปได้มากว่าคุณทำผิดพลาดง่าย ๆ ในการคำนวณ ตรวจสอบสิ่งที่คุณเขียนอีกครั้งและทุกอย่างอาจจะเข้าที่

สุดท้าย จำสูตรความคาดหวังทางคณิตศาสตร์ไว้ เราจะไม่ให้การคำนวณทั้งหมด เราจะเขียนเฉพาะคำตอบที่คุณสามารถตรวจสอบได้หลังจากทำตามขั้นตอนที่จำเป็นทั้งหมดแล้วเท่านั้น ค่าคาดหวังจะเป็น 5.48 ให้เรานึกถึงวิธีดำเนินการเท่านั้น โดยใช้องค์ประกอบแรกเป็นตัวอย่าง: 0*0.02 + 1*0.1... และอื่นๆ อย่างที่คุณเห็น เราแค่คูณค่าผลลัพธ์ด้วยความน่าจะเป็น

การเบี่ยงเบน

แนวคิดอีกประการหนึ่งที่เกี่ยวข้องอย่างใกล้ชิดกับการกระจายตัวและความคาดหวังทางคณิตศาสตร์ก็คือค่าเบี่ยงเบนมาตรฐาน มันถูกกำหนดไว้อย่างใดอย่างหนึ่ง ในตัวอักษรละติน sd หรือตัวพิมพ์เล็กกรีก "sigma" แนวคิดนี้แสดงให้เห็นว่าค่าเบี่ยงเบนไปจากคุณลักษณะส่วนกลางโดยเฉลี่ยเท่าใด คุณต้องคำนวณเพื่อหาค่าของมัน รากที่สองจากการกระจายตัว

ถ้าคุณวางแผน การกระจายตัวแบบปกติและต้องการดูค่าเบี่ยงเบนกำลังสองโดยตรง สามารถทำได้หลายขั้นตอน ใช้เวลาครึ่งหนึ่งของภาพไปทางซ้ายหรือขวาของโหมด (ค่ากลาง) วาดตั้งฉากกับแกนนอนเพื่อให้พื้นที่ของตัวเลขที่ได้เท่ากัน ขนาดของส่วนระหว่างกึ่งกลางของการกระจายและการฉายภาพที่เกิดขึ้นบนแกนนอนจะแสดงถึงค่าเบี่ยงเบนมาตรฐาน

ซอฟต์แวร์

ดังที่เห็นได้จากคำอธิบายของสูตรและตัวอย่างที่นำเสนอ การคำนวณความแปรปรวนและความคาดหวังทางคณิตศาสตร์ไม่ใช่ขั้นตอนที่ง่ายที่สุดจากมุมมองทางคณิตศาสตร์ เพื่อไม่ให้เป็นการเสียเวลา ควรใช้โปรแกรมที่ใช้ในการศึกษาระดับอุดมศึกษา สถาบันการศึกษา- เรียกว่า "ร" มีฟังก์ชันที่ช่วยให้คุณคำนวณค่าสำหรับแนวคิดต่างๆ จากสถิติและทฤษฎีความน่าจะเป็น

ตัวอย่างเช่น คุณระบุเวกเตอร์ของค่า ทำได้ดังนี้: เวกเตอร์<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

สรุปแล้ว

การกระจายตัวและความคาดหวังทางคณิตศาสตร์นั้นเป็นสิ่งที่ยากในการคำนวณสิ่งใดในอนาคต ในหลักสูตรหลักของการบรรยายที่มหาวิทยาลัยจะมีการพูดคุยกันในช่วงเดือนแรกของการศึกษาวิชานี้ เป็นเพราะขาดความเข้าใจในแนวคิดง่ายๆ เหล่านี้และไม่สามารถคำนวณได้ ทำให้นักเรียนจำนวนมากเริ่มล้าหลังในโปรแกรมทันทีและต่อมาได้รับคะแนนไม่ดีเมื่อสิ้นสุดภาคเรียน ซึ่งทำให้ไม่ได้รับทุนการศึกษา

ฝึกฝนอย่างน้อยหนึ่งสัปดาห์ ครึ่งชั่วโมงต่อวัน เพื่อแก้ปัญหาคล้ายกับที่นำเสนอในบทความนี้ จากนั้น ในการทดสอบใดๆ ในทฤษฎีความน่าจะเป็น คุณจะสามารถรับมือกับตัวอย่างต่างๆ ได้โดยไม่ต้องอาศัยคำแนะนำและสูตรโกงเพิ่มเติม

ในบรรดาตัวชี้วัดจำนวนมากที่ใช้ในทางสถิติ จำเป็นต้องเน้นการคำนวณความแปรปรวน ควรสังเกตว่าการคำนวณด้วยตนเองถือเป็นงานที่ค่อนข้างน่าเบื่อ โชคดีที่ Excel มีฟังก์ชันที่ช่วยให้คุณสามารถทำให้ขั้นตอนการคำนวณเป็นแบบอัตโนมัติได้ มาดูอัลกอริทึมสำหรับการทำงานกับเครื่องมือเหล่านี้กันดีกว่า

การกระจายตัวเป็นตัวบ่งชี้ความแปรผัน ซึ่งเป็นกำลังสองเฉลี่ยของการเบี่ยงเบนจากความคาดหวังทางคณิตศาสตร์ ดังนั้นจึงเป็นการแสดงออกถึงการแพร่กระจายของตัวเลขรอบๆ ค่าเฉลี่ย การคำนวณความแปรปรวนสามารถทำได้ทั้งสำหรับประชากรทั่วไปและสำหรับกลุ่มตัวอย่าง

วิธีที่ 1: คำนวณตามจำนวนประชากร

หากต้องการคำนวณตัวบ่งชี้นี้ใน Excel สำหรับประชากรทั่วไป ให้ใช้ฟังก์ชัน DISP.G- ไวยากรณ์ของนิพจน์นี้เป็นดังนี้:

DISP.G(หมายเลข 1;หมายเลข 2;...)

สามารถใช้อาร์กิวเมนต์ได้ทั้งหมด 1 ถึง 255 อาร์กิวเมนต์ อาร์กิวเมนต์อาจเป็นค่าตัวเลขหรือการอ้างอิงไปยังเซลล์ที่มีอยู่

เรามาดูวิธีการคำนวณค่านี้สำหรับช่วงที่มีข้อมูลตัวเลขกัน


วิธีที่ 2: คำนวณตามตัวอย่าง

ในการคำนวณตัวอย่าง ต่างจากการคำนวณค่าตามประชากรตรงที่ตัวส่วนไม่ได้ระบุจำนวนตัวเลขทั้งหมด แต่จะน้อยกว่า 1 ตัว สิ่งนี้ทำเพื่อวัตถุประสงค์ในการแก้ไขข้อผิดพลาด Excel คำนึงถึงความแตกต่างนี้ในฟังก์ชันพิเศษที่ออกแบบมาสำหรับการคำนวณประเภทนี้ - DISP.V ไวยากรณ์ของมันแสดงโดยสูตรต่อไปนี้:

DISP.B(หมายเลข 1;หมายเลข 2;...)

จำนวนอาร์กิวเมนต์เช่นเดียวกับในฟังก์ชันก่อนหน้า สามารถมีตั้งแต่ 1 ถึง 255 ได้เช่นกัน


อย่างที่คุณเห็น โปรแกรม Excel สามารถอำนวยความสะดวกในการคำนวณผลต่างได้อย่างมาก สถิตินี้สามารถคำนวณได้โดยการประยุกต์ใช้งาน ไม่ว่าจะจากประชากรหรือจากกลุ่มตัวอย่าง ในกรณีนี้ การกระทำของผู้ใช้ทั้งหมดจะลดลงเพื่อระบุช่วงของตัวเลขที่จะประมวลผล และ Excel จะทำงานหลักเอง แน่นอนว่าสิ่งนี้จะช่วยประหยัดเวลาของผู้ใช้ได้มาก

การกระจายตัวตัวแปรสุ่ม- การวัดการแพร่กระจายของที่กำหนด ตัวแปรสุ่มนั่นคือเธอ การเบี่ยงเบนจากความคาดหวังทางคณิตศาสตร์ ในสถิติ มักใช้สัญลักษณ์ (ซิกมากำลังสอง) เพื่อแสดงถึงการกระจายตัว รากที่สองของความแปรปรวนเท่ากับเรียกว่า ส่วนเบี่ยงเบนมาตรฐานหรือสเปรดมาตรฐาน ค่าเบี่ยงเบนมาตรฐานจะวัดในหน่วยเดียวกันกับตัวแปรสุ่ม และความแปรปรวนจะวัดเป็นหน่วยกำลังสองของหน่วยนั้น

แม้ว่าจะสะดวกมากที่จะใช้เพียงค่าเดียว (เช่น ค่าเฉลี่ยหรือโหมดและค่ามัธยฐาน) เพื่อประมาณค่าตัวอย่างทั้งหมด แต่แนวทางนี้สามารถนำไปสู่ข้อสรุปที่ไม่ถูกต้องได้อย่างง่ายดาย สาเหตุของสถานการณ์นี้ไม่ได้อยู่ที่ตัวค่าเอง แต่ในความจริงที่ว่าค่าหนึ่งไม่ได้สะท้อนถึงการแพร่กระจายของค่าข้อมูลในทางใดทางหนึ่ง

ตัวอย่างเช่น ในตัวอย่าง:

ค่าเฉลี่ยคือ 5

อย่างไรก็ตาม ในตัวอย่างนั้นไม่มีองค์ประกอบเดียวที่มีค่า 5 คุณอาจต้องทราบระดับความใกล้เคียงของแต่ละองค์ประกอบในตัวอย่างกับค่าเฉลี่ย หรืออีกนัยหนึ่ง คุณจะต้องทราบความแปรปรวนของค่าต่างๆ เมื่อทราบระดับการเปลี่ยนแปลงของข้อมูลแล้ว คุณก็จะตีความได้ดีขึ้น ค่าเฉลี่ย, ค่ามัธยฐานและ แฟชั่น- ระดับที่ค่าตัวอย่างเปลี่ยนแปลงถูกกำหนดโดยการคำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน



ความแปรปรวนและรากที่สองของความแปรปรวนที่เรียกว่าค่าเบี่ยงเบนมาตรฐาน เป็นตัวกำหนดลักษณะเฉพาะของค่าเบี่ยงเบนเฉลี่ยจากค่าเฉลี่ยตัวอย่าง ในบรรดาปริมาณทั้งสองนี้ สิ่งที่สำคัญที่สุดคือ ส่วนเบี่ยงเบนมาตรฐาน- ค่านี้ถือได้ว่าเป็นระยะทางเฉลี่ยที่องค์ประกอบต่างๆ มาจากองค์ประกอบตรงกลางของกลุ่มตัวอย่าง

ความแปรปรวนเป็นเรื่องยากที่จะตีความอย่างมีความหมาย อย่างไรก็ตาม รากที่สองของค่านี้คือค่าเบี่ยงเบนมาตรฐานและสามารถตีความได้ง่าย

ค่าเบี่ยงเบนมาตรฐานคำนวณโดยหาความแปรปรวนก่อน แล้วจึงหารากที่สองของความแปรปรวน

ตัวอย่างเช่นสำหรับอาร์เรย์ข้อมูลที่แสดงในรูปจะได้รับค่าต่อไปนี้:

รูปที่ 1

ค่าเฉลี่ยของผลต่างกำลังสองคือ 717.43 หากต้องการหาค่าเบี่ยงเบนมาตรฐาน ที่เหลือก็แค่หารากที่สองของจำนวนนี้

ผลลัพธ์จะอยู่ที่ประมาณ 26.78

โปรดจำไว้ว่าค่าเบี่ยงเบนมาตรฐานจะถูกตีความว่าเป็นระยะทางเฉลี่ยที่รายการต่างๆ มาจากค่าเฉลี่ยตัวอย่าง

ค่าเบี่ยงเบนมาตรฐานจะวัดว่าค่าเฉลี่ยอธิบายกลุ่มตัวอย่างทั้งหมดได้ดีเพียงใด

สมมติว่าคุณเป็นหัวหน้าแผนกผลิตชิ้นส่วนพีซี รายงานประจำไตรมาสระบุว่าการผลิตสำหรับไตรมาสที่แล้วอยู่ที่ 2,500 เครื่อง สิ่งนี้ดีหรือไม่ดี? คุณถาม (หรือมีคอลัมน์นี้อยู่แล้วในรายงาน) ให้แสดงค่าเบี่ยงเบนมาตรฐานสำหรับข้อมูลนี้ในรายงาน ตัวอย่างเช่น ค่าเบี่ยงเบนมาตรฐานคือ 2000 ในฐานะหัวหน้าแผนก คุณจะเห็นได้ชัดว่าสายการผลิตต้องการการจัดการที่ดีขึ้น (การเบี่ยงเบนมากเกินไปในจำนวนพีซีที่ประกอบ)

โปรดจำไว้ว่าเมื่อค่าเบี่ยงเบนมาตรฐานมีขนาดใหญ่ ข้อมูลจะกระจัดกระจายรอบๆ ค่าเฉลี่ย และเมื่อค่าเบี่ยงเบนมาตรฐานมีค่าน้อย ข้อมูลจะกระจัดกระจายใกล้กับค่าเฉลี่ย

ฟังก์ชันทางสถิติสี่ฟังก์ชัน VAR(), VAR(), STDEV() และ STDEV() ได้รับการออกแบบมาเพื่อคำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของตัวเลขในช่วงของเซลล์ ก่อนที่คุณจะสามารถคำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของชุดข้อมูลได้ คุณต้องพิจารณาว่าข้อมูลนั้นแสดงถึงประชากรหรือกลุ่มตัวอย่างของประชากร ในกรณีของกลุ่มตัวอย่างจากประชากรทั่วไป คุณควรใช้ฟังก์ชัน VAR() และ STDEV() และในกรณีของประชากรทั่วไป ฟังก์ชัน VAR() และ STDEV():

ประชากร การทำงาน

DISPR()

สแตนโดลอนป์()
ตัวอย่าง

DISP()

STDEV()

การกระจายตัว (เช่นเดียวกับค่าเบี่ยงเบนมาตรฐาน) ตามที่เราระบุไว้ บ่งชี้ขอบเขตที่ค่าที่รวมอยู่ในชุดข้อมูลกระจัดกระจายรอบค่าเฉลี่ยเลขคณิต

ค่าความแปรปรวนหรือส่วนเบี่ยงเบนมาตรฐานเล็กน้อยบ่งชี้ว่าข้อมูลทั้งหมดกระจุกตัวอยู่ที่ค่าเฉลี่ยเลขคณิต และค่าที่มากของค่าเหล่านี้บ่งชี้ว่าข้อมูลกระจัดกระจายไปตามค่าที่หลากหลาย

การกระจายตัวค่อนข้างยากในการตีความอย่างมีความหมาย (ค่าน้อยหมายถึงอะไร ค่ามาก) การดำเนินการ ภารกิจที่ 3จะช่วยให้คุณมองเห็นความหมายของความแปรปรวนของชุดข้อมูลบนกราฟได้

เควส

· ภารกิจที่ 1

· 2.1. ให้แนวคิด: การกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน; การกำหนดเชิงสัญลักษณ์สำหรับการประมวลผลข้อมูลทางสถิติ

· 2.2. กรอกแผ่นงานตามรูปที่ 1 และทำการคำนวณที่จำเป็น

· 2.3. ให้สูตรพื้นฐานที่ใช้ในการคำนวณ

· 2.4. อธิบายการกำหนดทั้งหมด ( , , )

· 2.5. อธิบายความหมายในทางปฏิบัติของแนวคิดเรื่องการกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน

ภารกิจที่ 2

1.1. ให้แนวคิด ประชากรทั่วไปและกลุ่มตัวอย่าง ความคาดหวังทางคณิตศาสตร์และค่าเฉลี่ยเลขคณิตในการกำหนดสัญลักษณ์สำหรับการประมวลผลข้อมูลทางสถิติ

1.2. ตามรูปที่ 2 เตรียมแผ่นงานและทำการคำนวณ

1.3. ระบุสูตรพื้นฐานที่ใช้ในการคำนวณ (สำหรับประชากรทั่วไปและกลุ่มตัวอย่าง)

รูปที่ 2

1.4. อธิบายว่าทำไมจึงได้ค่าเฉลี่ยเลขคณิตดังกล่าวในกลุ่มตัวอย่างเป็น 46.43 และ 48.78 (ดูไฟล์ภาคผนวก) วาดข้อสรุป

ภารกิจที่ 3

มีสองตัวอย่างที่มีชุดข้อมูลต่างกัน แต่ค่าเฉลี่ยจะเท่ากัน:

รูปที่ 3

3.1. กรอกแผ่นงานตามรูปที่ 3 และทำการคำนวณที่จำเป็น

3.2. ให้สูตรการคำนวณพื้นฐาน

3.3. สร้างกราฟตามรูปที่ 4, 5

3.4. อธิบายการพึ่งพาที่ได้รับ

3.5. ทำการคำนวณที่คล้ายกันสำหรับข้อมูลของสองตัวอย่าง

ตัวอย่างต้นฉบับ 11119999

เลือกค่าของตัวอย่างที่สองเพื่อให้ค่าเฉลี่ยเลขคณิตสำหรับตัวอย่างที่สองเท่ากัน เช่น

เลือกค่าสำหรับตัวอย่างที่สองด้วยตัวเอง จัดเรียงการคำนวณและกราฟคล้ายกับรูปที่ 3, 4, 5 แสดงสูตรพื้นฐานที่ใช้ในการคำนวณ

หาข้อสรุปที่เหมาะสม

เตรียมงานทั้งหมดในรูปแบบรายงานโดยประกอบด้วยรูปภาพ กราฟ สูตร และคำอธิบายสั้นๆ ที่จำเป็นทั้งหมด

หมายเหตุ: การสร้างกราฟต้องอธิบายด้วยภาพวาดและคำอธิบายสั้น ๆ

หากแบ่งประชากรออกเป็นกลุ่มตามลักษณะที่กำลังศึกษา ความแปรปรวนประเภทต่อไปนี้สามารถคำนวณได้สำหรับประชากรกลุ่มนี้: ผลรวม กลุ่ม (ภายในกลุ่ม) ค่าเฉลี่ยของกลุ่ม (ค่าเฉลี่ยภายในกลุ่ม) กลุ่มระหว่างกัน

เริ่มแรกจะคำนวณค่าสัมประสิทธิ์การตัดสินใจ ซึ่งแสดงให้เห็นว่าส่วนใดของการแปรผันรวมของลักษณะที่กำลังศึกษาคือความแปรผันระหว่างกลุ่ม เช่น เนื่องจากลักษณะการจัดกลุ่ม:

ความสัมพันธ์สหสัมพันธ์เชิงประจักษ์แสดงถึงความใกล้ชิดของความสัมพันธ์ระหว่างการจัดกลุ่ม (แฟกทอเรียล) และคุณลักษณะด้านประสิทธิภาพ

อัตราส่วนสหสัมพันธ์เชิงประจักษ์สามารถรับค่าได้ตั้งแต่ 0 ถึง 1

ในการประเมินความใกล้ชิดของการเชื่อมต่อตามอัตราส่วนสหสัมพันธ์เชิงประจักษ์ คุณสามารถใช้ความสัมพันธ์ Chaddock ได้:

ตัวอย่างที่ 4ข้อมูลต่อไปนี้มีให้เกี่ยวกับการปฏิบัติงานโดยองค์กรออกแบบและสำรวจของการเป็นเจ้าของในรูปแบบต่างๆ:

กำหนด:

1) ความแปรปรวนรวม;

2) ความแปรปรวนของกลุ่ม

3) ค่าเฉลี่ยของความแปรปรวนกลุ่ม

4) ความแปรปรวนระหว่างกลุ่ม;

5) ความแปรปรวนรวมตามกฎสำหรับการบวกความแปรปรวน


6) ค่าสัมประสิทธิ์การกำหนดและอัตราส่วนสหสัมพันธ์เชิงประจักษ์

วาดข้อสรุป

สารละลาย:

1. ให้เรากำหนดปริมาณงานโดยเฉลี่ยที่ดำเนินการโดยองค์กรที่มีความเป็นเจ้าของสองรูปแบบ:

มาคำนวณความแปรปรวนทั้งหมด:

2. กำหนดค่าเฉลี่ยกลุ่ม:

ล้านรูเบิล;

ล้านรูเบิล

ผลต่างกลุ่ม:

;

3. คำนวณค่าเฉลี่ยของผลต่างกลุ่ม:

4. เรามาพิจารณาความแปรปรวนระหว่างกลุ่มกัน:

5. คำนวณผลต่างทั้งหมดตามกฎสำหรับการบวกผลต่าง:

6. มากำหนดค่าสัมประสิทธิ์การตัดสินใจ:

.

ดังนั้นปริมาณงานที่ดำเนินการโดยองค์กรออกแบบและสำรวจจึงขึ้นอยู่กับ 22% ในรูปแบบการเป็นเจ้าของขององค์กร

อัตราส่วนสหสัมพันธ์เชิงประจักษ์คำนวณโดยใช้สูตร

.

ค่าของตัวบ่งชี้ที่คำนวณได้บ่งชี้ว่าการพึ่งพาปริมาณงานในรูปแบบการเป็นเจ้าของขององค์กรนั้นมีน้อย

ตัวอย่างที่ 5จากการสำรวจวินัยทางเทคโนโลยีของพื้นที่การผลิต ทำให้ได้ข้อมูลดังต่อไปนี้:

กำหนดค่าสัมประสิทธิ์การตัดสินใจ

ประเภทของการกระจายตัว:

ผลต่างรวมระบุลักษณะการเปลี่ยนแปลงของคุณลักษณะของประชากรทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ ค่านี้ถูกกำหนดโดยสูตร

โดยที่ค่าเฉลี่ยเลขคณิตโดยรวมของประชากรทั้งหมดที่อยู่ระหว่างการศึกษา

ความแปรปรวนภายในกลุ่มเฉลี่ยบ่งบอกถึงความแปรปรวนแบบสุ่มที่อาจเกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สามารถนับได้ และไม่ขึ้นอยู่กับคุณลักษณะของปัจจัยที่เป็นพื้นฐานของการจัดกลุ่ม ความแปรปรวนนี้คำนวณได้ดังนี้ ขั้นแรก ความแปรปรวนสำหรับแต่ละกลุ่มจะถูกคำนวณ () จากนั้นจึงคำนวณค่าเฉลี่ยความแปรปรวนภายในกลุ่ม:

โดยที่ n i คือจำนวนหน่วยในกลุ่ม

ความแปรปรวนระหว่างกลุ่ม(ความแปรปรวนของค่าเฉลี่ยกลุ่ม) แสดงถึงลักษณะความแปรปรวนอย่างเป็นระบบ เช่น ความแตกต่างในคุณค่าของลักษณะการศึกษาที่เกิดขึ้นภายใต้อิทธิพลของเครื่องหมายปัจจัยซึ่งเป็นพื้นฐานของการจัดกลุ่ม

โดยที่ค่าเฉลี่ยสำหรับกลุ่มแยกต่างหาก

ความแปรปรวนทั้งสามประเภทมีความสัมพันธ์กัน: ความแปรปรวนรวมเท่ากับผลรวมของค่าเฉลี่ยความแปรปรวนภายในกลุ่มและความแปรปรวนระหว่างกลุ่ม:

คุณสมบัติ:

25 การวัดสัมพัทธ์ของการแปรผัน

ค่าสัมประสิทธิ์การสั่น

ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์

ค่าสัมประสิทธิ์ของการแปรผัน

โคฟ. สสส. โอสะท้อนถึงความผันผวนสัมพัทธ์ของค่าสุดขีดของลักษณะเฉพาะรอบๆ ค่าเฉลี่ย ญาติ ลิน ปิด- กำหนดลักษณะสัดส่วนของค่าเฉลี่ยของเครื่องหมายของการเบี่ยงเบนสัมบูรณ์จากค่าเฉลี่ย โคฟ. ความแปรผันคือการวัดความแปรปรวนที่ใช้บ่อยที่สุดเพื่อประเมินลักษณะทั่วไปของค่าเฉลี่ย

ในสถิติ ประชากรที่มีค่าสัมประสิทธิ์ความแปรปรวนมากกว่า 30–35% ถือว่าต่างกัน

    ความสม่ำเสมอของซีรีย์การจัดจำหน่าย ช่วงเวลาแห่งการแจกจ่าย

ตัวบ่งชี้รูปร่างการกระจาย ในซีรีย์รูปแบบต่างๆ มีการเชื่อมโยงระหว่างความถี่และค่าของคุณสมบัติที่แตกต่างกัน: เมื่อคุณสมบัติเพิ่มขึ้น ค่าความถี่จะเพิ่มขึ้นจนถึงขีดจำกัดแรกแล้วจึงลดลง การเปลี่ยนแปลงดังกล่าวเรียกว่า

การศึกษารูปร่างของการกระจายโดยใช้ตัวชี้วัดความเบ้และความโด่ง เมื่อคำนวณตัวบ่งชี้เหล่านี้ จะใช้ช่วงเวลาการกระจาย

โมเมนต์ลำดับที่ k คือค่าเฉลี่ยของระดับความเบี่ยงเบนของค่าตัวแปรของคุณลักษณะจากค่าคงที่บางค่า ลำดับของโมเมนต์ถูกกำหนดโดยค่าของ k เมื่อวิเคราะห์อนุกรมรูปแบบ รูปแบบหนึ่งจะถูกจำกัดให้คำนวณช่วงเวลาของสี่คำสั่งแรกเท่านั้น เมื่อคำนวณช่วงเวลา ความถี่หรือความถี่สามารถใช้เป็นน้ำหนักได้ ขึ้นอยู่กับการเลือกค่าคงที่ช่วงเวลาเริ่มต้นเงื่อนไขและจุดศูนย์กลางจะแตกต่างกัน

ตัวบ่งชี้รูปแบบการจำหน่าย:

ความไม่สมมาตร(As) ตัวบ่งชี้ที่แสดงถึงระดับความไม่สมมาตรของการกระจาย .

ดังนั้น ด้วยความไม่สมดุลเชิงลบ (ด้านซ้าย) - ด้วยความไม่สมมาตรเชิงบวก (ด้านขวา) .

โมเมนต์ศูนย์กลางสามารถใช้เพื่อคำนวณความไม่สมมาตรได้ แล้ว:

,

ที่ไหน ม 3 – โมเมนต์กลางอันดับสาม

- ความโด่ง (E ถึง ) แสดงลักษณะความชันของกราฟฟังก์ชันเมื่อเปรียบเทียบกับการแจกแจงแบบปกติที่จุดแข็งของการแปรผันเท่ากัน:

,

โดยที่ μ 4 คือช่วงเวลาสำคัญของลำดับที่ 4

    กฎหมายการกระจายแบบปกติ

สำหรับการแจกแจงแบบปกติ (การแจกแจงแบบเกาส์เซียน) ฟังก์ชันการแจกแจงจะมีรูปแบบดังนี้

ความคาดหวัง - ส่วนเบี่ยงเบนมาตรฐาน

การแจกแจงแบบปกติมีความสมมาตรและมีลักษณะเฉพาะโดยความสัมพันธ์ต่อไปนี้: Xav=Me=Mo

ความโด่งของการแจกแจงแบบปกติคือ 3 และค่าสัมประสิทธิ์ความเบ้คือ 0

เส้นโค้งการกระจายปกติคือรูปหลายเหลี่ยม (เส้นตรงรูประฆังสมมาตร)

    ประเภทของการกระจายตัว กฎสำหรับการบวกผลต่าง

สาระสำคัญของสัมประสิทธิ์เชิงประจักษ์ของความมุ่งมั่น

    หากประชากรดั้งเดิมถูกแบ่งออกเป็นกลุ่มตามลักษณะสำคัญบางประการ จะมีการคำนวณความแปรปรวนประเภทต่อไปนี้:

ความแปรปรวนรวมของประชากรเดิม:

    โดยที่คือค่าเฉลี่ยโดยรวมของประชากรดั้งเดิม f คือความถี่ของประชากรดั้งเดิม การกระจายตัวทั้งหมดแสดงถึงความเบี่ยงเบนของค่าแต่ละค่าของลักษณะจากค่าเฉลี่ยโดยรวมของประชากรดั้งเดิม

ความแปรปรวนภายในกลุ่ม:

    โดยที่ j คือจำนวนของกลุ่มนั้น คือ ค่าเฉลี่ยในแต่ละกลุ่มของ j ความแปรปรวนภายในกลุ่มแสดงถึงความเบี่ยงเบนของค่าแต่ละค่าของลักษณะในแต่ละกลุ่มจากค่าเฉลี่ยของกลุ่ม จากความแปรปรวนภายในกลุ่มทั้งหมด ค่าเฉลี่ยจะคำนวณโดยใช้สูตร โดยที่ คือจำนวนหน่วยในแต่ละกลุ่มที่ j

ความแปรปรวนระหว่างกลุ่ม:

การกระจายตัวระหว่างกลุ่มแสดงถึงความเบี่ยงเบนของค่าเฉลี่ยกลุ่มจากค่าเฉลี่ยโดยรวมของประชากรดั้งเดิมคือความแปรปรวนรวมของประชากรเดิมควรเท่ากับผลรวมของค่าระหว่างกลุ่มและค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:

สัมประสิทธิ์เชิงประจักษ์ของความมุ่งมั่นแสดงสัดส่วนของการแปรผันในลักษณะที่ศึกษาเนื่องจากความแปรผันในลักษณะการจัดกลุ่มและคำนวณโดยใช้สูตร:

    วิธีการนับจากศูนย์ตามเงื่อนไข (วิธีโมเมนต์) เพื่อคำนวณค่าเฉลี่ยและความแปรปรวน

การคำนวณการกระจายตัวโดยวิธีโมเมนต์จะขึ้นอยู่กับการใช้สูตรและคุณสมบัติของการกระจายตัว 3 และ 4

(3. หากค่าทั้งหมดของคุณลักษณะ (ตัวเลือก) เพิ่มขึ้น (ลดลง) ด้วยจำนวนคงที่ A ค่าความแปรปรวนของประชากรใหม่จะไม่เปลี่ยนแปลง

4. หากค่าทั้งหมดของคุณลักษณะ (ตัวเลือก) เพิ่มขึ้น (คูณ) ด้วย K เท่าโดยที่ K เป็นจำนวนคงที่ จากนั้นความแปรปรวนของประชากรใหม่จะเพิ่มขึ้น (ลดลง) ด้วย K 2 เท่า)

เราได้สูตรสำหรับคำนวณการกระจายตัวของอนุกรมการแปรผันโดยมีช่วงเวลาเท่ากันโดยใช้วิธีโมเมนต์:

เอ - ศูนย์ตามเงื่อนไขเท่ากับตัวเลือกที่มีความถี่สูงสุด (ตรงกลางของช่วงเวลาที่มีความถี่สูงสุด)

การคำนวณค่าเฉลี่ยโดยวิธีโมเมนต์ยังขึ้นอยู่กับการใช้คุณสมบัติของค่าเฉลี่ยด้วย

    แนวคิดของการสังเกตแบบเลือกสรร ขั้นตอนของการศึกษาปรากฏการณ์ทางเศรษฐกิจโดยใช้วิธีสุ่มตัวอย่าง

การสังเกตตัวอย่างคือการสังเกตที่ไม่ได้มีการตรวจสอบและศึกษาทุกหน่วยของประชากรดั้งเดิม แต่เพียงส่วนหนึ่งของหน่วย ในขณะที่ผลลัพธ์ของการตรวจสอบส่วนหนึ่งของประชากรนำไปใช้กับประชากรดั้งเดิมทั้งหมด ประชากรที่เลือกหน่วยเพื่อตรวจสอบและศึกษาเพิ่มเติมเรียกว่า ทั่วไปและตัวบ่งชี้ทั้งหมดที่แสดงถึงจำนวนทั้งสิ้นนี้เรียกว่า ทั่วไป.

เรียกว่าขีดจำกัดที่เป็นไปได้ของการเบี่ยงเบนของค่าเฉลี่ยตัวอย่างจากค่าเฉลี่ยทั่วไป ข้อผิดพลาดในการสุ่มตัวอย่าง.

เรียกว่าชุดของหน่วยที่เลือก เลือกสรรและตัวบ่งชี้ทั้งหมดที่แสดงถึงจำนวนทั้งสิ้นนี้เรียกว่า เลือกสรร.

การวิจัยตัวอย่างประกอบด้วยขั้นตอนต่อไปนี้:

ลักษณะของวัตถุประสงค์การศึกษา (ปรากฏการณ์เศรษฐกิจมวลชน) หากประชากรมีขนาดเล็ก ไม่แนะนำให้สุ่มตัวอย่าง

การคำนวณขนาดตัวอย่าง สิ่งสำคัญคือต้องกำหนดปริมาตรที่เหมาะสมที่สุดซึ่งจะทำให้ข้อผิดพลาดในการสุ่มตัวอย่างอยู่ในช่วงที่ยอมรับได้โดยมีต้นทุนต่ำสุด

การเลือกหน่วยการสังเกตโดยคำนึงถึงข้อกำหนดของการสุ่มและสัดส่วน

หลักฐานความเป็นตัวแทนตามการประมาณค่าข้อผิดพลาดในการสุ่มตัวอย่าง สำหรับตัวอย่างแบบสุ่ม ข้อผิดพลาดจะคำนวณโดยใช้สูตร สำหรับตัวอย่างเป้าหมาย ความเป็นตัวแทนจะถูกประเมินโดยใช้วิธีการเชิงคุณภาพ (การเปรียบเทียบ การทดลอง)

การวิเคราะห์ประชากรตัวอย่าง หากตัวอย่างที่สร้างขึ้นตรงตามข้อกำหนดด้านความเป็นตัวแทน จะมีการวิเคราะห์โดยใช้ตัวบ่งชี้การวิเคราะห์ (ค่าเฉลี่ย ญาติ ฯลฯ)





ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!