การประมาณค่าความคาดหวังและการกระจายทางคณิตศาสตร์ คุณสมบัติ ตัวอย่าง

วัตถุประสงค์ของการบรรยาย: แนะนำแนวคิดของการประมาณค่าพารามิเตอร์การแจกแจงที่ไม่รู้จักและจัดหมวดหมู่ของการประมาณค่าดังกล่าว รับการประมาณจุดและช่วงเวลา ความคาดหวังทางคณิตศาสตร์และการกระจายตัว

ในทางปฏิบัติ ในกรณีส่วนใหญ่ กฎการกระจายของตัวแปรสุ่มไม่เป็นที่รู้จัก และเป็นไปตามผลลัพธ์ของการสังเกต
จำเป็นต้องประมาณคุณลักษณะเชิงตัวเลข (เช่น ความคาดหวังทางคณิตศาสตร์ การกระจายตัว หรือช่วงเวลาอื่นๆ) หรือพารามิเตอร์ที่ไม่รู้จัก ซึ่งกำหนดกฎการกระจาย (ความหนาแน่นของการกระจาย)
ตัวแปรสุ่มที่กำลังศึกษาอยู่ ดังนั้น สำหรับการแจกแจงแบบเอ็กซ์โปเนนเชียลหรือการแจกแจงแบบปัวซอง ก็เพียงพอแล้วที่จะประมาณค่าพารามิเตอร์หนึ่งตัว แต่สำหรับการแจกแจงแบบปกติ จะต้องประมาณพารามิเตอร์สองตัว ได้แก่ ค่าคาดหวังทางคณิตศาสตร์และความแปรปรวน

ประเภทของการประเมิน

ตัวแปรสุ่ม
มีความหนาแน่นของความน่าจะเป็น
, ที่ไหน – พารามิเตอร์การกระจายที่ไม่รู้จัก จากการทดลองได้ค่าของตัวแปรสุ่มนี้:
- ในการประเมินโดยพื้นฐานแล้วหมายความว่าค่าตัวอย่างของตัวแปรสุ่มจะต้องเชื่อมโยงกับค่าพารามิเตอร์ที่แน่นอน กล่าวคือ สร้างฟังก์ชันบางอย่างของผลการสังเกต
ซึ่งมูลค่าที่นำมาเป็นค่าประมาณ พารามิเตอร์ - ดัชนี ระบุจำนวนการทดลองที่ดำเนินการ

เรียกว่าฟังก์ชันใดๆ ที่ขึ้นอยู่กับผลลัพธ์ของการสังเกต สถิติ- เนื่องจากผลลัพธ์ของการสังเกตเป็นตัวแปรสุ่ม สถิติจึงเป็นตัวแปรสุ่มด้วย ดังนั้นการประเมิน
พารามิเตอร์ที่ไม่รู้จัก ควรถือเป็นตัวแปรสุ่มและค่าของมันคำนวณจากข้อมูลการทดลองในปริมาตร , – เป็นหนึ่งในค่าที่เป็นไปได้ของตัวแปรสุ่มนี้

การประมาณค่าพารามิเตอร์การกระจาย (ลักษณะเชิงตัวเลขของตัวแปรสุ่ม) แบ่งออกเป็นจุดและช่วง การประมาณจุดพารามิเตอร์ กำหนดโดยหมายเลขหนึ่ง และความถูกต้องแม่นยำนั้นมีลักษณะเฉพาะด้วยความแปรปรวนของการประมาณค่า การประมาณช่วงเรียกว่าคะแนนที่กำหนดด้วยตัวเลขสองตัว และ – สิ้นสุดช่วงเวลาที่ครอบคลุมพารามิเตอร์ที่ประมาณไว้ ด้วยความน่าจะเป็นของความมั่นใจที่กำหนด

การจำแนกประเภทของการประมาณจุด

สำหรับการประมาณค่าจุดของพารามิเตอร์ที่ไม่รู้จัก
ดีที่สุดในแง่ของความถูกต้อง จะต้องสม่ำเสมอ เป็นกลาง และมีประสิทธิภาพ

ร่ำรวยเรียกว่าการประเมิน
พารามิเตอร์ ถ้ามันมาบรรจบกันในความน่าจะเป็นกับพารามิเตอร์โดยประมาณนั่นคือ

. (8.8)

จากความไม่เท่าเทียมกันของเชบีเชฟ สามารถแสดงให้เห็นว่าเงื่อนไขที่เพียงพอสำหรับการบรรลุความสัมพันธ์ (8.8) คือความเท่าเทียมกัน

.

ความสอดคล้องเป็นคุณลักษณะเชิงเส้นกำกับของการประมาณค่าที่
.

เป็นกลางเรียกว่าการประเมิน
(ประมาณการโดยไม่มีข้อผิดพลาดอย่างเป็นระบบ) ความคาดหวังทางคณิตศาสตร์ซึ่งเท่ากับพารามิเตอร์ที่ประมาณไว้นั่นคือ

. (8.9)

หากไม่พอใจกับความเท่าเทียมกัน (8.9) การประมาณค่าจะเรียกว่าเอนเอียง ความแตกต่าง
เรียกว่าอคติหรือความผิดพลาดอย่างเป็นระบบในการประมาณค่า หากความเสมอภาค (8.9) เป็นที่พอใจเท่านั้น
จากนั้นการประมาณค่าที่สอดคล้องกันจะเรียกว่าไม่ลำเอียงเชิงกำกับเชิงกำกับ

ควรสังเกตว่าหากความสม่ำเสมอเป็นเงื่อนไขบังคับเกือบสำหรับการประมาณการทั้งหมดที่ใช้ในทางปฏิบัติ (การประมาณการที่ไม่สอดคล้องกันนั้นมีการใช้น้อยมาก) คุณสมบัติของความไม่ลำเอียงก็เป็นที่พึงปรารถนาเท่านั้น การประมาณการที่ใช้บ่อยจำนวนมากไม่มีคุณสมบัติที่เป็นกลาง

โดยทั่วไปความแม่นยำในการประมาณค่าพารามิเตอร์บางตัว ได้จากข้อมูลการทดลอง
โดดเด่นด้วยค่าคลาดเคลื่อนกำลังสองเฉลี่ย

,

ซึ่งสามารถลดฟอร์มลงได้

,

ความแปรปรวนอยู่ที่ไหน
– อคติการประมาณการกำลังสอง

หากการประมาณการมีความเป็นกลางแล้ว

ได้อย่างจำกัด การประมาณการอาจแตกต่างกันตามค่าคลาดเคลื่อนกำลังสองเฉลี่ย - โดยปกติแล้ว ยิ่งข้อผิดพลาดนี้น้อยลง ค่าการประเมินก็จะยิ่งถูกจัดกลุ่มตามพารามิเตอร์ที่ประมาณไว้มากขึ้นเท่านั้น ดังนั้นจึงเป็นที่พึงปรารถนาเสมอว่าข้อผิดพลาดในการประมาณค่าจะมีน้อยที่สุดเท่าที่จะเป็นไปได้ กล่าวคือ เป็นไปตามเงื่อนไข

. (8.10)

การประเมิน เงื่อนไขที่น่าพอใจ (8.10) เรียกว่าการประมาณค่าที่มีข้อผิดพลาดกำลังสองขั้นต่ำ

มีประสิทธิภาพเรียกว่าการประเมิน
โดยที่ค่าคลาดเคลื่อนกำลังสองเฉลี่ยไม่มากกว่าค่าคลาดเคลื่อนกำลังสองเฉลี่ยของการประมาณค่าอื่น ๆ กล่าวคือ

ที่ไหน – การประมาณพารามิเตอร์อื่นๆ .

เป็นที่ทราบกันว่าความแปรปรวนของการประมาณค่าที่ไม่เอนเอียงของพารามิเตอร์ตัวใดตัวหนึ่ง เป็นไปตามความไม่เท่าเทียมกันของ Cramer – Rao

,

ที่ไหน
– การกระจายความหนาแน่นของความน่าจะเป็นแบบมีเงื่อนไขของค่าที่ได้รับของตัวแปรสุ่มที่ค่าจริงของพารามิเตอร์ .

ดังนั้นการประมาณค่าที่เป็นกลาง
ซึ่งความไม่เท่าเทียมกันของ Cramer–Rao กลายเป็นความเท่าเทียมกันจะมีผล กล่าวคือ การประมาณการดังกล่าวมีความแปรปรวนน้อยที่สุด

การประมาณค่าความคาดหวังและความแปรปรวน

หากพิจารณาแล้ว ตัวแปรสุ่ม
ซึ่งมีความคาดหวังทางคณิตศาสตร์ และความแปรปรวน จากนั้นถือว่าพารามิเตอร์ทั้งสองนี้ไม่ทราบ ดังนั้นเหนือตัวแปรสุ่ม
ผลิต การทดลองอิสระที่ให้ผลลัพธ์:
- จำเป็นต้องค้นหาการประมาณค่าพารามิเตอร์ที่ไม่รู้จักอย่างสม่ำเสมอและเป็นกลาง และ .

ดังประมาณการ และ โดยปกติแล้ว ค่าเฉลี่ยทางสถิติ (ตัวอย่าง) และความแปรปรวนทางสถิติ (ตัวอย่าง) จะถูกเลือกตามลำดับ:

; (8.11)

. (8.12)

การประมาณค่าความคาดหวังทางคณิตศาสตร์ (8.11) สอดคล้องตามกฎของจำนวนมาก (ทฤษฎีบทของ Chebyshev):

.

ความคาดหวังของตัวแปรสุ่ม

.

ดังนั้นการประมาณการ ไม่ลำเอียง

การกระจายตัวของการประมาณค่าความคาดหวังทางคณิตศาสตร์:

ถ้าเป็นตัวแปรสุ่ม
มีการกระจายตามกฎปกติแล้วประมาณการ ก็มีประสิทธิภาพเช่นกัน

ความคาดหวังของการประมาณการผลต่าง

ในเวลาเดียวกัน

.

เพราะ
, ก
แล้วเราก็ได้

. (8.13)

ดังนั้น,
– การประเมินแบบเอนเอียง แม้ว่าจะสอดคล้องและมีประสิทธิภาพก็ตาม

จากสูตร (8.13) จะได้ค่าประมาณที่เป็นกลาง
ความแปรปรวนตัวอย่าง (8.12) ควรแก้ไขดังนี้:

ซึ่งถือว่า “ดีกว่า” เมื่อเทียบกับประมาณการ (8.12) แม้ว่าจะมีขนาดใหญ่ก็ตาม ค่าประมาณเหล่านี้เกือบจะเท่ากัน

วิธีการหาค่าประมาณของพารามิเตอร์การกระจาย

บ่อยครั้งในทางปฏิบัติโดยอาศัยการวิเคราะห์กลไกทางกายภาพที่สร้างตัวแปรสุ่ม
เราสามารถสรุปเกี่ยวกับกฎการกระจายของตัวแปรสุ่มนี้ได้ อย่างไรก็ตาม ไม่ทราบพารามิเตอร์ของการแจกแจงนี้ และต้องประมาณจากผลการทดลอง ซึ่งมักจะนำเสนอในรูปแบบของตัวอย่างที่มีขอบเขตจำกัด
- เพื่อแก้ปัญหานี้ มีการใช้สองวิธีบ่อยที่สุด: วิธีของช่วงเวลาและวิธีความน่าจะเป็นสูงสุด

วิธีการของช่วงเวลา- วิธีการประกอบด้วยการเทียบโมเมนต์ทางทฤษฎีกับโมเมนต์เชิงประจักษ์ที่สอดคล้องกันในลำดับเดียวกัน

จุดเริ่มต้นเชิงประจักษ์ -ลำดับที่ถูกกำหนดโดยสูตร:

,

และช่วงเวลาเริ่มต้นทางทฤษฎีที่สอดคล้องกัน - ลำดับที่ - สูตร:

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง

สำหรับตัวแปรสุ่มต่อเนื่อง

ที่ไหน – พารามิเตอร์การกระจายโดยประมาณ

เพื่อให้ได้ค่าประมาณของพารามิเตอร์ของการแจกแจงที่มีพารามิเตอร์ที่ไม่รู้จักสองตัว และ จะมีการคอมไพล์ระบบสองสมการ

ที่ไหน และ – โมเมนต์ศูนย์กลางทางทฤษฎีและเชิงประจักษ์ของลำดับที่สอง

การแก้ระบบสมการคือการประมาณค่า และ พารามิเตอร์การกระจายที่ไม่รู้จัก และ .

เมื่อเทียบช่วงเวลาเริ่มต้นทางทฤษฎีและเชิงประจักษ์ของลำดับแรก เราได้สิ่งนั้นโดยการประมาณค่าความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม
ที่มีการแจกแจงตามใจชอบจะเป็นค่าเฉลี่ยตัวอย่าง กล่าวคือ
- จากนั้น เมื่อเทียบโมเมนต์ศูนย์กลางทางทฤษฎีและเชิงประจักษ์ของลำดับที่สอง เราจะได้ค่าประมาณของความแปรปรวนของตัวแปรสุ่ม
ซึ่งมีการแจกแจงตามอำเภอใจ จะถูกกำหนดโดยสูตร

.

ในทำนองเดียวกัน เราสามารถหาค่าประมาณช่วงเวลาทางทฤษฎีของลำดับใดๆ ได้

วิธีการของโมเมนต์นั้นง่ายและไม่ต้องใช้การคำนวณที่ซับซ้อน แต่การประมาณค่าที่ได้จากวิธีนี้มักจะไม่ได้ผล

วิธีความน่าจะเป็นสูงสุด- วิธีความน่าจะเป็นสูงสุดของการประมาณค่าจุดของพารามิเตอร์การแจกแจงที่ไม่รู้จักลงมาเพื่อหาค่าสูงสุดของฟังก์ชันของพารามิเตอร์ที่ประมาณไว้ตั้งแต่หนึ่งตัวขึ้นไป

อนุญาต
เป็นตัวแปรสุ่มต่อเนื่องซึ่งส่งผลให้ การทดสอบใช้ค่า
- เพื่อให้ได้ค่าประมาณของพารามิเตอร์ที่ไม่รู้จัก จำเป็นต้องค้นหาค่าดังกล่าว ซึ่งความน่าจะเป็นของการนำตัวอย่างผลลัพธ์ไปใช้จะเป็นค่าสูงสุด เพราะ
แสดงถึงปริมาณที่เป็นอิสระต่อกันโดยมีความหนาแน่นของความน่าจะเป็นเท่ากัน
, ที่ ฟังก์ชันความน่าจะเป็นเรียกใช้ฟังก์ชันอาร์กิวเมนต์ :

การประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์ ค่านี้เรียกว่า ซึ่งฟังก์ชันความน่าจะเป็นถึงค่าสูงสุด นั่นคือ เป็นการแก้สมการ

,

ซึ่งขึ้นอยู่กับผลการทดสอบอย่างชัดเจน
.

ตั้งแต่ฟังก์ชั่น
และ
ถึงสูงสุดด้วยค่าเดียวกัน
จากนั้นเพื่อให้การคำนวณง่ายขึ้น พวกเขามักจะใช้ฟังก์ชันความน่าจะเป็นลอการิทึมและค้นหารากของสมการที่เกี่ยวข้อง

,

ซึ่งเรียกว่า สมการความน่าจะเป็น.

หากคุณต้องการประเมินพารามิเตอร์หลายตัว
การกระจาย
จากนั้นฟังก์ชันความน่าจะเป็นจะขึ้นอยู่กับพารามิเตอร์เหล่านี้ เพื่อหาค่าประมาณ
พารามิเตอร์การกระจาย จำเป็นต้องแก้ไขระบบ สมการความน่าจะเป็น

.

วิธีความน่าจะเป็นสูงสุดให้การประมาณค่าที่สม่ำเสมอและมีประสิทธิภาพเชิงกำกับเชิงกำกับ อย่างไรก็ตาม การประมาณค่าที่ได้จากวิธีความน่าจะเป็นสูงสุดนั้นมีอคติ และนอกจากนี้ เพื่อหาค่าประมาณ มักจะจำเป็นต้องแก้ระบบสมการที่ค่อนข้างซับซ้อน

การประมาณค่าพารามิเตอร์ช่วงเวลา

ความแม่นยำของการประมาณจุดนั้นมีลักษณะเฉพาะด้วยความแปรปรวน อย่างไรก็ตามไม่มีข้อมูลว่าค่าประมาณที่ได้รับนั้นใกล้เคียงกับค่าจริงของพารามิเตอร์เพียงใด ในงานจำนวนหนึ่ง คุณไม่เพียงแต่ต้องค้นหาพารามิเตอร์เท่านั้น ค่าตัวเลขที่เหมาะสม แต่ยังเพื่อประเมินความถูกต้องและความน่าเชื่อถือด้วย คุณต้องค้นหาว่าข้อผิดพลาดใดที่ทำให้เกิดข้อผิดพลาดในการเปลี่ยนพารามิเตอร์ การประมาณจุดของมัน และเราควรคาดหวังด้วยความมั่นใจในระดับใดว่าข้อผิดพลาดเหล่านี้จะไม่เกินขีดจำกัดที่ทราบ

งานดังกล่าวมีความเกี่ยวข้องอย่างยิ่งเมื่อมีการทดลองจำนวนน้อย เมื่อประมาณจุดแล้ว การทดแทนแบบสุ่มและโดยประมาณเป็นส่วนใหญ่ บน สามารถนำไปสู่ข้อผิดพลาดที่สำคัญได้

วิธีที่สมบูรณ์และเชื่อถือได้มากขึ้นในการประมาณค่าพารามิเตอร์การกระจายคือการกำหนดค่าไม่ใช่ค่าจุดเดียว แต่เป็นช่วงเวลาที่ครอบคลุมค่าที่แท้จริงของพารามิเตอร์ที่ประมาณไว้ ด้วยความน่าจะเป็นที่กำหนด

ให้เป็นไปตามผลลัพธ์ การทดลองได้ค่าประมาณที่เป็นกลาง
พารามิเตอร์ - จำเป็นต้องประเมินข้อผิดพลาดที่อาจเกิดขึ้น มีการเลือกความน่าจะเป็นที่สูงเพียงพอบางส่วน
(ตัวอย่าง) โดยที่เหตุการณ์ที่มีความน่าจะเป็นนี้ถือได้ว่าเป็นเหตุการณ์หนึ่งในทางปฏิบัติ และพบค่าดังกล่าว เพื่อที่

. (8.15)

ในกรณีนี้คือช่วงของค่าที่เป็นไปได้จริงของข้อผิดพลาดที่เกิดขึ้นระหว่างการเปลี่ยน บน , จะ
และข้อผิดพลาดที่มีค่าสัมบูรณ์มากจะปรากฏขึ้นโดยมีความน่าจะเป็นต่ำเท่านั้น .

นิพจน์ (8.15) หมายความว่า มีความน่าจะเป็น
ค่าพารามิเตอร์ที่ไม่รู้จัก ตกอยู่ในช่วงเวลา

. (8.16)

ความน่าจะเป็น
เรียกว่า ความน่าจะเป็นของความมั่นใจและช่วงเวลา ครอบคลุมถึงความน่าจะเป็น เรียกค่าที่แท้จริงของพารามิเตอร์ ช่วงความมั่นใจ- โปรดทราบว่าการบอกว่าค่าพารามิเตอร์อยู่ภายในช่วงความเชื่อมั่นและความน่าจะเป็นนั้นไม่ถูกต้อง - สูตรที่ใช้ (ครอบคลุม) หมายความว่าแม้ว่าจะไม่ทราบพารามิเตอร์ที่กำลังประมาณ แต่ก็มีค่าคงที่ ดังนั้นจึงไม่มีการแพร่กระจายเนื่องจากไม่ใช่ตัวแปรสุ่ม

ลักษณะตัวเลขที่สำคัญที่สุดของตัวแปรสุ่ม เอ็กซ์คือเธอ ความคาดหวังทางคณิตศาสตร์ m x =M และ การกระจายตัวσ 2 x = D[x] = M[(X – ม. x) 2 ] = ม. –- ตัวเลข ม.เอ็กซ์คือค่าเฉลี่ยของตัวแปรสุ่มที่มีค่าของปริมาณกระจายอยู่ เอ็กซ์การวัดการแพร่กระจายนี้คือการกระจายตัว ด[x]และ ส่วนเบี่ยงเบนมาตรฐาน:

ส x =(1.11)

เราจะพิจารณาปัญหาสำคัญเพิ่มเติมในการศึกษาตัวแปรสุ่มที่สังเกตได้ ให้มีตัวอย่างบ้าง (เราจะแทนมัน ) ตัวแปรสุ่ม เอ็กซ์- จำเป็นต้องประมาณค่าที่ไม่รู้จักจากตัวอย่างที่มีอยู่ ม.เอ็กซ์และ .

ทฤษฎีการประมาณค่าพารามิเตอร์ต่างๆ มีบทบาทสำคัญในสถิติทางคณิตศาสตร์ ดังนั้นให้เราพิจารณาปัญหาทั่วไปก่อน ปล่อยให้จำเป็นต้องประมาณค่าพารามิเตอร์บางอย่าง ตามตัวอย่าง - การประเมินแต่ละครั้งดังกล่าว ก*คือฟังก์ชันบางอย่าง ก*=ก*(ส)จากค่าตัวอย่าง ค่าตัวอย่างเป็นแบบสุ่มดังนั้นจึงเป็นการประมาณค่าเอง ก*เป็นตัวแปรสุ่ม สามารถสร้างการประมาณค่าต่างๆ (เช่น ฟังก์ชัน) ได้มากมาย ก*แต่ในขณะเดียวกัน ก็ยังเป็นที่พึงปรารถนาที่จะมีการประเมินที่ "ดี" หรือ "ดีที่สุด" ในแง่หนึ่ง โดยทั่วไปข้อกำหนดตามธรรมชาติสามประการต่อไปนี้จะกำหนดไว้ในการประเมิน

1. ไม่ถูกแทนที่ความคาดหวังทางคณิตศาสตร์ของการประเมิน ก*ต้องเท่ากับค่าที่แน่นอนของพารามิเตอร์: ม = ก- กล่าวอีกนัยหนึ่งคือคะแนน ก*ไม่ควรจะมีข้อผิดพลาดอย่างเป็นระบบ

2. ความมั่งคั่งด้วยขนาดตัวอย่างที่เพิ่มขึ้นอย่างไม่สิ้นสุด การประมาณการ ก*ควรมาบรรจบกันเป็นค่าที่แน่นอน กล่าวคือ เมื่อจำนวนการสังเกตเพิ่มขึ้น ความคลาดเคลื่อนในการประมาณค่าจะมีแนวโน้มเป็นศูนย์

3. ประสิทธิภาพระดับ ก*กล่าวกันว่ามีประสิทธิภาพหากเป็นกลางและมีความแปรปรวนของข้อผิดพลาดน้อยที่สุด ในกรณีนี้ การกระจายประมาณการมีน้อยมาก ก*สัมพันธ์กับมูลค่าที่แน่นอนและการประมาณค่านั้น “แม่นยำที่สุด” ในแง่หนึ่ง

น่าเสียดายที่ไม่สามารถสร้างการประเมินที่ตรงตามข้อกำหนดทั้งสามพร้อมกันได้เสมอไป

ในการประมาณค่าความคาดหวังทางคณิตศาสตร์ มักใช้การประมาณค่า

= , (1.12)

นั่นคือค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง ถ้าเป็นตัวแปรสุ่ม เอ็กซ์มีจำกัด ม.เอ็กซ์และ สเอ็กซ์แล้วค่าประมาณ (1.12) ไม่มีอคติและสม่ำเสมอ การประมาณการนี้มีผลใช้บังคับ เช่น ถ้า เอ็กซ์มี การกระจายตัวตามปกติ(รูปที่ 1.4 ภาคผนวก 1) สำหรับการแจกแจงแบบอื่นอาจไม่ได้ผล ตัวอย่างเช่น ในกรณีของการกระจายแบบสม่ำเสมอ (รูปที่ 1.1 ภาคผนวก 1) การประมาณการที่เป็นกลางและสม่ำเสมอจะเป็น

(1.13)

ในเวลาเดียวกัน ค่าประมาณ (1.13) สำหรับการแจกแจงแบบปกติจะไม่สอดคล้องกันและไม่มีประสิทธิผล และจะแย่ลงไปอีกเมื่อขนาดตัวอย่างเพิ่มขึ้น

ดังนั้นสำหรับการแจกแจงแต่ละประเภทของตัวแปรสุ่ม เอ็กซ์คุณควรใช้การประมาณค่าความคาดหวังทางคณิตศาสตร์ของคุณ อย่างไรก็ตาม ในสถานการณ์ของเรา ประเภทของการกระจายสามารถทราบได้เพียงเบื้องต้นเท่านั้น ดังนั้นเราจะใช้การประมาณค่า (1.12) ซึ่งค่อนข้างง่ายและมีคุณสมบัติที่สำคัญที่สุดคือความเป็นกลางและความสม่ำเสมอ

ในการประมาณค่าความคาดหวังทางคณิตศาสตร์สำหรับกลุ่มตัวอย่างที่จัดกลุ่ม จะใช้สูตรต่อไปนี้:

= , (1.14)

ซึ่งได้จากอันที่แล้วถ้าเราพิจารณาทุกอย่างแล้ว ฉันค่าตัวอย่างรวมอยู่ใน ฉัน-ช่วงที่เท่ากับตัวแทน ฉันช่วงเวลานี้ การประมาณการนี้จะหยาบกว่าโดยธรรมชาติ แต่ต้องใช้การคำนวณน้อยกว่ามาก โดยเฉพาะอย่างยิ่งเมื่อมีตัวอย่างขนาดใหญ่

การประมาณการที่ใช้กันมากที่สุดในการประมาณค่าความแปรปรวนคือ:

= , (1.15)

การประมาณนี้ไม่มีอคติและใช้ได้กับตัวแปรสุ่มใดๆ เอ็กซ์ซึ่งมีโมเมนต์จำกัดจนถึงลำดับที่สี่

ในกรณีของกลุ่มตัวอย่าง การประมาณการที่ใช้คือ:

= (1.16)

ตามกฎแล้วการประมาณค่า (1.14) และ (1.16) นั้นมีอคติและไม่สามารถป้องกันได้ เนื่องจากความคาดหวังทางคณิตศาสตร์และขีดจำกัดของการมาบรรจบกันนั้นแตกต่างกัน ม.เอ็กซ์และเนื่องจากการทดแทนค่าตัวอย่างทั้งหมดรวมอยู่ด้วย ฉันช่วงเวลาที่ -th ต่อตัวแทนช่วงเวลา ฉัน.

โปรดทราบว่าสำหรับขนาดใหญ่ เอ็น,ค่าสัมประสิทธิ์ ไม่มี/(ไม่มี – 1)ในนิพจน์ (1.15) และ (1.16) ใกล้เคียงกับเอกภาพจึงละเว้นได้

การประมาณช่วง

ปล่อยให้ค่าที่แน่นอนของพารามิเตอร์บางตัวเป็น และพบประมาณการณ์ว่า เช่น)ตามตัวอย่าง - การประเมิน ก*สอดคล้องกับจุดบนแกนตัวเลข (รูปที่ 1.5) ดังนั้นจึงเรียกว่าการประมาณนี้ จุด- การประมาณการทั้งหมดที่กล่าวถึงในย่อหน้าก่อนหน้านี้เป็นการประมาณการแบบจุด เกือบทุกครั้งเพราะความบังเอิญ

ก* ¹ กและเราก็หวังได้เพียงประเด็นนั้น ก*อยู่ที่ไหนสักแห่งในบริเวณใกล้เคียง - แต่ใกล้แค่ไหน? การประมาณการจุดอื่น ๆ จะมีข้อเสียเปรียบเหมือนกัน - ขาดการวัดความน่าเชื่อถือของผลลัพธ์


รูปที่.1.5. การประมาณจุดพารามิเตอร์.

เฉพาะเจาะจงมากขึ้นในเรื่องนี้คือ การประมาณช่วงเวลา- คะแนนช่วงเวลาแสดงถึงช่วงเวลา ฉัน ข = (ก , ข)ซึ่งพบค่าที่แน่นอนของพารามิเตอร์โดยประมาณด้วยความน่าจะเป็นที่กำหนด - ช่วงเวลา ไอบีเรียกว่า ช่วงความมั่นใจและความน่าจะเป็น เรียกว่า ความน่าจะเป็นของความมั่นใจและถือได้ว่าเป็น ความน่าเชื่อถือของการประเมิน.

ช่วงความเชื่อมั่นขึ้นอยู่กับตัวอย่างที่มีอยู่ เป็นการสุ่มในแง่ที่ว่าขอบเขตของมันสุ่ม เช่น)และ ข(ส)ซึ่งเราจะคำนวณจากตัวอย่าง (สุ่ม) นั่นเป็นเหตุผล มีความเป็นไปได้ที่ช่วงสุ่ม ไอบีจะครอบคลุมจุดที่ไม่สุ่ม - ในรูป 1.6. ช่วงเวลา ไอบีครอบคลุมประเด็น , ก ฉัน*- เลขที่. ดังนั้นจึงไม่ถูกต้องทั้งหมดที่จะพูดเช่นนั้น ก "ตก" เข้ามาเป็นระยะ

ถ้า ความน่าจะเป็นของความมั่นใจ ใหญ่ (เช่น ข = 0.999) จากนั้นจะเป็นค่าที่แน่นอนเกือบทุกครั้ง อยู่ในช่วงที่สร้างขึ้น


รูปที่ 1.6. ช่วงความเชื่อมั่นของพารามิเตอร์ สำหรับตัวอย่างที่แตกต่างกัน

ลองพิจารณาวิธีการสร้างช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม เอ็กซ์,ขึ้นอยู่กับ ทฤษฎีบทขีดจำกัดกลาง.

ปล่อยให้ตัวแปรสุ่ม เอ็กซ์มีความคาดหวังทางคณิตศาสตร์ที่ไม่ทราบ ม.เอ็กซ์และ ความแปรปรวนที่ทราบ- จากนั้น โดยอาศัยทฤษฎีบทขีดจำกัดกลาง ค่าเฉลี่ยเลขคณิตคือ:

= , (1.17)

ผลลัพธ์ n การทดสอบอิสระปริมาณ เอ็กซ์เป็นตัวแปรสุ่มที่มีการกระจายตัวมาก nใกล้เคียงกับการแจกแจงแบบปกติโดยมีค่าเฉลี่ย ม.เอ็กซ์และค่าเบี่ยงเบนมาตรฐาน ดังนั้นตัวแปรสุ่ม

(1.18)

มีการกระจายความน่าจะเป็นที่สามารถพิจารณาได้ มาตรฐานปกติด้วยความหนาแน่นของการกระจายตัว เจ(ที)กราฟที่แสดงในรูปที่ 1.7 (เช่นเดียวกับในรูปที่ 1.4 ภาคผนวก 1)



รูปที่ 1.7. การแจกแจงความหนาแน่นของความน่าจะเป็นของตัวแปรสุ่ม ที.

ให้ความน่าจะเป็นของความมั่นใจ และ ทีข -จำนวนที่เป็นไปตามสมการ

ข = Ф 0 (t ข) – Ф 0 (-t ข) = 2 Ф 0 (t ข)(1.19)

ที่ไหน - ฟังก์ชันลาปลาซ- แล้วความน่าจะเป็นที่จะตกอยู่ในช่วง (-t ข , เสื้อ ข)จะเท่ากับส่วนที่แรเงาในรูปที่ 1.7 พื้นที่ และโดยอาศัยนิพจน์ (1.19) เท่ากับ - เพราะฉะนั้น

ข = P(-tข< < t b) = P( –tb< m x < + เสื้อ ข ) =

= ป( –tb< m x < + ที ข ) .(1.20)

ดังนั้น เพื่อเป็นช่วงความมั่นใจ เราจึงใช้ช่วงดังกล่าวได้

ฉัน ข = ( – ทีบี ; + TB ) , (1.21)

เนื่องจากนิพจน์ (1.20) หมายความว่าไม่ทราบค่าที่แน่นอน ม.เอ็กซ์อยู่ใน ไอบีด้วยความน่าจะเป็นของความมั่นใจที่กำหนด - เพื่อสร้าง ไอบีจำเป็นตามที่ระบุไว้ หา ทีบีจากสมการ (1.19) ลองให้ค่าบางอย่าง ทีบีจำเป็นในอนาคต :

เสื้อ 0.9 = 1.645; เสื้อ 0.95 = 1.96; เสื้อ 0.99 = 2.58; เสื้อ 0.999 = 3.3.

เมื่อหานิพจน์ (1.21) จะถือว่าทราบค่าที่แน่นอนของส่วนเบี่ยงเบนมาตรฐาน สเอ็กซ์- อย่างไรก็ตามก็ไม่เป็นที่รู้จักเสมอไป ให้เราใช้การประมาณค่าของเขา (1.15) และรับ:

ฉัน ข = ( – ทีบี ; +TB). (1.22)

ดังนั้น การประมาณค่าและได้รับจากกลุ่มตัวอย่างที่จัดกลุ่มจะให้สูตรสำหรับช่วงความเชื่อมั่นต่อไปนี้:

ฉัน ข = ( – ทีบี ; +TB). (1.23)

ปล่อยให้ตัวอย่างสุ่มถูกสร้างขึ้นโดยตัวแปรสุ่มที่สังเกตได้ ξ ซึ่งเป็นค่าคาดหวังและความแปรปรวนทางคณิตศาสตร์ ซึ่งไม่เป็นที่รู้จัก เสนอให้ใช้ค่าเฉลี่ยตัวอย่างเป็นค่าประมาณสำหรับคุณลักษณะเหล่านี้

และความแปรปรวนตัวอย่าง

. (3.14)

ให้เราพิจารณาคุณสมบัติบางอย่างของการประมาณค่าความคาดหวังและการกระจายทางคณิตศาสตร์

1. คำนวณความคาดหวังทางคณิตศาสตร์ของค่าเฉลี่ยตัวอย่าง:

ดังนั้น ค่าเฉลี่ยตัวอย่างจึงเป็นตัวประมาณค่าที่ไม่เอนเอียงสำหรับ

2. จำไว้ว่าผลลัพธ์ การสังเกตเป็นตัวแปรสุ่มอิสระซึ่งแต่ละตัวมีกฎการแจกแจงเดียวกันกับค่าซึ่งหมายถึง , - เราจะถือว่าความแปรปรวนมีขอบเขตจำกัด จากนั้น ตามทฤษฎีบทของ Chebyshev เกี่ยวกับกฎของจำนวนมาก สำหรับ ε > 0 ใดๆ จะมีความเท่าเทียมกัน ,

ซึ่งสามารถเขียนได้ดังนี้: - (3.16) เมื่อเปรียบเทียบ (3.16) กับคำจำกัดความของคุณสมบัติความสอดคล้อง (3.11) เราจะเห็นว่าการประมาณค่านั้นเป็นค่าประมาณที่สอดคล้องกันของความคาดหวังทางคณิตศาสตร์

3. ค้นหาความแปรปรวนของค่าเฉลี่ยตัวอย่าง:

. (3.17)

ดังนั้น ความแปรปรวนของการประมาณค่าความคาดหวังทางคณิตศาสตร์จึงลดลงในสัดส่วนผกผันกับขนาดตัวอย่าง

สามารถพิสูจน์ได้ว่าถ้ามีการแจกแจงตัวแปรสุ่ม ξ ตามปกติ ค่าเฉลี่ยตัวอย่างจะเป็นค่าประมาณที่มีประสิทธิผลของความคาดหวังทางคณิตศาสตร์ กล่าวคือ ความแปรปรวนจะเกิดขึ้น ค่าที่น้อยที่สุดเปรียบเทียบกับการประมาณค่าความคาดหวังทางคณิตศาสตร์อื่นๆ สำหรับกฎหมายการจำหน่ายอื่นๆ ξ อาจไม่เป็นเช่นนั้น

ความแปรปรวนตัวอย่างเป็นการประมาณค่าความแปรปรวนแบบเอนเอียง เนื่องจาก . (3.18)

แท้จริงแล้วเราพบโดยใช้คุณสมบัติของความคาดหวังและสูตรทางคณิตศาสตร์ (3.17)

.

เพื่อให้ได้ค่าประมาณความแปรปรวนที่เป็นกลาง ต้องแก้ไขค่าประมาณ (3.14) นั่นคือคูณด้วย จากนั้นเราจะได้ความแปรปรวนตัวอย่างที่ไม่เอนเอียง

. (3.19)

โปรดทราบว่าสูตร (3.14) และ (3.19) แตกต่างกันเฉพาะในตัวส่วนเท่านั้น และสำหรับค่าขนาดใหญ่ ตัวอย่างและความแปรปรวนที่เป็นกลางจะแตกต่างกันเล็กน้อย อย่างไรก็ตาม ด้วยขนาดตัวอย่างที่น้อย ควรใช้ความสัมพันธ์ (3.19)

ในการประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม จะใช้สิ่งที่เรียกว่าค่าเบี่ยงเบนมาตรฐาน "แก้ไขแล้ว" ซึ่งเท่ากับ รากที่สองจากความแปรปรวนที่เป็นกลาง:

การประมาณช่วง

ในสถิติ มีสองวิธีในการประมาณค่าพารามิเตอร์ของการแจกแจงที่ไม่รู้จัก: จุดและช่วง ตามการประมาณจุดซึ่งกล่าวไว้ในหัวข้อที่แล้ว จะมีการระบุเฉพาะจุดที่อยู่รอบๆ ของพารามิเตอร์ที่ประมาณไว้เท่านั้น อย่างไรก็ตาม เป็นที่พึงปรารถนาที่จะรู้ว่าแท้จริงแล้วพารามิเตอร์นี้อาจมาจากการประมาณค่าที่เป็นไปได้ในการสังเกตชุดต่างๆ มากเพียงใด

คำตอบสำหรับคำถามนี้ - เป็นการประมาณ - กำหนดโดยวิธีอื่นในการประมาณค่าพารามิเตอร์ - ช่วงเวลา ตามวิธีการประมาณค่านี้ พบว่าช่วงที่มีความน่าจะเป็นใกล้เคียงกับค่าหนึ่ง จะครอบคลุมค่าตัวเลขที่ไม่รู้จักของพารามิเตอร์

แนวคิดของการประมาณค่าช่วงเวลา

การประมาณจุด เป็นตัวแปรสุ่มและสำหรับการใช้งานตัวอย่างที่เป็นไปได้จะใช้ค่าประมาณเท่ากับค่าจริงของพารามิเตอร์เท่านั้น ยิ่งความแตกต่างน้อยลง การประมาณค่าก็จะยิ่งแม่นยำมากขึ้น ดังนั้นจำนวนบวกซึ่ง ระบุลักษณะความแม่นยำของการประมาณค่าและเรียกว่า ข้อผิดพลาดในการประมาณค่า (หรือข้อผิดพลาดเล็กน้อย)

ความน่าจะเป็นของความมั่นใจ(หรือความน่าเชื่อถือ)เรียกว่าความน่าจะเป็น β โดยตระหนักถึงความไม่เท่าเทียมกัน , เช่น.

. (3.20)

ทดแทนความไม่เท่าเทียมกัน ความไม่เท่าเทียมกันสองเท่า , หรือ เราได้รับ

ช่วงเวลา ครอบคลุมถึงความน่าจะเป็น β , , เรียกพารามิเตอร์ที่ไม่รู้จัก ช่วงความมั่นใจ (หรือการประมาณช่วง)ความน่าจะเป็นของความเชื่อมั่นที่สอดคล้องกัน β .

ตัวแปรสุ่มไม่ได้เป็นเพียงค่าประมาณเท่านั้น แต่ยังรวมถึงข้อผิดพลาดด้วย ค่าของมันขึ้นอยู่กับความน่าจะเป็น β และตามกฎแล้วจากตัวอย่าง ดังนั้นช่วงความเชื่อมั่นจึงเป็นแบบสุ่มและควรอ่านนิพจน์ (3.21) ดังนี้ “ช่วงจะครอบคลุมพารามิเตอร์ด้วยความน่าจะเป็น β ” และไม่ใช่เช่นนี้: “ พารามิเตอร์จะตกอยู่ในช่วงเวลาที่มีความน่าจะเป็น β ”.

ความหมายของช่วงความเชื่อมั่นคือเมื่อทำซ้ำปริมาตรตัวอย่างหลายครั้งในสัดส่วนสัมพัทธ์ของกรณีเท่ากับ β ช่วงความเชื่อมั่นที่สอดคล้องกับความน่าจะเป็นของความเชื่อมั่น β ครอบคลุมค่าที่แท้จริงของพารามิเตอร์ที่ประมาณไว้ ดังนั้นความน่าจะเป็นของความเชื่อมั่น β ลักษณะ ความน่าเชื่อถือการประเมินความมั่นใจ: ยิ่งมากขึ้น β ยิ่งมีแนวโน้มมากขึ้นที่การนำช่วงความเชื่อมั่นไปใช้จะมีพารามิเตอร์ที่ไม่รู้จัก

การประมาณค่าความคาดหวังและความแปรปรวนทางคณิตศาสตร์

เราเริ่มคุ้นเคยกับแนวคิดเรื่องพารามิเตอร์การแจกแจงในทฤษฎีความน่าจะเป็น ตัวอย่างเช่น ในกฎการแจกแจงแบบปกติ ที่ระบุโดยฟังก์ชันความหนาแน่นของความน่าจะเป็น

ทำหน้าที่เป็นพารามิเตอร์ – ความคาดหวังทางคณิตศาสตร์และ – ส่วนเบี่ยงเบนมาตรฐาน ในการแจกแจงปัวซอง พารามิเตอร์คือตัวเลข ก = อดีต

คำนิยาม. การประมาณการทางสถิติของพารามิเตอร์ที่ไม่รู้จักของการแจกแจงทางทฤษฎีคือค่าโดยประมาณ ขึ้นอยู่กับข้อมูลตัวอย่าง(x 1, x 2, x 3,..., เอ็กซ์เค; หมายเลข 1, หมายเลข 2, หมายเลข 3,..., ไม่เป็นไร)นั่นคือฟังก์ชันบางอย่างของปริมาณเหล่านี้

ที่นี่ x 1, x 2, x 3,..., เอ็กซ์เค– ค่าลักษณะเฉพาะ หมายเลข 1, หมายเลข 2, หมายเลข 3,..., ไม่เป็นไร– ความถี่ที่สอดคล้องกัน การประมาณการทางสถิติเป็นตัวแปรสุ่ม

ให้เราแสดงโดย θ เป็นพารามิเตอร์โดยประมาณและผ่าน θ * - ของเขา การประเมินทางสถิติ- ขนาด | θ *–θ - เรียกว่า ความแม่นยำในการประเมินยิ่งน้อย | θ *–θ | ยิ่งดี ยิ่งมีการกำหนดพารามิเตอร์ที่ไม่รู้จักให้แม่นยำยิ่งขึ้น

เพื่อทำคะแนน θ * มีความสำคัญในทางปฏิบัติ ไม่ควรมีข้อผิดพลาดอย่างเป็นระบบและในขณะเดียวกันก็มีการกระจายตัวน้อยที่สุดที่เป็นไปได้ นอกจากนี้ เมื่อขนาดตัวอย่างเพิ่มขึ้น ความน่าจะเป็นของการเบี่ยงเบนเล็กน้อยโดยพลการ | θ *–θ - ควรอยู่ใกล้ 1

ให้เรากำหนดคำจำกัดความต่อไปนี้

1. การประมาณค่าพารามิเตอร์เรียกว่าไม่เอนเอียงหากความคาดหวังทางคณิตศาสตร์คือ M(θ *) เท่ากับพารามิเตอร์โดยประมาณ θ, เช่น.

(θ *) = θ, (1)

และถูกแทนที่ถ้า

(θ *) ≠ θ, (2)

2. การประมาณค่า θ* มีความสอดคล้องกันหากมีค่าใดๆ δ > 0

(3)

ความเท่าเทียมกัน (3) อ่านได้ดังนี้: การประมาณค่า θ * มาบรรจบกันด้วยความน่าจะเป็น θ .

3. การประมาณค่า θ* เรียกว่ามีประสิทธิผล หากค่า n ที่กำหนดมีความแปรปรวนน้อยที่สุด

ทฤษฎีบท 1ค่าเฉลี่ยตัวอย่าง X B เป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ที่เป็นกลางและสม่ำเสมอ

การพิสูจน์. ให้ตัวอย่างเป็นตัวแทน นั่นคือ องค์ประกอบทั้งหมด ประชากรมีโอกาสเหมือนกันที่จะรวมไว้ในตัวอย่าง ค่าลักษณะเฉพาะ x 1, x 2, x 3,..., xnสามารถถือเป็นตัวแปรสุ่มอิสระได้ X 1, X 2, X 3, ..., Xnมีการแจกแจงและลักษณะตัวเลขที่เหมือนกัน รวมถึงความคาดหวังทางคณิตศาสตร์ที่เท่ากันด้วย เอ,

เนื่องจากแต่ละปริมาณ X 1, X 2, X 3, ..., X หน้ามีการกระจายตัวที่ตรงกับการกระจายตัวของประชากรแล้ว (เอ็กซ์)= ก.นั่นเป็นเหตุผล

ด้วยเหตุนี้จึงเป็นการประมาณการที่สอดคล้องกัน (เอ็กซ์).

การใช้กฎการวิจัยสำหรับสุดขั้ว สามารถพิสูจน์ได้ว่านี่เป็นการประมาณการที่มีประสิทธิผลเช่นกัน (เอ็กซ์).

ความจำเป็นในการประมาณความคาดหวังทางคณิตศาสตร์จากผลการทดสอบจะปรากฏในปัญหาเมื่อผลลัพธ์ของการทดลองถูกอธิบายด้วยตัวแปรสุ่ม และความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่มนี้ถูกใช้เป็นตัวบ่งชี้คุณภาพของวัตถุที่กำลังศึกษา ตัวอย่างเช่น เพื่อเป็นตัวบ่งชี้ความน่าเชื่อถือ การคาดการณ์ทางคณิตศาสตร์เกี่ยวกับเวลาของการทำงานที่ปราศจากความล้มเหลวของระบบสามารถทำได้ และเมื่อประเมินประสิทธิภาพการผลิต การคาดการณ์ทางคณิตศาสตร์ของจำนวนผลิตภัณฑ์ที่ใช้งานได้ เป็นต้น

ปัญหาในการประมาณค่าความคาดหวังทางคณิตศาสตร์มีสูตรดังนี้ ให้เราสมมติว่าเพื่อกำหนดค่าที่ไม่รู้จักของตัวแปรสุ่ม X มันควรจะทำให้ n เป็นอิสระและปราศจากการวัดข้อผิดพลาดอย่างเป็นระบบ เอ็กซ์ กับ เอ็กซ์ 2 ,..., เอ็กซ์พีคุณต้องเลือกค่าประมาณที่ดีที่สุดของความคาดหวังทางคณิตศาสตร์

การประมาณค่าความคาดหวังทางคณิตศาสตร์ที่ดีที่สุดและพบบ่อยที่สุดในทางปฏิบัติคือค่าเฉลี่ยเลขคณิตของผลการทดสอบ

เรียกอีกอย่างว่า เชิงสถิติหรือ ค่าเฉลี่ยตัวอย่าง

ให้เราแสดงประมาณการว่า เสื้อเป็นไปตามข้อกำหนดทั้งหมดสำหรับการประเมินพารามิเตอร์ใดๆ

1. จากนิพจน์ (5.10) เป็นไปตามนั้น

นั่นคือการประเมิน เสื้อ "x- การประมาณการที่เป็นกลาง

2. ตามทฤษฎีบทของเชบีเชฟ ค่าเฉลี่ยเลขคณิตของผลการทดสอบมาบรรจบกันในความน่าจะเป็นกับความคาดหวังทางคณิตศาสตร์ เช่น

ดังนั้น ค่าประมาณ (5.10) จึงเป็นค่าประมาณความคาดหมายทางคณิตศาสตร์ที่สอดคล้องกัน

3. ความแปรปรวนของการประมาณค่า เสื้อเท่ากัน

เมื่อขนาดตัวอย่างเพิ่มขึ้น n จะลดลงโดยไม่มีขีดจำกัด ได้รับการพิสูจน์แล้วว่าหากตัวแปรสุ่ม X อยู่ภายใต้กฎการแจกแจงแบบปกติ ดังนั้นสำหรับค่าใดๆ nการกระจายตัว (5.11) จะมีน้อยที่สุดและประมาณการได้ เสื้อ- การประมาณค่าความคาดหวังทางคณิตศาสตร์อย่างมีประสิทธิผล การทราบความแปรปรวนของการประมาณการทำให้สามารถตัดสินเกี่ยวกับความแม่นยำในการกำหนดค่าที่ไม่ทราบของความคาดหวังทางคณิตศาสตร์โดยใช้การประมาณนี้

ค่าเฉลี่ยเลขคณิตจะใช้เป็นค่าประมาณของความคาดหวังทางคณิตศาสตร์ หากผลการวัดมีความแม่นยำเท่ากัน (ความแปรปรวน D, ฉัน = 1, 2, ..., nเหมือนกันทุกมิติ) อย่างไรก็ตาม ในทางปฏิบัติเราต้องจัดการกับปัญหาที่ผลการวัดไม่เท่ากัน (เช่น ในระหว่างการทดสอบ การวัดจะทำโดยใช้เครื่องมือที่แตกต่างกัน) ในกรณีนี้ การประมาณค่าความคาดหวังทางคณิตศาสตร์จะมีรูปแบบ

ที่ไหน - น้ำหนักของมิติที่ z

ในสูตร (5.12) ผลลัพธ์ของการวัดแต่ละครั้งจะรวมเข้ากับน้ำหนักของมันเอง กับ.. ดังนั้น การประเมินผลการวัด เสื้อเรียกว่า ถัวเฉลี่ยถ่วงน้ำหนัก

แสดงให้เห็นว่าการประมาณค่า (5.12) เป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ที่เป็นกลาง สม่ำเสมอ และมีประสิทธิภาพ ความแปรปรวนขั้นต่ำของการประมาณการกำหนดโดย


เมื่อทำการทดลองกับแบบจำลองบนคอมพิวเตอร์ ปัญหาที่คล้ายกันเกิดขึ้นเมื่อพบการประมาณค่าจากผลการทดสอบหลายชุดและจำนวนการทดสอบในแต่ละชุดแตกต่างกัน ตัวอย่างเช่น มีการทดสอบสองชุดโดยใช้ปริมาตร หมายเลข 1และ p 2 ขึ้นอยู่กับผลลัพธ์ของการประมาณการที่ได้รับ ซีและ เสื้อ x_เพื่อที่จะเพิ่มความแม่นยำและความน่าเชื่อถือในการพิจารณาความคาดหวังทางคณิตศาสตร์ ผลลัพธ์ของชุดการทดสอบเหล่านี้จึงถูกนำมารวมกัน เมื่อต้องการทำเช่นนี้ ให้ใช้นิพจน์ (5.12)

เมื่อคำนวณค่าสัมประสิทธิ์ C แทนที่จะใช้ความแปรปรวน D การประมาณค่าที่ได้จากผลการทดสอบในแต่ละชุดจะถูกทดแทน

วิธีการที่คล้ายกันนี้ใช้ในการกำหนดความน่าจะเป็นของเหตุการณ์สุ่มโดยพิจารณาจากผลลัพธ์ของชุดการทดสอบ

ในการประมาณค่าความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม X นอกเหนือจากค่าเฉลี่ยตัวอย่างแล้ว ยังสามารถใช้สถิติอื่นๆ ได้อีกด้วย สมาชิกมักถูกใช้เพื่อจุดประสงค์เหล่านี้ ซีรีย์การเปลี่ยนแปลงกล่าวคือสถิติลำดับบนพื้นฐานของการประมาณการ

ตอบสนองความต้องการหลัก ได้แก่ ความสม่ำเสมอและความเป็นกลาง

ให้เราสมมติว่าชุดรูปแบบประกอบด้วย n = 2kสมาชิก จากนั้นค่าเฉลี่ยใดๆ ก็สามารถนำมาเป็นค่าประมาณของความคาดหวังทางคณิตศาสตร์ได้:

ในเวลาเดียวกัน ถึง-eเฉลี่ย

ไม่มีอะไรมากไปกว่าค่ามัธยฐานทางสถิติของการแจกแจงของตัวแปรสุ่ม X เนื่องจากมีความเท่าเทียมกันอย่างเห็นได้ชัด

ข้อดีของค่ามัธยฐานทางสถิติคือ ปราศจากอิทธิพลของผลลัพธ์จากการสังเกตที่ผิดปกติ ซึ่งหลีกเลี่ยงไม่ได้เมื่อใช้ค่าเฉลี่ยแรก ซึ่งก็คือค่าเฉลี่ยของอนุกรมการเปลี่ยนแปลงจำนวนน้อยที่สุดและมากที่สุด

สำหรับขนาดตัวอย่างที่แปลก n = 2k- ค่ามัธยฐานทางสถิติ 1 อันเป็นองค์ประกอบตรงกลาง เช่น ถึงสมาชิกคนที่หนึ่งของซีรีส์รูปแบบต่างๆ ฉัน = xk

มีการแจกแจงที่ค่าเฉลี่ยเลขคณิตไม่ใช่การประมาณค่าความคาดหวังทางคณิตศาสตร์ที่มีประสิทธิผล เช่น การแจกแจงแบบลาปลาซ แสดงให้เห็นว่าสำหรับการแจกแจงแบบลาปลาซ การประมาณค่าความคาดหวังทางคณิตศาสตร์ที่มีประสิทธิผลคือค่ามัธยฐานของกลุ่มตัวอย่าง

ได้รับการพิสูจน์แล้วว่าหากตัวแปรสุ่ม X มีการแจกแจงแบบปกติ ดังนั้นด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ กฎการกระจายของค่ามัธยฐานทางสถิติจะใกล้เคียงกับปกติโดยมีลักษณะเป็นตัวเลข

จากการเปรียบเทียบสูตร (5.11) และ (5.14) พบว่าการกระจายตัวของค่ามัธยฐานทางสถิติมีค่ามากกว่าการกระจายตัวของค่าเฉลี่ยเลขคณิตถึง 1.57 เท่า ดังนั้น ค่าเฉลี่ยเลขคณิตซึ่งเป็นค่าประมาณของความคาดหวังทางคณิตศาสตร์จึงมีประสิทธิภาพมากกว่าค่ามัธยฐานทางสถิติหลายเท่า อย่างไรก็ตาม เนื่องจากความง่ายในการคำนวณและไม่ไวต่อผลการตรวจวัดที่ผิดปกติ ("การปนเปื้อน" ของตัวอย่าง) ในทางปฏิบัติ ค่ามัธยฐานทางสถิติจึงถูกนำมาใช้เป็นค่าประมาณของความคาดหวังทางคณิตศาสตร์

ควรสังเกตว่าสำหรับการแจกแจงแบบสมมาตรอย่างต่อเนื่อง ค่าคาดหวังทางคณิตศาสตร์และค่ามัธยฐานจะเท่ากัน ดังนั้น ค่ามัธยฐานทางสถิติสามารถใช้เป็นค่าประมาณที่ดีของความคาดหวังทางคณิตศาสตร์ได้ก็ต่อเมื่อการแจกแจงของตัวแปรสุ่มเป็นแบบสมมาตรเท่านั้น

สำหรับการแจกแจงแบบไม่สมมาตร ให้ใช้ค่ามัธยฐานทางสถิติ ฉันมีอคติอย่างมีนัยสำคัญเมื่อเทียบกับความคาดหวังทางคณิตศาสตร์ ดังนั้นจึงไม่เหมาะสมสำหรับการประเมิน





ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!