ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ ความแปรปรวน ความน่าจะเป็น การแก้ปัญหา
ให้ CB X สร้างประชากรทั่วไป และปล่อยให้ β เป็นพารามิเตอร์ที่ไม่รู้จัก CB X หากการประมาณการทางสถิติใน * มีความสอดคล้องกัน ยิ่งขนาดตัวอย่างใหญ่ขึ้น เราก็จะได้ค่า β ได้แม่นยำยิ่งขึ้น อย่างไรก็ตาม ในทางปฏิบัติ เราไม่มีตัวอย่างที่มีขนาดใหญ่มาก ดังนั้นเราจึงไม่สามารถรับประกันความแม่นยำที่มากขึ้นได้
ให้ b* เป็นค่าประมาณทางสถิติของ c ค่า |ใน* - ใน| เรียกว่าความแม่นยำในการประมาณค่า เห็นได้ชัดว่าความแม่นยำคือ CB เนื่องจาก β* เป็นตัวแปรสุ่ม ให้เราระบุจำนวนบวกเล็กน้อย 8 และต้องการความแม่นยำของการประมาณค่า |в* - в| น้อยกว่า 8 เช่น | ใน* - ใน |< 8.
ความน่าเชื่อถือ g หรือ ความน่าจะเป็นของความมั่นใจการประมาณค่าในโดยใน * คือความน่าจะเป็น g ซึ่งอสมการ |ใน * - ใน|< 8, т. е.
โดยปกติแล้ว ค่าความน่าเชื่อถือ g จะถูกระบุล่วงหน้า และค่า g จะเป็นตัวเลขที่ใกล้กับ 1 (0.9; 0.95; 0.99; ...)
เนื่องจากความไม่เท่าเทียมกัน |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:
ช่วง (ใน * - 8, ใน * + 5) เรียกว่าช่วงความเชื่อมั่นเช่น ช่วงความมั่นใจครอบคลุมพารามิเตอร์ที่ไม่รู้จักด้วยความน่าจะเป็น y โปรดทราบว่าจุดสิ้นสุดของช่วงความเชื่อมั่นนั้นเป็นแบบสุ่มและแตกต่างกันไปในแต่ละตัวอย่าง ดังนั้นจึงแม่นยำกว่าที่จะบอกว่าช่วง (ใน * - 8, ใน * + 8) ครอบคลุมพารามิเตอร์ที่ไม่รู้จักใน แทนที่จะเป็นในเป็นของค่านี้ ช่วงเวลา
อนุญาต ประชากรได้มาจากตัวแปรสุ่ม X ซึ่งกระจายตามกฎปกติ และทราบค่าเบี่ยงเบนมาตรฐาน a สิ่งที่ไม่ทราบคือความคาดหวังทางคณิตศาสตร์ a = M (X) จำเป็นต้องค้นหาช่วงความเชื่อมั่นของ a สำหรับความน่าเชื่อถือที่กำหนด y
ค่าเฉลี่ยตัวอย่าง
เป็น การประเมินทางสถิติสำหรับ xg = ก
ทฤษฎีบท. ตัวแปรสุ่ม xB มี การกระจายตัวแบบปกติถ้า X มีการแจกแจงแบบปกติ และ M (XB) = a
A (XB) = a โดยที่ a = y/B (X), a = M (X) ลิตร/ฉัน
ช่วงความเชื่อมั่นของ a มีรูปแบบ:
เราพบ 8
โดยใช้อัตราส่วน
โดยที่ Ф(r) คือฟังก์ชันลาปลาซ เรามี:
P ( | XB - และ |<8} = 2Ф
ตารางค่าของฟังก์ชัน Laplace เราพบค่าของ t
กำหนดแล้ว
T เราจะได้ F(t) = g เนื่องจากให้ g แล้วจึงโดย
จากความเท่าเทียมกันเราพบว่าการประมาณการมีความแม่นยำ
ซึ่งหมายความว่าช่วงความเชื่อมั่นของ a มีรูปแบบ:
จากตัวอย่างประชากร X
ง | ถึง" | X2 | Xm |
n. | n1 | n2 | นาโนเมตร |
n = U1 + ... + nm ดังนั้นช่วงความเชื่อมั่นจะเป็น:
ตัวอย่างที่ 6.35 หาช่วงความเชื่อมั่นในการประมาณค่าคาดหวังทางคณิตศาสตร์ของการแจกแจงแบบปกติด้วยค่าความน่าเชื่อถือ 0.95 โดยทราบค่าเฉลี่ยของกลุ่มตัวอย่าง Xb = 10.43 ขนาดตัวอย่าง n = 100 และส่วนเบี่ยงเบนมาตรฐาน s = 5
ลองใช้สูตรกัน
ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ - นี่คือช่วงเวลาที่คำนวณจากข้อมูลที่มีความน่าจะเป็นที่ทราบ และมีความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป การประมาณค่าตามธรรมชาติสำหรับความคาดหวังทางคณิตศาสตร์คือค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้ ดังนั้นตลอดบทเรียนเราจะใช้คำว่า "ค่าเฉลี่ย" และ "มูลค่าเฉลี่ย" ในปัญหาในการคำนวณช่วงความเชื่อมั่น คำตอบที่ต้องการบ่อยที่สุดคือ "ช่วงความเชื่อมั่นของตัวเลขเฉลี่ย [ค่าในปัญหาเฉพาะ] มาจาก [ค่าน้อยลง] ถึง [ค่ามากขึ้น]" เมื่อใช้ช่วงความเชื่อมั่น คุณสามารถประเมินได้ไม่เพียงแต่ค่าเฉลี่ยเท่านั้น แต่ยังรวมถึงน้ำหนักเฉพาะของคุณลักษณะเฉพาะของประชากรด้วย บทเรียนจะกล่าวถึงค่าเฉลี่ย การกระจาย ส่วนเบี่ยงเบนมาตรฐาน และข้อผิดพลาด ซึ่งเราจะได้คำจำกัดความและสูตรใหม่ ลักษณะเฉพาะของกลุ่มตัวอย่างและประชากร .
การประมาณจุดและช่วงของค่าเฉลี่ย
หากค่าเฉลี่ยของประชากรประมาณด้วยตัวเลข (จุด) ค่าเฉลี่ยเฉพาะซึ่งคำนวณจากตัวอย่างการสังเกตจะถูกนำมาใช้เป็นค่าประมาณของค่าเฉลี่ยที่ไม่ทราบของประชากร ในกรณีนี้ ค่าของค่าเฉลี่ยตัวอย่างซึ่งเป็นตัวแปรสุ่มไม่ตรงกับค่าเฉลี่ยของประชากรทั่วไป ดังนั้น เมื่อระบุค่าเฉลี่ยตัวอย่าง คุณต้องระบุข้อผิดพลาดในการสุ่มตัวอย่างไปพร้อมๆ กัน การวัดข้อผิดพลาดในการสุ่มตัวอย่างคือข้อผิดพลาดมาตรฐาน ซึ่งแสดงอยู่ในหน่วยเดียวกับค่าเฉลี่ย ดังนั้นจึงมักใช้สัญกรณ์ต่อไปนี้: .
หากการประมาณค่าเฉลี่ยจำเป็นต้องเชื่อมโยงกับความน่าจะเป็นที่แน่นอน พารามิเตอร์ที่น่าสนใจในประชากรจะต้องประมาณไม่ใช่ด้วยตัวเลขตัวเดียว แต่ต้องประมาณตามช่วงเวลา ช่วงความเชื่อมั่นคือช่วงที่มีความน่าจะเป็นที่แน่นอน ปพบค่าของตัวบ่งชี้ประชากรโดยประมาณ ช่วงความเชื่อมั่นที่เป็นไปได้ ป = 1 - α พบตัวแปรสุ่มคำนวณได้ดังนี้
,
α = 1 - ปซึ่งสามารถพบได้ในภาคผนวกของหนังสือสถิติเกือบทุกเล่ม
ในทางปฏิบัติ ไม่ทราบค่าเฉลี่ยประชากรและความแปรปรวน ดังนั้นความแปรปรวนประชากรจึงถูกแทนที่ด้วยความแปรปรวนตัวอย่าง และค่าเฉลี่ยประชากรด้วยค่าเฉลี่ยตัวอย่าง ดังนั้น ช่วงความเชื่อมั่นในกรณีส่วนใหญ่จึงคำนวณได้ดังนี้:
.
สูตรช่วงความเชื่อมั่นสามารถใช้เพื่อประมาณค่าเฉลี่ยประชากรได้
- ทราบค่าเบี่ยงเบนมาตรฐานของประชากร
- หรือไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร แต่ขนาดกลุ่มตัวอย่างมากกว่า 30
ค่าเฉลี่ยตัวอย่างเป็นการประมาณค่าเฉลี่ยประชากรอย่างเป็นกลาง ในทางกลับกัน ความแปรปรวนตัวอย่าง ไม่ใช่การประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง เพื่อให้ได้ค่าประมาณที่เป็นกลางของความแปรปรวนประชากรในสูตรความแปรปรวนตัวอย่าง ขนาดตัวอย่าง nควรถูกแทนที่ด้วย n-1.
ตัวอย่างที่ 1ข้อมูลถูกรวบรวมจากร้านกาแฟที่สุ่มเลือก 100 แห่งในเมืองหนึ่ง โดยจำนวนพนักงานโดยเฉลี่ยในร้านกาแฟเหล่านั้นคือ 10.5 โดยมีค่าเบี่ยงเบนมาตรฐานอยู่ที่ 4.6 กำหนดช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานร้านกาแฟ
โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .
ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานร้านกาแฟโดยเฉลี่ยจึงอยู่ระหว่าง 9.6 ถึง 11.4
ตัวอย่างที่ 2สำหรับการสุ่มตัวอย่างจากประชากร 64 การสังเกต จะมีการคำนวณค่าทั้งหมดดังต่อไปนี้:
ผลรวมของค่าในการสังเกต
ผลรวมของการเบี่ยงเบนกำลังสองของค่าจากค่าเฉลี่ย .
คำนวณช่วงความเชื่อมั่น 95% สำหรับการคาดหวังทางคณิตศาสตร์
ลองคำนวณค่าเบี่ยงเบนมาตรฐาน:
,
มาคำนวณค่าเฉลี่ยกัน:
.
เราแทนค่าลงในนิพจน์สำหรับช่วงความมั่นใจ:
โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .
เราได้รับ:
ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับความคาดหวังทางคณิตศาสตร์ของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 7.484 ถึง 11.266
ตัวอย่างที่ 3สำหรับตัวอย่างประชากรสุ่มจากการสังเกต 100 ครั้ง ค่าเฉลี่ยที่คำนวณได้คือ 15.2 และค่าเบี่ยงเบนมาตรฐานคือ 3.2 คำนวณช่วงความเชื่อมั่น 95% สำหรับค่าที่คาดหวัง จากนั้นจึงคำนวณช่วงความเชื่อมั่น 99% หากกำลังของตัวอย่างและความแปรผันยังคงไม่เปลี่ยนแปลงและค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้น ช่วงความเชื่อมั่นจะแคบลงหรือกว้างขึ้นหรือไม่
เราแทนที่ค่าเหล่านี้เป็นนิพจน์สำหรับช่วงความมั่นใจ:
โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .
เราได้รับ:
.
ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 14.57 ถึง 15.82
เราแทนที่ค่าเหล่านี้เป็นนิพจน์สำหรับช่วงความมั่นใจอีกครั้ง:
โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,01 .
เราได้รับ:
.
ดังนั้น ช่วงความเชื่อมั่น 99% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 14.37 ถึง 16.02
ดังที่เราเห็น เมื่อค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้น ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานก็จะเพิ่มขึ้นด้วย และด้วยเหตุนี้ จุดเริ่มต้นและจุดสิ้นสุดของช่วงเวลาจึงอยู่ห่างจากค่าเฉลี่ย และด้วยเหตุนี้ ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์จึงเพิ่มขึ้น .
การประมาณจุดและช่วงเวลาของความถ่วงจำเพาะ
ส่วนแบ่งของคุณลักษณะตัวอย่างบางส่วนสามารถตีความได้ว่าเป็นจุดประมาณของส่วนแบ่ง พีที่มีลักษณะเดียวกันในประชากรทั่วไป หากค่านี้จำเป็นต้องเชื่อมโยงกับความน่าจะเป็น ก็ควรคำนวณช่วงความเชื่อมั่นของความถ่วงจำเพาะ พีลักษณะเฉพาะของประชากรที่มีความน่าจะเป็น ป = 1 - α :
.
ตัวอย่างที่ 4ในบางเมืองมีผู้สมัครสองคน กและ บีกำลังลงสมัครรับตำแหน่งนายกเทศมนตรี สุ่มสำรวจชาวเมือง 200 คน โดย 46% ตอบว่าพวกเขาจะลงคะแนนให้ผู้สมัคร ก, 26% - สำหรับผู้สมัคร บีและ 28% ไม่รู้ว่าพวกเขาจะลงคะแนนให้ใคร กำหนดช่วงความเชื่อมั่น 95% สำหรับสัดส่วนของชาวเมืองที่สนับสนุนผู้สมัคร ก.
บ่อยครั้งที่ผู้ประเมินราคาต้องวิเคราะห์ตลาดอสังหาริมทรัพย์ในส่วนที่ทรัพย์สินนั้นถูกประเมินตั้งอยู่ หากตลาดได้รับการพัฒนา การวิเคราะห์ทั้งชุดของวัตถุที่นำเสนออาจเป็นเรื่องยาก ดังนั้นจึงใช้ตัวอย่างของวัตถุในการวิเคราะห์ ตัวอย่างนี้ไม่ได้เป็นเนื้อเดียวกันเสมอไป บางครั้งจำเป็นต้องเคลียร์จุดที่รุนแรง - ข้อเสนอของตลาดสูงเกินไปหรือต่ำเกินไป เพื่อจุดประสงค์นี้จึงถูกนำมาใช้ ช่วงความมั่นใจ- การศึกษานี้มีวัตถุประสงค์เพื่อทำการวิเคราะห์เปรียบเทียบสองวิธีในการคำนวณช่วงความเชื่อมั่น และเลือกตัวเลือกการคำนวณที่เหมาะสมที่สุดเมื่อทำงานกับตัวอย่างที่แตกต่างกันในระบบ estimatica.pro
ช่วงความเชื่อมั่นคือช่วงของค่าคุณลักษณะที่คำนวณตามกลุ่มตัวอย่าง ซึ่งมีความน่าจะเป็นที่ทราบอยู่แล้วว่ามีพารามิเตอร์โดยประมาณของประชากรทั่วไป
จุดของการคำนวณช่วงความเชื่อมั่นคือการสร้างช่วงดังกล่าวโดยอาศัยข้อมูลตัวอย่าง เพื่อให้สามารถระบุด้วยความน่าจะเป็นที่กำหนดว่าค่าของพารามิเตอร์โดยประมาณจะอยู่ในช่วงเวลานี้ กล่าวอีกนัยหนึ่ง ช่วงความเชื่อมั่นประกอบด้วยค่าที่ไม่ทราบของค่าประมาณที่มีความน่าจะเป็นที่แน่นอน ยิ่งช่วงห่างมากขึ้น ความคลาดเคลื่อนก็จะยิ่งสูงขึ้น
มีวิธีการต่างๆ ในการกำหนดช่วงความเชื่อมั่น ในบทความนี้เราจะดู 2 วิธี:
- ผ่านค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน
- ผ่านค่าวิกฤตของสถิติ t (สัมประสิทธิ์นักเรียน)
ขั้นตอนของการวิเคราะห์เปรียบเทียบวิธีการต่าง ๆ ในการคำนวณ CI:
1. สร้างตัวอย่างข้อมูล
2. เราประมวลผลโดยใช้วิธีการทางสถิติ: เราคำนวณค่าเฉลี่ย ค่ามัธยฐาน ความแปรปรวน ฯลฯ
3. คำนวณช่วงความเชื่อมั่นได้สองวิธี
4. วิเคราะห์ตัวอย่างที่ทำความสะอาดแล้วและช่วงความเชื่อมั่นที่ได้
ขั้นตอนที่ 1 การสุ่มตัวอย่างข้อมูล
ตัวอย่างถูกสร้างขึ้นโดยใช้ระบบ estimatica.pro ตัวอย่างรวมข้อเสนอ 91 รายการสำหรับการขายอพาร์ทเมนต์ 1 ห้องในโซนราคาที่ 3 พร้อมเลย์เอาต์ประเภท "ครุสชอฟ"
ตารางที่ 1. ตัวอย่างเริ่มต้น
ราคา 1 ตร.ม. หน่วย |
|
รูปที่ 1. ตัวอย่างเบื้องต้น
ขั้นตอนที่ 2 การประมวลผลตัวอย่างเริ่มต้น
การประมวลผลตัวอย่างโดยใช้วิธีทางสถิติจำเป็นต้องมีการคำนวณค่าต่อไปนี้:
1. ค่าเฉลี่ยเลขคณิต
2. ค่ามัธยฐานคือตัวเลขที่แสดงลักษณะของตัวอย่าง โดยครึ่งหนึ่งขององค์ประกอบตัวอย่างมีค่ามากกว่าค่ามัธยฐาน ส่วนอีกครึ่งหนึ่งมีค่าน้อยกว่าค่ามัธยฐาน
(สำหรับตัวอย่างที่มีค่าเลขคี่)
3. พิสัย - ความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดในกลุ่มตัวอย่าง
4. ความแปรปรวน - ใช้เพื่อประมาณค่าความแปรผันของข้อมูลได้แม่นยำยิ่งขึ้น
5. ค่าเบี่ยงเบนมาตรฐานตัวอย่าง (ต่อไปนี้ - SD) เป็นตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าการปรับรอบค่าเฉลี่ยเลขคณิต
6. ค่าสัมประสิทธิ์การเปลี่ยนแปลง - สะท้อนถึงระดับการกระจายของค่าการปรับ
7. ค่าสัมประสิทธิ์การแกว่ง - สะท้อนถึงความผันผวนสัมพัทธ์ของค่าราคาสุดขีดในตัวอย่างรอบค่าเฉลี่ย
ตารางที่ 2. ตัวบ่งชี้ทางสถิติของกลุ่มตัวอย่างดั้งเดิม
ค่าสัมประสิทธิ์การแปรผันซึ่งระบุลักษณะความเป็นเนื้อเดียวกันของข้อมูลคือ 12.29% แต่ค่าสัมประสิทธิ์การแกว่งสูงเกินไป ดังนั้น เราสามารถพูดได้ว่าตัวอย่างดั้งเดิมไม่เป็นเนื้อเดียวกัน ดังนั้น เรามาคำนวณช่วงความเชื่อมั่นกันดีกว่า
ขั้นตอนที่ 3 การคำนวณช่วงความเชื่อมั่น
วิธีที่ 1. การคำนวณโดยใช้ค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน
ช่วงความเชื่อมั่นถูกกำหนดดังนี้ ค่าต่ำสุด - ค่าเบี่ยงเบนมาตรฐานจะถูกลบออกจากค่ามัธยฐาน ค่าสูงสุด - ส่วนเบี่ยงเบนมาตรฐานจะถูกบวกเข้ากับค่ามัธยฐาน
ดังนั้น ช่วงความเชื่อมั่น (47179 CU; 60689 CU)
ข้าว. 2. ค่าที่ตกอยู่ในช่วงความเชื่อมั่น 1.
วิธีที่ 2 การสร้างช่วงความเชื่อมั่นโดยใช้ค่าวิกฤตของสถิติ t (สัมประสิทธิ์นักเรียน)
เอส.วี. Gribovsky ในหนังสือของเขา "วิธีการทางคณิตศาสตร์สำหรับการประมาณมูลค่าทรัพย์สิน" อธิบายวิธีการคำนวณช่วงความเชื่อมั่นผ่านค่าสัมประสิทธิ์นักเรียน เมื่อคำนวณโดยใช้วิธีนี้ ตัวประมาณค่าจะต้องตั้งค่าระดับนัยสำคัญ ∝ ด้วยตัวเอง ซึ่งจะกำหนดความน่าจะเป็นที่จะสร้างช่วงความเชื่อมั่น โดยปกติแล้ว จะใช้ระดับนัยสำคัญที่ 0.1 0.05 และ 0.01 สอดคล้องกับความน่าจะเป็นของความเชื่อมั่นที่ 0.9; 0.95 และ 0.99 ด้วยวิธีนี้ ค่าที่แท้จริงของความคาดหวังและความแปรปรวนทางคณิตศาสตร์จะถือว่าไม่เป็นที่รู้จักในทางปฏิบัติ (ซึ่งเกือบจะเป็นจริงเสมอเมื่อแก้ไขปัญหาการประมาณค่าเชิงปฏิบัติ)
สูตรช่วงความเชื่อมั่น:
n - ขนาดตัวอย่าง;
ค่าวิกฤตของสถิติ t (การกระจายตัวของนักเรียน) ที่มีระดับนัยสำคัญ ∝ จำนวนองศาอิสระ n-1 ซึ่งกำหนดจากตารางสถิติพิเศษหรือใช้ MS Excel (→"สถิติ"→ STUDIST)
∝ - ระดับนัยสำคัญ รับ ∝=0.01
ข้าว. 2. ค่าที่ตกอยู่ในช่วงความเชื่อมั่น 2.
ขั้นตอนที่ 4 การวิเคราะห์วิธีการต่าง ๆ ในการคำนวณช่วงความเชื่อมั่น
สองวิธีในการคำนวณช่วงความเชื่อมั่น - ผ่านค่ามัธยฐานและค่าสัมประสิทธิ์ของนักเรียน - นำไปสู่ค่าช่วงเวลาที่แตกต่างกัน ดังนั้นเราจึงได้ตัวอย่างที่ทำความสะอาดแล้วสองตัวอย่างที่แตกต่างกัน
ตารางที่ 3. สถิติสำหรับสามตัวอย่าง
ตัวบ่งชี้ |
ตัวอย่างเบื้องต้น |
1 ตัวเลือก |
ตัวเลือกที่ 2 |
ค่าเฉลี่ย |
|||
การกระจายตัว |
|||
โคฟ. รูปแบบต่างๆ |
|||
โคฟ. การสั่น |
|||
จำนวนวัตถุที่เลิกใช้ ชิ้น |
จากการคำนวณที่ดำเนินการ เราสามารถพูดได้ว่าค่าช่วงความเชื่อมั่นที่ได้รับโดยวิธีการต่างๆ ตัดกัน ดังนั้นคุณสามารถใช้วิธีการคำนวณใดๆ ก็ได้ตามดุลยพินิจของผู้ประเมิน
อย่างไรก็ตาม เราเชื่อว่าเมื่อทำงานในระบบ estimatica.pro ขอแนะนำให้เลือกวิธีการคำนวณช่วงความเชื่อมั่น ขึ้นอยู่กับระดับของการพัฒนาตลาด:
- หากตลาดยังไม่ได้รับการพัฒนา ให้ใช้วิธีการคำนวณโดยใช้ค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน เนื่องจากจำนวนวัตถุที่เลิกใช้ในกรณีนี้มีน้อย
- หากตลาดได้รับการพัฒนา ให้ใช้การคำนวณผ่านค่าวิกฤตของสถิติ t (สัมประสิทธิ์ของนักเรียน) เนื่องจากเป็นไปได้ที่จะสร้างตัวอย่างเริ่มต้นขนาดใหญ่
ในการเตรียมบทความมีการใช้สิ่งต่อไปนี้:
1. Gribovsky S.V., Sivets S.A., Levykina I.A. วิธีทางคณิตศาสตร์ในการประเมินมูลค่าทรัพย์สิน มอสโก, 2014
2. ระบบข้อมูล estimatica.pro
การประมาณค่าทางสถิติมีสองประเภท: จุดและช่วง การประมาณจุดคือสถิติตัวอย่างเดียวที่ใช้ในการประมาณค่าพารามิเตอร์ประชากร เช่น ค่าเฉลี่ยตัวอย่าง คือค่าประมาณแบบจุดของความคาดหวังทางคณิตศาสตร์ของประชากร และความแปรปรวนของกลุ่มตัวอย่าง เอส 2- การประมาณจุดของความแปรปรวนของประชากร ซิ 2- แสดงให้เห็นว่าค่าเฉลี่ยของกลุ่มตัวอย่างเป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ของประชากรอย่างเป็นกลาง ค่าเฉลี่ยตัวอย่างเรียกว่าเป็นกลาง เนื่องจากค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างทั้งหมด (ที่มีขนาดตัวอย่างเท่ากัน) n) เท่ากับค่าคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป
เพื่อให้เกิดความแปรปรวนตัวอย่าง เอส 2กลายเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง ซิ 2ควรตั้งค่าตัวส่วนของความแปรปรวนตัวอย่างให้เท่ากับ n – 1 , ไม่ n- กล่าวอีกนัยหนึ่ง ความแปรปรวนของประชากรคือค่าเฉลี่ยของความแปรปรวนตัวอย่างที่เป็นไปได้ทั้งหมด
เมื่อประมาณค่าพารามิเตอร์ประชากร ควรคำนึงถึงสถิติตัวอย่าง เช่น ขึ้นอยู่กับตัวอย่างเฉพาะ เพื่อคำนึงถึงข้อเท็จจริงนี้เพื่อรับ การประมาณช่วงความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป วิเคราะห์การกระจายตัวของค่าเฉลี่ยตัวอย่าง (ดูรายละเอียดเพิ่มเติม) ช่วงที่สร้างขึ้นนั้นมีลักษณะเฉพาะด้วยระดับความเชื่อมั่นที่แน่นอน ซึ่งแสดงถึงความน่าจะเป็นที่พารามิเตอร์ประชากรจริงได้รับการประมาณอย่างถูกต้อง ช่วงความเชื่อมั่นที่คล้ายกันสามารถใช้เพื่อประมาณสัดส่วนของคุณลักษณะได้ รและมวลกระจายหลักของประชากร
ดาวน์โหลดบันทึกในรูปแบบหรือตัวอย่างในรูปแบบ
การสร้างช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของประชากรที่มีค่าเบี่ยงเบนมาตรฐานที่ทราบ
การสร้างช่วงความเชื่อมั่นสำหรับส่วนแบ่งของคุณลักษณะในประชากร
ส่วนนี้จะขยายแนวคิดเรื่องช่วงความเชื่อมั่นไปสู่ข้อมูลที่เป็นหมวดหมู่ สิ่งนี้ช่วยให้เราสามารถประมาณส่วนแบ่งของลักษณะเฉพาะในประชากรได้ รโดยใช้การแชร์ตัวอย่าง รส= เอ็กซ์/n- ตามที่ระบุหากมีปริมาณ nรและ n(1 – หน้า)เกินเลข 5 การแจกแจงแบบทวินามสามารถประมาณได้ตามปกติ ดังนั้นเพื่อประมาณส่วนแบ่งของลักษณะเฉพาะในประชากร รสามารถสร้างช่วงที่มีระดับความเชื่อมั่นเท่ากับได้ (1 – แอลฟา)x100%.
ที่ไหน พีส- สัดส่วนตัวอย่างลักษณะเท่ากับ เอ็กซ์/n, เช่น. จำนวนความสำเร็จหารด้วยขนาดตัวอย่าง ร- ส่วนแบ่งของลักษณะในประชากรทั่วไป ซี- ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐาน n- ขนาดตัวอย่าง
ตัวอย่างที่ 3สมมติว่าตัวอย่างที่ประกอบด้วยใบแจ้งหนี้ 100 ใบที่กรอกในช่วงเดือนที่แล้วถูกแยกออกจากระบบข้อมูล สมมติว่าใบแจ้งหนี้ทั้ง 10 ใบถูกรวบรวมโดยมีข้อผิดพลาด ดังนั้น, ร= 10/100 = 0.1 ระดับความเชื่อมั่น 95% สอดคล้องกับค่าวิกฤต Z = 1.96
ดังนั้น ความน่าจะเป็นที่ระหว่าง 4.12% ถึง 15.88% ของใบแจ้งหนี้มีข้อผิดพลาดคือ 95%
สำหรับขนาดตัวอย่างที่กำหนด ช่วงความเชื่อมั่นที่มีสัดส่วนของลักษณะเฉพาะในประชากรจะปรากฏกว้างกว่าตัวแปรสุ่มแบบต่อเนื่อง เนื่องจากการวัดตัวแปรสุ่มแบบต่อเนื่องมีข้อมูลมากกว่าการวัดข้อมูลเชิงหมวดหมู่ กล่าวอีกนัยหนึ่งข้อมูลหมวดหมู่ที่รับเพียงสองค่าจะมีข้อมูลไม่เพียงพอที่จะประมาณค่าพารามิเตอร์ของการแจกแจง
ในการคำนวณค่าประมาณที่ดึงมาจากประชากรจำนวนจำกัด
การประมาณค่าความคาดหวังทางคณิตศาสตร์ปัจจัยแก้ไขสำหรับประชากรสุดท้าย ( เอฟพีซี) ถูกนำมาใช้เพื่อลดข้อผิดพลาดมาตรฐานตามปัจจัย เมื่อคำนวณช่วงความเชื่อมั่นสำหรับการประมาณค่าพารามิเตอร์ประชากร ปัจจัยการแก้ไขจะถูกใช้ในสถานการณ์ที่มีการเก็บตัวอย่างโดยไม่ถูกส่งกลับ ดังนั้น ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ที่มีระดับความเชื่อมั่นเท่ากับ (1 – แอลฟา)x100%คำนวณโดยสูตร:
ตัวอย่างที่ 4เพื่อแสดงให้เห็นการใช้ปัจจัยแก้ไขสำหรับประชากรที่มีจำกัด ขอให้เรากลับไปสู่ปัญหาในการคำนวณช่วงความเชื่อมั่นสำหรับจำนวนใบแจ้งหนี้โดยเฉลี่ย ตามที่กล่าวไว้ข้างต้นในตัวอย่างที่ 3 สมมติว่าบริษัทออกใบแจ้งหนี้ 5,000 ใบต่อเดือน และ เอ็กซ์=110.27 ดอลลาร์ ส= $28.95, เอ็น = 5000, n = 100, α = 0.05, ที 99 = 1.9842 การใช้สูตร (6) เราได้รับ:
การประมาณส่วนแบ่งของฟีเจอร์เมื่อเลือกโดยไม่ส่งคืน ช่วงความเชื่อมั่นสำหรับสัดส่วนของคุณลักษณะที่มีระดับความเชื่อมั่นเท่ากับ (1 – แอลฟา)x100%คำนวณโดยสูตร:
ช่วงความเชื่อมั่นและประเด็นทางจริยธรรม
เมื่อทำการสุ่มตัวอย่างประชากรและทำการสรุปทางสถิติ มักจะเกิดปัญหาด้านจริยธรรมเกิดขึ้น สิ่งสำคัญคือช่วงความเชื่อมั่นและการประมาณค่าจุดของสถิติตัวอย่างสอดคล้องกันอย่างไร การเผยแพร่การประมาณจุดโดยไม่ระบุช่วงความเชื่อมั่นที่เกี่ยวข้อง (โดยปกติจะอยู่ที่ระดับความเชื่อมั่น 95%) และขนาดตัวอย่างที่ได้รับมาอาจทำให้เกิดความสับสนได้ สิ่งนี้อาจทำให้ผู้ใช้รู้สึกว่าการประมาณจุดเป็นสิ่งที่เขาต้องการในการทำนายคุณสมบัติของประชากรทั้งหมด ดังนั้นจึงจำเป็นต้องเข้าใจว่าในการวิจัยใดๆ ไม่ควรเน้นที่การประมาณจุด แต่เป็นการประมาณช่วง นอกจากนี้ควรให้ความใส่ใจเป็นพิเศษกับการเลือกขนาดตัวอย่างที่ถูกต้อง
บ่อยครั้งที่เป้าหมายของการจัดการทางสถิติเป็นผลมาจากการสำรวจทางสังคมวิทยาของประชากรในประเด็นทางการเมืองบางอย่าง ในเวลาเดียวกัน ผลการสำรวจจะถูกตีพิมพ์บนหน้าแรกของหนังสือพิมพ์ และข้อผิดพลาดในการสุ่มตัวอย่างและวิธีการวิเคราะห์ทางสถิติจะถูกตีพิมพ์ที่ไหนสักแห่งตรงกลาง เพื่อพิสูจน์ความถูกต้องของการประมาณค่าจุดที่ได้รับ จำเป็นต้องระบุขนาดตัวอย่างตามที่ได้รับ ขอบเขตของช่วงความเชื่อมั่น และระดับนัยสำคัญ
หมายเหตุถัดไป
มีการใช้สื่อจากหนังสือ Levin และคณะ สถิติสำหรับผู้จัดการ – อ.: วิลเลียมส์, 2004. – หน้า. 448–462
ทฤษฎีบทขีดจำกัดกลางระบุว่าด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ การกระจายตัวของตัวอย่างสามารถประมาณได้ด้วยการแจกแจงแบบปกติ คุณสมบัตินี้ไม่ขึ้นอยู่กับประเภทของการกระจายตัวของประชากร
เริ่มต้นด้วยการจำคำจำกัดความต่อไปนี้:
ลองพิจารณาสถานการณ์ต่อไปนี้ ปล่อยให้ตัวแปรประชากรมีการแจกแจงแบบปกติโดยมีค่าคาดหวังทางคณิตศาสตร์ $a$ และค่าเบี่ยงเบนมาตรฐาน $\sigma$ ค่าเฉลี่ยตัวอย่างในกรณีนี้จะถือเป็นตัวแปรสุ่ม เมื่อมีการแจกแจงปริมาณ $X$ ตามปกติ ค่าเฉลี่ยตัวอย่างก็จะถูกแจกแจงตามปกติด้วยพารามิเตอร์ด้วย
ขอให้เราหาช่วงความเชื่อมั่นที่ครอบคลุมค่า $a$ โดยมีความน่าเชื่อถือเป็น $\gamma $
เพื่อจะทำสิ่งนี้ได้ เราจำเป็นต้องมีความเท่าเทียมกัน
จากนั้นเราได้รับ
จากที่นี่ เราสามารถค้นหา $t$ ได้อย่างง่ายดายจากตารางค่าฟังก์ชัน $Ф\left(t\right)$ และด้วยเหตุนี้ ให้ค้นหา $\delta $
ให้เราจำตารางค่าของฟังก์ชัน $Ф\left(t\right)$:
รูปที่ 1. ตารางค่าฟังก์ชัน $Ф\left(t\right).$
อินทิกรัลความมั่นใจสำหรับการประมาณค่าความคาดหวังทางคณิตศาสตร์สำหรับ $(\mathbf \sigma )$ ที่ไม่รู้จัก
ในกรณีนี้ เราจะใช้ค่าผลต่างที่แก้ไขแล้ว $S^2$ แทนที่ $\sigma $ ด้วย $S$ ในสูตรด้านบน เราจะได้:
ตัวอย่างโจทย์การหาช่วงความเชื่อมั่น
ตัวอย่างที่ 1
ปล่อยให้ปริมาณ $X$ มีการแจกแจงแบบปกติโดยมีความแปรปรวน $\sigma =4$ ให้ขนาดตัวอย่างเป็น $n=64$ และความน่าเชื่อถือเป็น $\gamma =0.95$ หาช่วงความเชื่อมั่นในการประมาณค่าคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้
เราจำเป็นต้องค้นหาช่วงเวลา ($\overline(x)-\delta ,\overline(x)+\delta)$
ดังที่เราเห็นข้างต้น
\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]
พารามิเตอร์ $t$ สามารถพบได้จากสูตร
\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]
จากตารางที่ 1 เราพบว่า $t=1.96$