ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ ความแปรปรวน ความน่าจะเป็น การแก้ปัญหา

ให้ CB X สร้างประชากรทั่วไป และปล่อยให้ β เป็นพารามิเตอร์ที่ไม่รู้จัก CB X หากการประมาณการทางสถิติใน * มีความสอดคล้องกัน ยิ่งขนาดตัวอย่างใหญ่ขึ้น เราก็จะได้ค่า β ได้แม่นยำยิ่งขึ้น อย่างไรก็ตาม ในทางปฏิบัติ เราไม่มีตัวอย่างที่มีขนาดใหญ่มาก ดังนั้นเราจึงไม่สามารถรับประกันความแม่นยำที่มากขึ้นได้

ให้ b* เป็นค่าประมาณทางสถิติของ c ค่า |ใน* - ใน| เรียกว่าความแม่นยำในการประมาณค่า เห็นได้ชัดว่าความแม่นยำคือ CB เนื่องจาก β* เป็นตัวแปรสุ่ม ให้เราระบุจำนวนบวกเล็กน้อย 8 และต้องการความแม่นยำของการประมาณค่า |в* - в| น้อยกว่า 8 เช่น | ใน* - ใน |< 8.

ความน่าเชื่อถือ g หรือ ความน่าจะเป็นของความมั่นใจการประมาณค่าในโดยใน * คือความน่าจะเป็น g ซึ่งอสมการ |ใน * - ใน|< 8, т. е.

โดยปกติแล้ว ค่าความน่าเชื่อถือ g จะถูกระบุล่วงหน้า และค่า g จะเป็นตัวเลขที่ใกล้กับ 1 (0.9; 0.95; 0.99; ...)

เนื่องจากความไม่เท่าเทียมกัน |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

ช่วง (ใน * - 8, ใน * + 5) เรียกว่าช่วงความเชื่อมั่นเช่น ช่วงความมั่นใจครอบคลุมพารามิเตอร์ที่ไม่รู้จักด้วยความน่าจะเป็น y โปรดทราบว่าจุดสิ้นสุดของช่วงความเชื่อมั่นนั้นเป็นแบบสุ่มและแตกต่างกันไปในแต่ละตัวอย่าง ดังนั้นจึงแม่นยำกว่าที่จะบอกว่าช่วง (ใน * - 8, ใน * + 8) ครอบคลุมพารามิเตอร์ที่ไม่รู้จักใน แทนที่จะเป็นในเป็นของค่านี้ ช่วงเวลา

อนุญาต ประชากรได้มาจากตัวแปรสุ่ม X ซึ่งกระจายตามกฎปกติ และทราบค่าเบี่ยงเบนมาตรฐาน a สิ่งที่ไม่ทราบคือความคาดหวังทางคณิตศาสตร์ a = M (X) จำเป็นต้องค้นหาช่วงความเชื่อมั่นของ a สำหรับความน่าเชื่อถือที่กำหนด y

ค่าเฉลี่ยตัวอย่าง

เป็น การประเมินทางสถิติสำหรับ xg = ก

ทฤษฎีบท. ตัวแปรสุ่ม xB มี การกระจายตัวแบบปกติถ้า X มีการแจกแจงแบบปกติ และ M (XB) = a

A (XB) = a โดยที่ a = y/B (X), a = M (X) ลิตร/ฉัน

ช่วงความเชื่อมั่นของ a มีรูปแบบ:

เราพบ 8

โดยใช้อัตราส่วน

โดยที่ Ф(r) คือฟังก์ชันลาปลาซ เรามี:

P ( | XB - และ |<8} = 2Ф

ตารางค่าของฟังก์ชัน Laplace เราพบค่าของ t

กำหนดแล้ว

T เราจะได้ F(t) = g เนื่องจากให้ g แล้วจึงโดย

จากความเท่าเทียมกันเราพบว่าการประมาณการมีความแม่นยำ

ซึ่งหมายความว่าช่วงความเชื่อมั่นของ a มีรูปแบบ:

จากตัวอย่างประชากร X

ถึง" X2 Xm
n. n1 n2 นาโนเมตร

n = U1 + ... + nm ดังนั้นช่วงความเชื่อมั่นจะเป็น:

ตัวอย่างที่ 6.35 หาช่วงความเชื่อมั่นในการประมาณค่าคาดหวังทางคณิตศาสตร์ของการแจกแจงแบบปกติด้วยค่าความน่าเชื่อถือ 0.95 โดยทราบค่าเฉลี่ยของกลุ่มตัวอย่าง Xb = 10.43 ขนาดตัวอย่าง n = 100 และส่วนเบี่ยงเบนมาตรฐาน s = 5

ลองใช้สูตรกัน

ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ - นี่คือช่วงเวลาที่คำนวณจากข้อมูลที่มีความน่าจะเป็นที่ทราบ และมีความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป การประมาณค่าตามธรรมชาติสำหรับความคาดหวังทางคณิตศาสตร์คือค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้ ดังนั้นตลอดบทเรียนเราจะใช้คำว่า "ค่าเฉลี่ย" และ "มูลค่าเฉลี่ย" ในปัญหาในการคำนวณช่วงความเชื่อมั่น คำตอบที่ต้องการบ่อยที่สุดคือ "ช่วงความเชื่อมั่นของตัวเลขเฉลี่ย [ค่าในปัญหาเฉพาะ] มาจาก [ค่าน้อยลง] ถึง [ค่ามากขึ้น]" เมื่อใช้ช่วงความเชื่อมั่น คุณสามารถประเมินได้ไม่เพียงแต่ค่าเฉลี่ยเท่านั้น แต่ยังรวมถึงน้ำหนักเฉพาะของคุณลักษณะเฉพาะของประชากรด้วย บทเรียนจะกล่าวถึงค่าเฉลี่ย การกระจาย ส่วนเบี่ยงเบนมาตรฐาน และข้อผิดพลาด ซึ่งเราจะได้คำจำกัดความและสูตรใหม่ ลักษณะเฉพาะของกลุ่มตัวอย่างและประชากร .

การประมาณจุดและช่วงของค่าเฉลี่ย

หากค่าเฉลี่ยของประชากรประมาณด้วยตัวเลข (จุด) ค่าเฉลี่ยเฉพาะซึ่งคำนวณจากตัวอย่างการสังเกตจะถูกนำมาใช้เป็นค่าประมาณของค่าเฉลี่ยที่ไม่ทราบของประชากร ในกรณีนี้ ค่าของค่าเฉลี่ยตัวอย่างซึ่งเป็นตัวแปรสุ่มไม่ตรงกับค่าเฉลี่ยของประชากรทั่วไป ดังนั้น เมื่อระบุค่าเฉลี่ยตัวอย่าง คุณต้องระบุข้อผิดพลาดในการสุ่มตัวอย่างไปพร้อมๆ กัน การวัดข้อผิดพลาดในการสุ่มตัวอย่างคือข้อผิดพลาดมาตรฐาน ซึ่งแสดงอยู่ในหน่วยเดียวกับค่าเฉลี่ย ดังนั้นจึงมักใช้สัญกรณ์ต่อไปนี้: .

หากการประมาณค่าเฉลี่ยจำเป็นต้องเชื่อมโยงกับความน่าจะเป็นที่แน่นอน พารามิเตอร์ที่น่าสนใจในประชากรจะต้องประมาณไม่ใช่ด้วยตัวเลขตัวเดียว แต่ต้องประมาณตามช่วงเวลา ช่วงความเชื่อมั่นคือช่วงที่มีความน่าจะเป็นที่แน่นอน พบค่าของตัวบ่งชี้ประชากรโดยประมาณ ช่วงความเชื่อมั่นที่เป็นไปได้ = 1 - α พบตัวแปรสุ่มคำนวณได้ดังนี้

,

α = 1 - ซึ่งสามารถพบได้ในภาคผนวกของหนังสือสถิติเกือบทุกเล่ม

ในทางปฏิบัติ ไม่ทราบค่าเฉลี่ยประชากรและความแปรปรวน ดังนั้นความแปรปรวนประชากรจึงถูกแทนที่ด้วยความแปรปรวนตัวอย่าง และค่าเฉลี่ยประชากรด้วยค่าเฉลี่ยตัวอย่าง ดังนั้น ช่วงความเชื่อมั่นในกรณีส่วนใหญ่จึงคำนวณได้ดังนี้:

.

สูตรช่วงความเชื่อมั่นสามารถใช้เพื่อประมาณค่าเฉลี่ยประชากรได้

  • ทราบค่าเบี่ยงเบนมาตรฐานของประชากร
  • หรือไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร แต่ขนาดกลุ่มตัวอย่างมากกว่า 30

ค่าเฉลี่ยตัวอย่างเป็นการประมาณค่าเฉลี่ยประชากรอย่างเป็นกลาง ในทางกลับกัน ความแปรปรวนตัวอย่าง ไม่ใช่การประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง เพื่อให้ได้ค่าประมาณที่เป็นกลางของความแปรปรวนประชากรในสูตรความแปรปรวนตัวอย่าง ขนาดตัวอย่าง nควรถูกแทนที่ด้วย n-1.

ตัวอย่างที่ 1ข้อมูลถูกรวบรวมจากร้านกาแฟที่สุ่มเลือก 100 แห่งในเมืองหนึ่ง โดยจำนวนพนักงานโดยเฉลี่ยในร้านกาแฟเหล่านั้นคือ 10.5 โดยมีค่าเบี่ยงเบนมาตรฐานอยู่ที่ 4.6 กำหนดช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานร้านกาแฟ

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .

ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานร้านกาแฟโดยเฉลี่ยจึงอยู่ระหว่าง 9.6 ถึง 11.4

ตัวอย่างที่ 2สำหรับการสุ่มตัวอย่างจากประชากร 64 การสังเกต จะมีการคำนวณค่าทั้งหมดดังต่อไปนี้:

ผลรวมของค่าในการสังเกต

ผลรวมของการเบี่ยงเบนกำลังสองของค่าจากค่าเฉลี่ย .

คำนวณช่วงความเชื่อมั่น 95% สำหรับการคาดหวังทางคณิตศาสตร์

ลองคำนวณค่าเบี่ยงเบนมาตรฐาน:

,

มาคำนวณค่าเฉลี่ยกัน:

.

เราแทนค่าลงในนิพจน์สำหรับช่วงความมั่นใจ:

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .

เราได้รับ:

ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับความคาดหวังทางคณิตศาสตร์ของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 7.484 ถึง 11.266

ตัวอย่างที่ 3สำหรับตัวอย่างประชากรสุ่มจากการสังเกต 100 ครั้ง ค่าเฉลี่ยที่คำนวณได้คือ 15.2 และค่าเบี่ยงเบนมาตรฐานคือ 3.2 คำนวณช่วงความเชื่อมั่น 95% สำหรับค่าที่คาดหวัง จากนั้นจึงคำนวณช่วงความเชื่อมั่น 99% หากกำลังของตัวอย่างและความแปรผันยังคงไม่เปลี่ยนแปลงและค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้น ช่วงความเชื่อมั่นจะแคบลงหรือกว้างขึ้นหรือไม่

เราแทนที่ค่าเหล่านี้เป็นนิพจน์สำหรับช่วงความมั่นใจ:

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,05 .

เราได้รับ:

.

ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 14.57 ถึง 15.82

เราแทนที่ค่าเหล่านี้เป็นนิพจน์สำหรับช่วงความมั่นใจอีกครั้ง:

โดยที่ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานสำหรับระดับนัยสำคัญ α = 0,01 .

เราได้รับ:

.

ดังนั้น ช่วงความเชื่อมั่น 99% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้จึงอยู่ในช่วงตั้งแต่ 14.37 ถึง 16.02

ดังที่เราเห็น เมื่อค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้น ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐานก็จะเพิ่มขึ้นด้วย และด้วยเหตุนี้ จุดเริ่มต้นและจุดสิ้นสุดของช่วงเวลาจึงอยู่ห่างจากค่าเฉลี่ย และด้วยเหตุนี้ ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์จึงเพิ่มขึ้น .

การประมาณจุดและช่วงเวลาของความถ่วงจำเพาะ

ส่วนแบ่งของคุณลักษณะตัวอย่างบางส่วนสามารถตีความได้ว่าเป็นจุดประมาณของส่วนแบ่ง พีที่มีลักษณะเดียวกันในประชากรทั่วไป หากค่านี้จำเป็นต้องเชื่อมโยงกับความน่าจะเป็น ก็ควรคำนวณช่วงความเชื่อมั่นของความถ่วงจำเพาะ พีลักษณะเฉพาะของประชากรที่มีความน่าจะเป็น = 1 - α :

.

ตัวอย่างที่ 4ในบางเมืองมีผู้สมัครสองคน และ บีกำลังลงสมัครรับตำแหน่งนายกเทศมนตรี สุ่มสำรวจชาวเมือง 200 คน โดย 46% ตอบว่าพวกเขาจะลงคะแนนให้ผู้สมัคร , 26% - สำหรับผู้สมัคร บีและ 28% ไม่รู้ว่าพวกเขาจะลงคะแนนให้ใคร กำหนดช่วงความเชื่อมั่น 95% สำหรับสัดส่วนของชาวเมืองที่สนับสนุนผู้สมัคร .

บ่อยครั้งที่ผู้ประเมินราคาต้องวิเคราะห์ตลาดอสังหาริมทรัพย์ในส่วนที่ทรัพย์สินนั้นถูกประเมินตั้งอยู่ หากตลาดได้รับการพัฒนา การวิเคราะห์ทั้งชุดของวัตถุที่นำเสนออาจเป็นเรื่องยาก ดังนั้นจึงใช้ตัวอย่างของวัตถุในการวิเคราะห์ ตัวอย่างนี้ไม่ได้เป็นเนื้อเดียวกันเสมอไป บางครั้งจำเป็นต้องเคลียร์จุดที่รุนแรง - ข้อเสนอของตลาดสูงเกินไปหรือต่ำเกินไป เพื่อจุดประสงค์นี้จึงถูกนำมาใช้ ช่วงความมั่นใจ- การศึกษานี้มีวัตถุประสงค์เพื่อทำการวิเคราะห์เปรียบเทียบสองวิธีในการคำนวณช่วงความเชื่อมั่น และเลือกตัวเลือกการคำนวณที่เหมาะสมที่สุดเมื่อทำงานกับตัวอย่างที่แตกต่างกันในระบบ estimatica.pro

ช่วงความเชื่อมั่นคือช่วงของค่าคุณลักษณะที่คำนวณตามกลุ่มตัวอย่าง ซึ่งมีความน่าจะเป็นที่ทราบอยู่แล้วว่ามีพารามิเตอร์โดยประมาณของประชากรทั่วไป

จุดของการคำนวณช่วงความเชื่อมั่นคือการสร้างช่วงดังกล่าวโดยอาศัยข้อมูลตัวอย่าง เพื่อให้สามารถระบุด้วยความน่าจะเป็นที่กำหนดว่าค่าของพารามิเตอร์โดยประมาณจะอยู่ในช่วงเวลานี้ กล่าวอีกนัยหนึ่ง ช่วงความเชื่อมั่นประกอบด้วยค่าที่ไม่ทราบของค่าประมาณที่มีความน่าจะเป็นที่แน่นอน ยิ่งช่วงห่างมากขึ้น ความคลาดเคลื่อนก็จะยิ่งสูงขึ้น

มีวิธีการต่างๆ ในการกำหนดช่วงความเชื่อมั่น ในบทความนี้เราจะดู 2 วิธี:

  • ผ่านค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน
  • ผ่านค่าวิกฤตของสถิติ t (สัมประสิทธิ์นักเรียน)

ขั้นตอนของการวิเคราะห์เปรียบเทียบวิธีการต่าง ๆ ในการคำนวณ CI:

1. สร้างตัวอย่างข้อมูล

2. เราประมวลผลโดยใช้วิธีการทางสถิติ: เราคำนวณค่าเฉลี่ย ค่ามัธยฐาน ความแปรปรวน ฯลฯ

3. คำนวณช่วงความเชื่อมั่นได้สองวิธี

4. วิเคราะห์ตัวอย่างที่ทำความสะอาดแล้วและช่วงความเชื่อมั่นที่ได้

ขั้นตอนที่ 1 การสุ่มตัวอย่างข้อมูล

ตัวอย่างถูกสร้างขึ้นโดยใช้ระบบ estimatica.pro ตัวอย่างรวมข้อเสนอ 91 รายการสำหรับการขายอพาร์ทเมนต์ 1 ห้องในโซนราคาที่ 3 พร้อมเลย์เอาต์ประเภท "ครุสชอฟ"

ตารางที่ 1. ตัวอย่างเริ่มต้น

ราคา 1 ตร.ม. หน่วย

รูปที่ 1. ตัวอย่างเบื้องต้น



ขั้นตอนที่ 2 การประมวลผลตัวอย่างเริ่มต้น

การประมวลผลตัวอย่างโดยใช้วิธีทางสถิติจำเป็นต้องมีการคำนวณค่าต่อไปนี้:

1. ค่าเฉลี่ยเลขคณิต

2. ค่ามัธยฐานคือตัวเลขที่แสดงลักษณะของตัวอย่าง โดยครึ่งหนึ่งขององค์ประกอบตัวอย่างมีค่ามากกว่าค่ามัธยฐาน ส่วนอีกครึ่งหนึ่งมีค่าน้อยกว่าค่ามัธยฐาน

(สำหรับตัวอย่างที่มีค่าเลขคี่)

3. พิสัย - ความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดในกลุ่มตัวอย่าง

4. ความแปรปรวน - ใช้เพื่อประมาณค่าความแปรผันของข้อมูลได้แม่นยำยิ่งขึ้น

5. ค่าเบี่ยงเบนมาตรฐานตัวอย่าง (ต่อไปนี้ - SD) เป็นตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าการปรับรอบค่าเฉลี่ยเลขคณิต

6. ค่าสัมประสิทธิ์การเปลี่ยนแปลง - สะท้อนถึงระดับการกระจายของค่าการปรับ

7. ค่าสัมประสิทธิ์การแกว่ง - สะท้อนถึงความผันผวนสัมพัทธ์ของค่าราคาสุดขีดในตัวอย่างรอบค่าเฉลี่ย

ตารางที่ 2. ตัวบ่งชี้ทางสถิติของกลุ่มตัวอย่างดั้งเดิม

ค่าสัมประสิทธิ์การแปรผันซึ่งระบุลักษณะความเป็นเนื้อเดียวกันของข้อมูลคือ 12.29% แต่ค่าสัมประสิทธิ์การแกว่งสูงเกินไป ดังนั้น เราสามารถพูดได้ว่าตัวอย่างดั้งเดิมไม่เป็นเนื้อเดียวกัน ดังนั้น เรามาคำนวณช่วงความเชื่อมั่นกันดีกว่า

ขั้นตอนที่ 3 การคำนวณช่วงความเชื่อมั่น

วิธีที่ 1. การคำนวณโดยใช้ค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน

ช่วงความเชื่อมั่นถูกกำหนดดังนี้ ค่าต่ำสุด - ค่าเบี่ยงเบนมาตรฐานจะถูกลบออกจากค่ามัธยฐาน ค่าสูงสุด - ส่วนเบี่ยงเบนมาตรฐานจะถูกบวกเข้ากับค่ามัธยฐาน

ดังนั้น ช่วงความเชื่อมั่น (47179 CU; 60689 CU)

ข้าว. 2. ค่าที่ตกอยู่ในช่วงความเชื่อมั่น 1.



วิธีที่ 2 การสร้างช่วงความเชื่อมั่นโดยใช้ค่าวิกฤตของสถิติ t (สัมประสิทธิ์นักเรียน)

เอส.วี. Gribovsky ในหนังสือของเขา "วิธีการทางคณิตศาสตร์สำหรับการประมาณมูลค่าทรัพย์สิน" อธิบายวิธีการคำนวณช่วงความเชื่อมั่นผ่านค่าสัมประสิทธิ์นักเรียน เมื่อคำนวณโดยใช้วิธีนี้ ตัวประมาณค่าจะต้องตั้งค่าระดับนัยสำคัญ ∝ ด้วยตัวเอง ซึ่งจะกำหนดความน่าจะเป็นที่จะสร้างช่วงความเชื่อมั่น โดยปกติแล้ว จะใช้ระดับนัยสำคัญที่ 0.1 0.05 และ 0.01 สอดคล้องกับความน่าจะเป็นของความเชื่อมั่นที่ 0.9; 0.95 และ 0.99 ด้วยวิธีนี้ ค่าที่แท้จริงของความคาดหวังและความแปรปรวนทางคณิตศาสตร์จะถือว่าไม่เป็นที่รู้จักในทางปฏิบัติ (ซึ่งเกือบจะเป็นจริงเสมอเมื่อแก้ไขปัญหาการประมาณค่าเชิงปฏิบัติ)

สูตรช่วงความเชื่อมั่น:

n - ขนาดตัวอย่าง;

ค่าวิกฤตของสถิติ t (การกระจายตัวของนักเรียน) ที่มีระดับนัยสำคัญ ∝ จำนวนองศาอิสระ n-1 ซึ่งกำหนดจากตารางสถิติพิเศษหรือใช้ MS Excel (→"สถิติ"→ STUDIST)

∝ - ระดับนัยสำคัญ รับ ∝=0.01

ข้าว. 2. ค่าที่ตกอยู่ในช่วงความเชื่อมั่น 2.

ขั้นตอนที่ 4 การวิเคราะห์วิธีการต่าง ๆ ในการคำนวณช่วงความเชื่อมั่น

สองวิธีในการคำนวณช่วงความเชื่อมั่น - ผ่านค่ามัธยฐานและค่าสัมประสิทธิ์ของนักเรียน - นำไปสู่ค่าช่วงเวลาที่แตกต่างกัน ดังนั้นเราจึงได้ตัวอย่างที่ทำความสะอาดแล้วสองตัวอย่างที่แตกต่างกัน

ตารางที่ 3. สถิติสำหรับสามตัวอย่าง

ตัวบ่งชี้

ตัวอย่างเบื้องต้น

1 ตัวเลือก

ตัวเลือกที่ 2

ค่าเฉลี่ย

การกระจายตัว

โคฟ. รูปแบบต่างๆ

โคฟ. การสั่น

จำนวนวัตถุที่เลิกใช้ ชิ้น

จากการคำนวณที่ดำเนินการ เราสามารถพูดได้ว่าค่าช่วงความเชื่อมั่นที่ได้รับโดยวิธีการต่างๆ ตัดกัน ดังนั้นคุณสามารถใช้วิธีการคำนวณใดๆ ก็ได้ตามดุลยพินิจของผู้ประเมิน

อย่างไรก็ตาม เราเชื่อว่าเมื่อทำงานในระบบ estimatica.pro ขอแนะนำให้เลือกวิธีการคำนวณช่วงความเชื่อมั่น ขึ้นอยู่กับระดับของการพัฒนาตลาด:

  • หากตลาดยังไม่ได้รับการพัฒนา ให้ใช้วิธีการคำนวณโดยใช้ค่ามัธยฐานและส่วนเบี่ยงเบนมาตรฐาน เนื่องจากจำนวนวัตถุที่เลิกใช้ในกรณีนี้มีน้อย
  • หากตลาดได้รับการพัฒนา ให้ใช้การคำนวณผ่านค่าวิกฤตของสถิติ t (สัมประสิทธิ์ของนักเรียน) เนื่องจากเป็นไปได้ที่จะสร้างตัวอย่างเริ่มต้นขนาดใหญ่

ในการเตรียมบทความมีการใช้สิ่งต่อไปนี้:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. วิธีทางคณิตศาสตร์ในการประเมินมูลค่าทรัพย์สิน มอสโก, 2014

2. ระบบข้อมูล estimatica.pro

การประมาณค่าทางสถิติมีสองประเภท: จุดและช่วง การประมาณจุดคือสถิติตัวอย่างเดียวที่ใช้ในการประมาณค่าพารามิเตอร์ประชากร เช่น ค่าเฉลี่ยตัวอย่าง คือค่าประมาณแบบจุดของความคาดหวังทางคณิตศาสตร์ของประชากร และความแปรปรวนของกลุ่มตัวอย่าง เอส 2- การประมาณจุดของความแปรปรวนของประชากร ซิ 2- แสดงให้เห็นว่าค่าเฉลี่ยของกลุ่มตัวอย่างเป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ของประชากรอย่างเป็นกลาง ค่าเฉลี่ยตัวอย่างเรียกว่าเป็นกลาง เนื่องจากค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างทั้งหมด (ที่มีขนาดตัวอย่างเท่ากัน) n) เท่ากับค่าคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป

เพื่อให้เกิดความแปรปรวนตัวอย่าง เอส 2กลายเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง ซิ 2ควรตั้งค่าตัวส่วนของความแปรปรวนตัวอย่างให้เท่ากับ n – 1 , ไม่ n- กล่าวอีกนัยหนึ่ง ความแปรปรวนของประชากรคือค่าเฉลี่ยของความแปรปรวนตัวอย่างที่เป็นไปได้ทั้งหมด

เมื่อประมาณค่าพารามิเตอร์ประชากร ควรคำนึงถึงสถิติตัวอย่าง เช่น ขึ้นอยู่กับตัวอย่างเฉพาะ เพื่อคำนึงถึงข้อเท็จจริงนี้เพื่อรับ การประมาณช่วงความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป วิเคราะห์การกระจายตัวของค่าเฉลี่ยตัวอย่าง (ดูรายละเอียดเพิ่มเติม) ช่วงที่สร้างขึ้นนั้นมีลักษณะเฉพาะด้วยระดับความเชื่อมั่นที่แน่นอน ซึ่งแสดงถึงความน่าจะเป็นที่พารามิเตอร์ประชากรจริงได้รับการประมาณอย่างถูกต้อง ช่วงความเชื่อมั่นที่คล้ายกันสามารถใช้เพื่อประมาณสัดส่วนของคุณลักษณะได้ และมวลกระจายหลักของประชากร

ดาวน์โหลดบันทึกในรูปแบบหรือตัวอย่างในรูปแบบ

การสร้างช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของประชากรที่มีค่าเบี่ยงเบนมาตรฐานที่ทราบ

การสร้างช่วงความเชื่อมั่นสำหรับส่วนแบ่งของคุณลักษณะในประชากร

ส่วนนี้จะขยายแนวคิดเรื่องช่วงความเชื่อมั่นไปสู่ข้อมูลที่เป็นหมวดหมู่ สิ่งนี้ช่วยให้เราสามารถประมาณส่วนแบ่งของลักษณะเฉพาะในประชากรได้ โดยใช้การแชร์ตัวอย่าง = เอ็กซ์/n- ตามที่ระบุหากมีปริมาณ nและ n(1 – หน้า)เกินเลข 5 การแจกแจงแบบทวินามสามารถประมาณได้ตามปกติ ดังนั้นเพื่อประมาณส่วนแบ่งของลักษณะเฉพาะในประชากร สามารถสร้างช่วงที่มีระดับความเชื่อมั่นเท่ากับได้ (1 – แอลฟา)x100%.


ที่ไหน พี- สัดส่วนตัวอย่างลักษณะเท่ากับ เอ็กซ์/n, เช่น. จำนวนความสำเร็จหารด้วยขนาดตัวอย่าง - ส่วนแบ่งของลักษณะในประชากรทั่วไป ซี- ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐาน n- ขนาดตัวอย่าง

ตัวอย่างที่ 3สมมติว่าตัวอย่างที่ประกอบด้วยใบแจ้งหนี้ 100 ใบที่กรอกในช่วงเดือนที่แล้วถูกแยกออกจากระบบข้อมูล สมมติว่าใบแจ้งหนี้ทั้ง 10 ใบถูกรวบรวมโดยมีข้อผิดพลาด ดังนั้น, = 10/100 = 0.1 ระดับความเชื่อมั่น 95% สอดคล้องกับค่าวิกฤต Z = 1.96

ดังนั้น ความน่าจะเป็นที่ระหว่าง 4.12% ถึง 15.88% ของใบแจ้งหนี้มีข้อผิดพลาดคือ 95%

สำหรับขนาดตัวอย่างที่กำหนด ช่วงความเชื่อมั่นที่มีสัดส่วนของลักษณะเฉพาะในประชากรจะปรากฏกว้างกว่าตัวแปรสุ่มแบบต่อเนื่อง เนื่องจากการวัดตัวแปรสุ่มแบบต่อเนื่องมีข้อมูลมากกว่าการวัดข้อมูลเชิงหมวดหมู่ กล่าวอีกนัยหนึ่งข้อมูลหมวดหมู่ที่รับเพียงสองค่าจะมีข้อมูลไม่เพียงพอที่จะประมาณค่าพารามิเตอร์ของการแจกแจง

ในการคำนวณค่าประมาณที่ดึงมาจากประชากรจำนวนจำกัด

การประมาณค่าความคาดหวังทางคณิตศาสตร์ปัจจัยแก้ไขสำหรับประชากรสุดท้าย ( เอฟพีซี) ถูกนำมาใช้เพื่อลดข้อผิดพลาดมาตรฐานตามปัจจัย เมื่อคำนวณช่วงความเชื่อมั่นสำหรับการประมาณค่าพารามิเตอร์ประชากร ปัจจัยการแก้ไขจะถูกใช้ในสถานการณ์ที่มีการเก็บตัวอย่างโดยไม่ถูกส่งกลับ ดังนั้น ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ที่มีระดับความเชื่อมั่นเท่ากับ (1 – แอลฟา)x100%คำนวณโดยสูตร:

ตัวอย่างที่ 4เพื่อแสดงให้เห็นการใช้ปัจจัยแก้ไขสำหรับประชากรที่มีจำกัด ขอให้เรากลับไปสู่ปัญหาในการคำนวณช่วงความเชื่อมั่นสำหรับจำนวนใบแจ้งหนี้โดยเฉลี่ย ตามที่กล่าวไว้ข้างต้นในตัวอย่างที่ 3 สมมติว่าบริษัทออกใบแจ้งหนี้ 5,000 ใบต่อเดือน และ เอ็กซ์=110.27 ดอลลาร์ = $28.95, เอ็น = 5000, n = 100, α = 0.05, ที 99 = 1.9842 การใช้สูตร (6) เราได้รับ:

การประมาณส่วนแบ่งของฟีเจอร์เมื่อเลือกโดยไม่ส่งคืน ช่วงความเชื่อมั่นสำหรับสัดส่วนของคุณลักษณะที่มีระดับความเชื่อมั่นเท่ากับ (1 – แอลฟา)x100%คำนวณโดยสูตร:

ช่วงความเชื่อมั่นและประเด็นทางจริยธรรม

เมื่อทำการสุ่มตัวอย่างประชากรและทำการสรุปทางสถิติ มักจะเกิดปัญหาด้านจริยธรรมเกิดขึ้น สิ่งสำคัญคือช่วงความเชื่อมั่นและการประมาณค่าจุดของสถิติตัวอย่างสอดคล้องกันอย่างไร การเผยแพร่การประมาณจุดโดยไม่ระบุช่วงความเชื่อมั่นที่เกี่ยวข้อง (โดยปกติจะอยู่ที่ระดับความเชื่อมั่น 95%) และขนาดตัวอย่างที่ได้รับมาอาจทำให้เกิดความสับสนได้ สิ่งนี้อาจทำให้ผู้ใช้รู้สึกว่าการประมาณจุดเป็นสิ่งที่เขาต้องการในการทำนายคุณสมบัติของประชากรทั้งหมด ดังนั้นจึงจำเป็นต้องเข้าใจว่าในการวิจัยใดๆ ไม่ควรเน้นที่การประมาณจุด แต่เป็นการประมาณช่วง นอกจากนี้ควรให้ความใส่ใจเป็นพิเศษกับการเลือกขนาดตัวอย่างที่ถูกต้อง

บ่อยครั้งที่เป้าหมายของการจัดการทางสถิติเป็นผลมาจากการสำรวจทางสังคมวิทยาของประชากรในประเด็นทางการเมืองบางอย่าง ในเวลาเดียวกัน ผลการสำรวจจะถูกตีพิมพ์บนหน้าแรกของหนังสือพิมพ์ และข้อผิดพลาดในการสุ่มตัวอย่างและวิธีการวิเคราะห์ทางสถิติจะถูกตีพิมพ์ที่ไหนสักแห่งตรงกลาง เพื่อพิสูจน์ความถูกต้องของการประมาณค่าจุดที่ได้รับ จำเป็นต้องระบุขนาดตัวอย่างตามที่ได้รับ ขอบเขตของช่วงความเชื่อมั่น และระดับนัยสำคัญ

หมายเหตุถัดไป

มีการใช้สื่อจากหนังสือ Levin และคณะ สถิติสำหรับผู้จัดการ – อ.: วิลเลียมส์, 2004. – หน้า. 448–462

ทฤษฎีบทขีดจำกัดกลางระบุว่าด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ การกระจายตัวของตัวอย่างสามารถประมาณได้ด้วยการแจกแจงแบบปกติ คุณสมบัตินี้ไม่ขึ้นอยู่กับประเภทของการกระจายตัวของประชากร

เริ่มต้นด้วยการจำคำจำกัดความต่อไปนี้:

ลองพิจารณาสถานการณ์ต่อไปนี้ ปล่อยให้ตัวแปรประชากรมีการแจกแจงแบบปกติโดยมีค่าคาดหวังทางคณิตศาสตร์ $a$ และค่าเบี่ยงเบนมาตรฐาน $\sigma$ ค่าเฉลี่ยตัวอย่างในกรณีนี้จะถือเป็นตัวแปรสุ่ม เมื่อมีการแจกแจงปริมาณ $X$ ตามปกติ ค่าเฉลี่ยตัวอย่างก็จะถูกแจกแจงตามปกติด้วยพารามิเตอร์ด้วย

ขอให้เราหาช่วงความเชื่อมั่นที่ครอบคลุมค่า $a$ โดยมีความน่าเชื่อถือเป็น $\gamma $

เพื่อจะทำสิ่งนี้ได้ เราจำเป็นต้องมีความเท่าเทียมกัน

จากนั้นเราได้รับ

จากที่นี่ เราสามารถค้นหา $t$ ได้อย่างง่ายดายจากตารางค่าฟังก์ชัน $Ф\left(t\right)$ และด้วยเหตุนี้ ให้ค้นหา $\delta $

ให้เราจำตารางค่าของฟังก์ชัน $Ф\left(t\right)$:

รูปที่ 1. ตารางค่าฟังก์ชัน $Ф\left(t\right).$

อินทิกรัลความมั่นใจสำหรับการประมาณค่าความคาดหวังทางคณิตศาสตร์สำหรับ $(\mathbf \sigma )$ ที่ไม่รู้จัก

ในกรณีนี้ เราจะใช้ค่าผลต่างที่แก้ไขแล้ว $S^2$ แทนที่ $\sigma $ ด้วย $S$ ในสูตรด้านบน เราจะได้:

ตัวอย่างโจทย์การหาช่วงความเชื่อมั่น

ตัวอย่างที่ 1

ปล่อยให้ปริมาณ $X$ มีการแจกแจงแบบปกติโดยมีความแปรปรวน $\sigma =4$ ให้ขนาดตัวอย่างเป็น $n=64$ และความน่าเชื่อถือเป็น $\gamma =0.95$ หาช่วงความเชื่อมั่นในการประมาณค่าคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้

เราจำเป็นต้องค้นหาช่วงเวลา ($\overline(x)-\delta ,\overline(x)+\delta)$

ดังที่เราเห็นข้างต้น

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

พารามิเตอร์ $t$ สามารถพบได้จากสูตร

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

จากตารางที่ 1 เราพบว่า $t=1.96$





ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!