ตัวอย่างความแปรปรวนของตัวแปรสุ่ม การคำนวณผลต่างใน Microsoft Excel

27.09.2019 | สถานะ

การกระจายในสถิติพบเป็นค่าแต่ละค่าของคุณสมบัติในตารางของ ขึ้นอยู่กับข้อมูลเริ่มต้น ซึ่งจะถูกกำหนดโดยสูตรความแปรปรวนอย่างง่ายและถ่วงน้ำหนัก:

1. (สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม) คำนวณโดยสูตร:

2. ความแปรปรวนแบบถ่วงน้ำหนัก (สำหรับชุดรูปแบบต่างๆ):

โดยที่ n คือความถี่ (ปัจจัยความสามารถในการทำซ้ำ X)

ตัวอย่างการหาค่าความแปรปรวน

หน้านี้อธิบายตัวอย่างมาตรฐานของการค้นหาความแปรปรวน คุณยังสามารถดูงานอื่นๆ เพื่อค้นหาความแปรปรวนได้

ตัวอย่างที่ 1 เรามีข้อมูลต่อไปนี้สำหรับกลุ่มนักเรียนที่ติดต่อทางจดหมาย 20 คน จำเป็นต้องสร้าง ซีรีย์ช่วงเวลาการกระจายคุณลักษณะ คำนวณค่าเฉลี่ยของคุณลักษณะ และศึกษาความแปรปรวน

มาสร้างการแบ่งกลุ่มตามช่วงเวลากัน กำหนดช่วงของช่วงเวลาตามสูตร:

โดยที่ X max คือค่าสูงสุดของคุณลักษณะการจัดกลุ่ม
X min คือค่าต่ำสุดของคุณสมบัติการจัดกลุ่ม
n คือจำนวนช่วงเวลา:

เรายอมรับ n=5 ขั้นตอนคือ: h \u003d (192 - 159) / 5 \u003d 6.6

มาทำการแบ่งกลุ่มเป็นช่วงๆ กันเถอะ

สำหรับการคำนวณเพิ่มเติม เราจะสร้างตารางเสริม:

X'i อยู่ตรงกลางของช่วงเวลา (เช่น ตรงกลางของช่วง 159 - 165.6 = 162.3)

การเติบโตเฉลี่ยของนักเรียนถูกกำหนดโดยสูตรค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:

เราพิจารณาการกระจายตามสูตร:

สูตรความแปรปรวนสามารถแปลงได้ดังนี้:

จากสูตรนี้เป็นไปตามนั้น ความแปรปรวนคือ ความแตกต่างระหว่างค่าเฉลี่ยของกำลังสองของตัวเลือกและกำลังสองและค่าเฉลี่ย

การกระจายตัวใน ชุดการเปลี่ยนแปลง กับ ในช่วงเวลาเท่ากันโดยวิธีการของโมเมนต์สามารถคำนวณได้ด้วยวิธีต่อไปนี้โดยใช้คุณสมบัติที่สองของการกระจาย (การหารตัวเลือกทั้งหมดด้วยค่าของช่วงเวลา) นิยามของความแปรปรวนคำนวณโดยวิธีของช่วงเวลาตามสูตรต่อไปนี้ใช้เวลาน้อยลง:

โดยที่ i คือค่าของช่วงเวลา
A - ศูนย์เงื่อนไขซึ่งสะดวกในการใช้ช่วงกลางของช่วงเวลาที่มีความถี่สูงสุด
m1 คือกำลังสองของโมเมนต์ลำดับที่หนึ่ง
m2 - ช่วงเวลาของลำดับที่สอง

(หากแอตทริบิวต์เปลี่ยนแปลงในประชากรทางสถิติในลักษณะที่มีตัวเลือกพิเศษร่วมกันเพียงสองตัวเลือก ความแปรปรวนดังกล่าวเรียกว่า ทางเลือก) สามารถคำนวณได้โดยสูตร:

แทนที่ด้วยสูตรการกระจายนี้ q = 1- p เราได้รับ:

ประเภทของการกระจาย

ความแปรปรวนทั้งหมดวัดความผันแปรของคุณลักษณะของประชากรทั้งหมดโดยรวมภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ มันเท่ากับค่าเฉลี่ยกำลังสองของความเบี่ยงเบนของแต่ละค่าของแอตทริบิวต์ x จากค่าเฉลี่ยทั้งหมด x และสามารถกำหนดเป็นความแปรปรวนอย่างง่ายหรือความแปรปรวนถ่วงน้ำหนัก

ระบุลักษณะการแปรผันแบบสุ่ม เช่น ส่วนหนึ่งของการแปรผันซึ่งเป็นผลมาจากอิทธิพลของปัจจัยที่ไม่ได้นับและไม่ได้ขึ้นอยู่กับปัจจัยเครื่องหมายที่อยู่ภายใต้การจัดกลุ่ม ความแปรปรวนนี้เท่ากับค่าเฉลี่ยกำลังสองของความเบี่ยงเบนของค่าแต่ละค่าของแอตทริบิวต์ภายในกลุ่ม X จากค่าเฉลี่ยเลขคณิตของกลุ่ม และสามารถคำนวณเป็นความแปรปรวนอย่างง่ายหรือความแปรปรวนถ่วงน้ำหนัก

ดังนั้น, การวัดความแปรปรวนภายในกลุ่มการเปลี่ยนแปลงของลักษณะภายในกลุ่มและถูกกำหนดโดยสูตร:

โดยที่ xi - ค่าเฉลี่ยของกลุ่ม
ni คือจำนวนหน่วยในกลุ่ม

ตัวอย่างเช่น ความแปรปรวนภายในกลุ่มซึ่งต้องพิจารณาในงานศึกษาอิทธิพลของคุณสมบัติของคนงานต่อระดับผลิตภาพแรงงานในร้าน แสดงการเปลี่ยนแปลงของผลผลิตในแต่ละกลุ่มที่เกิดจากปัจจัยที่เป็นไปได้ทั้งหมด ( เงื่อนไขทางเทคนิคอุปกรณ์ ความพร้อมใช้งานของเครื่องมือและวัสดุ อายุของคนงาน ความเข้มข้นของแรงงาน ฯลฯ) ยกเว้นความแตกต่างในประเภทคุณสมบัติ (ภายในกลุ่ม คนงานทั้งหมดมีคุณสมบัติเหมือนกัน)

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มสะท้อนถึงการสุ่ม นั่นคือ ส่วนหนึ่งของความแปรปรวนที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยอื่นๆ ทั้งหมด ยกเว้นปัจจัยการจัดกลุ่ม คำนวณโดยสูตร:

มันแสดงลักษณะการเปลี่ยนแปลงอย่างเป็นระบบของลักษณะผลลัพธ์ ซึ่งเป็นผลมาจากอิทธิพลของปัจจัยลักษณะที่อยู่ภายใต้การจัดกลุ่ม มันเท่ากับค่าเฉลี่ยกำลังสองของความเบี่ยงเบนของค่าเฉลี่ยกลุ่มจากค่าเฉลี่ยโดยรวม ความแปรปรวนระหว่างกลุ่มคำนวณโดยสูตร:

กฎการบวกผลต่างในสถิติ

ตาม กฎการบวกผลต่างความแปรปรวนทั้งหมดเท่ากับผลรวมของค่าเฉลี่ยของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม:

ความหมายของกฎนี้คือความแปรปรวนทั้งหมดที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยทั้งหมดจะเท่ากับผลรวมของความแปรปรวนที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยอื่นทั้งหมด และความแปรปรวนที่เกิดขึ้นเนื่องจากปัจจัยการจัดกลุ่ม

เมื่อใช้สูตรสำหรับการเพิ่มความแปรปรวน เราสามารถกำหนดได้ด้วยสอง ความแปรปรวนที่ทราบไม่ทราบที่สามเช่นเดียวกับการตัดสินความแข็งแกร่งของอิทธิพลของคุณลักษณะการจัดกลุ่ม

คุณสมบัติการกระจายตัว

1. หากค่าทั้งหมดของแอตทริบิวต์ลดลง (เพิ่มขึ้น) ด้วยค่าคงที่เดียวกัน ความแปรปรวนจะไม่เปลี่ยนแปลงจากนี้
2. หากค่าทั้งหมดของแอตทริบิวต์ลดลง (เพิ่มขึ้น) ด้วยจำนวนครั้งที่เท่ากัน n ความแปรปรวนจะลดลง (เพิ่มขึ้น) ตาม n^2 เท่า

ตัวบ่งชี้ทั่วไปที่สำคัญของความแปรผันในสถิติคือการกระจายและส่วนเบี่ยงเบนมาตรฐาน

การกระจายตัว มัน ค่าเฉลี่ยเลขคณิต ค่าเบี่ยงเบนกำลังสองของแต่ละค่าคุณลักษณะจากค่าเฉลี่ยรวม ความแปรปรวนมักจะเรียกว่าค่าเฉลี่ยกำลังสองของการเบี่ยงเบนและเขียนแทนด้วย  2 . ขึ้นอยู่กับข้อมูลเริ่มต้น ความแปรปรวนสามารถคำนวณได้จากค่าเฉลี่ยเลขคณิต แบบธรรมดาหรือแบบถ่วงน้ำหนัก:

 การกระจายแบบไม่ถ่วงน้ำหนัก (อย่างง่าย);

 ความแปรปรวนถ่วงน้ำหนัก

ส่วนเบี่ยงเบนมาตรฐาน เป็นลักษณะทั่วไปของมิติสัมบูรณ์ รูปแบบต่างๆ ลักษณะโดยรวม โดยแสดงเป็นหน่วยเดียวกับเครื่องหมาย (เป็นเมตร ตัน เปอร์เซ็นต์ เฮกตาร์ ฯลฯ)

ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนและแสดงโดย :

 ส่วนเบี่ยงเบนมาตรฐานที่ไม่ได้ถ่วงน้ำหนัก

 ค่าเบี่ยงเบนมาตรฐานถ่วงน้ำหนัก

ค่าเบี่ยงเบนมาตรฐานเป็นตัววัดความน่าเชื่อถือของค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐานยิ่งน้อย ค่าเฉลี่ยเลขคณิตก็ยิ่งสะท้อนถึงประชากรที่เป็นตัวแทนทั้งหมดได้ดียิ่งขึ้น

การคำนวณส่วนเบี่ยงเบนมาตรฐานจะนำหน้าด้วยการคำนวณความแปรปรวน

ขั้นตอนการคำนวณผลต่างถ่วงน้ำหนักมีดังนี้

1) กำหนดค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:

2) คำนวณส่วนเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย:

3) ยกกำลังสองส่วนเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย:

4) คูณส่วนเบี่ยงเบนกำลังสองด้วยน้ำหนัก (ความถี่):

5) สรุปผลงานที่ได้รับ:

6) จำนวนผลลัพธ์หารด้วยผลรวมของน้ำหนัก:

ตัวอย่าง 2.1

คำนวณค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:

ค่าเบี่ยงเบนจากค่าเฉลี่ยและกำลังสองแสดงอยู่ในตาราง มากำหนดความแปรปรวนกัน:

ค่าเบี่ยงเบนมาตรฐานจะเท่ากับ:

ถ้าข้อมูลต้นทางถูกนำเสนอเป็นช่วงๆ ชุดจำหน่าย จากนั้นคุณต้องกำหนดค่าแยกของคุณลักษณะก่อน จากนั้นจึงใช้วิธีการที่อธิบายไว้

ตัวอย่าง 2.2

ให้เราแสดงการคำนวณความแปรปรวนสำหรับอนุกรมช่วงเวลาบนข้อมูลการกระจายพื้นที่หว่านของฟาร์มรวมตามผลผลิตข้าวสาลี

ค่าเฉลี่ยเลขคณิตคือ:

ลองคำนวณความแปรปรวน:

6.3. การคำนวณการกระจายตามสูตรสำหรับข้อมูลแต่ละรายการ

เทคนิคการคำนวณ การกระจายตัว ซับซ้อนและสำหรับตัวเลือกและความถี่ที่มีค่ามากอาจยุ่งยาก การคำนวณสามารถทำให้ง่ายขึ้นได้โดยใช้คุณสมบัติการกระจาย

การกระจายมีคุณสมบัติดังต่อไปนี้

1. น้ำหนัก (ความถี่) ของคุณลักษณะตัวแปรที่ลดลงหรือเพิ่มขึ้นตามจำนวนครั้งที่กำหนดจะไม่เปลี่ยนการกระจาย

2. การลดหรือเพิ่มค่าคุณสมบัติแต่ละค่าด้วยค่าคงที่เดียวกัน กการกระจายไม่เปลี่ยนแปลง

3. ลดหรือเพิ่มค่าคุณสมบัติแต่ละค่าตามจำนวนครั้งที่กำหนด เคลดหรือเพิ่มความแปรปรวนตามลำดับตามลำดับ เค 2 ครั้ง ส่วนเบี่ยงเบนมาตรฐาน  ใน เคครั้งหนึ่ง.

4. ความแปรปรวนของคุณลักษณะที่สัมพันธ์กับค่าโดยพลการจะมากกว่าความแปรปรวนที่สัมพันธ์กับค่าเฉลี่ยเลขคณิตด้วยกำลังสองของผลต่างระหว่างค่าเฉลี่ยและค่าเฉลี่ยเลขคณิตเสมอ:

ถ้า ก 0 จะได้สมการดังนี้

กล่าวคือ ความแปรปรวนของคุณลักษณะมีค่าเท่ากับความแตกต่างระหว่างค่าเฉลี่ยกำลังสองของค่าคุณลักษณะและกำลังสองของค่าเฉลี่ย

แต่ละคุณสมบัติสามารถใช้เดี่ยวๆ หรือใช้ร่วมกับคุณสมบัติอื่นๆ เมื่อคำนวณความแปรปรวน

ขั้นตอนการคำนวณความแปรปรวนนั้นง่าย:

1) กำหนด ค่าเฉลี่ยเลขคณิต :

2) กำลังสองค่าเฉลี่ยเลขคณิต:

3) ยกกำลังสองส่วนเบี่ยงเบนของตัวแปรแต่ละชุด:

เอ็กซ์ ฉัน 2 .

4) ค้นหาผลรวมของกำลังสองของตัวเลือก:

5) หารผลรวมของตัวเลือกกำลังสองด้วยจำนวน เช่น กำหนดค่าเฉลี่ยกำลังสอง:

6) กำหนดความแตกต่างระหว่างค่าเฉลี่ยกำลังสองของคุณลักษณะและกำลังสองของค่าเฉลี่ย:

ตัวอย่าง 3.1เรามีข้อมูลต่อไปนี้เกี่ยวกับประสิทธิภาพการทำงานของคนงาน:

ลองทำการคำนวณต่อไปนี้:

สำหรับข้อมูลที่จัดกลุ่ม การกระจายสารตกค้าง- ค่าเฉลี่ยของ ความแปรปรวนภายในกลุ่ม:

โดยที่ σ 2 j คือความแปรปรวนภายในของกลุ่ม j -th

สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม การกระจายสารตกค้างเป็นการวัดความแม่นยำในการประมาณ เช่น การประมาณเส้นการถดถอยกับข้อมูลเดิม:
โดยที่ y(t) คือการคาดการณ์ตามสมการแนวโน้ม y t – ชุดไดนามิกเริ่มต้น; n คือจำนวนคะแนน p คือจำนวนสัมประสิทธิ์ของสมการถดถอย (จำนวนของตัวแปรอธิบาย)
ในตัวอย่างนี้เรียกว่า การประมาณค่าความแปรปรวนที่เป็นกลาง.

ตัวอย่าง #1 การกระจายคนงานของสามองค์กรของสมาคมเดียวตามประเภทภาษีมีลักษณะดังนี้:

หมวดค่าจ้างคนงาน	จำนวนคนงานในองค์กร
หมวดค่าจ้างคนงาน	องค์กร 1	องค์กร 2	องค์กร 3
1	50	20	40
2	100	80	60
3	150	150	200
4	350	300	400
5	200	150	250
6	150	100	150

กำหนด:
1. การกระจายสำหรับแต่ละองค์กร (การกระจายภายในกลุ่ม);
2. ค่าเฉลี่ยของการกระจายตัวภายในกลุ่ม
3. การกระจายตัวระหว่างกลุ่ม
4. ผลต่างทั้งหมด

สารละลาย.
ก่อนดำเนินการแก้ไขปัญหา จำเป็นต้องค้นหาว่าฟีเจอร์ใดมีประสิทธิภาพและฟีเจอร์ใดแฟกทอเรียล ในตัวอย่างที่กำลังพิจารณา คุณลักษณะที่มีประสิทธิผลคือ "หมวดหมู่อัตราค่าไฟฟ้า" และคุณลักษณะตัวประกอบคือ "หมายเลข (ชื่อ) ขององค์กร"
จากนั้นเรามีสามกลุ่ม (องค์กร) ซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยของกลุ่มและความแปรปรวนภายในกลุ่ม:

บริษัท	ค่าเฉลี่ยกลุ่ม,	ความแปรปรวนภายในกลุ่ม
1	4	1,8

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม ( การกระจายสารตกค้าง) คำนวณโดยสูตร:

ที่คุณสามารถคำนวณ:

หรือ:

แล้ว:
การกระจายทั้งหมดจะเท่ากับ: s 2 \u003d 1.6 + 0 \u003d 1.6
นอกจากนี้ยังสามารถคำนวณความแปรปรวนทั้งหมดโดยใช้หนึ่งในสองสูตรต่อไปนี้:

เมื่อแก้ปัญหาในทางปฏิบัติ เรามักจะต้องจัดการกับเครื่องหมายที่ใช้ค่าทางเลือกเพียงสองค่า ในกรณีนี้ พวกเขาไม่ได้พูดถึงน้ำหนักของค่าเฉพาะของคุณลักษณะ แต่เกี่ยวกับส่วนแบ่งโดยรวม หากสัดส่วนของหน่วยประชากรที่มีลักษณะตามการศึกษาแสดงด้วย " ร", และไม่ครอบครอง - ผ่าน" ถาม" จากนั้นสามารถคำนวณการกระจายตัวได้ตามสูตร:
s 2 = p×q

ตัวอย่าง #2 จากข้อมูลการพัฒนาคนงานหกคนของกองพล ให้กำหนดความแปรปรวนระหว่างกลุ่มและประเมินผลกระทบของกะงานต่อผลิตภาพแรงงานหากความแปรปรวนทั้งหมดเท่ากับ 12.2

จำนวนกองพลที่ทำงาน	เอาต์พุตการทำงานชิ้น
จำนวนกองพลที่ทำงาน	ในกะแรก	ในกะที่ 2
1	18	13
2	19	14
3	22	15
4	20	17
5	24	16
6	23	15

สารละลาย. ข้อมูลเบื้องต้น

เอ็กซ์	ฉ.1	f2	ฉ 3	f4	f5	ฉ.6	ทั้งหมด
1	18	19	22	20	24	23	126
2	13	14	15	17	16	15	90
ทั้งหมด	31	33	37	37	40	38

จากนั้นเรามี 6 กลุ่มซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยกลุ่มและความแปรปรวนภายในกลุ่ม
1. หาค่าเฉลี่ยของแต่ละกลุ่ม.

2. หาค่าเฉลี่ยกำลังสองของแต่ละกลุ่ม.

เราสรุปผลการคำนวณในตาราง:

หมายเลขกลุ่ม	ค่าเฉลี่ยของกลุ่ม	ความแปรปรวนภายในกลุ่ม
1	1.42	0.24
2	1.42	0.24
3	1.41	0.24
4	1.46	0.25
5	1.4	0.24
6	1.39	0.24

3. ความแปรปรวนภายในกลุ่มอธิบายลักษณะการเปลี่ยนแปลง (ความผันแปร) ของลักษณะ (ผลลัพธ์) ที่ศึกษาภายในกลุ่มภายใต้อิทธิพลของปัจจัยทั้งหมด ยกเว้นปัจจัยที่อยู่ภายใต้การจัดกลุ่ม:
เราคำนวณค่าเฉลี่ยของการกระจายภายในกลุ่มโดยใช้สูตร:

4. ความแปรปรวนระหว่างกลุ่มอธิบายลักษณะการเปลี่ยนแปลง (ความแปรปรวน) ของลักษณะ (ผลลัพธ์) ที่ศึกษาภายใต้อิทธิพลของปัจจัย (ลักษณะแฟกทอเรียล) ที่อยู่ภายใต้การจัดกลุ่ม
การกระจายระหว่างกลุ่มหมายถึง:

ที่ไหน

แล้ว

ความแปรปรวนทั้งหมดแสดงลักษณะการเปลี่ยนแปลง (ความแปรปรวน) ของลักษณะ (ผลลัพธ์) ที่ศึกษาภายใต้อิทธิพลของปัจจัยทั้งหมด (ลักษณะแฟกทอเรียล) โดยไม่มีข้อยกเว้น โดยเงื่อนไขของโจทย์จะเท่ากับ 12.2
ความสัมพันธ์เชิงประจักษ์วัดความผันผวนทั้งหมดของแอตทริบิวต์ผลลัพธ์ที่เกิดจากปัจจัยที่ศึกษา นี่คืออัตราส่วนของความแปรปรวนแฟกทอเรียลต่อ ความแปรปรวนทั้งหมด:

เรากำหนดความสัมพันธ์เชิงประจักษ์:

ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ อาจอ่อนแอหรือแข็งแกร่ง (ปิด) เกณฑ์ของพวกเขาได้รับการประเมินในระดับ Chaddock:
0.1 0.3 0.5 0.7 0.9 ในตัวอย่างของเรา ความสัมพันธ์ระหว่างคุณลักษณะ Y ปัจจัย X อ่อนแอ
ค่าสัมประสิทธิ์การกำหนด

มากำหนดค่าสัมประสิทธิ์ของการตัดสินใจ:

ดังนั้น 0.67% ของการเปลี่ยนแปลงเกิดจากความแตกต่างระหว่างลักษณะ และ 99.37% เกิดจากปัจจัยอื่นๆ
บทสรุป: ในกรณีนี้ ผลลัพธ์ของคนงานไม่ได้ขึ้นอยู่กับงานในกะใดกะหนึ่ง เช่น อิทธิพลของการเปลี่ยนแปลงการทำงานต่อผลิตภาพแรงงานนั้นไม่มีนัยสำคัญและเกิดจากปัจจัยอื่นๆ

ตัวอย่าง #3 ขึ้นอยู่กับค่าเฉลี่ย ค่าจ้างและค่าเบี่ยงเบนกำลังสองจากค่าของคนงานสองกลุ่ม ค้นหาความแปรปรวนทั้งหมดโดยใช้กฎสำหรับการเพิ่มความแปรปรวน:

สารละลาย:
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม

การกระจายระหว่างกลุ่มหมายถึง:

ความแปรปรวนทั้งหมดจะเป็น: 480 + 13824 = 14304

อย่างไรก็ตามลักษณะนี้เพียงอย่างเดียวไม่เพียงพอที่จะศึกษา ตัวแปรสุ่ม. ลองนึกภาพนักกีฬาสองคนที่กำลังยิงไปที่เป้าหมาย อันหนึ่งยิงอย่างแม่นยำและเข้าใกล้จุดศูนย์กลาง ส่วนอีกอัน ... แค่สนุกและไม่ได้เล็งด้วยซ้ำ แต่ที่ตลกก็คือ เฉลี่ยผลลัพธ์จะเหมือนกับผู้ยิงคนแรกทุกประการ! สถานการณ์นี้แสดงตามเงื่อนไขโดยตัวแปรสุ่มต่อไปนี้:

ความคาดหวังทางคณิตศาสตร์ "สไนเปอร์" เท่ากับ อย่างไรก็ตาม สำหรับ "บุคคลที่น่าสนใจ": - ก็เป็นศูนย์เช่นกัน!

ดังนั้นจึงจำเป็นต้องคำนวณว่าไกลแค่ไหน กระจัดกระจายสัญลักษณ์แสดงหัวข้อย่อย (ค่าสุ่ม) ที่สัมพันธ์กับศูนย์กลางของเป้าหมาย ( ความคาดหวังทางคณิตศาสตร์). ดีและ กระจัดกระจายแปลจากภาษาละตินเท่านั้นเป็น การกระจายตัว .

มาดูกันว่าลักษณะตัวเลขนี้ถูกกำหนดอย่างไรในตัวอย่างหนึ่งของส่วนที่ 1 ของบทเรียน:

เราพบความคาดหวังทางคณิตศาสตร์ที่น่าผิดหวังของเกมนี้ และตอนนี้เราต้องคำนวณความแปรปรวนของมัน ซึ่ง แสดงผ่าน .

มาดูกันว่าการชนะ/แพ้นั้น "กระจัดกระจาย" แค่ไหนเมื่อเทียบกับค่าเฉลี่ย แน่นอนเราต้องคำนวณสำหรับสิ่งนี้ ความแตกต่างระหว่าง ค่าของตัวแปรสุ่มและเธอ ความคาดหวังทางคณิตศาสตร์:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

ตอนนี้ดูเหมือนว่าจำเป็นต้องสรุปผลลัพธ์ แต่วิธีนี้ไม่ดี - ด้วยเหตุผลที่การแกว่งไปทางซ้ายจะหักล้างกันด้วยการสั่นไปทางขวา ตัวอย่างเช่น นักกีฬา "มือสมัครเล่น" (ตัวอย่างด้านบน)ความแตกต่างจะเป็น และเมื่อเพิ่มเข้าไป พวกเขาจะให้เป็นศูนย์ ดังนั้นเราจะไม่ได้รับค่าประมาณของการกระเจิงของการยิงของเขา

เพื่อหลีกเลี่ยงความรำคาญนี้ให้พิจารณา โมดูลความแตกต่างแต่ เหตุผลทางเทคนิคแนวทางดังกล่าวได้หยั่งรากเมื่อมีการยกกำลังสอง สะดวกกว่าในการจัดเรียงโซลูชันในตาราง:

และนี่คือการคำนวณ ถัวเฉลี่ยถ่วงน้ำหนักค่าของการเบี่ยงเบนกำลังสอง มันคืออะไร? มันเป็นของพวกเขา มูลค่าที่คาดหวังซึ่งเป็นการวัดการกระจาย:

– คำนิยามการกระจายตัว เป็นที่ชัดเจนทันทีจากคำจำกัดความว่า ความแปรปรวนไม่สามารถเป็นค่าลบได้- จดไว้ปฏิบัติ!

มาจำวิธีค้นหาความคาดหวังกันเถอะ คูณผลต่างกำลังสองด้วยความน่าจะเป็นที่สอดคล้องกัน (ความต่อเนื่องของตาราง):
- พูดเปรียบเปรยนี่คือ "แรงฉุด"
และสรุปผล:

คุณไม่คิดว่าเบื้องหลังของการชนะผลลัพธ์ที่ได้จะใหญ่เกินไปเหรอ? ถูกต้อง เรากำลังยกกำลังสอง และเพื่อที่จะกลับไปสู่มิติของเกมของเรา เราต้องแยก รากที่สอง. ค่านี้เรียกว่า ส่วนเบี่ยงเบนมาตรฐาน และแสดงว่า อักษรกรีก"ซิกม่า":

บางครั้งก็เรียกความหมายนี้ว่า ส่วนเบี่ยงเบนมาตรฐาน .

ความหมายของมันคืออะไร? ถ้าเราเบี่ยงเบนจากความคาดหวังทางคณิตศาสตร์ไปทางซ้ายและทางขวาด้วยส่วนเบี่ยงเบนมาตรฐาน:

– จากนั้นค่าที่เป็นไปได้มากที่สุดของตัวแปรสุ่มจะ "เข้มข้น" ในช่วงเวลานี้ สิ่งที่เราเห็นจริง:

อย่างไรก็ตาม มันเกิดขึ้นในการวิเคราะห์การกระเจิงเกือบทุกครั้งด้วยแนวคิดของการกระจาย มาดูกันว่ามันหมายถึงอะไรเกี่ยวกับเกม หากในกรณีของมือปืนเรากำลังพูดถึง "ความแม่นยำ" ของการยิงที่สัมพันธ์กับศูนย์กลางของเป้าหมาย การกระจายจะแสดงลักษณะสองสิ่งต่อไปนี้:

อย่างแรก เห็นได้ชัดว่าเมื่ออัตราเพิ่มขึ้น ความแปรปรวนก็เพิ่มขึ้นด้วย ตัวอย่างเช่น ถ้าเราเพิ่มขึ้น 10 เท่า ความคาดหวังทางคณิตศาสตร์จะเพิ่มขึ้น 10 เท่า และความแปรปรวนจะเพิ่มขึ้น 100 เท่า (ทันทีที่มันเป็นค่ากำลังสอง). แต่โปรดทราบว่ากฎของเกมไม่มีการเปลี่ยนแปลง! เฉพาะอัตราเท่านั้นที่เปลี่ยนแปลง พูดคร่าวๆ เราเคยเดิมพัน 10 รูเบิล ตอนนี้ 100

ประการที่สองเพิ่มเติม จุดที่น่าสนใจคือความแปรปรวนกำหนดลักษณะของเกม แก้ไขอัตราเกมทางจิตใจ ได้ในระดับหนึ่งและดูว่ามีอะไรอยู่ที่นี่:

เกมที่มีความแปรปรวนต่ำเป็นเกมที่ระมัดระวัง ผู้เล่นมักจะเลือกแผนการที่น่าเชื่อถือที่สุด โดยที่เขาไม่แพ้/ชนะมากเกินไปในคราวเดียว ตัวอย่างเช่น ระบบสีแดง/ดำในรูเล็ต (ดูตัวอย่างที่ 4 ของบทความ ตัวแปรสุ่ม) .

เกมที่มีความแปรปรวนสูง เธอมักจะถูกเรียกว่า การกระจายตัวเกม. นี่คือรูปแบบการเล่นแบบผจญภัยหรือก้าวร้าวที่ผู้เล่นเลือกแผน "อะดรีนาลีน" อย่างน้อยก็จำไว้ "มาร์ติงเกล"ซึ่งจำนวนเงินเดิมพันเป็นลำดับความสำคัญที่มากกว่าเกม "เงียบ" ในย่อหน้าก่อนหน้า

สถานการณ์ในโป๊กเกอร์เป็นสิ่งบ่งชี้: มีสิ่งที่เรียกว่า แน่นผู้เล่นที่มักจะระมัดระวังและ "เขย่า" กับเงินในเกมของพวกเขา (แบ๊งค์). ไม่น่าแปลกใจที่แบ๊งค์ของพวกเขาไม่ผันผวนมากนัก (ความแปรปรวนต่ำ) ในทางกลับกัน หากผู้เล่นมีความแปรปรวนสูง ก็จะเป็นฝ่ายรุกราน เขามักจะเสี่ยง ทำการเดิมพันจำนวนมาก และทั้งคู่สามารถทำลายธนาคารขนาดใหญ่และแตกเป็นชิ้นๆ

สิ่งเดียวกันนี้เกิดขึ้นใน Forex และอื่นๆ - มีตัวอย่างมากมาย

ยิ่งไปกว่านั้น ในทุกกรณี ไม่สำคัญว่าเกมนี้จะมีราคาเพียงเพนนีหรือหลายพันดอลลาร์ ทุกระดับมีผู้เล่นที่มีความแปรปรวนต่ำและสูง สำหรับการชนะโดยเฉลี่ยอย่างที่เราจำได้ "รับผิดชอบ" มูลค่าที่คาดหวัง.

คุณอาจสังเกตเห็นว่าการค้นหาความแปรปรวนเป็นกระบวนการที่ยาวนานและต้องใช้ความอุตสาหะ แต่คณิตศาสตร์นั้นใจกว้าง:

สูตรการหาค่าความแปรปรวน

สูตรนี้ได้มาจากนิยามของความแปรปรวนโดยตรง และเรานำไปใช้ทันที ฉันจะคัดลอกจานด้วยเกมของเราจากด้านบน:

และความคาดหวังที่พบ

เราคำนวณความแปรปรวนด้วยวิธีที่สอง ก่อนอื่น มาหาความคาดหวังทางคณิตศาสตร์ - กำลังสองของตัวแปรสุ่ม โดย ความหมายของความคาดหวังทางคณิตศาสตร์:

ในกรณีนี้:

ดังนั้น ตามสูตร:

อย่างที่พวกเขาพูด รู้สึกถึงความแตกต่าง และแน่นอนว่าในทางปฏิบัติควรใช้สูตร (เว้นแต่เงื่อนไขจะกำหนดไว้เป็นอย่างอื่น)

เราเชี่ยวชาญในเทคนิคการแก้ปัญหาและการออกแบบ:

ตัวอย่างที่ 6

ค้นหาความคาดหวังทางคณิตศาสตร์ ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐาน

งานนี้พบได้ทุกที่และตามกฎแล้วไปโดยไม่มีความหมาย
คุณสามารถจินตนาการถึงหลอดไฟหลายดวงพร้อมตัวเลขที่สว่างขึ้นในโรงบาลที่มีความน่าจะเป็น :)

สารละลาย: สะดวกในการสรุปการคำนวณหลักในตาราง อันดับแรก เราเขียนข้อมูลเริ่มต้นในสองบรรทัดบนสุด จากนั้นเราจะคำนวณผลิตภัณฑ์ จากนั้นและสุดท้ายคือผลรวมในคอลัมน์ด้านขวา:

ที่จริงมีพร้อมเกือบทุกอย่าง ในบรรทัดที่สาม มีการวาดความคาดหวังทางคณิตศาสตร์สำเร็จรูป: .

การกระจายคำนวณโดยสูตร:

และสุดท้าย ค่าเบี่ยงเบนมาตรฐาน:
- โดยส่วนตัวแล้วผมมักจะปัดเศษเป็นทศนิยม 2 ตำแหน่ง

การคำนวณทั้งหมดสามารถทำได้บนเครื่องคิดเลข และดีกว่า - ใน Excel:

มันยากที่จะผิดพลาดที่นี่ :)

คำตอบ:

ผู้ที่ต้องการทำให้ชีวิตของพวกเขาง่ายขึ้นและใช้ประโยชน์จากฉัน เครื่องคิดเลข (การสาธิต)ซึ่งจะไม่เพียงแก้ปัญหาได้ทันที งานนี้แต่ยังสร้าง กราฟิกเฉพาะเรื่อง (มาเร็ว ๆ นี้). โปรแกรมสามารถ ดาวน์โหลดในห้องสมุด– หากคุณดาวน์โหลดสื่อการเรียนรู้อย่างน้อยหนึ่งรายการหรือได้รับ อีกวิธีหนึ่ง. ขอบคุณสำหรับการสนับสนุนโครงการ!

งานสองสามอย่างสำหรับโซลูชันอิสระ:

ตัวอย่างที่ 7

คำนวณความแปรปรวนของตัวแปรสุ่มของตัวอย่างก่อนหน้าตามนิยาม

และตัวอย่างที่คล้ายกัน:

ตัวอย่างที่ 8

ตัวแปรสุ่มแบบไม่ต่อเนื่องถูกกำหนดโดยกฎการกระจายของมันเอง:

ใช่ ค่าของตัวแปรสุ่มอาจมีขนาดค่อนข้างใหญ่ (ตัวอย่างจากงานจริง)และที่นี่ ถ้าเป็นไปได้ ให้ใช้ Excel อย่างไรก็ตามในตัวอย่างที่ 7 นั้นเร็วกว่าเชื่อถือได้และน่าพอใจกว่า

วิธีแก้ไขและคำตอบที่ด้านล่างของหน้า

ในบทสรุปของส่วนที่ 2 ของบทเรียน เราจะวิเคราะห์งานทั่วไปอีกหนึ่งงาน บางคนอาจพูดว่า rebus เล็กๆ:

ตัวอย่างที่ 9

ตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถรับค่าได้เพียงสองค่าเท่านั้น: และ และ ทราบความน่าจะเป็น ความคาดหวังทางคณิตศาสตร์ และความแปรปรวน

สารละลาย: เริ่มจากความน่าจะเป็นที่ไม่รู้จัก เนื่องจากตัวแปรสุ่มสามารถรับได้เพียงสองค่า ดังนั้นผลรวมของความน่าจะเป็นของเหตุการณ์ที่เกี่ยวข้อง:

และตั้งแต่นั้นเป็นต้นมา

มันยังคงค้นหา ... พูดง่าย ๆ :) แต่เอาล่ะมันเริ่มแล้ว ตามคำจำกัดความของความคาดหวังทางคณิตศาสตร์:
- แทนที่ค่าที่ทราบ:

- และไม่มีอะไรสามารถบีบออกจากสมการนี้ได้อีก ยกเว้นว่าคุณสามารถเขียนใหม่ในทิศทางปกติ:

หรือ:

ฉันคิดว่าคุณสามารถเดาได้เกี่ยวกับการดำเนินการเพิ่มเติม มาสร้างและแก้ไขระบบกัน:

ทศนิยม- แน่นอนว่านี่เป็นความอัปยศอย่างสมบูรณ์ คูณสมการทั้งสองด้วย 10:

และหารด้วย 2:

นั่นดีกว่า. จากสมการที่ 1 เราแสดง:
(นี่เป็นวิธีที่ง่ายกว่า)- แทนที่ในสมการที่ 2:

เรากำลังสร้าง กำลังสองและทำให้ง่ายขึ้น:

เราคูณด้วย:

ผลที่ตามมา, สมการกำลังสองค้นหาการเลือกปฏิบัติ:
- ยอดเยี่ยม!

และเราได้คำตอบสองทาง:

1) ถ้า , ที่ ;

2) ถ้า , ที่ .

ค่าคู่แรกเป็นไปตามเงื่อนไข ด้วยความเป็นไปได้สูงทุกอย่างถูกต้อง แต่อย่างไรก็ตามเราเขียนกฎการกระจาย:

และทำการตรวจสอบ กล่าวคือ ค้นหาความคาดหวัง:

ควบคู่ไปกับการศึกษาความแปรผันของลักษณะเฉพาะของประชากรทั้งหมดโดยรวม มักจำเป็นต้องติดตามการเปลี่ยนแปลงเชิงปริมาณของลักษณะในกลุ่มที่ประชากรถูกแบ่ง เช่นเดียวกับระหว่างกลุ่ม การศึกษาความแปรผันนี้ทำได้โดยการคำนวณและการวิเคราะห์ ชนิดต่างๆการกระจายตัว
แยกความแตกต่างระหว่างการกระจายทั้งหมด ระหว่างกลุ่ม และภายในกลุ่ม.
ผลต่างทั้งหมด σ 2วัดความผันแปรของคุณลักษณะของประชากรทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้

ความแปรปรวนระหว่างกลุ่ม (δ) แสดงลักษณะการแปรผันอย่างเป็นระบบ เช่น ความแตกต่างในขนาดของลักษณะที่ศึกษาซึ่งเกิดขึ้นภายใต้อิทธิพลของปัจจัยลักษณะที่อยู่ภายใต้การจัดกลุ่ม คำนวณโดยสูตร:
.

ความแปรปรวนภายในกลุ่ม (σ)สะท้อนถึงการเปลี่ยนแปลงแบบสุ่ม เช่น ส่วนหนึ่งของความผันแปรที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่ได้นับและไม่ขึ้นอยู่กับปัจจัยลักษณะที่อยู่ภายใต้การจัดกลุ่ม คำนวณโดยสูตร:
.

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม: .

มีกฎหมายเชื่อมโยงการแพร่กระจาย 3 ประเภท ความแปรปรวนทั้งหมดเท่ากับผลรวมของค่าเฉลี่ยของกลุ่มภายในและ ความแปรปรวนระหว่างกลุ่ม: .
อัตราส่วนนี้เรียกว่า กฎการบวกผลต่าง.

ในการวิเคราะห์ มีการใช้การวัดกันอย่างแพร่หลาย ซึ่งเป็นสัดส่วนของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด มันมีชื่อ ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด (η 2): .
รากที่สองของค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดเรียกว่า อัตราส่วนสหสัมพันธ์เชิงประจักษ์ (η):
.
มันแสดงลักษณะอิทธิพลของแอตทริบิวต์ที่อยู่ภายใต้การจัดกลุ่มต่อการเปลี่ยนแปลงของแอตทริบิวต์ที่เป็นผลลัพธ์ อัตราส่วนสหสัมพันธ์เชิงประจักษ์แตกต่างกันไปตั้งแต่ 0 ถึง 1
มาแสดงกันเถอะ ใช้งานได้จริงในตัวอย่างต่อไปนี้ (ตารางที่ 1)

ตัวอย่าง #1 ตารางที่ 1 - ผลิตภาพแรงงานของคนงานสองกลุ่มในหนึ่งในการประชุมเชิงปฏิบัติการของ NPO "Cyclone"

คำนวณผลรวมและค่าเฉลี่ยของกลุ่มและความแปรปรวน:

ข้อมูลเริ่มต้นสำหรับการคำนวณค่าเฉลี่ยของการกระจายภายในกลุ่มและระหว่างกลุ่มแสดงไว้ในตาราง 2.
ตารางที่ 2
การคำนวณและ δ 2 สำหรับคนทำงานสองกลุ่ม

กลุ่มคนงาน	จำนวนคนงานต่อคน	ค่าเฉลี่ย det./กะ	การกระจายตัว
ผ่านการฝึกอบรมทางเทคนิค	5	95	42,0
ไม่ได้รับการฝึกฝนทางเทคนิค	5	81	231,2
คนงานทั้งหมด	10	88	185,6

มาคำนวณคะแนนกัน ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:

.
ความแปรปรวนระหว่างกลุ่ม

ความแปรปรวนทั้งหมด:
ดังนั้น อัตราส่วนสหสัมพันธ์เชิงประจักษ์: .

นอกเหนือจากการเปลี่ยนแปลงของลักษณะเชิงปริมาณแล้ว ยังสามารถสังเกตการเปลี่ยนแปลงของลักษณะเชิงคุณภาพได้อีกด้วย การศึกษาความแปรผันนี้ทำได้โดยการคำนวณความแปรปรวนประเภทต่างๆ ต่อไปนี้:

ความแปรปรวนภายในกลุ่มของส่วนแบ่งถูกกำหนดโดยสูตร

ที่ไหน ฉัน– จำนวนหน่วยในกลุ่มแยก
สัดส่วนของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร:
การกระจายทั้งสามประเภทมีความสัมพันธ์กันดังนี้: