ตัวอย่างความแปรปรวนของตัวแปรสุ่ม การคำนวณผลต่างใน Microsoft Excel
การกระจายในสถิติพบเป็นค่าแต่ละค่าของคุณสมบัติในตารางของ ขึ้นอยู่กับข้อมูลเริ่มต้น ซึ่งจะถูกกำหนดโดยสูตรความแปรปรวนอย่างง่ายและถ่วงน้ำหนัก:
1. (สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม) คำนวณโดยสูตร:
2. ความแปรปรวนแบบถ่วงน้ำหนัก (สำหรับชุดรูปแบบต่างๆ):
โดยที่ n คือความถี่ (ปัจจัยความสามารถในการทำซ้ำ X)
ตัวอย่างการหาค่าความแปรปรวน
หน้านี้อธิบายตัวอย่างมาตรฐานของการค้นหาความแปรปรวน คุณยังสามารถดูงานอื่นๆ เพื่อค้นหาความแปรปรวนได้
ตัวอย่างที่ 1 เรามีข้อมูลต่อไปนี้สำหรับกลุ่มนักเรียนที่ติดต่อทางจดหมาย 20 คน จำเป็นต้องสร้าง ซีรีย์ช่วงเวลาการกระจายคุณลักษณะ คำนวณค่าเฉลี่ยของคุณลักษณะ และศึกษาความแปรปรวน
มาสร้างการแบ่งกลุ่มตามช่วงเวลากัน กำหนดช่วงของช่วงเวลาตามสูตร:
โดยที่ X max คือค่าสูงสุดของคุณลักษณะการจัดกลุ่ม
X min คือค่าต่ำสุดของคุณสมบัติการจัดกลุ่ม
n คือจำนวนช่วงเวลา:
เรายอมรับ n=5 ขั้นตอนคือ: h \u003d (192 - 159) / 5 \u003d 6.6
มาทำการแบ่งกลุ่มเป็นช่วงๆ กันเถอะ
สำหรับการคำนวณเพิ่มเติม เราจะสร้างตารางเสริม:
X'i อยู่ตรงกลางของช่วงเวลา (เช่น ตรงกลางของช่วง 159 - 165.6 = 162.3)
การเติบโตเฉลี่ยของนักเรียนถูกกำหนดโดยสูตรค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:
เราพิจารณาการกระจายตามสูตร:
สูตรความแปรปรวนสามารถแปลงได้ดังนี้:
จากสูตรนี้เป็นไปตามนั้น ความแปรปรวนคือ ความแตกต่างระหว่างค่าเฉลี่ยของกำลังสองของตัวเลือกและกำลังสองและค่าเฉลี่ย
การกระจายตัวใน ชุดการเปลี่ยนแปลง กับ ในช่วงเวลาเท่ากันโดยวิธีการของโมเมนต์สามารถคำนวณได้ด้วยวิธีต่อไปนี้โดยใช้คุณสมบัติที่สองของการกระจาย (การหารตัวเลือกทั้งหมดด้วยค่าของช่วงเวลา) นิยามของความแปรปรวนคำนวณโดยวิธีของช่วงเวลาตามสูตรต่อไปนี้ใช้เวลาน้อยลง:
โดยที่ i คือค่าของช่วงเวลา
A - ศูนย์เงื่อนไขซึ่งสะดวกในการใช้ช่วงกลางของช่วงเวลาที่มีความถี่สูงสุด
m1 คือกำลังสองของโมเมนต์ลำดับที่หนึ่ง
m2 - ช่วงเวลาของลำดับที่สอง
(หากแอตทริบิวต์เปลี่ยนแปลงในประชากรทางสถิติในลักษณะที่มีตัวเลือกพิเศษร่วมกันเพียงสองตัวเลือก ความแปรปรวนดังกล่าวเรียกว่า ทางเลือก) สามารถคำนวณได้โดยสูตร:
แทนที่ด้วยสูตรการกระจายนี้ q = 1- p เราได้รับ:
ประเภทของการกระจาย
ความแปรปรวนทั้งหมดวัดความผันแปรของคุณลักษณะของประชากรทั้งหมดโดยรวมภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ มันเท่ากับค่าเฉลี่ยกำลังสองของความเบี่ยงเบนของแต่ละค่าของแอตทริบิวต์ x จากค่าเฉลี่ยทั้งหมด x และสามารถกำหนดเป็นความแปรปรวนอย่างง่ายหรือความแปรปรวนถ่วงน้ำหนัก
ระบุลักษณะการแปรผันแบบสุ่ม เช่น ส่วนหนึ่งของการแปรผันซึ่งเป็นผลมาจากอิทธิพลของปัจจัยที่ไม่ได้นับและไม่ได้ขึ้นอยู่กับปัจจัยเครื่องหมายที่อยู่ภายใต้การจัดกลุ่ม ความแปรปรวนนี้เท่ากับค่าเฉลี่ยกำลังสองของความเบี่ยงเบนของค่าแต่ละค่าของแอตทริบิวต์ภายในกลุ่ม X จากค่าเฉลี่ยเลขคณิตของกลุ่ม และสามารถคำนวณเป็นความแปรปรวนอย่างง่ายหรือความแปรปรวนถ่วงน้ำหนัก
ดังนั้น, การวัดความแปรปรวนภายในกลุ่มการเปลี่ยนแปลงของลักษณะภายในกลุ่มและถูกกำหนดโดยสูตร:
โดยที่ xi - ค่าเฉลี่ยของกลุ่ม
ni คือจำนวนหน่วยในกลุ่ม
ตัวอย่างเช่น ความแปรปรวนภายในกลุ่มซึ่งต้องพิจารณาในงานศึกษาอิทธิพลของคุณสมบัติของคนงานต่อระดับผลิตภาพแรงงานในร้าน แสดงการเปลี่ยนแปลงของผลผลิตในแต่ละกลุ่มที่เกิดจากปัจจัยที่เป็นไปได้ทั้งหมด ( เงื่อนไขทางเทคนิคอุปกรณ์ ความพร้อมใช้งานของเครื่องมือและวัสดุ อายุของคนงาน ความเข้มข้นของแรงงาน ฯลฯ) ยกเว้นความแตกต่างในประเภทคุณสมบัติ (ภายในกลุ่ม คนงานทั้งหมดมีคุณสมบัติเหมือนกัน)
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มสะท้อนถึงการสุ่ม นั่นคือ ส่วนหนึ่งของความแปรปรวนที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยอื่นๆ ทั้งหมด ยกเว้นปัจจัยการจัดกลุ่ม คำนวณโดยสูตร:
มันแสดงลักษณะการเปลี่ยนแปลงอย่างเป็นระบบของลักษณะผลลัพธ์ ซึ่งเป็นผลมาจากอิทธิพลของปัจจัยลักษณะที่อยู่ภายใต้การจัดกลุ่ม มันเท่ากับค่าเฉลี่ยกำลังสองของความเบี่ยงเบนของค่าเฉลี่ยกลุ่มจากค่าเฉลี่ยโดยรวม ความแปรปรวนระหว่างกลุ่มคำนวณโดยสูตร:
กฎการบวกผลต่างในสถิติ
ตาม กฎการบวกผลต่างความแปรปรวนทั้งหมดเท่ากับผลรวมของค่าเฉลี่ยของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม:
ความหมายของกฎนี้คือความแปรปรวนทั้งหมดที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยทั้งหมดจะเท่ากับผลรวมของความแปรปรวนที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยอื่นทั้งหมด และความแปรปรวนที่เกิดขึ้นเนื่องจากปัจจัยการจัดกลุ่ม
เมื่อใช้สูตรสำหรับการเพิ่มความแปรปรวน เราสามารถกำหนดได้ด้วยสอง ความแปรปรวนที่ทราบไม่ทราบที่สามเช่นเดียวกับการตัดสินความแข็งแกร่งของอิทธิพลของคุณลักษณะการจัดกลุ่ม
คุณสมบัติการกระจายตัว
1. หากค่าทั้งหมดของแอตทริบิวต์ลดลง (เพิ่มขึ้น) ด้วยค่าคงที่เดียวกัน ความแปรปรวนจะไม่เปลี่ยนแปลงจากนี้
2. หากค่าทั้งหมดของแอตทริบิวต์ลดลง (เพิ่มขึ้น) ด้วยจำนวนครั้งที่เท่ากัน n ความแปรปรวนจะลดลง (เพิ่มขึ้น) ตาม n^2 เท่า
ตัวบ่งชี้ทั่วไปที่สำคัญของความแปรผันในสถิติคือการกระจายและส่วนเบี่ยงเบนมาตรฐาน
การกระจายตัว มัน ค่าเฉลี่ยเลขคณิต ค่าเบี่ยงเบนกำลังสองของแต่ละค่าคุณลักษณะจากค่าเฉลี่ยรวม ความแปรปรวนมักจะเรียกว่าค่าเฉลี่ยกำลังสองของการเบี่ยงเบนและเขียนแทนด้วย 2 . ขึ้นอยู่กับข้อมูลเริ่มต้น ความแปรปรวนสามารถคำนวณได้จากค่าเฉลี่ยเลขคณิต แบบธรรมดาหรือแบบถ่วงน้ำหนัก:
การกระจายแบบไม่ถ่วงน้ำหนัก (อย่างง่าย);
ความแปรปรวนถ่วงน้ำหนัก
ส่วนเบี่ยงเบนมาตรฐาน เป็นลักษณะทั่วไปของมิติสัมบูรณ์ รูปแบบต่างๆ ลักษณะโดยรวม โดยแสดงเป็นหน่วยเดียวกับเครื่องหมาย (เป็นเมตร ตัน เปอร์เซ็นต์ เฮกตาร์ ฯลฯ)
ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนและแสดงโดย :
ส่วนเบี่ยงเบนมาตรฐานที่ไม่ได้ถ่วงน้ำหนัก
ค่าเบี่ยงเบนมาตรฐานถ่วงน้ำหนัก
ค่าเบี่ยงเบนมาตรฐานเป็นตัววัดความน่าเชื่อถือของค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐานยิ่งน้อย ค่าเฉลี่ยเลขคณิตก็ยิ่งสะท้อนถึงประชากรที่เป็นตัวแทนทั้งหมดได้ดียิ่งขึ้น
การคำนวณส่วนเบี่ยงเบนมาตรฐานจะนำหน้าด้วยการคำนวณความแปรปรวน
ขั้นตอนการคำนวณผลต่างถ่วงน้ำหนักมีดังนี้
1) กำหนดค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:
2) คำนวณส่วนเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย:
3) ยกกำลังสองส่วนเบี่ยงเบนของแต่ละตัวเลือกจากค่าเฉลี่ย:
4) คูณส่วนเบี่ยงเบนกำลังสองด้วยน้ำหนัก (ความถี่):
5) สรุปผลงานที่ได้รับ:
6) จำนวนผลลัพธ์หารด้วยผลรวมของน้ำหนัก:
ตัวอย่าง 2.1
คำนวณค่าเฉลี่ยถ่วงน้ำหนักเลขคณิต:
ค่าเบี่ยงเบนจากค่าเฉลี่ยและกำลังสองแสดงอยู่ในตาราง มากำหนดความแปรปรวนกัน:
ค่าเบี่ยงเบนมาตรฐานจะเท่ากับ:
ถ้าข้อมูลต้นทางถูกนำเสนอเป็นช่วงๆ ชุดจำหน่าย จากนั้นคุณต้องกำหนดค่าแยกของคุณลักษณะก่อน จากนั้นจึงใช้วิธีการที่อธิบายไว้
ตัวอย่าง 2.2
ให้เราแสดงการคำนวณความแปรปรวนสำหรับอนุกรมช่วงเวลาบนข้อมูลการกระจายพื้นที่หว่านของฟาร์มรวมตามผลผลิตข้าวสาลี
ค่าเฉลี่ยเลขคณิตคือ:
ลองคำนวณความแปรปรวน:
6.3. การคำนวณการกระจายตามสูตรสำหรับข้อมูลแต่ละรายการ
เทคนิคการคำนวณ การกระจายตัว ซับซ้อนและสำหรับตัวเลือกและความถี่ที่มีค่ามากอาจยุ่งยาก การคำนวณสามารถทำให้ง่ายขึ้นได้โดยใช้คุณสมบัติการกระจาย
การกระจายมีคุณสมบัติดังต่อไปนี้
1. น้ำหนัก (ความถี่) ของคุณลักษณะตัวแปรที่ลดลงหรือเพิ่มขึ้นตามจำนวนครั้งที่กำหนดจะไม่เปลี่ยนการกระจาย
2. การลดหรือเพิ่มค่าคุณสมบัติแต่ละค่าด้วยค่าคงที่เดียวกัน กการกระจายไม่เปลี่ยนแปลง
3. ลดหรือเพิ่มค่าคุณสมบัติแต่ละค่าตามจำนวนครั้งที่กำหนด เคลดหรือเพิ่มความแปรปรวนตามลำดับตามลำดับ เค 2 ครั้ง ส่วนเบี่ยงเบนมาตรฐาน ใน เคครั้งหนึ่ง.
4. ความแปรปรวนของคุณลักษณะที่สัมพันธ์กับค่าโดยพลการจะมากกว่าความแปรปรวนที่สัมพันธ์กับค่าเฉลี่ยเลขคณิตด้วยกำลังสองของผลต่างระหว่างค่าเฉลี่ยและค่าเฉลี่ยเลขคณิตเสมอ:
ถ้า ก 0 จะได้สมการดังนี้
กล่าวคือ ความแปรปรวนของคุณลักษณะมีค่าเท่ากับความแตกต่างระหว่างค่าเฉลี่ยกำลังสองของค่าคุณลักษณะและกำลังสองของค่าเฉลี่ย
แต่ละคุณสมบัติสามารถใช้เดี่ยวๆ หรือใช้ร่วมกับคุณสมบัติอื่นๆ เมื่อคำนวณความแปรปรวน
ขั้นตอนการคำนวณความแปรปรวนนั้นง่าย:
1) กำหนด ค่าเฉลี่ยเลขคณิต :
2) กำลังสองค่าเฉลี่ยเลขคณิต:
3) ยกกำลังสองส่วนเบี่ยงเบนของตัวแปรแต่ละชุด:
เอ็กซ์ ฉัน 2 .
4) ค้นหาผลรวมของกำลังสองของตัวเลือก:
5) หารผลรวมของตัวเลือกกำลังสองด้วยจำนวน เช่น กำหนดค่าเฉลี่ยกำลังสอง:
6) กำหนดความแตกต่างระหว่างค่าเฉลี่ยกำลังสองของคุณลักษณะและกำลังสองของค่าเฉลี่ย:
ตัวอย่าง 3.1เรามีข้อมูลต่อไปนี้เกี่ยวกับประสิทธิภาพการทำงานของคนงาน:
ลองทำการคำนวณต่อไปนี้:
สำหรับข้อมูลที่จัดกลุ่ม การกระจายสารตกค้าง- ค่าเฉลี่ยของ ความแปรปรวนภายในกลุ่ม:โดยที่ σ 2 j คือความแปรปรวนภายในของกลุ่ม j -th
สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม การกระจายสารตกค้างเป็นการวัดความแม่นยำในการประมาณ เช่น การประมาณเส้นการถดถอยกับข้อมูลเดิม:
โดยที่ y(t) คือการคาดการณ์ตามสมการแนวโน้ม y t – ชุดไดนามิกเริ่มต้น; n คือจำนวนคะแนน p คือจำนวนสัมประสิทธิ์ของสมการถดถอย (จำนวนของตัวแปรอธิบาย)
ในตัวอย่างนี้เรียกว่า การประมาณค่าความแปรปรวนที่เป็นกลาง.
ตัวอย่าง #1 การกระจายคนงานของสามองค์กรของสมาคมเดียวตามประเภทภาษีมีลักษณะดังนี้:
หมวดค่าจ้างคนงาน | จำนวนคนงานในองค์กร | ||
องค์กร 1 | องค์กร 2 | องค์กร 3 | |
1 | 50 | 20 | 40 |
2 | 100 | 80 | 60 |
3 | 150 | 150 | 200 |
4 | 350 | 300 | 400 |
5 | 200 | 150 | 250 |
6 | 150 | 100 | 150 |
กำหนด:
1. การกระจายสำหรับแต่ละองค์กร (การกระจายภายในกลุ่ม);
2. ค่าเฉลี่ยของการกระจายตัวภายในกลุ่ม
3. การกระจายตัวระหว่างกลุ่ม
4. ผลต่างทั้งหมด
สารละลาย.
ก่อนดำเนินการแก้ไขปัญหา จำเป็นต้องค้นหาว่าฟีเจอร์ใดมีประสิทธิภาพและฟีเจอร์ใดแฟกทอเรียล ในตัวอย่างที่กำลังพิจารณา คุณลักษณะที่มีประสิทธิผลคือ "หมวดหมู่อัตราค่าไฟฟ้า" และคุณลักษณะตัวประกอบคือ "หมายเลข (ชื่อ) ขององค์กร"
จากนั้นเรามีสามกลุ่ม (องค์กร) ซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยของกลุ่มและความแปรปรวนภายในกลุ่ม:
บริษัท | ค่าเฉลี่ยกลุ่ม, | ความแปรปรวนภายในกลุ่ม |
1 | 4 | 1,8 |
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม ( การกระจายสารตกค้าง) คำนวณโดยสูตร:
ที่คุณสามารถคำนวณ:
หรือ:
แล้ว:
การกระจายทั้งหมดจะเท่ากับ: s 2 \u003d 1.6 + 0 \u003d 1.6
นอกจากนี้ยังสามารถคำนวณความแปรปรวนทั้งหมดโดยใช้หนึ่งในสองสูตรต่อไปนี้:
เมื่อแก้ปัญหาในทางปฏิบัติ เรามักจะต้องจัดการกับเครื่องหมายที่ใช้ค่าทางเลือกเพียงสองค่า ในกรณีนี้ พวกเขาไม่ได้พูดถึงน้ำหนักของค่าเฉพาะของคุณลักษณะ แต่เกี่ยวกับส่วนแบ่งโดยรวม หากสัดส่วนของหน่วยประชากรที่มีลักษณะตามการศึกษาแสดงด้วย " ร", และไม่ครอบครอง - ผ่าน" ถาม" จากนั้นสามารถคำนวณการกระจายตัวได้ตามสูตร:
s 2 = p×q
ตัวอย่าง #2 จากข้อมูลการพัฒนาคนงานหกคนของกองพล ให้กำหนดความแปรปรวนระหว่างกลุ่มและประเมินผลกระทบของกะงานต่อผลิตภาพแรงงานหากความแปรปรวนทั้งหมดเท่ากับ 12.2
จำนวนกองพลที่ทำงาน | เอาต์พุตการทำงานชิ้น | |
ในกะแรก | ในกะที่ 2 | |
1 | 18 | 13 |
2 | 19 | 14 |
3 | 22 | 15 |
4 | 20 | 17 |
5 | 24 | 16 |
6 | 23 | 15 |
สารละลาย. ข้อมูลเบื้องต้น
เอ็กซ์ | ฉ.1 | f2 | ฉ 3 | f4 | f5 | ฉ.6 | ทั้งหมด |
1 | 18 | 19 | 22 | 20 | 24 | 23 | 126 |
2 | 13 | 14 | 15 | 17 | 16 | 15 | 90 |
ทั้งหมด | 31 | 33 | 37 | 37 | 40 | 38 |
จากนั้นเรามี 6 กลุ่มซึ่งจำเป็นต้องคำนวณค่าเฉลี่ยกลุ่มและความแปรปรวนภายในกลุ่ม
1. หาค่าเฉลี่ยของแต่ละกลุ่ม.
2. หาค่าเฉลี่ยกำลังสองของแต่ละกลุ่ม.
เราสรุปผลการคำนวณในตาราง:
หมายเลขกลุ่ม | ค่าเฉลี่ยของกลุ่ม | ความแปรปรวนภายในกลุ่ม |
1 | 1.42 | 0.24 |
2 | 1.42 | 0.24 |
3 | 1.41 | 0.24 |
4 | 1.46 | 0.25 |
5 | 1.4 | 0.24 |
6 | 1.39 | 0.24 |
3. ความแปรปรวนภายในกลุ่มอธิบายลักษณะการเปลี่ยนแปลง (ความผันแปร) ของลักษณะ (ผลลัพธ์) ที่ศึกษาภายในกลุ่มภายใต้อิทธิพลของปัจจัยทั้งหมด ยกเว้นปัจจัยที่อยู่ภายใต้การจัดกลุ่ม:
เราคำนวณค่าเฉลี่ยของการกระจายภายในกลุ่มโดยใช้สูตร:
4. ความแปรปรวนระหว่างกลุ่มอธิบายลักษณะการเปลี่ยนแปลง (ความแปรปรวน) ของลักษณะ (ผลลัพธ์) ที่ศึกษาภายใต้อิทธิพลของปัจจัย (ลักษณะแฟกทอเรียล) ที่อยู่ภายใต้การจัดกลุ่ม
การกระจายระหว่างกลุ่มหมายถึง:
ที่ไหน
แล้ว
ความแปรปรวนทั้งหมดแสดงลักษณะการเปลี่ยนแปลง (ความแปรปรวน) ของลักษณะ (ผลลัพธ์) ที่ศึกษาภายใต้อิทธิพลของปัจจัยทั้งหมด (ลักษณะแฟกทอเรียล) โดยไม่มีข้อยกเว้น โดยเงื่อนไขของโจทย์จะเท่ากับ 12.2
ความสัมพันธ์เชิงประจักษ์วัดความผันผวนทั้งหมดของแอตทริบิวต์ผลลัพธ์ที่เกิดจากปัจจัยที่ศึกษา นี่คืออัตราส่วนของความแปรปรวนแฟกทอเรียลต่อ ความแปรปรวนทั้งหมด:
เรากำหนดความสัมพันธ์เชิงประจักษ์:
ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ อาจอ่อนแอหรือแข็งแกร่ง (ปิด) เกณฑ์ของพวกเขาได้รับการประเมินในระดับ Chaddock:
0.1 0.3 0.5 0.7 0.9 ในตัวอย่างของเรา ความสัมพันธ์ระหว่างคุณลักษณะ Y ปัจจัย X อ่อนแอ
ค่าสัมประสิทธิ์การกำหนด
มากำหนดค่าสัมประสิทธิ์ของการตัดสินใจ:
ดังนั้น 0.67% ของการเปลี่ยนแปลงเกิดจากความแตกต่างระหว่างลักษณะ และ 99.37% เกิดจากปัจจัยอื่นๆ
บทสรุป: ในกรณีนี้ ผลลัพธ์ของคนงานไม่ได้ขึ้นอยู่กับงานในกะใดกะหนึ่ง เช่น อิทธิพลของการเปลี่ยนแปลงการทำงานต่อผลิตภาพแรงงานนั้นไม่มีนัยสำคัญและเกิดจากปัจจัยอื่นๆ
ตัวอย่าง #3 ขึ้นอยู่กับค่าเฉลี่ย ค่าจ้างและค่าเบี่ยงเบนกำลังสองจากค่าของคนงานสองกลุ่ม ค้นหาความแปรปรวนทั้งหมดโดยใช้กฎสำหรับการเพิ่มความแปรปรวน:
สารละลาย:ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม
การกระจายระหว่างกลุ่มหมายถึง:
ความแปรปรวนทั้งหมดจะเป็น: 480 + 13824 = 14304
อย่างไรก็ตามลักษณะนี้เพียงอย่างเดียวไม่เพียงพอที่จะศึกษา ตัวแปรสุ่ม. ลองนึกภาพนักกีฬาสองคนที่กำลังยิงไปที่เป้าหมาย อันหนึ่งยิงอย่างแม่นยำและเข้าใกล้จุดศูนย์กลาง ส่วนอีกอัน ... แค่สนุกและไม่ได้เล็งด้วยซ้ำ แต่ที่ตลกก็คือ เฉลี่ยผลลัพธ์จะเหมือนกับผู้ยิงคนแรกทุกประการ! สถานการณ์นี้แสดงตามเงื่อนไขโดยตัวแปรสุ่มต่อไปนี้:
ความคาดหวังทางคณิตศาสตร์ "สไนเปอร์" เท่ากับ อย่างไรก็ตาม สำหรับ "บุคคลที่น่าสนใจ": - ก็เป็นศูนย์เช่นกัน!
ดังนั้นจึงจำเป็นต้องคำนวณว่าไกลแค่ไหน กระจัดกระจายสัญลักษณ์แสดงหัวข้อย่อย (ค่าสุ่ม) ที่สัมพันธ์กับศูนย์กลางของเป้าหมาย ( ความคาดหวังทางคณิตศาสตร์). ดีและ กระจัดกระจายแปลจากภาษาละตินเท่านั้นเป็น การกระจายตัว .
มาดูกันว่าลักษณะตัวเลขนี้ถูกกำหนดอย่างไรในตัวอย่างหนึ่งของส่วนที่ 1 ของบทเรียน:
เราพบความคาดหวังทางคณิตศาสตร์ที่น่าผิดหวังของเกมนี้ และตอนนี้เราต้องคำนวณความแปรปรวนของมัน ซึ่ง แสดงผ่าน .
มาดูกันว่าการชนะ/แพ้นั้น "กระจัดกระจาย" แค่ไหนเมื่อเทียบกับค่าเฉลี่ย แน่นอนเราต้องคำนวณสำหรับสิ่งนี้ ความแตกต่างระหว่าง ค่าของตัวแปรสุ่มและเธอ ความคาดหวังทางคณิตศาสตร์:
–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5
ตอนนี้ดูเหมือนว่าจำเป็นต้องสรุปผลลัพธ์ แต่วิธีนี้ไม่ดี - ด้วยเหตุผลที่การแกว่งไปทางซ้ายจะหักล้างกันด้วยการสั่นไปทางขวา ตัวอย่างเช่น นักกีฬา "มือสมัครเล่น" (ตัวอย่างด้านบน)ความแตกต่างจะเป็น และเมื่อเพิ่มเข้าไป พวกเขาจะให้เป็นศูนย์ ดังนั้นเราจะไม่ได้รับค่าประมาณของการกระเจิงของการยิงของเขา
เพื่อหลีกเลี่ยงความรำคาญนี้ให้พิจารณา โมดูลความแตกต่างแต่ เหตุผลทางเทคนิคแนวทางดังกล่าวได้หยั่งรากเมื่อมีการยกกำลังสอง สะดวกกว่าในการจัดเรียงโซลูชันในตาราง:
และนี่คือการคำนวณ ถัวเฉลี่ยถ่วงน้ำหนักค่าของการเบี่ยงเบนกำลังสอง มันคืออะไร? มันเป็นของพวกเขา มูลค่าที่คาดหวังซึ่งเป็นการวัดการกระจาย:
– คำนิยามการกระจายตัว เป็นที่ชัดเจนทันทีจากคำจำกัดความว่า ความแปรปรวนไม่สามารถเป็นค่าลบได้- จดไว้ปฏิบัติ!
มาจำวิธีค้นหาความคาดหวังกันเถอะ คูณผลต่างกำลังสองด้วยความน่าจะเป็นที่สอดคล้องกัน (ความต่อเนื่องของตาราง):
- พูดเปรียบเปรยนี่คือ "แรงฉุด"
และสรุปผล:
คุณไม่คิดว่าเบื้องหลังของการชนะผลลัพธ์ที่ได้จะใหญ่เกินไปเหรอ? ถูกต้อง เรากำลังยกกำลังสอง และเพื่อที่จะกลับไปสู่มิติของเกมของเรา เราต้องแยก รากที่สอง. ค่านี้เรียกว่า ส่วนเบี่ยงเบนมาตรฐาน
และแสดงว่า อักษรกรีก"ซิกม่า":
บางครั้งก็เรียกความหมายนี้ว่า ส่วนเบี่ยงเบนมาตรฐาน .
ความหมายของมันคืออะไร? ถ้าเราเบี่ยงเบนจากความคาดหวังทางคณิตศาสตร์ไปทางซ้ายและทางขวาด้วยส่วนเบี่ยงเบนมาตรฐาน:
– จากนั้นค่าที่เป็นไปได้มากที่สุดของตัวแปรสุ่มจะ "เข้มข้น" ในช่วงเวลานี้ สิ่งที่เราเห็นจริง:
อย่างไรก็ตาม มันเกิดขึ้นในการวิเคราะห์การกระเจิงเกือบทุกครั้งด้วยแนวคิดของการกระจาย มาดูกันว่ามันหมายถึงอะไรเกี่ยวกับเกม หากในกรณีของมือปืนเรากำลังพูดถึง "ความแม่นยำ" ของการยิงที่สัมพันธ์กับศูนย์กลางของเป้าหมาย การกระจายจะแสดงลักษณะสองสิ่งต่อไปนี้:
อย่างแรก เห็นได้ชัดว่าเมื่ออัตราเพิ่มขึ้น ความแปรปรวนก็เพิ่มขึ้นด้วย ตัวอย่างเช่น ถ้าเราเพิ่มขึ้น 10 เท่า ความคาดหวังทางคณิตศาสตร์จะเพิ่มขึ้น 10 เท่า และความแปรปรวนจะเพิ่มขึ้น 100 เท่า (ทันทีที่มันเป็นค่ากำลังสอง). แต่โปรดทราบว่ากฎของเกมไม่มีการเปลี่ยนแปลง! เฉพาะอัตราเท่านั้นที่เปลี่ยนแปลง พูดคร่าวๆ เราเคยเดิมพัน 10 รูเบิล ตอนนี้ 100
ประการที่สองเพิ่มเติม จุดที่น่าสนใจคือความแปรปรวนกำหนดลักษณะของเกม แก้ไขอัตราเกมทางจิตใจ ได้ในระดับหนึ่งและดูว่ามีอะไรอยู่ที่นี่:
เกมที่มีความแปรปรวนต่ำเป็นเกมที่ระมัดระวัง ผู้เล่นมักจะเลือกแผนการที่น่าเชื่อถือที่สุด โดยที่เขาไม่แพ้/ชนะมากเกินไปในคราวเดียว ตัวอย่างเช่น ระบบสีแดง/ดำในรูเล็ต (ดูตัวอย่างที่ 4 ของบทความ ตัวแปรสุ่ม) .
เกมที่มีความแปรปรวนสูง เธอมักจะถูกเรียกว่า การกระจายตัวเกม. นี่คือรูปแบบการเล่นแบบผจญภัยหรือก้าวร้าวที่ผู้เล่นเลือกแผน "อะดรีนาลีน" อย่างน้อยก็จำไว้ "มาร์ติงเกล"ซึ่งจำนวนเงินเดิมพันเป็นลำดับความสำคัญที่มากกว่าเกม "เงียบ" ในย่อหน้าก่อนหน้า
สถานการณ์ในโป๊กเกอร์เป็นสิ่งบ่งชี้: มีสิ่งที่เรียกว่า แน่นผู้เล่นที่มักจะระมัดระวังและ "เขย่า" กับเงินในเกมของพวกเขา (แบ๊งค์). ไม่น่าแปลกใจที่แบ๊งค์ของพวกเขาไม่ผันผวนมากนัก (ความแปรปรวนต่ำ) ในทางกลับกัน หากผู้เล่นมีความแปรปรวนสูง ก็จะเป็นฝ่ายรุกราน เขามักจะเสี่ยง ทำการเดิมพันจำนวนมาก และทั้งคู่สามารถทำลายธนาคารขนาดใหญ่และแตกเป็นชิ้นๆ
สิ่งเดียวกันนี้เกิดขึ้นใน Forex และอื่นๆ - มีตัวอย่างมากมาย
ยิ่งไปกว่านั้น ในทุกกรณี ไม่สำคัญว่าเกมนี้จะมีราคาเพียงเพนนีหรือหลายพันดอลลาร์ ทุกระดับมีผู้เล่นที่มีความแปรปรวนต่ำและสูง สำหรับการชนะโดยเฉลี่ยอย่างที่เราจำได้ "รับผิดชอบ" มูลค่าที่คาดหวัง.
คุณอาจสังเกตเห็นว่าการค้นหาความแปรปรวนเป็นกระบวนการที่ยาวนานและต้องใช้ความอุตสาหะ แต่คณิตศาสตร์นั้นใจกว้าง:
สูตรการหาค่าความแปรปรวน
สูตรนี้ได้มาจากนิยามของความแปรปรวนโดยตรง และเรานำไปใช้ทันที ฉันจะคัดลอกจานด้วยเกมของเราจากด้านบน:
และความคาดหวังที่พบ
เราคำนวณความแปรปรวนด้วยวิธีที่สอง ก่อนอื่น มาหาความคาดหวังทางคณิตศาสตร์ - กำลังสองของตัวแปรสุ่ม โดย ความหมายของความคาดหวังทางคณิตศาสตร์:
ในกรณีนี้:
ดังนั้น ตามสูตร:
อย่างที่พวกเขาพูด รู้สึกถึงความแตกต่าง และแน่นอนว่าในทางปฏิบัติควรใช้สูตร (เว้นแต่เงื่อนไขจะกำหนดไว้เป็นอย่างอื่น)
เราเชี่ยวชาญในเทคนิคการแก้ปัญหาและการออกแบบ:
ตัวอย่างที่ 6
ค้นหาความคาดหวังทางคณิตศาสตร์ ความแปรปรวน และส่วนเบี่ยงเบนมาตรฐาน
งานนี้พบได้ทุกที่และตามกฎแล้วไปโดยไม่มีความหมาย
คุณสามารถจินตนาการถึงหลอดไฟหลายดวงพร้อมตัวเลขที่สว่างขึ้นในโรงบาลที่มีความน่าจะเป็น :)
สารละลาย: สะดวกในการสรุปการคำนวณหลักในตาราง อันดับแรก เราเขียนข้อมูลเริ่มต้นในสองบรรทัดบนสุด จากนั้นเราจะคำนวณผลิตภัณฑ์ จากนั้นและสุดท้ายคือผลรวมในคอลัมน์ด้านขวา:
ที่จริงมีพร้อมเกือบทุกอย่าง ในบรรทัดที่สาม มีการวาดความคาดหวังทางคณิตศาสตร์สำเร็จรูป: .
การกระจายคำนวณโดยสูตร:
และสุดท้าย ค่าเบี่ยงเบนมาตรฐาน:
- โดยส่วนตัวแล้วผมมักจะปัดเศษเป็นทศนิยม 2 ตำแหน่ง
การคำนวณทั้งหมดสามารถทำได้บนเครื่องคิดเลข และดีกว่า - ใน Excel:
มันยากที่จะผิดพลาดที่นี่ :)
คำตอบ:
ผู้ที่ต้องการทำให้ชีวิตของพวกเขาง่ายขึ้นและใช้ประโยชน์จากฉัน เครื่องคิดเลข (การสาธิต)ซึ่งจะไม่เพียงแก้ปัญหาได้ทันที งานนี้แต่ยังสร้าง กราฟิกเฉพาะเรื่อง (มาเร็ว ๆ นี้). โปรแกรมสามารถ ดาวน์โหลดในห้องสมุด– หากคุณดาวน์โหลดสื่อการเรียนรู้อย่างน้อยหนึ่งรายการหรือได้รับ อีกวิธีหนึ่ง. ขอบคุณสำหรับการสนับสนุนโครงการ!
งานสองสามอย่างสำหรับโซลูชันอิสระ:
ตัวอย่างที่ 7
คำนวณความแปรปรวนของตัวแปรสุ่มของตัวอย่างก่อนหน้าตามนิยาม
และตัวอย่างที่คล้ายกัน:
ตัวอย่างที่ 8
ตัวแปรสุ่มแบบไม่ต่อเนื่องถูกกำหนดโดยกฎการกระจายของมันเอง:
ใช่ ค่าของตัวแปรสุ่มอาจมีขนาดค่อนข้างใหญ่ (ตัวอย่างจากงานจริง)และที่นี่ ถ้าเป็นไปได้ ให้ใช้ Excel อย่างไรก็ตามในตัวอย่างที่ 7 นั้นเร็วกว่าเชื่อถือได้และน่าพอใจกว่า
วิธีแก้ไขและคำตอบที่ด้านล่างของหน้า
ในบทสรุปของส่วนที่ 2 ของบทเรียน เราจะวิเคราะห์งานทั่วไปอีกหนึ่งงาน บางคนอาจพูดว่า rebus เล็กๆ:
ตัวอย่างที่ 9
ตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถรับค่าได้เพียงสองค่าเท่านั้น: และ และ ทราบความน่าจะเป็น ความคาดหวังทางคณิตศาสตร์ และความแปรปรวน
สารละลาย: เริ่มจากความน่าจะเป็นที่ไม่รู้จัก เนื่องจากตัวแปรสุ่มสามารถรับได้เพียงสองค่า ดังนั้นผลรวมของความน่าจะเป็นของเหตุการณ์ที่เกี่ยวข้อง:
และตั้งแต่นั้นเป็นต้นมา
มันยังคงค้นหา ... พูดง่าย ๆ :) แต่เอาล่ะมันเริ่มแล้ว ตามคำจำกัดความของความคาดหวังทางคณิตศาสตร์:
- แทนที่ค่าที่ทราบ:
- และไม่มีอะไรสามารถบีบออกจากสมการนี้ได้อีก ยกเว้นว่าคุณสามารถเขียนใหม่ในทิศทางปกติ:
หรือ:
ฉันคิดว่าคุณสามารถเดาได้เกี่ยวกับการดำเนินการเพิ่มเติม มาสร้างและแก้ไขระบบกัน:
ทศนิยม- แน่นอนว่านี่เป็นความอัปยศอย่างสมบูรณ์ คูณสมการทั้งสองด้วย 10:
และหารด้วย 2:
นั่นดีกว่า. จากสมการที่ 1 เราแสดง:
(นี่เป็นวิธีที่ง่ายกว่า)- แทนที่ในสมการที่ 2:
เรากำลังสร้าง กำลังสองและทำให้ง่ายขึ้น:
เราคูณด้วย:
ผลที่ตามมา, สมการกำลังสองค้นหาการเลือกปฏิบัติ:
- ยอดเยี่ยม!
และเราได้คำตอบสองทาง:
1) ถ้า , ที่ ;
2) ถ้า , ที่ .
ค่าคู่แรกเป็นไปตามเงื่อนไข ด้วยความเป็นไปได้สูงทุกอย่างถูกต้อง แต่อย่างไรก็ตามเราเขียนกฎการกระจาย:
และทำการตรวจสอบ กล่าวคือ ค้นหาความคาดหวัง:
ควบคู่ไปกับการศึกษาความแปรผันของลักษณะเฉพาะของประชากรทั้งหมดโดยรวม มักจำเป็นต้องติดตามการเปลี่ยนแปลงเชิงปริมาณของลักษณะในกลุ่มที่ประชากรถูกแบ่ง เช่นเดียวกับระหว่างกลุ่ม การศึกษาความแปรผันนี้ทำได้โดยการคำนวณและการวิเคราะห์ ชนิดต่างๆการกระจายตัว
แยกความแตกต่างระหว่างการกระจายทั้งหมด ระหว่างกลุ่ม และภายในกลุ่ม.
ผลต่างทั้งหมด σ 2วัดความผันแปรของคุณลักษณะของประชากรทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้
ความแปรปรวนระหว่างกลุ่ม (δ) แสดงลักษณะการแปรผันอย่างเป็นระบบ เช่น ความแตกต่างในขนาดของลักษณะที่ศึกษาซึ่งเกิดขึ้นภายใต้อิทธิพลของปัจจัยลักษณะที่อยู่ภายใต้การจัดกลุ่ม คำนวณโดยสูตร:
.
ความแปรปรวนภายในกลุ่ม (σ)สะท้อนถึงการเปลี่ยนแปลงแบบสุ่ม เช่น ส่วนหนึ่งของความผันแปรที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่ได้นับและไม่ขึ้นอยู่กับปัจจัยลักษณะที่อยู่ภายใต้การจัดกลุ่ม คำนวณโดยสูตร:
.
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม: .
มีกฎหมายเชื่อมโยงการแพร่กระจาย 3 ประเภท ความแปรปรวนทั้งหมดเท่ากับผลรวมของค่าเฉลี่ยของกลุ่มภายในและ ความแปรปรวนระหว่างกลุ่ม: .
อัตราส่วนนี้เรียกว่า กฎการบวกผลต่าง.
ในการวิเคราะห์ มีการใช้การวัดกันอย่างแพร่หลาย ซึ่งเป็นสัดส่วนของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด มันมีชื่อ ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด (η 2): .
รากที่สองของค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดเรียกว่า อัตราส่วนสหสัมพันธ์เชิงประจักษ์ (η):
.
มันแสดงลักษณะอิทธิพลของแอตทริบิวต์ที่อยู่ภายใต้การจัดกลุ่มต่อการเปลี่ยนแปลงของแอตทริบิวต์ที่เป็นผลลัพธ์ อัตราส่วนสหสัมพันธ์เชิงประจักษ์แตกต่างกันไปตั้งแต่ 0 ถึง 1
มาแสดงกันเถอะ ใช้งานได้จริงในตัวอย่างต่อไปนี้ (ตารางที่ 1)
ตัวอย่าง #1 ตารางที่ 1 - ผลิตภาพแรงงานของคนงานสองกลุ่มในหนึ่งในการประชุมเชิงปฏิบัติการของ NPO "Cyclone"
คำนวณผลรวมและค่าเฉลี่ยของกลุ่มและความแปรปรวน:ข้อมูลเริ่มต้นสำหรับการคำนวณค่าเฉลี่ยของการกระจายภายในกลุ่มและระหว่างกลุ่มแสดงไว้ในตาราง 2.
ตารางที่ 2
การคำนวณและ δ 2 สำหรับคนทำงานสองกลุ่ม
กลุ่มคนงาน | จำนวนคนงานต่อคน | ค่าเฉลี่ย det./กะ | การกระจายตัว |
ผ่านการฝึกอบรมทางเทคนิค | 5 | 95 | 42,0 |
ไม่ได้รับการฝึกฝนทางเทคนิค | 5 | 81 | 231,2 |
คนงานทั้งหมด | 10 | 88 | 185,6 |
.
ความแปรปรวนระหว่างกลุ่ม
ความแปรปรวนทั้งหมด:
ดังนั้น อัตราส่วนสหสัมพันธ์เชิงประจักษ์: .
นอกเหนือจากการเปลี่ยนแปลงของลักษณะเชิงปริมาณแล้ว ยังสามารถสังเกตการเปลี่ยนแปลงของลักษณะเชิงคุณภาพได้อีกด้วย การศึกษาความแปรผันนี้ทำได้โดยการคำนวณความแปรปรวนประเภทต่างๆ ต่อไปนี้:
ความแปรปรวนภายในกลุ่มของส่วนแบ่งถูกกำหนดโดยสูตร
ที่ไหน ฉัน– จำนวนหน่วยในกลุ่มแยกสัดส่วนของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร:
การกระจายทั้งสามประเภทมีความสัมพันธ์กันดังนี้:
.
อัตราส่วนของความแปรปรวนนี้เรียกว่าทฤษฎีบทการบวกความแปรปรวนแบบแบ่งคุณลักษณะ