การประเมินนัยสำคัญทางสถิติของสมการถดถอยและพารามิเตอร์ต่างๆ การประเมินความสำคัญของสมการถดถอยและค่าสัมประสิทธิ์
หลังจากประเมินนัยสำคัญทางสถิติส่วนบุคคลของสัมประสิทธิ์การถดถอยแต่ละรายการแล้ว โดยปกติจะมีการวิเคราะห์นัยสำคัญโดยรวมของสัมประสิทธิ์ดังกล่าว เช่น สมการทั้งหมดโดยรวม การวิเคราะห์นี้ดำเนินการบนพื้นฐานของการทดสอบสมมติฐานเกี่ยวกับความสำคัญทั่วไปของสมมติฐานเกี่ยวกับความเสมอภาคพร้อมกันถึงศูนย์ของสัมประสิทธิ์การถดถอยทั้งหมดสำหรับตัวแปรอธิบาย:
ชม 0: ข 1 = ข 2 = ... = ข ม. = 0
หากสมมติฐานนี้ไม่ถูกปฏิเสธ ก็จะสรุปได้ว่าอิทธิพลสะสมของตัวแปรอธิบาย m ทั้งหมด X 1, X 2, ..., X m ของแบบจำลองบนตัวแปรตาม Y ถือว่าไม่มีนัยสำคัญทางสถิติ และคุณภาพโดยรวม ของสมการถดถอยถือว่าต่ำ
สมมติฐานนี้ได้รับการทดสอบตาม การวิเคราะห์ความแปรปรวนการเปรียบเทียบความแปรปรวนที่อธิบายและความแปรปรวนคงเหลือ
H 0: (ความแปรปรวนอธิบาย) = (ความแปรปรวนคงเหลือ)
H 1: (ความแปรปรวนแบบอธิบาย) > (ความแปรปรวนคงเหลือ)
สร้างสถิติ F:
ที่ไหน – ความแปรปรวนอธิบายโดยการถดถอย
– การกระจายตัวของสารตกค้าง (ผลรวมของการเบี่ยงเบนกำลังสองหารด้วยจำนวนองศาอิสระ n-m-1) เมื่อเป็นไปตามสมมติฐานของ OLS สถิติ F ที่สร้างขึ้นจะมีการแจกแจงแบบฟิชเชอร์โดยมีดีกรีอิสระ n1 = m, n2 = n–m–1 ดังนั้น หาก F สังเกตที่ระดับนัยสำคัญที่ต้องการ > F a ; ม.; n - m -1 = F a (โดยที่ F a ; m ; n - m -1 เป็นจุดวิกฤตของการแจกแจงแบบฟิชเชอร์) จากนั้น H 0 จะถูกปฏิเสธไปแทน H 1 ซึ่งหมายความว่าความแปรปรวนที่อธิบายโดยการถดถอยมีค่ามากกว่าความแปรปรวนที่เหลืออย่างมีนัยสำคัญ ดังนั้น สมการการถดถอยจึงค่อนข้างสะท้อนถึงพลวัตของการเปลี่ยนแปลงในตัวแปรตาม Y ในเชิงคุณภาพ ถ้า F สังเกต< F a ; m ; n - m -1 = F кр. , то нет основания для отклонения Н 0 . Значит, объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами. Это дает основание считать, что совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество модели невысоко.
อย่างไรก็ตาม ในทางปฏิบัติ แทนที่จะใช้สมมติฐานนี้ สมมติฐานที่เกี่ยวข้องอย่างใกล้ชิดเกี่ยวกับนัยสำคัญทางสถิติของสัมประสิทธิ์การกำหนด R2 มักถูกทดสอบมากกว่า:
ชม 0: ร 2 > 0
เพื่อทดสอบสมมติฐานนี้ จะใช้สถิติ F ต่อไปนี้:
. (8.20)
ค่าของ F หากเป็นไปตามสมมติฐานของ OLS และหาก H 0 เป็นจริง จะมีการกระจายตัวแบบฟิชเชอร์คล้ายกับการกระจายตัวของสถิติ F (8.19) อันที่จริง การหารทั้งเศษและส่วนของเศษส่วนใน (8.19) ด้วยผลรวมของส่วนเบี่ยงเบนยกกำลังสอง และรู้ว่ามันแบ่งออกเป็นผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอยและผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง (ซึ่งเป็นผลตามมาของระบบสมการปกติดังที่จะแสดงในภายหลัง)
,
เราได้รับสูตร (8.20):
จาก (8.20) เห็นได้ชัดว่าเลขชี้กำลัง F และ R 2 เท่ากันหรือไม่เท่ากับศูนย์ในเวลาเดียวกัน ถ้า F = 0 ดังนั้น R 2 = 0 และเส้นการถดถอย Y = เป็นค่าที่ดีที่สุดตามกำลังสองน้อยที่สุด ดังนั้นค่าของ Y จึงไม่ขึ้นอยู่กับ X 1, X 2, ..., X m เป็นเส้นตรง . เพื่อทดสอบสมมติฐานว่าง H 0: F = 0 ที่ระดับนัยสำคัญ a ค่าวิกฤต F cr = F a จะพบได้จากตารางจุดวิกฤตของการแจกแจงแบบฟิชเชอร์ ม.; n - m -1 . สมมติฐานว่างจะถูกปฏิเสธถ้า F > F cr นี่เทียบเท่ากับข้อเท็จจริงที่ว่า R 2 > 0 เช่น R 2 มีนัยสำคัญทางสถิติ
การวิเคราะห์สถิติ F ช่วยให้เราสามารถสรุปได้ว่าเพื่อที่จะยอมรับสมมติฐานที่ว่าสัมประสิทธิ์ทั้งหมดมีค่าเท่ากับศูนย์พร้อมกัน การถดถอยเชิงเส้นค่าสัมประสิทธิ์การกำหนด R2 ไม่ควรแตกต่างอย่างมีนัยสำคัญจากศูนย์ ค่าวิกฤตของมันจะลดลงเมื่อจำนวนการสังเกตเพิ่มขึ้นและอาจมีขนาดเล็กลงโดยพลการ
ตัวอย่างเช่น เมื่อประมาณค่าการถดถอยด้วยตัวแปรอธิบายสองตัว X 1 i, X 2 i สำหรับการสังเกต 30 ครั้ง R 2 = 0.65 แล้ว
ยอด = =25.07.
จากการใช้ตารางจุดวิกฤติของการแจกแจงฟิชเชอร์ เราจะพบว่า F 0.05; 2; 27 = 3.36; ฉ 0.01; 2; 27 = 5.49. เนื่องจาก F สังเกต = 25.07 > F cr ทั้งที่ 5% และที่ระดับนัยสำคัญ 1% สมมติฐานว่างจึงถูกปฏิเสธในทั้งสองกรณี
หากในสถานการณ์เดียวกัน R 2 = 0.4 แสดงว่า
F obs = = 9
ข้อสันนิษฐานที่ว่าความสัมพันธ์ไม่มีนัยสำคัญก็ถูกปฏิเสธที่นี่เช่นกัน
โปรดทราบว่าในกรณีของการถดถอยแบบคู่ การทดสอบสมมติฐานว่างสำหรับสถิติ F จะเทียบเท่ากับการทดสอบสมมติฐานว่างสำหรับสถิติ t
ค่าสัมประสิทธิ์สหสัมพันธ์ ในกรณีนี้ สถิติ F จะเท่ากับสถิติ t กำลังสอง ค่าสัมประสิทธิ์ R2 ได้รับนัยสำคัญอย่างเป็นอิสระในกรณีของการถดถอยเชิงเส้นพหุคูณ
8.6. การวิเคราะห์ความแปรปรวนเพื่อแยกผลรวมของการเบี่ยงเบนกำลังสอง องศาอิสระสำหรับผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน
ลองใช้ทฤษฎีที่อธิบายไว้ข้างต้นกับการถดถอยเชิงเส้นแบบคู่
หลังจากพบสมการการถดถอยเชิงเส้นแล้ว จะมีการประเมินความสำคัญของทั้งสมการโดยรวมและพารามิเตอร์แต่ละตัว
ความสำคัญของสมการการถดถอยโดยรวมได้รับการประเมินโดยใช้การทดสอบ Fisher F ในกรณีนี้ มีการเสนอสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยเท่ากับศูนย์ นั่นคือ b = 0 ดังนั้นตัวประกอบ x จึงไม่ส่งผลต่อผลลัพธ์ y
การคำนวณโดยตรงของการทดสอบ F นำหน้าด้วยการวิเคราะห์ความแปรปรวน สถานที่ศูนย์กลางในนั้นถูกครอบครองโดยการสลายตัวของผลรวมของการเบี่ยงเบนกำลังสองของตัวแปร y จากค่าเฉลี่ยออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":
สมการ (8.21) เป็นผลมาจากระบบสมการปกติที่ได้มาจากหัวข้อใดหัวข้อหนึ่งก่อนหน้านี้
หลักฐานการแสดงออก (8.21)
ยังคงต้องพิสูจน์ว่าเทอมสุดท้ายมีค่าเท่ากับศูนย์
หากคุณบวกสมการทั้งหมดตั้งแต่ 1 ถึง n
y i = a+b×x i +e i , (8.22)
จากนั้นเราจะได้ åy i = a×å1+b×åx i +åe i เนื่องจาก åe i =0 และ å1 =n เราจึงได้
แล้ว .
ถ้าเราลบสมการ (8.23) ออกจากนิพจน์ (8.22) เราจะได้
เป็นผลให้เราได้รับ
ผลรวมสุดท้ายเท่ากับศูนย์เนื่องจากระบบสมการปกติสองสมการ
ผลรวมของการเบี่ยงเบนกำลังสองของแต่ละค่าของคุณลักษณะที่มีประสิทธิผล y จากค่าเฉลี่ยนั้นเกิดจากอิทธิพลของเหตุผลหลายประการ ให้เราแบ่งเหตุผลทั้งชุดอย่างมีเงื่อนไขออกเป็นสองกลุ่ม: ปัจจัยที่ศึกษา x และปัจจัยอื่นๆ หากปัจจัยไม่มีอิทธิพลใดๆ ต่อผลลัพธ์ เส้นการถดถอยจะขนานกับ OX และแกน จากนั้นความแปรปรวนทั้งหมดของลักษณะผลลัพธ์นั้นเกิดจากอิทธิพลของปัจจัยอื่น ๆ และผลรวมของการเบี่ยงเบนกำลังสองจะตรงกับค่าคงเหลือ หากปัจจัยอื่นไม่ส่งผลต่อผลลัพธ์ y จะสัมพันธ์กับ x และผลรวมที่เหลือของกำลังสองจะเป็นศูนย์ ในกรณีนี้ ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอยเกิดขึ้นพร้อมกับผลรวมของกำลังสองทั้งหมด
เนื่องจากไม่ใช่ทุกจุดของสนามความสัมพันธ์จะอยู่บนเส้นถดถอย การกระจัดกระจายจึงเกิดขึ้นเสมอเนื่องจากอิทธิพลของปัจจัย x กล่าวคือ การถดถอยของ y บน x และเกิดจากสาเหตุอื่น (ความแปรผันที่ไม่สามารถอธิบายได้) ความเหมาะสมของเส้นการถดถอยสำหรับการทำนายขึ้นอยู่กับความแปรผันรวมในลักษณะ y ที่เกิดจากความแปรผันที่อธิบายไว้ แน่นอนว่า หากผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอยมากกว่าผลรวมที่เหลือของกำลังสอง สมการการถดถอยจะมีนัยสำคัญทางสถิติ และตัวประกอบ x มีผลกระทบอย่างมีนัยสำคัญต่อคุณลักษณะ y นี่เทียบเท่ากับความจริงที่ว่าค่าสัมประสิทธิ์ความมุ่งมั่นจะเข้าใกล้ความสามัคคี
ผลรวมของกำลังสองสัมพันธ์กับจำนวนองศาอิสระ (df – องศาอิสระ) กับจำนวนอิสระของการแปรผันอย่างอิสระของคุณลักษณะ จำนวนระดับความเป็นอิสระสัมพันธ์กับจำนวนหน่วยประชากร n และจำนวนค่าคงที่ที่กำหนดจากมัน ในความสัมพันธ์กับปัญหาที่กำลังศึกษาอยู่ จำนวนดีกรีอิสระควรแสดงจำนวนค่าเบี่ยงเบนอิสระจากค่าที่เป็นไปได้ n ค่าที่จำเป็นเพื่อสร้างผลรวมของกำลังสองที่กำหนด ดังนั้น สำหรับผลรวมของกำลังสองทั้งหมด จำเป็นต้องมีการเบี่ยงเบนอิสระ (n-1) เนื่องจากในชุดที่มี n หน่วย หลังจากคำนวณค่าเฉลี่ยแล้ว จำนวนการเบี่ยงเบนเพียง (n-1) เท่านั้นที่จะแปรผันอย่างอิสระ ตัวอย่างเช่น เรามีชุดของค่า y: 1,2,3,4,5 ค่าเฉลี่ยของพวกเขาคือ 3 และจากนั้น n ส่วนเบี่ยงเบนจากค่าเฉลี่ยจะเป็น: -2, -1, 0, 1, 2 เนื่องจาก มีการเบี่ยงเบนเพียงสี่ค่าเท่านั้นที่แตกต่างกันอย่างอิสระและสามารถระบุค่าเบี่ยงเบนที่ห้าได้หากทราบสี่ค่าก่อนหน้านี้ .
เมื่อคำนวณผลรวมอธิบายหรือตัวประกอบของกำลังสอง ใช้ค่าทางทฤษฎี (คำนวณ) ของคุณลักษณะผลลัพธ์
จากนั้นผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอยเชิงเส้นจะเท่ากับ
เนื่องจากสำหรับปริมาตรของการสังเกตใน x และ y ผลรวมตัวประกอบของกำลังสองในการถดถอยเชิงเส้นจะขึ้นอยู่กับค่าคงที่การถดถอย b เท่านั้น ผลรวมของกำลังสองนี้มีระดับความอิสระเพียงระดับเดียวเท่านั้น
มีความเท่าเทียมกันระหว่างจำนวนองศาอิสระของผลรวม ตัวประกอบ และผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง จำนวนองศาอิสระของผลรวมที่เหลือของกำลังสองในการถดถอยเชิงเส้นคือ n-2 จำนวนองศาอิสระของผลรวมของกำลังสองทั้งหมดถูกกำหนดโดยจำนวนหน่วยของลักษณะตัวแปร และเนื่องจากเราใช้ค่าเฉลี่ยที่คำนวณจากข้อมูลตัวอย่าง เราจึงสูญเสียอิสระหนึ่งระดับ นั่นคือ ผลรวม df = น–1
ดังนั้นเราจึงมีความเท่าเทียมกันสองประการ:
เมื่อหารผลรวมของกำลังสองแต่ละค่าด้วยจำนวนองศาอิสระที่สอดคล้องกัน เราจะได้ค่ากำลังสองเฉลี่ยของส่วนเบี่ยงเบน หรือซึ่งเท่ากันคือการกระจายตัวต่อระดับอิสระ D หนึ่งระดับ
;
;
.
การกำหนดความแปรปรวนด้วยอิสระระดับหนึ่งจะทำให้ความแปรปรวนมีรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือต่อระดับความเป็นอิสระ เราจะได้ค่าของการทดสอบ Fisher F
โดยที่เกณฑ์ F สำหรับทดสอบสมมติฐานว่าง H 0: D fact = D ส่วนที่เหลือ
หากสมมติฐานว่างเป็นจริง ปัจจัยและความแปรปรวนคงเหลือจะไม่แตกต่างกัน สำหรับ H 0 จำเป็นต้องมีการพิสูจน์เพื่อให้การกระจายตัวของปัจจัยเกินการกระจายตัวของสารตกค้างหลายครั้ง Snedecor นักสถิติชาวอังกฤษพัฒนาตารางค่าวิกฤตของอัตราส่วน F ที่ระดับนัยสำคัญต่างๆ ของสมมติฐานว่างและระดับความเป็นอิสระต่างๆ ค่าตารางของการทดสอบ F คือค่าสูงสุดของอัตราส่วนของความแปรปรวนที่สามารถเกิดขึ้นได้หากพวกมันเบี่ยงเบนแบบสุ่ม ระดับนี้ความน่าจะเป็นที่จะมีสมมติฐานว่าง ค่าอัตราส่วน F ที่คำนวณได้จะถือว่าเชื่อถือได้หากมากกว่าค่าในตาราง ถ้า F ข้อเท็จจริง > ตาราง F ดังนั้นสมมติฐานว่าง H 0: D fact = D ที่เหลือเกี่ยวกับการไม่มีการเชื่อมต่อระหว่างคุณลักษณะถูกปฏิเสธและมีการสรุปข้อสรุปเกี่ยวกับความสำคัญของการเชื่อมต่อนี้
ถ้า F เป็นข้อเท็จจริง< F табл, то вероятность нулевой гипотезы H 0: D факт = D ост выше заданного уровня (например, 0,05) и она не может быть отклонена без серьёзного риска сделать ข้อสรุปที่ผิดเกี่ยวกับการมีอยู่ของการเชื่อมต่อ ในกรณีนี้ สมการการถดถอยถือว่าไม่มีนัยสำคัญทางสถิติ สมมติฐาน H 0 จะไม่ถูกปฏิเสธ
ในตัวอย่างนี้จากบทที่ 3:
= 131200 -7*144002 = 30400 – ผลรวมของกำลังสอง;
1,057.878*(135.43-7*(3.92571) 2) = 28979.8 – ผลรวมตัวประกอบของกำลังสอง;
=30400-28979.8 = 1420.197 – ผลรวมที่เหลือของกำลังสอง
ความจริง = 28979.8;
ส่วนที่เหลือ = 1420.197/(n-2) = 284.0394;
ข้อเท็จจริง F =28979.8/284.0394 = 102.0274;
ฉ =0.05; 2; 5 =6.61; ฉ =0.01; 2; 5 = 16.26.
เนื่องจากข้อเท็จจริง F > ตาราง F ที่ระดับนัยสำคัญทั้ง 1% และ 5% เราสามารถสรุปได้ว่าสมการการถดถอยมีความสำคัญ (ความสัมพันธ์ได้รับการพิสูจน์แล้ว)
ค่าของการทดสอบ F สัมพันธ์กับค่าสัมประสิทธิ์การตัดสินใจ ผลรวมตัวประกอบของการเบี่ยงเบนกำลังสองสามารถแสดงได้เป็น
,
และผลรวมที่เหลือของกำลังสองเท่ากับ
.
จากนั้นค่าของการทดสอบ F สามารถแสดงเป็น
.
การประเมินนัยสำคัญการถดถอยมักจะได้รับในรูปแบบของการวิเคราะห์ตารางความแปรปรวน
แหล่งที่มาของการเปลี่ยนแปลง | จำนวนองศาความเป็นอิสระ | ผลรวมของการเบี่ยงเบนกำลังสอง | การกระจายตัวต่อระดับความเป็นอิสระ | อัตราส่วน F | |
แท้จริง | แบบตารางที่ a=0.05 | ||||
ทั่วไป | |||||
อธิบาย | 28979,8 | 28979,8 | 102,0274 | 6,61 | |
สารตกค้าง | 1420,197 | 284,0394 | ค่าของมันถูกเปรียบเทียบกับค่าตารางที่ระดับนัยสำคัญที่แน่นอน α และจำนวนองศาอิสระ (n-2)
การทดสอบขั้นสุดท้ายทางเศรษฐมิติ
1. ประเมินความสำคัญของพารามิเตอร์ของสมการถดถอยตาม:
A) t - การทดสอบของนักเรียน;
b) การทดสอบฟิชเชอร์ – สนีเดคคอร์ F;
c) หมายถึงค่าคลาดเคลื่อนกำลังสอง;
ช) ข้อผิดพลาดโดยเฉลี่ยการประมาณ
2. ค่าสัมประสิทธิ์การถดถอยในสมการที่แสดงความสัมพันธ์ระหว่างปริมาณผลิตภัณฑ์ที่ขาย (ล้านรูเบิล) และกำไรของผู้ประกอบการอุตสาหกรรมยานยนต์สำหรับปี (ล้านรูเบิล) หมายความว่าเมื่อปริมาณผลิตภัณฑ์ที่ขายเพิ่มขึ้น 1 ล้านรูเบิล กำไรเพิ่มขึ้นโดย:
ง) 0.5 ล้าน ถู.;
ค) 500,000 ถู.;
D) 1.5 ล้านรูเบิล
3. อัตราส่วนสหสัมพันธ์ (ดัชนีสหสัมพันธ์) วัดระดับความใกล้ชิดของการเชื่อมต่อระหว่าง X และย:
ก) มีรูปแบบการพึ่งพาแบบไม่เชิงเส้นเท่านั้น
B) สำหรับการเสพติดทุกรูปแบบ;
c) เฉพาะเมื่อเท่านั้น การพึ่งพาเชิงเส้น.
4. ตามทิศทางของการสื่อสารมีดังนี้:
ก) ปานกลาง;
ข) ตรง;
ค) ตรง
5. จากการสังเกต 17 ครั้ง จึงมีการสร้างสมการถดถอย:
.
เราคำนวณเพื่อตรวจสอบความสำคัญของสมการค่าที่สังเกตได้ที- สถิติ: 3.9. บทสรุป:
A) สมการนี้มีนัยสำคัญสำหรับ a = 0,05;
b) สมการไม่มีนัยสำคัญที่ a = 0.01;
c) สมการไม่มีนัยสำคัญที่ a = 0.05
6. อะไรคือผลที่ตามมาของการละเมิดสมมติฐานของ OLS “ความคาดหวังทางคณิตศาสตร์ของการถดถอยคงเหลือเป็นศูนย์”?
A) การประมาณค่าสัมประสิทธิ์การถดถอยแบบเอนเอียง
b) การประมาณค่าสัมประสิทธิ์การถดถอยที่มีประสิทธิผลแต่ไม่สอดคล้องกัน
c) การประมาณค่าสัมประสิทธิ์การถดถอยที่ไม่มีประสิทธิผล
d) การประมาณค่าสัมประสิทธิ์การถดถอยไม่สอดคล้องกัน
7. ข้อความใดต่อไปนี้เป็นจริงหากสารตกค้างเป็นแบบเฮเทอโรซิดาสติก
A) ข้อสรุปจากสถิติ t และ F ไม่น่าเชื่อถือ
d) การประมาณพารามิเตอร์สมการถดถอยมีความเอนเอียง
8. การทดสอบมีพื้นฐานมาจากอะไร? ความสัมพันธ์อันดับสเปียร์แมน?
ก) การใช้ t – สถิติ;
ค) ใช้งานอยู่ ;
9. การทดสอบความขาวมีพื้นฐานมาจากอะไร?
b) การใช้สถิติ F
ข) ใช้งานอยู่ ;
d) ในการวิเคราะห์เชิงกราฟของสารตกค้าง
10. วิธีใดสามารถใช้เพื่อกำจัดความสัมพันธ์อัตโนมัติได้?
11. การละเมิดสมมติฐานของความแปรปรวนคงที่ของสารตกค้างเรียกว่าอะไร?
ก) ความเป็นหลายเส้นตรง;
b) ความสัมพันธ์อัตโนมัติ;
B) ความต่างกัน;
d) ความเป็นเนื้อเดียวกัน
12. ป้อนตัวแปรจำลองลงใน:
ก) เฉพาะในโมเดลเชิงเส้นเท่านั้น
b) เฉพาะในการถดถอยแบบไม่เชิงเส้นพหุคูณเท่านั้น
c) เฉพาะในรูปแบบที่ไม่เชิงเส้นเท่านั้น
D) ทั้งแบบจำลองเชิงเส้นและไม่เชิงเส้นลดลงเป็นรูปแบบเชิงเส้น
13. หากมีค่าสัมประสิทธิ์สหสัมพันธ์ในเมทริกซ์
แล้วสิ่งนี้บ่งชี้ว่า:
A) เกี่ยวกับการมีอยู่ของความหลากหลาย
b) เกี่ยวกับการขาด multicollinearity;
c) เกี่ยวกับการมีอยู่ของความสัมพันธ์อัตโนมัติ
d) เกี่ยวกับการไม่มีความแตกต่าง
14. มาตรการใดที่ไม่สามารถใช้กำจัด multicollinearity ได้?
ก) การเพิ่มขนาดตัวอย่าง
D) การเปลี่ยนแปลงขององค์ประกอบแบบสุ่ม
15. ถ้า
และอันดับของเมทริกซ์ A น้อยกว่า (K-1) จะได้สมการดังนี้
ก) มีการระบุตัวตนมากเกินไป;
B) ไม่ปรากฏชื่อ;
c) ระบุอย่างถูกต้อง
16. สมการถดถอยมีรูปแบบดังนี้
ก)
;
ข)
;
วี)
.
17.การระบุรุ่นมีปัญหาอะไร?
A) การได้รับพารามิเตอร์ที่กำหนดไว้ไม่ซ้ำกันของแบบจำลองที่ระบุโดยระบบสมการพร้อมกัน
b) การเลือกและการใช้วิธีการสำหรับการประมาณค่าทางสถิติของพารามิเตอร์แบบจำลองที่ไม่รู้จักโดยใช้ข้อมูลทางสถิติเริ่มต้น
c) การตรวจสอบความเพียงพอของแบบจำลอง
18. วิธีใดใช้ในการประมาณค่าพารามิเตอร์ของสมการที่ระบุมากเกินไป?
B) DMNK, CMNK;
19. ถ้าตัวแปรเชิงคุณภาพมีเคค่าทางเลือก จากนั้นสิ่งต่อไปนี้จะถูกใช้ในการสร้างแบบจำลอง:
A) (k-1) ตัวแปรจำลอง;
b) ตัวแปร kdummy;
c) (k+1) ตัวแปรจำลอง
20. การวิเคราะห์ความใกล้ชิดและทิศทางของการเชื่อมต่อระหว่างสองลักษณะจะดำเนินการบนพื้นฐานของ:
ก) สัมประสิทธิ์สหสัมพันธ์คู่;
b) สัมประสิทธิ์การตัดสินใจ;
c) สัมประสิทธิ์สหสัมพันธ์พหุคูณ
21. ในสมการเชิงเส้น x = ก 0 +ก 1 x ค่าสัมประสิทธิ์การถดถอยแสดง:
ก) ความใกล้ชิดของการสื่อสาร
b) สัดส่วนของความแปรปรวน "Y" ขึ้นอยู่กับ "X";
C) “Y” จะเปลี่ยนแปลงโดยเฉลี่ยเท่าใดเมื่อ “X” เปลี่ยนแปลงไปหนึ่งหน่วย
d) ข้อผิดพลาดของสัมประสิทธิ์สหสัมพันธ์
22. ตัวบ่งชี้ใดที่ใช้ในการกำหนดส่วนของการเปลี่ยนแปลงเนื่องจากการเปลี่ยนแปลงค่าของปัจจัยที่กำลังศึกษา?
ก) สัมประสิทธิ์ของการแปรผัน;
b) สัมประสิทธิ์สหสัมพันธ์;
B) สัมประสิทธิ์การตัดสินใจ;
d) ค่าสัมประสิทธิ์ความยืดหยุ่น
23. ค่าสัมประสิทธิ์ความยืดหยุ่นแสดง:
A) ค่าของ y จะเปลี่ยนไปกี่% เมื่อ x เปลี่ยนแปลง 1%;
b) โดยจำนวนหน่วยการวัดค่า y จะเปลี่ยนเมื่อ x เปลี่ยนแปลง 1%;
c) ค่า y จะเปลี่ยนไปกี่เปอร์เซ็นต์เมื่อ x เปลี่ยนตามหน่วย มิติของมัน
24. วิธีการใดบ้างที่สามารถใช้เพื่อตรวจจับความแตกต่างได้?
A) การทดสอบ Golfeld-Quandt;
B) การทดสอบความสัมพันธ์อันดับของสเปียร์แมน
ค) การทดสอบเดอร์บิน-วัตสัน
25. การทดสอบ Holfeld-Quandt มีพื้นฐานมาจากอะไร?
ก) การใช้สถิติที
B) การใช้ F – สถิติ;
ค) ใช้งานอยู่ ;
d) ในการวิเคราะห์เชิงกราฟของสารตกค้าง
26. วิธีใดที่ไม่สามารถใช้เพื่อกำจัดความสัมพันธ์อัตโนมัติของสารตกค้างได้?
ก) วิธีการทั่วไป กำลังสองน้อยที่สุด;
B) วิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก
C) วิธีความน่าจะเป็นสูงสุด
D) วิธีกำลังสองน้อยที่สุดแบบสองขั้นตอน
27. การละเมิดสมมติฐานความเป็นอิสระของสารตกค้างเรียกว่าอะไร?
ก) ความเป็นหลายเส้นตรง;
B) ความสัมพันธ์อัตโนมัติ;
c) ความต่างกัน;
d) ความเป็นเนื้อเดียวกัน
28. วิธีใดที่สามารถใช้ในการกำจัดความแตกต่างได้?
A) วิธีกำลังสองน้อยที่สุดทั่วไป
b) วิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก
ค) วิธีความน่าจะเป็นสูงสุด
d) วิธีกำลังสองน้อยที่สุดแบบสองขั้นตอน
30. ถ้าตามที-เกณฑ์ ค่าสัมประสิทธิ์การถดถอยส่วนใหญ่มีนัยสำคัญทางสถิติและเป็นแบบจำลองโดยรวมเอฟ- เกณฑ์ไม่มีนัยสำคัญซึ่งอาจบ่งชี้ว่า:
ก) ความเป็นหลายเส้นตรง
B) เกี่ยวกับความสัมพันธ์อัตโนมัติของสารตกค้าง
c) ในเรื่องความไม่สมดุลของสารตกค้าง
d) ตัวเลือกนี้เป็นไปไม่ได้
31. เป็นไปได้ไหมที่จะกำจัด multicollinearity โดยใช้การแปลงตัวแปร?
ก) มาตรการนี้จะมีผลก็ต่อเมื่อขนาดตัวอย่างเพิ่มขึ้น
32. ใช้วิธีใดในการหาค่าประมาณของพารามิเตอร์ของสมการการถดถอยเชิงเส้น:
ก) วิธีกำลังสองน้อยที่สุด;
ข) การวิเคราะห์ความสัมพันธ์และการถดถอย
c) การวิเคราะห์ความแปรปรวน
33. มีการสร้างสมการการถดถอยเชิงเส้นพหุคูณพร้อมตัวแปรจำลอง หากต้องการตรวจสอบความสำคัญของสัมประสิทธิ์แต่ละรายการ ให้ใช้ การกระจาย:
ก) ปกติ;
b) การทดสอบของนักเรียน
ค) เพียร์สัน;
ง) ฟิสเชอร์-สเนเดคอร์
34. ถ้า
และอันดับของเมทริกซ์ A มากกว่า (K-1) ดังนั้นสมการคือ:
ก) มีการระบุตัวตนมากเกินไป;
b) ไม่ปรากฏชื่อ;
c) ระบุอย่างถูกต้อง
35. ในการประมาณค่าพารามิเตอร์ของระบบสมการที่ระบุอย่างแม่นยำ จะใช้สิ่งต่อไปนี้:
ก) DMNK, CMNK;
b) DMNK, MNK, CMNK;
36. หลักเกณฑ์ของ Chow ขึ้นอยู่กับการประยุกต์ใช้:
ก) F - สถิติ;
b) เสื้อ - สถิติ;
c) เกณฑ์ Durbin-Watson
37. ตัวแปรจำลองสามารถรับค่าต่อไปนี้:
d) ค่าใด ๆ
39. จากการสังเกต 20 ครั้ง สมการการถดถอยได้ถูกสร้างขึ้น:
.
เพื่อตรวจสอบความสำคัญของสมการ ค่าของสถิติจะถูกคำนวณ:4.2. ข้อสรุป:
ก) สมการนี้มีนัยสำคัญที่ a=0.05;
b) สมการไม่มีนัยสำคัญที่ a=0.05;
c) สมการไม่มีนัยสำคัญที่ a=0.01
40. ข้อความใดต่อไปนี้ไม่ถูกต้องเมื่อสารตกค้างเป็นแบบเฮเทอโรซิดาสติก?
ก) ข้อสรุปจากสถิติ t และ F ไม่น่าเชื่อถือ
b) Heteroscedasticity แสดงออกผ่านค่าต่ำของสถิติ Durbin-Watson
c) ด้วยความแตกต่างที่แตกต่างกัน การประมาณการยังคงมีผล;
d) การประมาณการมีอคติ
41. การทดสอบ Chow ขึ้นอยู่กับการเปรียบเทียบ:
ก) ความแปรปรวน;
b) สัมประสิทธิ์การตัดสินใจ;
c) ความคาดหวังทางคณิตศาสตร์
ง) เฉลี่ย
42. ถ้าอยู่ในแบบทดสอบเชาเชา
ถือว่า:
A) แนะนำให้แบ่งพาร์ติชันออกเป็นช่วงย่อยจากมุมมองของการปรับปรุงคุณภาพของแบบจำลอง
b) แบบจำลองไม่มีนัยสำคัญทางสถิติ
c) แบบจำลองมีนัยสำคัญทางสถิติ
d) ไม่มีประโยชน์ที่จะแยกตัวอย่างออกเป็นส่วน ๆ
43. ตัวแปรจำลองคือตัวแปร:
ก) คุณภาพสูง;
ข) สุ่ม;
B) เชิงปริมาณ;
ง) ตรรกะ
44. วิธีใดต่อไปนี้ไม่สามารถใช้ตรวจจับความสัมพันธ์อัตโนมัติได้?
ก) วิธีอนุกรม
b) การทดสอบเดอร์บิน-วัตสัน;
c) การทดสอบความสัมพันธ์อันดับของสเปียร์แมน
D) การทดสอบของไวท์
45. รูปแบบโครงสร้างที่ง่ายที่สุดของแบบจำลองคือ:
ก)
ข)
วี)
ช)
.
46. มาตรการใดที่สามารถใช้เพื่อกำจัด multicollinearity?
ก) การเพิ่มขนาดตัวอย่าง
b) การแยกตัวแปรที่มีความสัมพันธ์สูงกับตัวแปรอื่น ๆ
c) การเปลี่ยนแปลงข้อกำหนดของแบบจำลอง
d) การเปลี่ยนแปลงขององค์ประกอบแบบสุ่ม
47. ถ้า
และอันดับของเมทริกซ์ A คือ (K-1) ดังนั้นสมการคือ:
ก) มีการระบุตัวตนมากเกินไป;
b) ไม่ปรากฏชื่อ;
B) ระบุอย่างถูกต้อง;
48. โมเดลจะได้รับการพิจารณาหาก:
ก) ในสมการของแบบจำลองนั้นมีสมการปกติอย่างน้อยหนึ่งอัน
B) แต่ละสมการของระบบสามารถระบุได้
c) ในสมการแบบจำลองมีอย่างน้อยหนึ่งสมการที่ไม่ปรากฏชื่อ
d) ในบรรดาสมการแบบจำลองนั้นมีอย่างน้อยหนึ่งสมการที่ระบุมากเกินไป
49. ใช้วิธีใดในการประมาณค่าพารามิเตอร์ของสมการที่ไม่ปรากฏหลักฐาน?
ก) DMNK, CMNK;
b) DMNK, MNK;
C) ไม่สามารถประมาณพารามิเตอร์ของสมการดังกล่าวได้
50. เศรษฐมิติเกิดขึ้นที่จุดเชื่อมต่อของความรู้ด้านใด:
ก) ทฤษฎีเศรษฐศาสตร์ สถิติทางเศรษฐกิจและคณิตศาสตร์
ข) ทฤษฎีเศรษฐศาสตร์ สถิติทางคณิตศาสตร์ และทฤษฎีความน่าจะเป็น
ค) สถิติเศรษฐศาสตร์และคณิตศาสตร์ ทฤษฎีความน่าจะเป็น
51. ในสมการการถดถอยเชิงเส้นพหุคูณ ช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์การถดถอยจะถูกสร้างขึ้นโดยใช้การแจกแจง:
ก) ปกติ;
ข) นักเรียน;
ค) เพียร์สัน;
ง) ฟิสเชอร์-สเนเดคอร์
52. จากการสังเกต 16 ครั้ง สมการการถดถอยเชิงเส้นคู่ได้ถูกสร้างขึ้น สำหรับทดสอบความสำคัญของสัมประสิทธิ์การถดถอยที่คำนวณได้ที สำหรับ 6l =2.5.
ก) ค่าสัมประสิทธิ์ไม่มีนัยสำคัญที่ a=0.05;
b) ค่าสัมประสิทธิ์มีนัยสำคัญที่ a=0.05;
c) ค่าสัมประสิทธิ์มีนัยสำคัญที่ a=0.01
53. เป็นที่รู้กันว่าระหว่างปริมาณเอ็กซ์และยมีอยู่จริงการเชื่อมต่อเชิงบวก ขนาดไหนพบค่าสัมประสิทธิ์สหสัมพันธ์คู่หรือไม่?
ก) จาก -1 ถึง 0;
ข) จาก 0 ถึง 1;
B) จาก –1 ถึง 1
54. ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณคือ 0.9 เปอร์เซ็นต์เท่าไรความแปรปรวนของลักษณะผลลัพธ์นั้นอธิบายได้ด้วยอิทธิพลของทุกคนสัญญาณปัจจัย?
55. วิธีใดต่อไปนี้ไม่สามารถใช้ในการตรวจจับความแตกต่างได้?
A) การทดสอบ Golfeld-Quandt;
b) การทดสอบความสัมพันธ์อันดับของสเปียร์แมน
c) วิธีอนุกรม
56. รูปแบบที่ลดลงของแบบจำลองคือ:
ก) ระบบฟังก์ชันไม่เชิงเส้นของตัวแปรภายนอกจากฟังก์ชันภายนอก
B) ระบบฟังก์ชันเชิงเส้นของตัวแปรภายนอกจากตัวแปรภายนอก
c) ระบบฟังก์ชันเชิงเส้นของตัวแปรภายนอกจากฟังก์ชันภายนอก
d) ระบบสมการปกติ
57. ค่าสัมประสิทธิ์สหสัมพันธ์บางส่วนที่คำนวณโดยใช้สูตรแบบเรียกซ้ำเปลี่ยนแปลงภายในขอบเขตเท่าใด
ก) จาก - ถึง + ;
ข) จาก 0 ถึง 1;
c) จาก 0 ถึง + ;
ง) จาก –1 ถึง +1
58. ค่าสัมประสิทธิ์สหสัมพันธ์บางส่วนที่คำนวณผ่านค่าสัมประสิทธิ์การกำหนดเปลี่ยนแปลงภายในขอบเขตเท่าใด
ก) จาก - ถึง + ;
B) จาก 0 ถึง 1;
c) จาก 0 ถึง + ;
ง) จาก –1 ถึง +1
59. ตัวแปรภายนอก:
ก) ตัวแปรตาม;
B) ตัวแปรอิสระ
61. เมื่อบวกปัจจัยอธิบายอีกตัวหนึ่งในสมการการถดถอย ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณจะเป็น:
ก) จะลดลง;
ข) จะเพิ่มขึ้น;
c) จะคงความหมายไว้
62. มีการสร้างสมการการถดถอยไฮเปอร์โบลิก:ย= ก+ ข/ เอ็กซ์- สำหรับเพื่อตรวจสอบความสำคัญของสมการ จะใช้การแจกแจง:
ก) ปกติ;
ข) นักเรียน;
ค) เพียร์สัน;
ง) ฟิสเชอร์-สเนเดคอร์
63. ระบบประเภทใดที่สามารถหาพารามิเตอร์ของสมการทางเศรษฐมิติแต่ละรายการโดยใช้วิธีกำลังสองน้อยที่สุดแบบดั้งเดิมได้
ก) ระบบสมการปกติ
B) ระบบสมการอิสระ
C) ระบบสมการแบบเรียกซ้ำ
D) ระบบสมการที่พึ่งพาซึ่งกันและกัน
64. ตัวแปรภายนอก:
ก) ตัวแปรตาม;
ข) ตัวแปรอิสระ
c) ลงวันที่ไปยังจุดก่อนหน้าของเวลา
65. ค่าสัมประสิทธิ์การตัดสินใจเปลี่ยนแปลงภายในขอบเขตเท่าใด?
ก) จาก 0 ถึง + ;
ข) จาก - ถึง + ;
B) จาก 0 ถึง +1;
d) จาก -l ถึง +1
66. มีการสร้างสมการถดถอยเชิงเส้นพหุคูณแล้ว หากต้องการตรวจสอบความสำคัญของสัมประสิทธิ์แต่ละรายการ ให้ใช้ การกระจาย:
ก) ปกติ;
b) การทดสอบของนักเรียน
ค) เพียร์สัน;
D) ฟิสเชอร์-สเนเดคอร์
67. เมื่อเพิ่มปัจจัยอธิบายอื่นลงในสมการการถดถอย ค่าสัมประสิทธิ์การกำหนด:
ก) จะลดลง;
B) จะเพิ่มขึ้น;
c) จะคงความหมายไว้;
d) จะไม่ลดลง
68. สาระสำคัญของวิธีกำลังสองน้อยที่สุดคือ:
A) การประมาณการถูกกำหนดจากเงื่อนไขในการลดผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลตัวอย่างจากการประมาณการที่กำหนด
b) การประมาณการถูกกำหนดจากเงื่อนไขในการลดผลรวมของการเบี่ยงเบนของข้อมูลตัวอย่างจากการประมาณการที่กำหนด
c) การประมาณถูกกำหนดจากเงื่อนไขในการลดผลรวมของส่วนเบี่ยงเบนกำลังสองของค่าเฉลี่ยตัวอย่างจากความแปรปรวนตัวอย่าง
69. พาราโบลาอยู่ในประเภทใดของการถดถอยแบบไม่เชิงเส้น:
73. เส้นโค้งเอ็กซ์โปเนนเชียลอยู่ในคลาสของการถดถอยแบบไม่เชิงเส้น:
74. ฟังก์ชั่นของรูปแบบ ŷ อยู่ในคลาสใดของการถดถอยแบบไม่เชิงเส้น?
:
A) การถดถอยที่ไม่เชิงเส้นตามตัวแปรที่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นตามพารามิเตอร์ที่ประมาณไว้
b) การถดถอยแบบไม่เชิงเส้นของพารามิเตอร์ที่ประมาณไว้
78. ฟังก์ชั่นของรูปแบบ ŷ อยู่ในคลาสใดของการถดถอยแบบไม่เชิงเส้น?
:
ก) การถดถอยที่ไม่เป็นเชิงเส้นเกี่ยวกับตัวแปรที่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นตามพารามิเตอร์ที่ประมาณไว้
B) การถดถอยแบบไม่เชิงเส้นของพารามิเตอร์โดยประมาณ
79. ในสมการการถดถอยในรูปของไฮเปอร์โบลา ŷ
ถ้าค่าข
>0
, ที่:
A) ด้วยการเพิ่มลักษณะของปัจจัย เอ็กซ์ค่าแอตทริบิวต์ผลลัพธ์ ที่ลดลงอย่างช้าๆ และด้วย x→∞ค่าเฉลี่ย ที่จะเท่ากัน ก;
b) จากนั้นค่าของเครื่องหมายผลลัพธ์ ที่เพิ่มขึ้นพร้อมกับการเติบโตที่ช้าเมื่อลักษณะของปัจจัยเพิ่มขึ้น เอ็กซ์และที่ x→∞
81. ค่าสัมประสิทธิ์ความยืดหยุ่นถูกกำหนดโดยสูตร
ก) ฟังก์ชันเชิงเส้น
ข) พาราโบลา;
c) อติพจน์;
ง) เส้นโค้งเอ็กซ์โปเนนเชียล
จ) พลังงาน
82. ค่าสัมประสิทธิ์ความยืดหยุ่นถูกกำหนดโดยสูตร
สำหรับโมเดลการถดถอยในรูปแบบ:
ก) ฟังก์ชันเชิงเส้น
B) พาราโบลา;
c) อติพจน์;
ง) เส้นโค้งเอ็กซ์โปเนนเชียล
จ) พลังงาน
86. สมการ
เรียกว่า:
ก) แนวโน้มเชิงเส้น
b) แนวโน้มพาราโบลา;
c) แนวโน้มการผ่อนชำระ;
d) แนวโน้มแบบเอ็กซ์โปเนนเชียล
89. สมการ
เรียกว่า:
ก) แนวโน้มเชิงเส้น
b) แนวโน้มพาราโบลา;
c) แนวโน้มการผ่อนชำระ;
D) แนวโน้มแบบเอ็กซ์โปเนนเชียล
90. ประเภทของระบบ เรียกว่า:
ก) ระบบสมการอิสระ
b) ระบบสมการเวียนเกิด
c) ระบบสมการที่พึ่งพาซึ่งกันและกัน (ร่วม, พร้อมกัน)
93. เศรษฐมิติสามารถกำหนดได้เป็น:
A) เป็นวินัยทางวิทยาศาสตร์อิสระที่รวมชุดของผลลัพธ์ทางทฤษฎี เทคนิค วิธีการ และแบบจำลองที่ออกแบบมาเพื่อ บนพื้นฐานของทฤษฎีเศรษฐศาสตร์ สถิติทางเศรษฐศาสตร์ และเครื่องมือทางคณิตศาสตร์และสถิติ ให้การแสดงออกเชิงปริมาณเฉพาะกับรูปแบบทั่วไป (เชิงคุณภาพ) กำหนดโดยทฤษฎีเศรษฐศาสตร์
B) ศาสตร์แห่งการวัดทางเศรษฐศาสตร์
B) การวิเคราะห์ทางสถิติของข้อมูลทางเศรษฐกิจ
94. งานของเศรษฐมิติ ได้แก่ :
A) การคาดการณ์ตัวบ่งชี้ทางเศรษฐกิจและเศรษฐกิจสังคมที่แสดงถึงสถานะและการพัฒนาของระบบที่วิเคราะห์
B) การจำลองสถานการณ์ที่เป็นไปได้สำหรับการพัฒนาเศรษฐกิจและสังคมของระบบเพื่อระบุว่าการเปลี่ยนแปลงตามแผนในพารามิเตอร์ที่ควบคุมได้บางอย่างจะส่งผลต่อคุณลักษณะผลลัพธ์อย่างไร
c) การทดสอบสมมติฐานโดยใช้ข้อมูลทางสถิติ
95. ความสัมพันธ์มีความโดดเด่นตามธรรมชาติ:
ก) การทำงานและความสัมพันธ์;
b) การทำงาน เส้นโค้ง และเส้นตรง;
c) ความสัมพันธ์และการผกผัน;
d) เชิงสถิติและโดยตรง
96. เกี่ยวข้องโดยตรงกับการเพิ่มขึ้นของลักษณะปัจจัย:
ก) สัญญาณที่มีประสิทธิภาพลดลง;
b) สัญญาณผลลัพธ์ไม่เปลี่ยนแปลง
C) สัญญาณที่มีประสิทธิภาพเพิ่มขึ้น
97. ใช้วิธีใดในการระบุการมีอยู่ ลักษณะ และทิศทางของความสัมพันธ์ในสถิติ?
ก) ค่าเฉลี่ย;
B) การเปรียบเทียบอนุกรมแบบขนาน
C) วิธีการจัดกลุ่มเชิงวิเคราะห์
d) ค่าสัมพัทธ์;
D) วิธีกราฟิก
98. วิธีการใดที่ใช้ในการระบุรูปแบบของอิทธิพลของปัจจัยหนึ่งต่ออีกปัจจัยหนึ่ง?
ก) การวิเคราะห์ความสัมพันธ์
B) การวิเคราะห์การถดถอย;
ค) การวิเคราะห์ดัชนี
d) การวิเคราะห์ความแปรปรวน
99. วิธีใดที่ใช้ในการหาปริมาณความเข้มแข็งของอิทธิพลของปัจจัยหนึ่งต่ออีกปัจจัยหนึ่ง:
ก) การวิเคราะห์ความสัมพันธ์
ข) การวิเคราะห์การถดถอย
c) วิธีการหาค่าเฉลี่ย
d) การวิเคราะห์ความแปรปรวน
100. มีตัวบ่งชี้อะไรบ้างในแง่ของมูลค่าตั้งแต่ลบถึงบวกหนึ่ง:
ก) สัมประสิทธิ์การตัดสินใจ;
b) ความสัมพันธ์สหสัมพันธ์;
ใน) ค่าสัมประสิทธิ์เชิงเส้นความสัมพันธ์
101. ค่าสัมประสิทธิ์การถดถอยสำหรับแบบจำลองปัจจัยเดียวแสดง:
A) ฟังก์ชันเปลี่ยนกี่หน่วยเมื่ออาร์กิวเมนต์เปลี่ยนไปหนึ่งหน่วย
b) ฟังก์ชันเปลี่ยนแปลงกี่เปอร์เซ็นต์ต่อการเปลี่ยนแปลงหน่วยในการโต้แย้ง
102. ค่าสัมประสิทธิ์ความยืดหยุ่นแสดง:
ก) ฟังก์ชันเปลี่ยนแปลงเป็นเปอร์เซ็นต์เมื่อมีการเปลี่ยนแปลงอาร์กิวเมนต์หนึ่งหน่วยของการวัด
B) ฟังก์ชันเปลี่ยนแปลงกี่เปอร์เซ็นต์โดยมีการเปลี่ยนแปลงอาร์กิวเมนต์ 1%;
c) โดยจำนวนหน่วยการวัดที่ฟังก์ชันเปลี่ยนแปลงโดยมีการเปลี่ยนแปลงอาร์กิวเมนต์ 1%
105. ค่าดัชนีสหสัมพันธ์เท่ากับ 0.087 หมายถึง:
A) เกี่ยวกับการพึ่งพาอาศัยกันที่อ่อนแอ;
b) เกี่ยวกับความสัมพันธ์อันแน่นแฟ้น;
c) เกี่ยวกับข้อผิดพลาดในการคำนวณ
107. ค่าสัมประสิทธิ์สหสัมพันธ์ของคู่เท่ากับ 1.12 หมายถึง:
ก) เกี่ยวกับการพึ่งพาอาศัยกันที่อ่อนแอ;
b) เกี่ยวกับความสัมพันธ์อันแน่นแฟ้น;
C) เกี่ยวกับข้อผิดพลาดในการคำนวณ
109. ตัวเลขใดต่อไปนี้สามารถเป็นค่าของสัมประสิทธิ์สหสัมพันธ์คู่ได้:
111. ตัวเลขใดต่อไปนี้สามารถเป็นค่าของสัมประสิทธิ์สหสัมพันธ์พหุคูณได้:
115. ทำเครื่องหมายรูปร่างที่ถูกต้อง สมการเชิงเส้นการถดถอย:
ก) ซ
;
โดย
;
ค) ซ
;
ง) ซ
.
การประเมินความสำคัญของสมการ การถดถอยหลายครั้ง
การสร้างสมการถดถอยเชิงประจักษ์คือ ระยะเริ่มแรกการวิเคราะห์ทางเศรษฐมิติ สมการการถดถอยแรกสุดที่สร้างขึ้นจากตัวอย่างไม่ค่อยน่าพอใจในแง่ของคุณลักษณะบางอย่าง ดังนั้น งานที่สำคัญที่สุดถัดไปของการวิเคราะห์ทางเศรษฐมิติคือการตรวจสอบคุณภาพของสมการถดถอย ในทางเศรษฐมิติ มีการใช้รูปแบบที่เป็นที่ยอมรับสำหรับการตรวจสอบดังกล่าว
ดังนั้น การตรวจสอบคุณภาพทางสถิติของสมการการถดถอยโดยประมาณจึงดำเนินการในพื้นที่ต่อไปนี้:
· การตรวจสอบความสำคัญของสมการถดถอย
· การตรวจสอบนัยสำคัญทางสถิติของสัมประสิทธิ์สมการถดถอย
· การตรวจสอบคุณสมบัติของข้อมูล ความเป็นไปได้ที่สันนิษฐานไว้เมื่อประมาณสมการ (การตรวจสอบความเป็นไปได้ของสถานที่ OLS)
การทดสอบความสำคัญของสมการการถดถอยพหุคูณ รวมถึงการถดถอยแบบคู่ ดำเนินการโดยใช้การทดสอบฟิชเชอร์ ในกรณีนี้ (ไม่เหมือนกับการถดถอยแบบคู่) จะมีการหยิบยกสมมติฐานว่างขึ้นมา เอช 0ว่าสัมประสิทธิ์การถดถอยทั้งหมดเท่ากับศูนย์ ( ข 1=0, ข 2=0, … , ข ม=0) เกณฑ์ฟิชเชอร์ถูกกำหนดโดยสูตรต่อไปนี้:
ที่ไหน ดีข้อเท็จจริง - ความแปรปรวนของปัจจัยที่อธิบายโดยการถดถอยต่อเสรีภาพหนึ่งระดับ ดี ost - การกระจายตัวของสารตกค้างต่อระดับเสรีภาพ ร 2- สัมประสิทธิ์การตัดสินใจพหุคูณ; ต เอ็กซ์ในสมการการถดถอย (ในการถดถอยเชิงเส้นคู่ ต= 1); พี -จำนวนการสังเกต
ค่า F-test ที่ได้จะถูกนำมาเปรียบเทียบกับค่าตารางที่ระดับนัยสำคัญที่แน่นอน หากค่าจริงมากกว่าค่าตาราง แสดงว่าสมมุติฐาน แต่ความไม่สำคัญของสมการการถดถอยถูกปฏิเสธ และสมมติฐานทางเลือกเกี่ยวกับนัยสำคัญทางสถิติได้รับการยอมรับ
เมื่อใช้เกณฑ์ฟิชเชอร์ คุณสามารถประเมินความสำคัญของไม่เพียงแต่สมการถดถอยโดยรวมเท่านั้น แต่ยังรวมถึงความสำคัญของการรวมแต่ละปัจจัยเพิ่มเติมในแบบจำลองด้วย การประเมินดังกล่าวมีความจำเป็นเพื่อไม่ให้โหลดแบบจำลองด้วยปัจจัยที่ไม่ส่งผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ นอกจากนี้ เนื่องจากแบบจำลองประกอบด้วยปัจจัยหลายประการ จึงสามารถนำเข้าแบบจำลองในลำดับที่ต่างกันได้ และเนื่องจากมีความสัมพันธ์กันระหว่างปัจจัยต่างๆ ความสำคัญของการรวมปัจจัยเดียวกันในแบบจำลองอาจแตกต่างกันไปขึ้นอยู่กับลำดับที่ มีการนำปัจจัยต่างๆ เข้ามาเกี่ยวข้อง
เพื่อประเมินความสำคัญของการรวมปัจจัยเพิ่มเติมในแบบจำลอง จะมีการคำนวณเกณฑ์ฟิชเชอร์บางส่วน ฟกซี่.ขึ้นอยู่กับการเปรียบเทียบการเพิ่มขึ้นของความแปรปรวนของปัจจัยเนื่องจากการรวมปัจจัยเพิ่มเติมในแบบจำลองกับความแปรปรวนคงเหลือต่อความอิสระหนึ่งระดับสำหรับการถดถอยโดยรวม ดังนั้นสูตรการคำนวณ การทดสอบ F ส่วนตัวสำหรับตัวประกอบจะมีรูปแบบดังนี้
ที่ไหน R 2 yx 1 x 2… x… xp -ค่าสัมประสิทธิ์การกำหนดพหุคูณสำหรับโมเดลแบบเต็มชุด nปัจจัย - R 2 ปีx 1 x 2… x ผม -1 x ผม +1… xp- ค่าสัมประสิทธิ์ของการตัดสินใจพหุคูณสำหรับแบบจำลองที่ไม่รวมปัจจัย x ฉัน;n- จำนวนการสังเกต ต- จำนวนพารามิเตอร์สำหรับปัจจัย xในสมการถดถอย
ค่าที่แท้จริงของการทดสอบบางส่วนของฟิชเชอร์จะถูกนำไปเปรียบเทียบกับค่าในตารางที่ระดับนัยสำคัญ 0.05 หรือ 0.1 และจำนวนองศาอิสระที่สอดคล้องกัน ถ้าตามมูลค่าจริง ฟ ซีเกิน เอฟ โต๊ะจากนั้นจึงรวมปัจจัยเพิ่มเติม x ฉันลงในแบบจำลองนั้นมีความสมเหตุสมผลทางสถิติ และค่าสัมประสิทธิ์การถดถอย "บริสุทธิ์" ข ฉันที่ปัจจัย x ฉันมีนัยสำคัญทางสถิติ ถ้า ฟ ซีน้อย เอฟ โต๊ะจากนั้นการรวมปัจจัยเพิ่มเติมในแบบจำลองจะไม่เพิ่มส่วนแบ่งของความแปรผันที่อธิบายไว้ในผลลัพธ์อย่างมีนัยสำคัญ ใช่ดังนั้นการรวมไว้ในแบบจำลองจึงไม่สมเหตุสมผล ค่าสัมประสิทธิ์การถดถอยสำหรับปัจจัยนี้ในกรณีนี้ไม่มีนัยสำคัญทางสถิติ
เมื่อใช้การทดสอบบางส่วนของฟิชเชอร์ คุณสามารถทดสอบความสำคัญของสัมประสิทธิ์การถดถอยทั้งหมดภายใต้สมมติฐานว่าแต่ละปัจจัยที่สอดคล้องกัน x ฉันถูกป้อนลงในสมการการถดถอยพหุคูณเป็นลำดับสุดท้าย และปัจจัยอื่นๆ ทั้งหมดรวมอยู่ในแบบจำลองก่อนหน้านี้แล้ว
การประเมินความสำคัญของสัมประสิทธิ์การถดถอย "บริสุทธิ์" ข ฉันโดย การทดสอบของนักเรียนสามารถดำเนินการได้โดยไม่ต้องคำนวณส่วนตัว เอฟ-เกณฑ์. ในกรณีนี้ เช่นเดียวกับการถดถอยแบบคู่ สูตรจะถูกนำไปใช้กับแต่ละปัจจัย
เสื้อ ไบ = ข ผม / ม. ไบ ,
ที่ไหน ข ฉัน- สัมประสิทธิ์ของการถดถอย "บริสุทธิ์" พร้อมตัวประกอบ x ฉัน ; ม บี- ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย ข ฉัน .
คุณสามารถตรวจสอบความสำคัญของพารามิเตอร์สมการถดถอยได้โดยใช้สถิติแบบ t
ออกกำลังกาย:
สำหรับกลุ่มองค์กรที่ผลิตผลิตภัณฑ์ประเภทเดียวกัน ฟังก์ชันต้นทุนจะได้รับการพิจารณา:
y = α + βx;
y = α x β ;
y = α β x ;
y = α + β / x;
โดยที่ y คือต้นทุนการผลิตพันหน่วย
x คือผลผลิตการผลิต, พันหน่วย
ที่จำเป็น:
1. สร้างสมการการถดถอยแบบคู่ y จาก x:
- เชิงเส้น;
- พลัง;
- สาธิต;
- ไฮเปอร์โบลาด้านเท่ากันหมด
3. ประเมินนัยสำคัญทางสถิติของสมการถดถอยโดยรวม
4. ประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์
5. ดำเนินการคาดการณ์ต้นทุนการผลิตโดยมีผลผลิตคาดการณ์ 195% ของระดับเฉลี่ย
6. ประเมินความถูกต้องแม่นยำของการพยากรณ์ คำนวณความคลาดเคลื่อนของการคาดการณ์และผลของมัน ช่วงความมั่นใจ.
7. ประเมินแบบจำลองโดยใช้ความคลาดเคลื่อนโดยเฉลี่ยของการประมาณ
สารละลาย:
1. สมการคือ y = α + βx
1. พารามิเตอร์สมการถดถอย
ค่าเฉลี่ย
การกระจายตัว
ส่วนเบี่ยงเบนมาตรฐาน
ค่าสัมประสิทธิ์สหสัมพันธ์
ความสัมพันธ์ระหว่างคุณลักษณะ Y และปัจจัย X นั้นแข็งแกร่งและตรงไปตรงมา
สมการถดถอย
ค่าสัมประสิทธิ์การตัดสินใจ
R 2 = 0.94 2 = 0.89 เช่น ใน 88.9774% ของกรณี การเปลี่ยนแปลงใน x นำไปสู่การเปลี่ยนแปลงใน y กล่าวอีกนัยหนึ่ง ความแม่นยำในการเลือกสมการถดถอยมีสูง
x | ย | x2 | คุณ 2 | x∙y | ใช่(x) | (ปปป) 2 | (ป-ป(x)) 2 | (x-x น) 2 |
78 | 133 | 6084 | 17689 | 10374 | 142.16 | 115.98 | 83.83 | 1 |
82 | 148 | 6724 | 21904 | 12136 | 148.61 | 17.9 | 0.37 | 9 |
87 | 134 | 7569 | 17956 | 11658 | 156.68 | 95.44 | 514.26 | 64 |
79 | 154 | 6241 | 23716 | 12166 | 143.77 | 104.67 | 104.67 | 0 |
89 | 162 | 7921 | 26244 | 14418 | 159.9 | 332.36 | 4.39 | 100 |
106 | 195 | 11236 | 38025 | 20670 | 187.33 | 2624.59 | 58.76 | 729 |
67 | 139 | 4489 | 19321 | 9313 | 124.41 | 22.75 | 212.95 | 144 |
88 | 158 | 7744 | 24964 | 13904 | 158.29 | 202.51 | 0.08 | 81 |
73 | 152 | 5329 | 23104 | 11096 | 134.09 | 67.75 | 320.84 | 36 |
87 | 162 | 7569 | 26244 | 14094 | 156.68 | 332.36 | 28.33 | 64 |
76 | 159 | 5776 | 25281 | 12084 | 138.93 | 231.98 | 402.86 | 9 |
115 | 173 | 13225 | 29929 | 19895 | 201.86 | 854.44 | 832.66 | 1296 |
0 | 0 | 0 | 16.3 | 20669.59 | 265.73 | 6241 | ||
1027 | 1869 | 89907 | 294377 | 161808 | 1869 | 25672.31 | 2829.74 | 8774 |
หมายเหตุ: ค่าของ y(x) พบได้จากสมการถดถอยผลลัพธ์:
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
... ... ...
2. การประมาณค่าพารามิเตอร์สมการถดถอย
ความสำคัญของสัมประสิทธิ์สหสัมพันธ์
ใช้ตารางของนักเรียนเราจะพบ Ttable
ตาราง T (n-m-1;α/2) = (11;0.05/2) = 1.796
เนื่องจาก Tob > Ttabl เราปฏิเสธสมมติฐานที่ว่าค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0 กล่าวอีกนัยหนึ่ง ค่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญทางสถิติ
การวิเคราะห์ความแม่นยำในการประมาณค่าสัมประสิทธิ์การถดถอย
ส=0.1712
ช่วงความเชื่อมั่นสำหรับตัวแปรตาม
ให้เราคำนวณขอบเขตของช่วงเวลาที่ 95% ของค่าที่เป็นไปได้ของ Y จะเข้มข้นด้วยการสังเกตไม่ จำกัด จำนวนและ X = 1
(-20.41;56.24)
การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิ์ของสมการการถดถอยเชิงเส้น
1) สถิติ t
นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย a ได้รับการยืนยันแล้ว
นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย b ไม่ได้รับการยืนยัน
ช่วงความมั่นใจสำหรับสัมประสิทธิ์สมการถดถอย
ให้เรากำหนดช่วงความเชื่อมั่นของสัมประสิทธิ์การถดถอยซึ่งมีความน่าเชื่อถือ 95% จะเป็นดังนี้:
(ก - เสื้อ ส ก ; ก + เสื้อ ส ก)
(1.306;1.921)
(ข - t ข S ข ; ข + t ข ข)
(-9.2733;41.876)
โดยที่ t = 1.796
2) สถิติ F
เอฟเคพี = 4.84
เนื่องจาก F > Fkp สัมประสิทธิ์การตัดสินใจจึงมีนัยสำคัญทางสถิติ
หัวข้อ 4 วิธีการทางสถิติสำหรับการศึกษาความสัมพันธ์
สมการถดถอย -นี่คือการนำเสนอเชิงวิเคราะห์ของการพึ่งพาสหสัมพันธ์ สมการการถดถอยอธิบายความสัมพันธ์เชิงฟังก์ชันสมมุติระหว่างค่าเฉลี่ยแบบมีเงื่อนไขของคุณลักษณะผลลัพธ์กับค่าของคุณลักษณะ - ปัจจัย (ปัจจัย) เช่น แนวโน้มหลักของการติดยาเสพติด
การพึ่งพาสหสัมพันธ์แบบคู่อธิบายได้ด้วยสมการถดถอยแบบคู่ และการพึ่งพาสหสัมพันธ์แบบพหุอธิบายโดยสมการถดถอยแบบพหุคูณ
คุณลักษณะผลลัพธ์ในสมการการถดถอยคือตัวแปรตาม (การตอบสนอง ตัวแปรอธิบาย) และคุณลักษณะตัวประกอบคือตัวแปรอิสระ (อาร์กิวเมนต์ ตัวแปรอธิบาย)
สมการการถดถอยที่ง่ายที่สุดคือสมการของการพึ่งพาเชิงเส้นคู่:
โดยที่ y เป็นตัวแปรตาม (แอตทริบิวต์-ผลลัพธ์) x – ตัวแปรอิสระ (ปัจจัยลักษณะ) และ – พารามิเตอร์ของสมการถดถอย - ข้อผิดพลาดในการประมาณค่า
ฟังก์ชันทางคณิตศาสตร์ต่างๆ สามารถใช้เป็นสมการการถดถอยได้ สมการของการพึ่งพาเชิงเส้น พาราโบลา ไฮเปอร์โบลา ฟังก์ชันสเตปป์ ฯลฯ มักใช้ในทางปฏิบัติ
ตามกฎแล้ว การวิเคราะห์เริ่มต้นด้วยการประเมินความสัมพันธ์เชิงเส้น เนื่องจากผลลัพธ์นั้นง่ายต่อการตีความอย่างมีความหมาย การเลือกประเภทของสมการการมีเพศสัมพันธ์เป็นขั้นตอนการวิเคราะห์ที่สำคัญพอสมควร ในยุค "ก่อนคอมพิวเตอร์" กระบวนการนี้เกี่ยวข้องกับความยากลำบากบางประการ และนักวิเคราะห์จำเป็นต้องทราบคุณสมบัติของฟังก์ชันทางคณิตศาสตร์ ปัจจุบันบนพื้นฐานของโปรแกรมเฉพาะทางคุณสามารถสร้างสมการการสื่อสารจำนวนมากได้อย่างรวดเร็วและตัดสินใจเลือกตามเกณฑ์ที่เป็นทางการ รุ่นที่ดีที่สุด(อย่างไรก็ตาม ความรู้ทางคณิตศาสตร์ของนักวิเคราะห์ไม่ได้สูญเสียความเกี่ยวข้องไป)
สมมติฐานเกี่ยวกับประเภทของการพึ่งพาสหสัมพันธ์สามารถหยิบยกขึ้นมาได้จากผลลัพธ์ของการสร้างฟิลด์สหสัมพันธ์ (ดูการบรรยายที่ 6) ขึ้นอยู่กับลักษณะของตำแหน่งของจุดบนกราฟ (พิกัดของจุดสอดคล้องกับค่าของตัวแปรตามและตัวแปรอิสระ) แนวโน้มของความสัมพันธ์ระหว่างคุณลักษณะ (ตัวบ่งชี้) จะถูกเปิดเผย หากเส้นถดถอยผ่านทุกจุดของฟิลด์สหสัมพันธ์ แสดงว่ามีการเชื่อมต่อที่ใช้งานได้ ในการปฏิบัติการวิจัยทางเศรษฐกิจและสังคม ไม่สามารถสังเกตภาพดังกล่าวได้ เนื่องจากมีการพึ่งพาทางสถิติ (สหสัมพันธ์) ในเงื่อนไขของการพึ่งพาความสัมพันธ์ เมื่อพล็อตเส้นการถดถอยบนแผนภาพกระจาย จะสังเกตการเบี่ยงเบนของจุดของฟิลด์สหสัมพันธ์จากเส้นการถดถอย ซึ่งแสดงให้เห็นถึงสิ่งที่เรียกว่าข้อผิดพลาดที่เหลือหรือการประมาณค่า (ดูรูปที่ 7.1)
การปรากฏตัวของข้อผิดพลาดในสมการเกิดจากการที่:
§ ปัจจัยทั้งหมดที่มีอิทธิพลต่อผลลัพธ์ไม่ได้ถูกนำมาพิจารณาในสมการการถดถอย
§ รูปแบบของการเชื่อมต่ออาจถูกเลือกไม่ถูกต้อง - สมการถดถอย
§ ไม่ใช่ทุกปัจจัยที่จะรวมอยู่ในสมการ
การสร้างสมการถดถอยหมายถึงการคำนวณค่าของพารามิเตอร์ สมการการถดถอยถูกสร้างขึ้นตามค่าที่แท้จริงของคุณลักษณะที่วิเคราะห์ โดยปกติการคำนวณพารามิเตอร์จะดำเนินการโดยใช้ วิธีกำลังสองน้อยที่สุด (LSM)
สาระสำคัญของ MNCคือเป็นไปได้ที่จะได้รับค่าดังกล่าวของพารามิเตอร์สมการที่ลดผลรวมของการเบี่ยงเบนกำลังสองของค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ (คำนวณบนพื้นฐานของสมการถดถอย) จากค่าจริง:
,
โดยที่ค่าที่แท้จริงของลักษณะผลลัพธ์คือ หน่วยที่ iมวลรวม; - ค่าของลักษณะผลลัพธ์สำหรับหน่วย i-th ของประชากรที่ได้จากสมการถดถอย ()
ดังนั้นปัญหาของ extremum กำลังได้รับการแก้ไขนั่นคือมีความจำเป็นต้องค้นหาค่าของพารามิเตอร์ที่ฟังก์ชัน S ถึงค่าต่ำสุด
ดำเนินการสร้างความแตกต่างโดยเท่ากับอนุพันธ์บางส่วนเป็นศูนย์:
, (7.3)
, (7.4)
โดยที่ผลคูณเฉลี่ยของปัจจัยและค่าผลลัพธ์ - ค่าเฉลี่ยของคุณลักษณะ - ปัจจัย - ค่าเฉลี่ยของลักษณะผลลัพธ์ - ความแปรปรวนของลักษณะปัจจัย
พารามิเตอร์ในสมการการถดถอยจะแสดงลักษณะความชันของเส้นการถดถอยบนกราฟ พารามิเตอร์นี้เรียกว่า ค่าสัมประสิทธิ์การถดถอยและค่าของมันจะระบุถึงจำนวนหน่วยการวัดที่แอตทริบิวต์ผลลัพธ์จะเปลี่ยนไปเมื่อแอตทริบิวต์ของปัจจัยเปลี่ยนแปลงไปหนึ่งหน่วยของการวัด เครื่องหมายของสัมประสิทธิ์การถดถอยสะท้อนทิศทางของการพึ่งพา (โดยตรงหรือผกผัน) และเกิดขึ้นพร้อมกับเครื่องหมายของสัมประสิทธิ์สหสัมพันธ์ (ในเงื่อนไขของการพึ่งพาแบบคู่)
ในบริบทของตัวอย่างที่กำลังพิจารณา โปรแกรม STATISTICA คำนวณพารามิเตอร์ของสมการการถดถอยที่อธิบายความสัมพันธ์ระหว่างระดับรายได้ทางการเงินต่อหัวของประชากรและมูลค่าของผลิตภัณฑ์มวลรวมในภูมิภาคต่อหัวในภูมิภาคของรัสเซีย ดู ตารางที่ 7.1.
ตารางที่ 7.1 - การคำนวณและการประเมินพารามิเตอร์ของสมการที่อธิบายความสัมพันธ์ระหว่างระดับรายได้ทางการเงินเฉลี่ยต่อหัวของประชากรและมูลค่าของผลิตภัณฑ์มวลรวมในภูมิภาคต่อหัวในภูมิภาครัสเซีย 2556
คอลัมน์ "B" ของตารางมีค่าของพารามิเตอร์ของสมการการถดถอยคู่ดังนั้นเราจึงสามารถเขียนได้: = 13406.89 + 22.82 x สมการนี้อธิบายแนวโน้มความสัมพันธ์ระหว่างคุณลักษณะที่วิเคราะห์ พารามิเตอร์คือค่าสัมประสิทธิ์การถดถอย ในกรณีนี้จะเท่ากับ 22.82 และมีลักษณะดังต่อไปนี้: ด้วยการเพิ่มขึ้นของ GRP ต่อหัว 1,000 รูเบิล รายได้เงินสดเฉลี่ยต่อหัวจะเพิ่มขึ้นโดยเฉลี่ย (ตามที่ระบุด้วยเครื่องหมาย "+") 22.28 รูเบิล
ตามกฎแล้ว พารามิเตอร์สมการถดถอยในการศึกษาทางเศรษฐกิจและสังคมไม่ได้ถูกตีความอย่างมีความหมาย อย่างเป็นทางการจะสะท้อนถึงค่าของแอตทริบิวต์ - ผลลัพธ์โดยมีเงื่อนไขว่าแอตทริบิวต์ - ปัจจัยมีค่าเท่ากับศูนย์ พารามิเตอร์แสดงลักษณะตำแหน่งของเส้นถดถอยบนกราฟ ดูรูป 7.1
รูปที่ 7.1 - ช่องสหสัมพันธ์และเส้นถดถอยที่สะท้อนถึงการพึ่งพาระดับรายได้ทางการเงินต่อหัวของประชากรในภูมิภาครัสเซียและมูลค่าของ GRP ต่อหัว
ค่าพารามิเตอร์สอดคล้องกับจุดตัดของเส้นถดถอยกับแกน Y ที่ X=0
การสร้างสมการถดถอยจะมาพร้อมกับการประเมินนัยสำคัญทางสถิติของสมการโดยรวมและพารามิเตอร์ต่างๆ ความจำเป็นในขั้นตอนดังกล่าวเกี่ยวข้องกับข้อมูลจำนวนจำกัด ซึ่งอาจขัดขวางการดำเนินการตามกฎหมายที่มีจำนวนมาก และด้วยเหตุนี้ การระบุแนวโน้มที่แท้จริงในความสัมพันธ์ของตัวบ่งชี้ที่วิเคราะห์ นอกจากนี้ ประชากรใดๆ ที่อยู่ระหว่างการศึกษาถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไป และคุณลักษณะที่ได้รับระหว่างการวิเคราะห์เป็นการประเมินพารามิเตอร์ทั่วไป
การประเมินนัยสำคัญทางสถิติของพารามิเตอร์และสมการโดยรวมเป็นการพิสูจน์ความเป็นไปได้ของการใช้แบบจำลองการสื่อสารที่สร้างขึ้นเพื่อการตัดสินใจด้านการจัดการและการพยากรณ์ (การสร้างแบบจำลอง)
นัยสำคัญทางสถิติของสมการถดถอยประเมินโดยทั่วไปโดยใช้ การทดสอบ F ของฟิชเชอร์ซึ่งเป็นอัตราส่วนของปัจจัยและความแปรปรวนคงเหลือที่คำนวณตามระดับความเป็นอิสระ:
ที่ไหน - การกระจายปัจจัยของคุณลักษณะ - ผลลัพธ์; k – จำนวนดีกรีอิสระของการกระจายตัวประกอบ (จำนวนตัวประกอบในสมการการถดถอย) - ค่าเฉลี่ยของตัวแปรตาม - ค่าทางทฤษฎี (ได้มาจากสมการถดถอย) ของตัวแปรตามสำหรับหน่วย i – th ของประชากร - ความแปรปรวนคงเหลือของคุณลักษณะ - ผลลัพธ์; n คือปริมาตรของประชากร n-k-1 – จำนวนองศาอิสระของการกระจายตัวของสารตกค้าง
ตามสูตร ค่าของการทดสอบ Fisher's F จะแสดงลักษณะความสัมพันธ์ระหว่างปัจจัยและความแปรปรวนคงเหลือของตัวแปรตาม ซึ่งแสดงให้เห็นโดยพื้นฐานแล้วว่าค่าของส่วนที่อธิบายของการแปรผันนั้นเกินกว่าส่วนที่อธิบายไม่ได้กี่ครั้ง
การทดสอบ F ของฟิชเชอร์จะถูกทำเป็นตาราง ข้อมูลเข้าในตารางคือจำนวนองศาอิสระของตัวประกอบและความแปรปรวนที่เหลือ การเปรียบเทียบค่าที่คำนวณได้ของเกณฑ์กับค่าในตาราง (วิกฤต) ช่วยให้เราสามารถตอบคำถามได้: นั่นเป็นส่วนหนึ่งของการเปลี่ยนแปลงในแอตทริบิวต์ผลลัพธ์ที่สามารถอธิบายได้ด้วยปัจจัยที่รวมอยู่ในสมการประเภทนี้หรือไม่ มีนัยสำคัญทางสถิติหรือไม่ ถ้า ดังนั้นสมการการถดถอยจึงถือว่ามีนัยสำคัญทางสถิติ ดังนั้นค่าสัมประสิทธิ์การกำหนดจึงมีนัยสำคัญทางสถิติ มิฉะนั้น ( ) สมการนี้ไม่มีนัยสำคัญทางสถิติ เช่น การแปรผันของปัจจัยที่นำมาพิจารณาในสมการไม่ได้อธิบายส่วนที่มีนัยสำคัญทางสถิติของการแปรผันในลักษณะผลลัพธ์ หรือเลือกสมการความสัมพันธ์ไม่ถูกต้อง
การประมาณนัยสำคัญทางสถิติของพารามิเตอร์สมการดำเนินการบนพื้นฐาน t-สถิติซึ่งคำนวณเป็นอัตราส่วนของโมดูลัสของพารามิเตอร์ของสมการถดถอยต่อข้อผิดพลาดมาตรฐาน ( ):
, ที่ไหน ; (7.6)
, ที่ไหน ; (7.7)
ที่ไหน - ส่วนเบี่ยงเบนมาตรฐานเครื่องหมาย - ปัจจัยและเครื่องหมาย - ผลลัพธ์ - ค่าสัมประสิทธิ์การตัดสินใจ
ในโปรแกรมทางสถิติเฉพาะทางการคำนวณพารามิเตอร์จะมาพร้อมกับการคำนวณค่าของข้อผิดพลาดมาตรฐาน (ค่าเฉลี่ยกำลังสอง) และสถิติ t (ดูตารางที่ 7.1) เสมอ ค่าสถิติ t ที่คำนวณได้จะถูกนำมาเปรียบเทียบกับตารางที่ 1 หากปริมาตรของประชากรที่กำลังศึกษาน้อยกว่า 30 หน่วย (แน่นอนว่าเป็นตัวอย่างขนาดเล็ก) คุณควรอ้างอิงถึงตารางการแจกแจงค่า t ของนักเรียน หากปริมาณประชากรมีขนาดใหญ่ คุณควรใช้ตารางการแจกแจงแบบปกติ (อินทิกรัลความน่าจะเป็นของลาปลาซ) พารามิเตอร์สมการถือว่ามีนัยสำคัญทางสถิติหาก
การประมาณค่าพารามิเตอร์ตามสถิติ t นั้นเป็นการทดสอบสมมติฐานว่างว่าพารามิเตอร์ทั่วไปมีค่าเท่ากับศูนย์ (H 0: =0; H 0: =0;) นั่นคือ พารามิเตอร์ของสมการการถดถอยคือ ไม่มีนัยสำคัญทางสถิติ โดยทั่วไปจะยอมรับระดับนัยสำคัญของสมมติฐาน: = 0.05 หากระดับนัยสำคัญที่คำนวณได้น้อยกว่า 0.05 สมมติฐานว่างจะถูกปฏิเสธและสมมติฐานทางเลือกจะได้รับการยอมรับ - เกี่ยวกับนัยสำคัญทางสถิติของพารามิเตอร์
มาดูตัวอย่างกันต่อ ในตารางที่ 7.1 คอลัมน์ "B" แสดงค่าของพารามิเตอร์และคอลัมน์ Std.Err.ofB แสดงค่าของข้อผิดพลาดมาตรฐานของพารามิเตอร์ ( ) ในคอลัมน์ เสื้อ(77 – จำนวนองศาอิสระ) ค่าของ t - สถิติคำนวณโดยคำนึงถึงจำนวนองศาอิสระ ในการประเมินนัยสำคัญทางสถิติของพารามิเตอร์ต้องเปรียบเทียบค่าที่คำนวณได้ของ t - สถิติกับค่าตาราง ระดับนัยสำคัญที่ระบุ (0.05) ในตารางการแจกแจงแบบปกติสอดคล้องกับ t = 1.96 ตั้งแต่ 18.02, 10.84 เช่น ควรรับรู้นัยสำคัญทางสถิติของค่าพารามิเตอร์ที่ได้รับเช่น ค่าเหล่านี้เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สุ่มและสะท้อนถึงแนวโน้มของความสัมพันธ์ระหว่างตัวบ่งชี้ที่วิเคราะห์
เพื่อประเมินนัยสำคัญทางสถิติของสมการโดยรวม ให้เราพิจารณาค่าของการทดสอบ F ของฟิชเชอร์ (ดูตารางที่ 7.1) ค่าที่คำนวณได้ของเกณฑ์ F = 117.51 ซึ่งเป็นค่าในตารางของเกณฑ์ โดยขึ้นอยู่กับจำนวนองศาอิสระที่สอดคล้องกัน (สำหรับการกระจายตัวของปัจจัย d.f. =1 สำหรับการกระจายตัวของสารตกค้าง d.f. =77) เท่ากับ 4.00 (ดูภาคผนวก .... .) ดังนั้น, ดังนั้นสมการการถดถอยโดยรวมจึงมีนัยสำคัญทางสถิติ ในสถานการณ์เช่นนี้เราสามารถพูดคุยเกี่ยวกับนัยสำคัญทางสถิติของค่าสัมประสิทธิ์การกำหนดได้เช่น ร้อยละ 60 ของการเปลี่ยนแปลงของรายได้เฉลี่ยต่อหัวของประชากรในภูมิภาคของรัสเซียสามารถอธิบายได้จากการเปลี่ยนแปลงของปริมาณผลิตภัณฑ์รวมของภูมิภาคต่อหัว
เราสามารถหาค่านัยสำคัญทางสถิติของสมการถดถอยและพารามิเตอร์ต่างๆ ได้ การรวมกันที่แตกต่างกันผลลัพธ์.
· สมการตามการทดสอบ F มีนัยสำคัญทางสถิติ และพารามิเตอร์ทั้งหมดของสมการตามสถิติ t ก็มีนัยสำคัญทางสถิติเช่นกัน สมการนี้สามารถใช้ได้ทั้งในการตัดสินใจด้านการจัดการ (ปัจจัยใดควรได้รับอิทธิพลเพื่อให้ได้ผลลัพธ์ที่ต้องการ) และสำหรับการทำนายพฤติกรรมของลักษณะผลลัพธ์ที่ค่าหนึ่งของปัจจัย
· จากการทดสอบ F สมการนี้มีนัยสำคัญทางสถิติ แต่พารามิเตอร์ (พารามิเตอร์) ของสมการไม่มีนัยสำคัญ สามารถใช้สมการในการตัดสินใจของฝ่ายบริหารได้ (เกี่ยวข้องกับปัจจัยที่ได้รับการยืนยันนัยสำคัญทางสถิติของอิทธิพล) แต่ไม่สามารถใช้สมการในการพยากรณ์ได้
· สมการการทดสอบ F ไม่มีนัยสำคัญทางสถิติ ไม่สามารถใช้สมการได้ คุณควรค้นหาสัญญาณ-ปัจจัยที่สำคัญหรือรูปแบบการวิเคราะห์ของการเชื่อมโยงระหว่างข้อโต้แย้งและการตอบสนองต่อไป
หากนัยสำคัญทางสถิติของสมการและพารามิเตอร์ได้รับการยืนยัน ก็จะสามารถรับรู้สิ่งที่เรียกว่าการพยากรณ์จุดได้ เช่น ได้รับการประมาณค่าของลักษณะผลลัพธ์ (y) สำหรับค่าที่แน่นอนของปัจจัย (x)
เห็นได้ชัดว่าค่าทำนายของตัวแปรตามซึ่งคำนวณตามสมการความสัมพันธ์ จะไม่ตรงกับค่าจริง ( ) ในภาพกราฟิก สถานการณ์นี้ได้รับการยืนยันจากข้อเท็จจริงที่ว่าไม่ใช่ทุกจุดของฟิลด์สหสัมพันธ์จะอยู่บนเส้นถดถอย เฉพาะการเชื่อมต่อเชิงฟังก์ชันเท่านั้นที่เส้นการถดถอยจะผ่านทุกจุดของแผนภาพกระจาย การปรากฏตัวของความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎีของตัวแปรตามนั้นสัมพันธ์กันก่อนอื่นด้วยสาระสำคัญของการพึ่งพาสหสัมพันธ์: ในเวลาเดียวกันผลลัพธ์จะได้รับอิทธิพลจากหลายปัจจัยซึ่งเพียงบางส่วนเท่านั้น สามารถนำมาพิจารณาในสมการการสื่อสารเฉพาะได้ นอกจากนี้ รูปแบบของการเชื่อมต่อระหว่างผลลัพธ์กับตัวประกอบ (ประเภทของสมการการถดถอย) อาจเลือกไม่ถูกต้อง ในเรื่องนี้ คำถามเกิดขึ้นว่าสมการการมีเพศสัมพันธ์ที่สร้างขึ้นมีข้อมูลมากน้อยเพียงใด ตัวบ่งชี้สองตัวตอบคำถามนี้: ค่าสัมประสิทธิ์การตัดสินใจ (ตามที่กล่าวไว้ข้างต้น) และข้อผิดพลาดมาตรฐานของการประมาณค่า
เรียกว่าความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎีของตัวแปรตาม การเบี่ยงเบนหรือข้อผิดพลาดหรือสิ่งตกค้าง- ขึ้นอยู่กับค่าเหล่านี้ จะมีการคำนวณผลต่างคงเหลือ รากที่สองจากความแปรปรวนคงเหลือ และ คือ ข้อผิดพลาดในการประมาณรากกำลังสองเฉลี่ย (มาตรฐาน):
= (7.8)
ค่าคลาดเคลื่อนมาตรฐานของสมการจะวัดในหน่วยเดียวกับค่าที่ทำนายไว้ หากข้อผิดพลาดในสมการเป็นไปตามการแจกแจงแบบปกติ (สำหรับข้อมูลจำนวนมาก) ค่า 95 เปอร์เซ็นต์ควรอยู่ภายใน 2S ของเส้นการถดถอย (ขึ้นอยู่กับคุณสมบัติของการแจกแจงแบบปกติ - กฎสามซิกมา) . ขนาด ข้อผิดพลาดมาตรฐานการประมาณค่าใช้ในการคำนวณช่วงความเชื่อมั่นเมื่อทำนายค่าของคุณลักษณะ - ผลลัพธ์สำหรับหน่วยเฉพาะของประชากร
ในการวิจัยเชิงปฏิบัติ มักมีความจำเป็นต้องทำนายค่าเฉลี่ยของคุณลักษณะหนึ่งๆ ซึ่งเป็นผลลัพธ์ของค่าเฉพาะของคุณลักษณะนั้นๆ ปัจจัยต่างๆ ในกรณีนี้ ในการคำนวณช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรตาม()
คำนึงถึงค่าของข้อผิดพลาดโดยเฉลี่ย:
(7.9)
การใช้ค่าความผิดพลาดที่แตกต่างกันอธิบายได้จากข้อเท็จจริงที่ว่าความแปรปรวนของระดับตัวบ่งชี้ในหน่วยเฉพาะของประชากรนั้นสูงกว่าความแปรปรวนของค่าเฉลี่ยมาก ดังนั้นข้อผิดพลาดในการทำนายค่าเฉลี่ยจึงน้อยกว่า
ช่วงความเชื่อมั่นสำหรับการพยากรณ์ค่าเฉลี่ยของตัวแปรตาม:
, (7.10)
ที่ไหน - ข้อผิดพลาดในการประมาณค่าสูงสุด (ดูทฤษฎีการสุ่มตัวอย่าง) เสื้อ – ค่าสัมประสิทธิ์ความเชื่อมั่น ค่าที่อยู่ในตารางที่เกี่ยวข้อง ขึ้นอยู่กับระดับความน่าจะเป็น (จำนวนระดับความเป็นอิสระ) ที่ผู้วิจัยยอมรับ (ดูทฤษฎีการสุ่มตัวอย่าง)
ช่วงความเชื่อมั่นสำหรับค่าที่คาดการณ์ไว้ของคุณลักษณะผลลัพธ์สามารถคำนวณได้โดยคำนึงถึงการแก้ไขอคติ (การเปลี่ยนแปลง) ของเส้นการถดถอย กำหนดค่าของปัจจัยการแก้ไขถูกกำหนด:
(7.11)
โดยที่ คือค่าของลักษณะเฉพาะของปัจจัย โดยขึ้นอยู่กับค่าของลักษณะผลลัพธ์ที่คาดการณ์ไว้
ตามมาว่ายิ่งค่าแตกต่างจากค่าเฉลี่ยของคุณลักษณะปัจจัยมากเท่าใด ค่าสัมประสิทธิ์การแก้ไขก็จะยิ่งมากขึ้น ข้อผิดพลาดในการพยากรณ์ก็จะยิ่งมากขึ้นเท่านั้น เมื่อคำนึงถึงค่าสัมประสิทธิ์นี้ ช่วงความเชื่อมั่นของการพยากรณ์จะถูกคำนวณ:
ความแม่นยำของการทำนายตามสมการถดถอยอาจได้รับผลกระทบ เหตุผลต่างๆ- ประการแรกควรคำนึงว่าการประเมินคุณภาพของสมการและพารามิเตอร์นั้นดำเนินการบนสมมติฐานที่ว่า การกระจายตัวแบบปกติของเหลือแบบสุ่ม การละเมิดสมมติฐานนี้อาจเกิดจากการมีค่าที่แตกต่างกันอย่างมากในข้อมูล ความแปรปรวนที่ไม่สม่ำเสมอ หรือการมีความสัมพันธ์แบบไม่เชิงเส้น ในกรณีนี้ คุณภาพของการคาดการณ์จะลดลง จุดที่สองที่ต้องจำคือค่าของปัจจัยที่นำมาพิจารณาเมื่อทำนายผลลัพธ์ไม่ควรเกินช่วงของการแปรผันของข้อมูลที่ใช้สมการ
©2015-2019 เว็บไซต์
สิทธิ์ทั้งหมดเป็นของผู้เขียน ไซต์นี้ไม่ได้อ้างสิทธิ์ในการประพันธ์ แต่ให้ใช้งานฟรี
วันที่สร้างเพจ: 2018-01-08