การประเมินนัยสำคัญทางสถิติของสมการถดถอยและพารามิเตอร์ต่างๆ การประเมินความสำคัญของสมการถดถอยและค่าสัมประสิทธิ์

หลังจากประเมินนัยสำคัญทางสถิติส่วนบุคคลของสัมประสิทธิ์การถดถอยแต่ละรายการแล้ว โดยปกติจะมีการวิเคราะห์นัยสำคัญโดยรวมของสัมประสิทธิ์ดังกล่าว เช่น สมการทั้งหมดโดยรวม การวิเคราะห์นี้ดำเนินการบนพื้นฐานของการทดสอบสมมติฐานเกี่ยวกับความสำคัญทั่วไปของสมมติฐานเกี่ยวกับความเสมอภาคพร้อมกันถึงศูนย์ของสัมประสิทธิ์การถดถอยทั้งหมดสำหรับตัวแปรอธิบาย:

ชม 0: ข 1 = ข 2 = ... = ข ม. = 0

หากสมมติฐานนี้ไม่ถูกปฏิเสธ ก็จะสรุปได้ว่าอิทธิพลสะสมของตัวแปรอธิบาย m ทั้งหมด X 1, X 2, ..., X m ของแบบจำลองบนตัวแปรตาม Y ถือว่าไม่มีนัยสำคัญทางสถิติ และคุณภาพโดยรวม ของสมการถดถอยถือว่าต่ำ

สมมติฐานนี้ได้รับการทดสอบตาม การวิเคราะห์ความแปรปรวนการเปรียบเทียบความแปรปรวนที่อธิบายและความแปรปรวนคงเหลือ

H 0: (ความแปรปรวนอธิบาย) = (ความแปรปรวนคงเหลือ)

H 1: (ความแปรปรวนแบบอธิบาย) > (ความแปรปรวนคงเหลือ)

สร้างสถิติ F:

ที่ไหน – ความแปรปรวนอธิบายโดยการถดถอย

– การกระจายตัวของสารตกค้าง (ผลรวมของการเบี่ยงเบนกำลังสองหารด้วยจำนวนองศาอิสระ n-m-1) เมื่อเป็นไปตามสมมติฐานของ OLS สถิติ F ที่สร้างขึ้นจะมีการแจกแจงแบบฟิชเชอร์โดยมีดีกรีอิสระ n1 = m, n2 = n–m–1 ดังนั้น หาก F สังเกตที่ระดับนัยสำคัญที่ต้องการ > F a ; ม.; n - m -1 = F a (โดยที่ F a ; m ; n - m -1 เป็นจุดวิกฤตของการแจกแจงแบบฟิชเชอร์) จากนั้น H 0 จะถูกปฏิเสธไปแทน H 1 ซึ่งหมายความว่าความแปรปรวนที่อธิบายโดยการถดถอยมีค่ามากกว่าความแปรปรวนที่เหลืออย่างมีนัยสำคัญ ดังนั้น สมการการถดถอยจึงค่อนข้างสะท้อนถึงพลวัตของการเปลี่ยนแปลงในตัวแปรตาม Y ในเชิงคุณภาพ ถ้า F สังเกต< F a ; m ; n - m -1 = F кр. , то нет основания для отклонения Н 0 . Значит, объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами. Это дает основание считать, что совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество модели невысоко.

อย่างไรก็ตาม ในทางปฏิบัติ แทนที่จะใช้สมมติฐานนี้ สมมติฐานที่เกี่ยวข้องอย่างใกล้ชิดเกี่ยวกับนัยสำคัญทางสถิติของสัมประสิทธิ์การกำหนด R2 มักถูกทดสอบมากกว่า:



ชม 0: ร 2 > 0

เพื่อทดสอบสมมติฐานนี้ จะใช้สถิติ F ต่อไปนี้:

. (8.20)

ค่าของ F หากเป็นไปตามสมมติฐานของ OLS และหาก H 0 เป็นจริง จะมีการกระจายตัวแบบฟิชเชอร์คล้ายกับการกระจายตัวของสถิติ F (8.19) อันที่จริง การหารทั้งเศษและส่วนของเศษส่วนใน (8.19) ด้วยผลรวมของส่วนเบี่ยงเบนยกกำลังสอง และรู้ว่ามันแบ่งออกเป็นผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอยและผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง (ซึ่งเป็นผลตามมาของระบบสมการปกติดังที่จะแสดงในภายหลัง)

,

เราได้รับสูตร (8.20):

จาก (8.20) เห็นได้ชัดว่าเลขชี้กำลัง F และ R 2 เท่ากันหรือไม่เท่ากับศูนย์ในเวลาเดียวกัน ถ้า F = 0 ดังนั้น R 2 = 0 และเส้นการถดถอย Y = เป็นค่าที่ดีที่สุดตามกำลังสองน้อยที่สุด ดังนั้นค่าของ Y จึงไม่ขึ้นอยู่กับ X 1, X 2, ..., X m เป็นเส้นตรง . เพื่อทดสอบสมมติฐานว่าง H 0: F = 0 ที่ระดับนัยสำคัญ a ค่าวิกฤต F cr = F a จะพบได้จากตารางจุดวิกฤตของการแจกแจงแบบฟิชเชอร์ ม.; n - m -1 . สมมติฐานว่างจะถูกปฏิเสธถ้า F > F cr นี่เทียบเท่ากับข้อเท็จจริงที่ว่า R 2 > 0 เช่น R 2 มีนัยสำคัญทางสถิติ

การวิเคราะห์สถิติ F ช่วยให้เราสามารถสรุปได้ว่าเพื่อที่จะยอมรับสมมติฐานที่ว่าสัมประสิทธิ์ทั้งหมดมีค่าเท่ากับศูนย์พร้อมกัน การถดถอยเชิงเส้นค่าสัมประสิทธิ์การกำหนด R2 ไม่ควรแตกต่างอย่างมีนัยสำคัญจากศูนย์ ค่าวิกฤตของมันจะลดลงเมื่อจำนวนการสังเกตเพิ่มขึ้นและอาจมีขนาดเล็กลงโดยพลการ

ตัวอย่างเช่น เมื่อประมาณค่าการถดถอยด้วยตัวแปรอธิบายสองตัว X 1 i, X 2 i สำหรับการสังเกต 30 ครั้ง R 2 = 0.65 แล้ว

ยอด = =25.07.

จากการใช้ตารางจุดวิกฤติของการแจกแจงฟิชเชอร์ เราจะพบว่า F 0.05; 2; 27 = 3.36; ฉ 0.01; 2; 27 = 5.49. เนื่องจาก F สังเกต = 25.07 > F cr ทั้งที่ 5% และที่ระดับนัยสำคัญ 1% สมมติฐานว่างจึงถูกปฏิเสธในทั้งสองกรณี

หากในสถานการณ์เดียวกัน R 2 = 0.4 แสดงว่า

F obs = = 9

ข้อสันนิษฐานที่ว่าความสัมพันธ์ไม่มีนัยสำคัญก็ถูกปฏิเสธที่นี่เช่นกัน

โปรดทราบว่าในกรณีของการถดถอยแบบคู่ การทดสอบสมมติฐานว่างสำหรับสถิติ F จะเทียบเท่ากับการทดสอบสมมติฐานว่างสำหรับสถิติ t

ค่าสัมประสิทธิ์สหสัมพันธ์ ในกรณีนี้ สถิติ F จะเท่ากับสถิติ t กำลังสอง ค่าสัมประสิทธิ์ R2 ได้รับนัยสำคัญอย่างเป็นอิสระในกรณีของการถดถอยเชิงเส้นพหุคูณ

8.6. การวิเคราะห์ความแปรปรวนเพื่อแยกผลรวมของการเบี่ยงเบนกำลังสอง องศาอิสระสำหรับผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน

ลองใช้ทฤษฎีที่อธิบายไว้ข้างต้นกับการถดถอยเชิงเส้นแบบคู่

หลังจากพบสมการการถดถอยเชิงเส้นแล้ว จะมีการประเมินความสำคัญของทั้งสมการโดยรวมและพารามิเตอร์แต่ละตัว

ความสำคัญของสมการการถดถอยโดยรวมได้รับการประเมินโดยใช้การทดสอบ Fisher F ในกรณีนี้ มีการเสนอสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยเท่ากับศูนย์ นั่นคือ b = 0 ดังนั้นตัวประกอบ x จึงไม่ส่งผลต่อผลลัพธ์ y

การคำนวณโดยตรงของการทดสอบ F นำหน้าด้วยการวิเคราะห์ความแปรปรวน สถานที่ศูนย์กลางในนั้นถูกครอบครองโดยการสลายตัวของผลรวมของการเบี่ยงเบนกำลังสองของตัวแปร y จากค่าเฉลี่ยออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":

สมการ (8.21) เป็นผลมาจากระบบสมการปกติที่ได้มาจากหัวข้อใดหัวข้อหนึ่งก่อนหน้านี้

หลักฐานการแสดงออก (8.21)

ยังคงต้องพิสูจน์ว่าเทอมสุดท้ายมีค่าเท่ากับศูนย์

หากคุณบวกสมการทั้งหมดตั้งแต่ 1 ถึง n

y i = a+b×x i +e i , (8.22)

จากนั้นเราจะได้ åy i = a×å1+b×åx i +åe i เนื่องจาก åe i =0 และ å1 =n เราจึงได้

แล้ว .

ถ้าเราลบสมการ (8.23) ออกจากนิพจน์ (8.22) เราจะได้

เป็นผลให้เราได้รับ

ผลรวมสุดท้ายเท่ากับศูนย์เนื่องจากระบบสมการปกติสองสมการ

ผลรวมของการเบี่ยงเบนกำลังสองของแต่ละค่าของคุณลักษณะที่มีประสิทธิผล y จากค่าเฉลี่ยนั้นเกิดจากอิทธิพลของเหตุผลหลายประการ ให้เราแบ่งเหตุผลทั้งชุดอย่างมีเงื่อนไขออกเป็นสองกลุ่ม: ปัจจัยที่ศึกษา x และปัจจัยอื่นๆ หากปัจจัยไม่มีอิทธิพลใดๆ ต่อผลลัพธ์ เส้นการถดถอยจะขนานกับ OX และแกน จากนั้นความแปรปรวนทั้งหมดของลักษณะผลลัพธ์นั้นเกิดจากอิทธิพลของปัจจัยอื่น ๆ และผลรวมของการเบี่ยงเบนกำลังสองจะตรงกับค่าคงเหลือ หากปัจจัยอื่นไม่ส่งผลต่อผลลัพธ์ y จะสัมพันธ์กับ x และผลรวมที่เหลือของกำลังสองจะเป็นศูนย์ ในกรณีนี้ ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอยเกิดขึ้นพร้อมกับผลรวมของกำลังสองทั้งหมด

เนื่องจากไม่ใช่ทุกจุดของสนามความสัมพันธ์จะอยู่บนเส้นถดถอย การกระจัดกระจายจึงเกิดขึ้นเสมอเนื่องจากอิทธิพลของปัจจัย x กล่าวคือ การถดถอยของ y บน x และเกิดจากสาเหตุอื่น (ความแปรผันที่ไม่สามารถอธิบายได้) ความเหมาะสมของเส้นการถดถอยสำหรับการทำนายขึ้นอยู่กับความแปรผันรวมในลักษณะ y ที่เกิดจากความแปรผันที่อธิบายไว้ แน่นอนว่า หากผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอยมากกว่าผลรวมที่เหลือของกำลังสอง สมการการถดถอยจะมีนัยสำคัญทางสถิติ และตัวประกอบ x มีผลกระทบอย่างมีนัยสำคัญต่อคุณลักษณะ y นี่เทียบเท่ากับความจริงที่ว่าค่าสัมประสิทธิ์ความมุ่งมั่นจะเข้าใกล้ความสามัคคี

ผลรวมของกำลังสองสัมพันธ์กับจำนวนองศาอิสระ (df – องศาอิสระ) กับจำนวนอิสระของการแปรผันอย่างอิสระของคุณลักษณะ จำนวนระดับความเป็นอิสระสัมพันธ์กับจำนวนหน่วยประชากร n และจำนวนค่าคงที่ที่กำหนดจากมัน ในความสัมพันธ์กับปัญหาที่กำลังศึกษาอยู่ จำนวนดีกรีอิสระควรแสดงจำนวนค่าเบี่ยงเบนอิสระจากค่าที่เป็นไปได้ n ค่าที่จำเป็นเพื่อสร้างผลรวมของกำลังสองที่กำหนด ดังนั้น สำหรับผลรวมของกำลังสองทั้งหมด จำเป็นต้องมีการเบี่ยงเบนอิสระ (n-1) เนื่องจากในชุดที่มี n หน่วย หลังจากคำนวณค่าเฉลี่ยแล้ว จำนวนการเบี่ยงเบนเพียง (n-1) เท่านั้นที่จะแปรผันอย่างอิสระ ตัวอย่างเช่น เรามีชุดของค่า y: 1,2,3,4,5 ค่าเฉลี่ยของพวกเขาคือ 3 และจากนั้น n ส่วนเบี่ยงเบนจากค่าเฉลี่ยจะเป็น: -2, -1, 0, 1, 2 เนื่องจาก มีการเบี่ยงเบนเพียงสี่ค่าเท่านั้นที่แตกต่างกันอย่างอิสระและสามารถระบุค่าเบี่ยงเบนที่ห้าได้หากทราบสี่ค่าก่อนหน้านี้ .

เมื่อคำนวณผลรวมอธิบายหรือตัวประกอบของกำลังสอง ใช้ค่าทางทฤษฎี (คำนวณ) ของคุณลักษณะผลลัพธ์

จากนั้นผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอยเชิงเส้นจะเท่ากับ

เนื่องจากสำหรับปริมาตรของการสังเกตใน x และ y ผลรวมตัวประกอบของกำลังสองในการถดถอยเชิงเส้นจะขึ้นอยู่กับค่าคงที่การถดถอย b เท่านั้น ผลรวมของกำลังสองนี้มีระดับความอิสระเพียงระดับเดียวเท่านั้น

มีความเท่าเทียมกันระหว่างจำนวนองศาอิสระของผลรวม ตัวประกอบ และผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง จำนวนองศาอิสระของผลรวมที่เหลือของกำลังสองในการถดถอยเชิงเส้นคือ n-2 จำนวนองศาอิสระของผลรวมของกำลังสองทั้งหมดถูกกำหนดโดยจำนวนหน่วยของลักษณะตัวแปร และเนื่องจากเราใช้ค่าเฉลี่ยที่คำนวณจากข้อมูลตัวอย่าง เราจึงสูญเสียอิสระหนึ่งระดับ นั่นคือ ผลรวม df = น–1

ดังนั้นเราจึงมีความเท่าเทียมกันสองประการ:

เมื่อหารผลรวมของกำลังสองแต่ละค่าด้วยจำนวนองศาอิสระที่สอดคล้องกัน เราจะได้ค่ากำลังสองเฉลี่ยของส่วนเบี่ยงเบน หรือซึ่งเท่ากันคือการกระจายตัวต่อระดับอิสระ D หนึ่งระดับ

;

;

.

การกำหนดความแปรปรวนด้วยอิสระระดับหนึ่งจะทำให้ความแปรปรวนมีรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือต่อระดับความเป็นอิสระ เราจะได้ค่าของการทดสอบ Fisher F

โดยที่เกณฑ์ F สำหรับทดสอบสมมติฐานว่าง H 0: D fact = D ส่วนที่เหลือ

หากสมมติฐานว่างเป็นจริง ปัจจัยและความแปรปรวนคงเหลือจะไม่แตกต่างกัน สำหรับ H 0 จำเป็นต้องมีการพิสูจน์เพื่อให้การกระจายตัวของปัจจัยเกินการกระจายตัวของสารตกค้างหลายครั้ง Snedecor นักสถิติชาวอังกฤษพัฒนาตารางค่าวิกฤตของอัตราส่วน F ที่ระดับนัยสำคัญต่างๆ ของสมมติฐานว่างและระดับความเป็นอิสระต่างๆ ค่าตารางของการทดสอบ F คือค่าสูงสุดของอัตราส่วนของความแปรปรวนที่สามารถเกิดขึ้นได้หากพวกมันเบี่ยงเบนแบบสุ่ม ระดับนี้ความน่าจะเป็นที่จะมีสมมติฐานว่าง ค่าอัตราส่วน F ที่คำนวณได้จะถือว่าเชื่อถือได้หากมากกว่าค่าในตาราง ถ้า F ข้อเท็จจริง > ตาราง F ดังนั้นสมมติฐานว่าง H 0: D fact = D ที่เหลือเกี่ยวกับการไม่มีการเชื่อมต่อระหว่างคุณลักษณะถูกปฏิเสธและมีการสรุปข้อสรุปเกี่ยวกับความสำคัญของการเชื่อมต่อนี้

ถ้า F เป็นข้อเท็จจริง< F табл, то вероятность нулевой гипотезы H 0: D факт = D ост выше заданного уровня (например, 0,05) и она не может быть отклонена без серьёзного риска сделать ข้อสรุปที่ผิดเกี่ยวกับการมีอยู่ของการเชื่อมต่อ ในกรณีนี้ สมการการถดถอยถือว่าไม่มีนัยสำคัญทางสถิติ สมมติฐาน H 0 จะไม่ถูกปฏิเสธ

ในตัวอย่างนี้จากบทที่ 3:

= 131200 -7*144002 = 30400 – ผลรวมของกำลังสอง;

1,057.878*(135.43-7*(3.92571) 2) = 28979.8 – ผลรวมตัวประกอบของกำลังสอง;

=30400-28979.8 = 1420.197 – ผลรวมที่เหลือของกำลังสอง

ความจริง = 28979.8;

ส่วนที่เหลือ = 1420.197/(n-2) = 284.0394;

ข้อเท็จจริง F =28979.8/284.0394 = 102.0274;

ฉ =0.05; 2; 5 =6.61; ฉ =0.01; 2; 5 = 16.26.

เนื่องจากข้อเท็จจริง F > ตาราง F ที่ระดับนัยสำคัญทั้ง 1% และ 5% เราสามารถสรุปได้ว่าสมการการถดถอยมีความสำคัญ (ความสัมพันธ์ได้รับการพิสูจน์แล้ว)

ค่าของการทดสอบ F สัมพันธ์กับค่าสัมประสิทธิ์การตัดสินใจ ผลรวมตัวประกอบของการเบี่ยงเบนกำลังสองสามารถแสดงได้เป็น

,

และผลรวมที่เหลือของกำลังสองเท่ากับ

.

จากนั้นค่าของการทดสอบ F สามารถแสดงเป็น

.

การประเมินนัยสำคัญการถดถอยมักจะได้รับในรูปแบบของการวิเคราะห์ตารางความแปรปรวน

ค่าของมันถูกเปรียบเทียบกับค่าตารางที่ระดับนัยสำคัญที่แน่นอน α และจำนวนองศาอิสระ (n-2)
แหล่งที่มาของการเปลี่ยนแปลง จำนวนองศาความเป็นอิสระ ผลรวมของการเบี่ยงเบนกำลังสอง การกระจายตัวต่อระดับความเป็นอิสระ อัตราส่วน F
แท้จริง แบบตารางที่ a=0.05
ทั่วไป
อธิบาย 28979,8 28979,8 102,0274 6,61
สารตกค้าง 1420,197 284,0394

การทดสอบขั้นสุดท้ายทางเศรษฐมิติ

1. ประเมินความสำคัญของพารามิเตอร์ของสมการถดถอยตาม:

A) t - การทดสอบของนักเรียน;

b) การทดสอบฟิชเชอร์ – สนีเดคคอร์ F;

c) หมายถึงค่าคลาดเคลื่อนกำลังสอง;

ช) ข้อผิดพลาดโดยเฉลี่ยการประมาณ

2. ค่าสัมประสิทธิ์การถดถอยในสมการที่แสดงความสัมพันธ์ระหว่างปริมาณผลิตภัณฑ์ที่ขาย (ล้านรูเบิล) และกำไรของผู้ประกอบการอุตสาหกรรมยานยนต์สำหรับปี (ล้านรูเบิล) หมายความว่าเมื่อปริมาณผลิตภัณฑ์ที่ขายเพิ่มขึ้น 1 ล้านรูเบิล กำไรเพิ่มขึ้นโดย:

ง) 0.5 ล้าน ถู.;

ค) 500,000 ถู.;

D) 1.5 ล้านรูเบิล

3. อัตราส่วนสหสัมพันธ์ (ดัชนีสหสัมพันธ์) วัดระดับความใกล้ชิดของการเชื่อมต่อระหว่าง X และ:

ก) มีรูปแบบการพึ่งพาแบบไม่เชิงเส้นเท่านั้น

B) สำหรับการเสพติดทุกรูปแบบ;

c) เฉพาะเมื่อเท่านั้น การพึ่งพาเชิงเส้น.

4. ตามทิศทางของการสื่อสารมีดังนี้:

ก) ปานกลาง;

ข) ตรง;

ค) ตรง

5. จากการสังเกต 17 ครั้ง จึงมีการสร้างสมการถดถอย:
.
เราคำนวณเพื่อตรวจสอบความสำคัญของสมการค่าที่สังเกตได้ที- สถิติ: 3.9. บทสรุป:

A) สมการนี้มีนัยสำคัญสำหรับ a = 0,05;

b) สมการไม่มีนัยสำคัญที่ a = 0.01;

c) สมการไม่มีนัยสำคัญที่ a = 0.05

6. อะไรคือผลที่ตามมาของการละเมิดสมมติฐานของ OLS “ความคาดหวังทางคณิตศาสตร์ของการถดถอยคงเหลือเป็นศูนย์”?

A) การประมาณค่าสัมประสิทธิ์การถดถอยแบบเอนเอียง

b) การประมาณค่าสัมประสิทธิ์การถดถอยที่มีประสิทธิผลแต่ไม่สอดคล้องกัน

c) การประมาณค่าสัมประสิทธิ์การถดถอยที่ไม่มีประสิทธิผล

d) การประมาณค่าสัมประสิทธิ์การถดถอยไม่สอดคล้องกัน

7. ข้อความใดต่อไปนี้เป็นจริงหากสารตกค้างเป็นแบบเฮเทอโรซิดาสติก

A) ข้อสรุปจากสถิติ t และ F ไม่น่าเชื่อถือ

d) การประมาณพารามิเตอร์สมการถดถอยมีความเอนเอียง

8. การทดสอบมีพื้นฐานมาจากอะไร? ความสัมพันธ์อันดับสเปียร์แมน?

ก) การใช้ t – สถิติ;

ค) ใช้งานอยู่ ;

9. การทดสอบความขาวมีพื้นฐานมาจากอะไร?

b) การใช้สถิติ F

ข) ใช้งานอยู่ ;

d) ในการวิเคราะห์เชิงกราฟของสารตกค้าง

10. วิธีใดสามารถใช้เพื่อกำจัดความสัมพันธ์อัตโนมัติได้?

11. การละเมิดสมมติฐานของความแปรปรวนคงที่ของสารตกค้างเรียกว่าอะไร?

ก) ความเป็นหลายเส้นตรง;

b) ความสัมพันธ์อัตโนมัติ;

B) ความต่างกัน;

d) ความเป็นเนื้อเดียวกัน

12. ป้อนตัวแปรจำลองลงใน:

ก) เฉพาะในโมเดลเชิงเส้นเท่านั้น

b) เฉพาะในการถดถอยแบบไม่เชิงเส้นพหุคูณเท่านั้น

c) เฉพาะในรูปแบบที่ไม่เชิงเส้นเท่านั้น

D) ทั้งแบบจำลองเชิงเส้นและไม่เชิงเส้นลดลงเป็นรูปแบบเชิงเส้น

13. หากมีค่าสัมประสิทธิ์สหสัมพันธ์ในเมทริกซ์
แล้วสิ่งนี้บ่งชี้ว่า:

A) เกี่ยวกับการมีอยู่ของความหลากหลาย

b) เกี่ยวกับการขาด multicollinearity;

c) เกี่ยวกับการมีอยู่ของความสัมพันธ์อัตโนมัติ

d) เกี่ยวกับการไม่มีความแตกต่าง

14. มาตรการใดที่ไม่สามารถใช้กำจัด multicollinearity ได้?

ก) การเพิ่มขนาดตัวอย่าง

D) การเปลี่ยนแปลงขององค์ประกอบแบบสุ่ม

15. ถ้า
และอันดับของเมทริกซ์ A น้อยกว่า (K-1) จะได้สมการดังนี้

ก) มีการระบุตัวตนมากเกินไป;

B) ไม่ปรากฏชื่อ;

c) ระบุอย่างถูกต้อง

16. สมการถดถอยมีรูปแบบดังนี้

ก)
;

ข)
;

วี)
.

17.การระบุรุ่นมีปัญหาอะไร?

A) การได้รับพารามิเตอร์ที่กำหนดไว้ไม่ซ้ำกันของแบบจำลองที่ระบุโดยระบบสมการพร้อมกัน

b) การเลือกและการใช้วิธีการสำหรับการประมาณค่าทางสถิติของพารามิเตอร์แบบจำลองที่ไม่รู้จักโดยใช้ข้อมูลทางสถิติเริ่มต้น

c) การตรวจสอบความเพียงพอของแบบจำลอง

18. วิธีใดใช้ในการประมาณค่าพารามิเตอร์ของสมการที่ระบุมากเกินไป?

B) DMNK, CMNK;

19. ถ้าตัวแปรเชิงคุณภาพมีเคค่าทางเลือก จากนั้นสิ่งต่อไปนี้จะถูกใช้ในการสร้างแบบจำลอง:

A) (k-1) ตัวแปรจำลอง;

b) ตัวแปร kdummy;

c) (k+1) ตัวแปรจำลอง

20. การวิเคราะห์ความใกล้ชิดและทิศทางของการเชื่อมต่อระหว่างสองลักษณะจะดำเนินการบนพื้นฐานของ:

ก) สัมประสิทธิ์สหสัมพันธ์คู่;

b) สัมประสิทธิ์การตัดสินใจ;

c) สัมประสิทธิ์สหสัมพันธ์พหุคูณ

21. ในสมการเชิงเส้น x = 0 +ก 1 x ค่าสัมประสิทธิ์การถดถอยแสดง:

ก) ความใกล้ชิดของการสื่อสาร

b) สัดส่วนของความแปรปรวน "Y" ขึ้นอยู่กับ "X";

C) “Y” จะเปลี่ยนแปลงโดยเฉลี่ยเท่าใดเมื่อ “X” เปลี่ยนแปลงไปหนึ่งหน่วย

d) ข้อผิดพลาดของสัมประสิทธิ์สหสัมพันธ์

22. ตัวบ่งชี้ใดที่ใช้ในการกำหนดส่วนของการเปลี่ยนแปลงเนื่องจากการเปลี่ยนแปลงค่าของปัจจัยที่กำลังศึกษา?

ก) สัมประสิทธิ์ของการแปรผัน;

b) สัมประสิทธิ์สหสัมพันธ์;

B) สัมประสิทธิ์การตัดสินใจ;

d) ค่าสัมประสิทธิ์ความยืดหยุ่น

23. ค่าสัมประสิทธิ์ความยืดหยุ่นแสดง:

A) ค่าของ y จะเปลี่ยนไปกี่% เมื่อ x เปลี่ยนแปลง 1%;

b) โดยจำนวนหน่วยการวัดค่า y จะเปลี่ยนเมื่อ x เปลี่ยนแปลง 1%;

c) ค่า y จะเปลี่ยนไปกี่เปอร์เซ็นต์เมื่อ x เปลี่ยนตามหน่วย มิติของมัน

24. วิธีการใดบ้างที่สามารถใช้เพื่อตรวจจับความแตกต่างได้?

A) การทดสอบ Golfeld-Quandt;

B) การทดสอบความสัมพันธ์อันดับของสเปียร์แมน

ค) การทดสอบเดอร์บิน-วัตสัน

25. การทดสอบ Holfeld-Quandt มีพื้นฐานมาจากอะไร?

ก) การใช้สถิติที

B) การใช้ F – สถิติ;

ค) ใช้งานอยู่ ;

d) ในการวิเคราะห์เชิงกราฟของสารตกค้าง

26. วิธีใดที่ไม่สามารถใช้เพื่อกำจัดความสัมพันธ์อัตโนมัติของสารตกค้างได้?

ก) วิธีการทั่วไป กำลังสองน้อยที่สุด;

B) วิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก

C) วิธีความน่าจะเป็นสูงสุด

D) วิธีกำลังสองน้อยที่สุดแบบสองขั้นตอน

27. การละเมิดสมมติฐานความเป็นอิสระของสารตกค้างเรียกว่าอะไร?

ก) ความเป็นหลายเส้นตรง;

B) ความสัมพันธ์อัตโนมัติ;

c) ความต่างกัน;

d) ความเป็นเนื้อเดียวกัน

28. วิธีใดที่สามารถใช้ในการกำจัดความแตกต่างได้?

A) วิธีกำลังสองน้อยที่สุดทั่วไป

b) วิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก

ค) วิธีความน่าจะเป็นสูงสุด

d) วิธีกำลังสองน้อยที่สุดแบบสองขั้นตอน

30. ถ้าตามที-เกณฑ์ ค่าสัมประสิทธิ์การถดถอยส่วนใหญ่มีนัยสำคัญทางสถิติและเป็นแบบจำลองโดยรวมเอฟ- เกณฑ์ไม่มีนัยสำคัญซึ่งอาจบ่งชี้ว่า:

ก) ความเป็นหลายเส้นตรง

B) เกี่ยวกับความสัมพันธ์อัตโนมัติของสารตกค้าง

c) ในเรื่องความไม่สมดุลของสารตกค้าง

d) ตัวเลือกนี้เป็นไปไม่ได้

31. เป็นไปได้ไหมที่จะกำจัด multicollinearity โดยใช้การแปลงตัวแปร?

ก) มาตรการนี้จะมีผลก็ต่อเมื่อขนาดตัวอย่างเพิ่มขึ้น

32. ใช้วิธีใดในการหาค่าประมาณของพารามิเตอร์ของสมการการถดถอยเชิงเส้น:

ก) วิธีกำลังสองน้อยที่สุด;

ข) การวิเคราะห์ความสัมพันธ์และการถดถอย

c) การวิเคราะห์ความแปรปรวน

33. มีการสร้างสมการการถดถอยเชิงเส้นพหุคูณพร้อมตัวแปรจำลอง หากต้องการตรวจสอบความสำคัญของสัมประสิทธิ์แต่ละรายการ ให้ใช้ การกระจาย:

ก) ปกติ;

b) การทดสอบของนักเรียน

ค) เพียร์สัน;

ง) ฟิสเชอร์-สเนเดคอร์

34. ถ้า
และอันดับของเมทริกซ์ A มากกว่า (K-1) ดังนั้นสมการคือ:

ก) มีการระบุตัวตนมากเกินไป;

b) ไม่ปรากฏชื่อ;

c) ระบุอย่างถูกต้อง

35. ในการประมาณค่าพารามิเตอร์ของระบบสมการที่ระบุอย่างแม่นยำ จะใช้สิ่งต่อไปนี้:

ก) DMNK, CMNK;

b) DMNK, MNK, CMNK;

36. หลักเกณฑ์ของ Chow ขึ้นอยู่กับการประยุกต์ใช้:

ก) F - สถิติ;

b) เสื้อ - สถิติ;

c) เกณฑ์ Durbin-Watson

37. ตัวแปรจำลองสามารถรับค่าต่อไปนี้:

d) ค่าใด ๆ

39. จากการสังเกต 20 ครั้ง สมการการถดถอยได้ถูกสร้างขึ้น:
.
เพื่อตรวจสอบความสำคัญของสมการ ค่าของสถิติจะถูกคำนวณ:4.2. ข้อสรุป:

ก) สมการนี้มีนัยสำคัญที่ a=0.05;

b) สมการไม่มีนัยสำคัญที่ a=0.05;

c) สมการไม่มีนัยสำคัญที่ a=0.01

40. ข้อความใดต่อไปนี้ไม่ถูกต้องเมื่อสารตกค้างเป็นแบบเฮเทอโรซิดาสติก?

ก) ข้อสรุปจากสถิติ t และ F ไม่น่าเชื่อถือ

b) Heteroscedasticity แสดงออกผ่านค่าต่ำของสถิติ Durbin-Watson

c) ด้วยความแตกต่างที่แตกต่างกัน การประมาณการยังคงมีผล;

d) การประมาณการมีอคติ

41. การทดสอบ Chow ขึ้นอยู่กับการเปรียบเทียบ:

ก) ความแปรปรวน;

b) สัมประสิทธิ์การตัดสินใจ;

c) ความคาดหวังทางคณิตศาสตร์

ง) เฉลี่ย

42. ถ้าอยู่ในแบบทดสอบเชาเชา
ถือว่า:

A) แนะนำให้แบ่งพาร์ติชันออกเป็นช่วงย่อยจากมุมมองของการปรับปรุงคุณภาพของแบบจำลอง

b) แบบจำลองไม่มีนัยสำคัญทางสถิติ

c) แบบจำลองมีนัยสำคัญทางสถิติ

d) ไม่มีประโยชน์ที่จะแยกตัวอย่างออกเป็นส่วน ๆ

43. ตัวแปรจำลองคือตัวแปร:

ก) คุณภาพสูง;

ข) สุ่ม;

B) เชิงปริมาณ;

ง) ตรรกะ

44. วิธีใดต่อไปนี้ไม่สามารถใช้ตรวจจับความสัมพันธ์อัตโนมัติได้?

ก) วิธีอนุกรม

b) การทดสอบเดอร์บิน-วัตสัน;

c) การทดสอบความสัมพันธ์อันดับของสเปียร์แมน

D) การทดสอบของไวท์

45. รูปแบบโครงสร้างที่ง่ายที่สุดของแบบจำลองคือ:

ก)

ข)

วี)

ช)
.

46. ​​​​มาตรการใดที่สามารถใช้เพื่อกำจัด multicollinearity?

ก) การเพิ่มขนาดตัวอย่าง

b) การแยกตัวแปรที่มีความสัมพันธ์สูงกับตัวแปรอื่น ๆ

c) การเปลี่ยนแปลงข้อกำหนดของแบบจำลอง

d) การเปลี่ยนแปลงขององค์ประกอบแบบสุ่ม

47. ถ้า
และอันดับของเมทริกซ์ A คือ (K-1) ดังนั้นสมการคือ:

ก) มีการระบุตัวตนมากเกินไป;

b) ไม่ปรากฏชื่อ;

B) ระบุอย่างถูกต้อง;

48. โมเดลจะได้รับการพิจารณาหาก:

ก) ในสมการของแบบจำลองนั้นมีสมการปกติอย่างน้อยหนึ่งอัน

B) แต่ละสมการของระบบสามารถระบุได้

c) ในสมการแบบจำลองมีอย่างน้อยหนึ่งสมการที่ไม่ปรากฏชื่อ

d) ในบรรดาสมการแบบจำลองนั้นมีอย่างน้อยหนึ่งสมการที่ระบุมากเกินไป

49. ใช้วิธีใดในการประมาณค่าพารามิเตอร์ของสมการที่ไม่ปรากฏหลักฐาน?

ก) DMNK, CMNK;

b) DMNK, MNK;

C) ไม่สามารถประมาณพารามิเตอร์ของสมการดังกล่าวได้

50. เศรษฐมิติเกิดขึ้นที่จุดเชื่อมต่อของความรู้ด้านใด:

ก) ทฤษฎีเศรษฐศาสตร์ สถิติทางเศรษฐกิจและคณิตศาสตร์

ข) ทฤษฎีเศรษฐศาสตร์ สถิติทางคณิตศาสตร์ และทฤษฎีความน่าจะเป็น

ค) สถิติเศรษฐศาสตร์และคณิตศาสตร์ ทฤษฎีความน่าจะเป็น

51. ในสมการการถดถอยเชิงเส้นพหุคูณ ช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์การถดถอยจะถูกสร้างขึ้นโดยใช้การแจกแจง:

ก) ปกติ;

ข) นักเรียน;

ค) เพียร์สัน;

ง) ฟิสเชอร์-สเนเดคอร์

52. จากการสังเกต 16 ครั้ง สมการการถดถอยเชิงเส้นคู่ได้ถูกสร้างขึ้น สำหรับทดสอบความสำคัญของสัมประสิทธิ์การถดถอยที่คำนวณได้ที สำหรับ 6l =2.5.

ก) ค่าสัมประสิทธิ์ไม่มีนัยสำคัญที่ a=0.05;

b) ค่าสัมประสิทธิ์มีนัยสำคัญที่ a=0.05;

c) ค่าสัมประสิทธิ์มีนัยสำคัญที่ a=0.01

53. เป็นที่รู้กันว่าระหว่างปริมาณเอ็กซ์และมีอยู่จริงการเชื่อมต่อเชิงบวก ขนาดไหนพบค่าสัมประสิทธิ์สหสัมพันธ์คู่หรือไม่?

ก) จาก -1 ถึง 0;

ข) จาก 0 ถึง 1;

B) จาก –1 ถึง 1

54. ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณคือ 0.9 เปอร์เซ็นต์เท่าไรความแปรปรวนของลักษณะผลลัพธ์นั้นอธิบายได้ด้วยอิทธิพลของทุกคนสัญญาณปัจจัย?

55. วิธีใดต่อไปนี้ไม่สามารถใช้ในการตรวจจับความแตกต่างได้?

A) การทดสอบ Golfeld-Quandt;

b) การทดสอบความสัมพันธ์อันดับของสเปียร์แมน

c) วิธีอนุกรม

56. รูปแบบที่ลดลงของแบบจำลองคือ:

ก) ระบบฟังก์ชันไม่เชิงเส้นของตัวแปรภายนอกจากฟังก์ชันภายนอก

B) ระบบฟังก์ชันเชิงเส้นของตัวแปรภายนอกจากตัวแปรภายนอก

c) ระบบฟังก์ชันเชิงเส้นของตัวแปรภายนอกจากฟังก์ชันภายนอก

d) ระบบสมการปกติ

57. ค่าสัมประสิทธิ์สหสัมพันธ์บางส่วนที่คำนวณโดยใช้สูตรแบบเรียกซ้ำเปลี่ยนแปลงภายในขอบเขตเท่าใด

ก) จาก - ถึง + ;

ข) จาก 0 ถึง 1;

c) จาก 0 ถึง + ;

ง) จาก –1 ถึง +1

58. ค่าสัมประสิทธิ์สหสัมพันธ์บางส่วนที่คำนวณผ่านค่าสัมประสิทธิ์การกำหนดเปลี่ยนแปลงภายในขอบเขตเท่าใด

ก) จาก - ถึง + ;

B) จาก 0 ถึง 1;

c) จาก 0 ถึง + ;

ง) จาก –1 ถึง +1

59. ตัวแปรภายนอก:

ก) ตัวแปรตาม;

B) ตัวแปรอิสระ

61. เมื่อบวกปัจจัยอธิบายอีกตัวหนึ่งในสมการการถดถอย ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณจะเป็น:

ก) จะลดลง;

ข) จะเพิ่มขึ้น;

c) จะคงความหมายไว้

62. มีการสร้างสมการการถดถอยไฮเปอร์โบลิก:= + / เอ็กซ์- สำหรับเพื่อตรวจสอบความสำคัญของสมการ จะใช้การแจกแจง:

ก) ปกติ;

ข) นักเรียน;

ค) เพียร์สัน;

ง) ฟิสเชอร์-สเนเดคอร์

63. ระบบประเภทใดที่สามารถหาพารามิเตอร์ของสมการทางเศรษฐมิติแต่ละรายการโดยใช้วิธีกำลังสองน้อยที่สุดแบบดั้งเดิมได้

ก) ระบบสมการปกติ

B) ระบบสมการอิสระ

C) ระบบสมการแบบเรียกซ้ำ

D) ระบบสมการที่พึ่งพาซึ่งกันและกัน

64. ตัวแปรภายนอก:

ก) ตัวแปรตาม;

ข) ตัวแปรอิสระ

c) ลงวันที่ไปยังจุดก่อนหน้าของเวลา

65. ค่าสัมประสิทธิ์การตัดสินใจเปลี่ยนแปลงภายในขอบเขตเท่าใด?

ก) จาก 0 ถึง + ;

ข) จาก - ถึง + ;

B) จาก 0 ถึง +1;

d) จาก -l ถึง +1

66. มีการสร้างสมการถดถอยเชิงเส้นพหุคูณแล้ว หากต้องการตรวจสอบความสำคัญของสัมประสิทธิ์แต่ละรายการ ให้ใช้ การกระจาย:

ก) ปกติ;

b) การทดสอบของนักเรียน

ค) เพียร์สัน;

D) ฟิสเชอร์-สเนเดคอร์

67. เมื่อเพิ่มปัจจัยอธิบายอื่นลงในสมการการถดถอย ค่าสัมประสิทธิ์การกำหนด:

ก) จะลดลง;

B) จะเพิ่มขึ้น;

c) จะคงความหมายไว้;

d) จะไม่ลดลง

68. สาระสำคัญของวิธีกำลังสองน้อยที่สุดคือ:

A) การประมาณการถูกกำหนดจากเงื่อนไขในการลดผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลตัวอย่างจากการประมาณการที่กำหนด

b) การประมาณการถูกกำหนดจากเงื่อนไขในการลดผลรวมของการเบี่ยงเบนของข้อมูลตัวอย่างจากการประมาณการที่กำหนด

c) การประมาณถูกกำหนดจากเงื่อนไขในการลดผลรวมของส่วนเบี่ยงเบนกำลังสองของค่าเฉลี่ยตัวอย่างจากความแปรปรวนตัวอย่าง

69. พาราโบลาอยู่ในประเภทใดของการถดถอยแบบไม่เชิงเส้น:

73. เส้นโค้งเอ็กซ์โปเนนเชียลอยู่ในคลาสของการถดถอยแบบไม่เชิงเส้น:

74. ฟังก์ชั่นของรูปแบบ ŷ อยู่ในคลาสใดของการถดถอยแบบไม่เชิงเส้น?
:

A) การถดถอยที่ไม่เชิงเส้นตามตัวแปรที่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นตามพารามิเตอร์ที่ประมาณไว้

b) การถดถอยแบบไม่เชิงเส้นของพารามิเตอร์ที่ประมาณไว้

78. ฟังก์ชั่นของรูปแบบ ŷ อยู่ในคลาสใดของการถดถอยแบบไม่เชิงเส้น?
:

ก) การถดถอยที่ไม่เป็นเชิงเส้นเกี่ยวกับตัวแปรที่รวมอยู่ในการวิเคราะห์ แต่เป็นเชิงเส้นตามพารามิเตอร์ที่ประมาณไว้

B) การถดถอยแบบไม่เชิงเส้นของพารามิเตอร์โดยประมาณ

79. ในสมการการถดถอยในรูปของไฮเปอร์โบลา ŷ
ถ้าค่า
>0 , ที่:

A) ด้วยการเพิ่มลักษณะของปัจจัย เอ็กซ์ค่าแอตทริบิวต์ผลลัพธ์ ที่ลดลงอย่างช้าๆ และด้วย x→∞ค่าเฉลี่ย ที่จะเท่ากัน ก;

b) จากนั้นค่าของเครื่องหมายผลลัพธ์ ที่เพิ่มขึ้นพร้อมกับการเติบโตที่ช้าเมื่อลักษณะของปัจจัยเพิ่มขึ้น เอ็กซ์และที่ x→∞

81. ค่าสัมประสิทธิ์ความยืดหยุ่นถูกกำหนดโดยสูตร

ก) ฟังก์ชันเชิงเส้น

ข) พาราโบลา;

c) อติพจน์;

ง) เส้นโค้งเอ็กซ์โปเนนเชียล

จ) พลังงาน

82. ค่าสัมประสิทธิ์ความยืดหยุ่นถูกกำหนดโดยสูตร
สำหรับโมเดลการถดถอยในรูปแบบ:

ก) ฟังก์ชันเชิงเส้น

B) พาราโบลา;

c) อติพจน์;

ง) เส้นโค้งเอ็กซ์โปเนนเชียล

จ) พลังงาน

86. สมการ
เรียกว่า:

ก) แนวโน้มเชิงเส้น

b) แนวโน้มพาราโบลา;

c) แนวโน้มการผ่อนชำระ;

d) แนวโน้มแบบเอ็กซ์โปเนนเชียล

89. สมการ
เรียกว่า:

ก) แนวโน้มเชิงเส้น

b) แนวโน้มพาราโบลา;

c) แนวโน้มการผ่อนชำระ;

D) แนวโน้มแบบเอ็กซ์โปเนนเชียล

90. ประเภทของระบบ เรียกว่า:

ก) ระบบสมการอิสระ

b) ระบบสมการเวียนเกิด

c) ระบบสมการที่พึ่งพาซึ่งกันและกัน (ร่วม, พร้อมกัน)

93. เศรษฐมิติสามารถกำหนดได้เป็น:

A) เป็นวินัยทางวิทยาศาสตร์อิสระที่รวมชุดของผลลัพธ์ทางทฤษฎี เทคนิค วิธีการ และแบบจำลองที่ออกแบบมาเพื่อ บนพื้นฐานของทฤษฎีเศรษฐศาสตร์ สถิติทางเศรษฐศาสตร์ และเครื่องมือทางคณิตศาสตร์และสถิติ ให้การแสดงออกเชิงปริมาณเฉพาะกับรูปแบบทั่วไป (เชิงคุณภาพ) กำหนดโดยทฤษฎีเศรษฐศาสตร์

B) ศาสตร์แห่งการวัดทางเศรษฐศาสตร์

B) การวิเคราะห์ทางสถิติของข้อมูลทางเศรษฐกิจ

94. งานของเศรษฐมิติ ได้แก่ :

A) การคาดการณ์ตัวบ่งชี้ทางเศรษฐกิจและเศรษฐกิจสังคมที่แสดงถึงสถานะและการพัฒนาของระบบที่วิเคราะห์

B) การจำลองสถานการณ์ที่เป็นไปได้สำหรับการพัฒนาเศรษฐกิจและสังคมของระบบเพื่อระบุว่าการเปลี่ยนแปลงตามแผนในพารามิเตอร์ที่ควบคุมได้บางอย่างจะส่งผลต่อคุณลักษณะผลลัพธ์อย่างไร

c) การทดสอบสมมติฐานโดยใช้ข้อมูลทางสถิติ

95. ความสัมพันธ์มีความโดดเด่นตามธรรมชาติ:

ก) การทำงานและความสัมพันธ์;

b) การทำงาน เส้นโค้ง และเส้นตรง;

c) ความสัมพันธ์และการผกผัน;

d) เชิงสถิติและโดยตรง

96. เกี่ยวข้องโดยตรงกับการเพิ่มขึ้นของลักษณะปัจจัย:

ก) สัญญาณที่มีประสิทธิภาพลดลง;

b) สัญญาณผลลัพธ์ไม่เปลี่ยนแปลง

C) สัญญาณที่มีประสิทธิภาพเพิ่มขึ้น

97. ใช้วิธีใดในการระบุการมีอยู่ ลักษณะ และทิศทางของความสัมพันธ์ในสถิติ?

ก) ค่าเฉลี่ย;

B) การเปรียบเทียบอนุกรมแบบขนาน

C) วิธีการจัดกลุ่มเชิงวิเคราะห์

d) ค่าสัมพัทธ์;

D) วิธีกราฟิก

98. วิธีการใดที่ใช้ในการระบุรูปแบบของอิทธิพลของปัจจัยหนึ่งต่ออีกปัจจัยหนึ่ง?

ก) การวิเคราะห์ความสัมพันธ์

B) การวิเคราะห์การถดถอย;

ค) การวิเคราะห์ดัชนี

d) การวิเคราะห์ความแปรปรวน

99. วิธีใดที่ใช้ในการหาปริมาณความเข้มแข็งของอิทธิพลของปัจจัยหนึ่งต่ออีกปัจจัยหนึ่ง:

ก) การวิเคราะห์ความสัมพันธ์

ข) การวิเคราะห์การถดถอย

c) วิธีการหาค่าเฉลี่ย

d) การวิเคราะห์ความแปรปรวน

100. มีตัวบ่งชี้อะไรบ้างในแง่ของมูลค่าตั้งแต่ลบถึงบวกหนึ่ง:

ก) สัมประสิทธิ์การตัดสินใจ;

b) ความสัมพันธ์สหสัมพันธ์;

ใน) ค่าสัมประสิทธิ์เชิงเส้นความสัมพันธ์

101. ค่าสัมประสิทธิ์การถดถอยสำหรับแบบจำลองปัจจัยเดียวแสดง:

A) ฟังก์ชันเปลี่ยนกี่หน่วยเมื่ออาร์กิวเมนต์เปลี่ยนไปหนึ่งหน่วย

b) ฟังก์ชันเปลี่ยนแปลงกี่เปอร์เซ็นต์ต่อการเปลี่ยนแปลงหน่วยในการโต้แย้ง

102. ค่าสัมประสิทธิ์ความยืดหยุ่นแสดง:

ก) ฟังก์ชันเปลี่ยนแปลงเป็นเปอร์เซ็นต์เมื่อมีการเปลี่ยนแปลงอาร์กิวเมนต์หนึ่งหน่วยของการวัด

B) ฟังก์ชันเปลี่ยนแปลงกี่เปอร์เซ็นต์โดยมีการเปลี่ยนแปลงอาร์กิวเมนต์ 1%;

c) โดยจำนวนหน่วยการวัดที่ฟังก์ชันเปลี่ยนแปลงโดยมีการเปลี่ยนแปลงอาร์กิวเมนต์ 1%

105. ค่าดัชนีสหสัมพันธ์เท่ากับ 0.087 หมายถึง:

A) เกี่ยวกับการพึ่งพาอาศัยกันที่อ่อนแอ;

b) เกี่ยวกับความสัมพันธ์อันแน่นแฟ้น;

c) เกี่ยวกับข้อผิดพลาดในการคำนวณ

107. ค่าสัมประสิทธิ์สหสัมพันธ์ของคู่เท่ากับ 1.12 หมายถึง:

ก) เกี่ยวกับการพึ่งพาอาศัยกันที่อ่อนแอ;

b) เกี่ยวกับความสัมพันธ์อันแน่นแฟ้น;

C) เกี่ยวกับข้อผิดพลาดในการคำนวณ

109. ตัวเลขใดต่อไปนี้สามารถเป็นค่าของสัมประสิทธิ์สหสัมพันธ์คู่ได้:

111. ตัวเลขใดต่อไปนี้สามารถเป็นค่าของสัมประสิทธิ์สหสัมพันธ์พหุคูณได้:

115. ทำเครื่องหมายรูปร่างที่ถูกต้อง สมการเชิงเส้นการถดถอย:

ก) ซ
;

โดย
;

ค) ซ
;

ง) ซ
.

การประเมินความสำคัญของสมการ การถดถอยหลายครั้ง

การสร้างสมการถดถอยเชิงประจักษ์คือ ระยะเริ่มแรกการวิเคราะห์ทางเศรษฐมิติ สมการการถดถอยแรกสุดที่สร้างขึ้นจากตัวอย่างไม่ค่อยน่าพอใจในแง่ของคุณลักษณะบางอย่าง ดังนั้น งานที่สำคัญที่สุดถัดไปของการวิเคราะห์ทางเศรษฐมิติคือการตรวจสอบคุณภาพของสมการถดถอย ในทางเศรษฐมิติ มีการใช้รูปแบบที่เป็นที่ยอมรับสำหรับการตรวจสอบดังกล่าว

ดังนั้น การตรวจสอบคุณภาพทางสถิติของสมการการถดถอยโดยประมาณจึงดำเนินการในพื้นที่ต่อไปนี้:

· การตรวจสอบความสำคัญของสมการถดถอย

· การตรวจสอบนัยสำคัญทางสถิติของสัมประสิทธิ์สมการถดถอย

· การตรวจสอบคุณสมบัติของข้อมูล ความเป็นไปได้ที่สันนิษฐานไว้เมื่อประมาณสมการ (การตรวจสอบความเป็นไปได้ของสถานที่ OLS)

การทดสอบความสำคัญของสมการการถดถอยพหุคูณ รวมถึงการถดถอยแบบคู่ ดำเนินการโดยใช้การทดสอบฟิชเชอร์ ในกรณีนี้ (ไม่เหมือนกับการถดถอยแบบคู่) จะมีการหยิบยกสมมติฐานว่างขึ้นมา เอช 0ว่าสัมประสิทธิ์การถดถอยทั้งหมดเท่ากับศูนย์ ( ข 1=0, ข 2=0, … , ข ม=0) เกณฑ์ฟิชเชอร์ถูกกำหนดโดยสูตรต่อไปนี้:

ที่ไหน ดีข้อเท็จจริง - ความแปรปรวนของปัจจัยที่อธิบายโดยการถดถอยต่อเสรีภาพหนึ่งระดับ ดี ost - การกระจายตัวของสารตกค้างต่อระดับเสรีภาพ ร 2- สัมประสิทธิ์การตัดสินใจพหุคูณ; เอ็กซ์ในสมการการถดถอย (ในการถดถอยเชิงเส้นคู่ = 1); พี -จำนวนการสังเกต

ค่า F-test ที่ได้จะถูกนำมาเปรียบเทียบกับค่าตารางที่ระดับนัยสำคัญที่แน่นอน หากค่าจริงมากกว่าค่าตาราง แสดงว่าสมมุติฐาน แต่ความไม่สำคัญของสมการการถดถอยถูกปฏิเสธ และสมมติฐานทางเลือกเกี่ยวกับนัยสำคัญทางสถิติได้รับการยอมรับ

เมื่อใช้เกณฑ์ฟิชเชอร์ คุณสามารถประเมินความสำคัญของไม่เพียงแต่สมการถดถอยโดยรวมเท่านั้น แต่ยังรวมถึงความสำคัญของการรวมแต่ละปัจจัยเพิ่มเติมในแบบจำลองด้วย การประเมินดังกล่าวมีความจำเป็นเพื่อไม่ให้โหลดแบบจำลองด้วยปัจจัยที่ไม่ส่งผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ นอกจากนี้ เนื่องจากแบบจำลองประกอบด้วยปัจจัยหลายประการ จึงสามารถนำเข้าแบบจำลองในลำดับที่ต่างกันได้ และเนื่องจากมีความสัมพันธ์กันระหว่างปัจจัยต่างๆ ความสำคัญของการรวมปัจจัยเดียวกันในแบบจำลองอาจแตกต่างกันไปขึ้นอยู่กับลำดับที่ มีการนำปัจจัยต่างๆ เข้ามาเกี่ยวข้อง

เพื่อประเมินความสำคัญของการรวมปัจจัยเพิ่มเติมในแบบจำลอง จะมีการคำนวณเกณฑ์ฟิชเชอร์บางส่วน ฟกซี่.ขึ้นอยู่กับการเปรียบเทียบการเพิ่มขึ้นของความแปรปรวนของปัจจัยเนื่องจากการรวมปัจจัยเพิ่มเติมในแบบจำลองกับความแปรปรวนคงเหลือต่อความอิสระหนึ่งระดับสำหรับการถดถอยโดยรวม ดังนั้นสูตรการคำนวณ การทดสอบ F ส่วนตัวสำหรับตัวประกอบจะมีรูปแบบดังนี้

ที่ไหน R 2 yx 1 x 2… x… xp -ค่าสัมประสิทธิ์การกำหนดพหุคูณสำหรับโมเดลแบบเต็มชุด nปัจจัย - R 2 ปีx 1 x 2… x ผม -1 x ผม +1… xp- ค่าสัมประสิทธิ์ของการตัดสินใจพหุคูณสำหรับแบบจำลองที่ไม่รวมปัจจัย x ฉัน;n- จำนวนการสังเกต - จำนวนพารามิเตอร์สำหรับปัจจัย xในสมการถดถอย

ค่าที่แท้จริงของการทดสอบบางส่วนของฟิชเชอร์จะถูกนำไปเปรียบเทียบกับค่าในตารางที่ระดับนัยสำคัญ 0.05 หรือ 0.1 และจำนวนองศาอิสระที่สอดคล้องกัน ถ้าตามมูลค่าจริง ฟ ซีเกิน เอฟ โต๊ะจากนั้นจึงรวมปัจจัยเพิ่มเติม x ฉันลงในแบบจำลองนั้นมีความสมเหตุสมผลทางสถิติ และค่าสัมประสิทธิ์การถดถอย "บริสุทธิ์" ข ฉันที่ปัจจัย x ฉันมีนัยสำคัญทางสถิติ ถ้า ฟ ซีน้อย เอฟ โต๊ะจากนั้นการรวมปัจจัยเพิ่มเติมในแบบจำลองจะไม่เพิ่มส่วนแบ่งของความแปรผันที่อธิบายไว้ในผลลัพธ์อย่างมีนัยสำคัญ ใช่ดังนั้นการรวมไว้ในแบบจำลองจึงไม่สมเหตุสมผล ค่าสัมประสิทธิ์การถดถอยสำหรับปัจจัยนี้ในกรณีนี้ไม่มีนัยสำคัญทางสถิติ

เมื่อใช้การทดสอบบางส่วนของฟิชเชอร์ คุณสามารถทดสอบความสำคัญของสัมประสิทธิ์การถดถอยทั้งหมดภายใต้สมมติฐานว่าแต่ละปัจจัยที่สอดคล้องกัน x ฉันถูกป้อนลงในสมการการถดถอยพหุคูณเป็นลำดับสุดท้าย และปัจจัยอื่นๆ ทั้งหมดรวมอยู่ในแบบจำลองก่อนหน้านี้แล้ว

การประเมินความสำคัญของสัมประสิทธิ์การถดถอย "บริสุทธิ์" ข ฉันโดย การทดสอบของนักเรียนสามารถดำเนินการได้โดยไม่ต้องคำนวณส่วนตัว เอฟ-เกณฑ์. ในกรณีนี้ เช่นเดียวกับการถดถอยแบบคู่ สูตรจะถูกนำไปใช้กับแต่ละปัจจัย

เสื้อ ไบ = ข ผม / ม. ไบ ,

ที่ไหน ข ฉัน- สัมประสิทธิ์ของการถดถอย "บริสุทธิ์" พร้อมตัวประกอบ x ฉัน ; ม บี- ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย ข ฉัน .

คุณสามารถตรวจสอบความสำคัญของพารามิเตอร์สมการถดถอยได้โดยใช้สถิติแบบ t

ออกกำลังกาย:
สำหรับกลุ่มองค์กรที่ผลิตผลิตภัณฑ์ประเภทเดียวกัน ฟังก์ชันต้นทุนจะได้รับการพิจารณา:
y = α + βx;
y = α x β ;
y = α β x ;
y = α + β / x;
โดยที่ y คือต้นทุนการผลิตพันหน่วย
x คือผลผลิตการผลิต, พันหน่วย

ที่จำเป็น:
1. สร้างสมการการถดถอยแบบคู่ y จาก x:

  • เชิงเส้น;
  • พลัง;
  • สาธิต;
  • ไฮเปอร์โบลาด้านเท่ากันหมด
2. คำนวณค่าสัมประสิทธิ์เชิงเส้นของความสัมพันธ์คู่และค่าสัมประสิทธิ์การกำหนด วาดข้อสรุป
3. ประเมินนัยสำคัญทางสถิติของสมการถดถอยโดยรวม
4. ประเมินนัยสำคัญทางสถิติของพารามิเตอร์การถดถอยและสหสัมพันธ์
5. ดำเนินการคาดการณ์ต้นทุนการผลิตโดยมีผลผลิตคาดการณ์ 195% ของระดับเฉลี่ย
6. ประเมินความถูกต้องแม่นยำของการพยากรณ์ คำนวณความคลาดเคลื่อนของการคาดการณ์และผลของมัน ช่วงความมั่นใจ.
7. ประเมินแบบจำลองโดยใช้ความคลาดเคลื่อนโดยเฉลี่ยของการประมาณ

สารละลาย:

1. สมการคือ y = α + βx
1. พารามิเตอร์สมการถดถอย
ค่าเฉลี่ย

การกระจายตัว

ส่วนเบี่ยงเบนมาตรฐาน

ค่าสัมประสิทธิ์สหสัมพันธ์

ความสัมพันธ์ระหว่างคุณลักษณะ Y และปัจจัย X นั้นแข็งแกร่งและตรงไปตรงมา
สมการถดถอย

ค่าสัมประสิทธิ์การตัดสินใจ
R 2 = 0.94 2 = 0.89 เช่น ใน 88.9774% ของกรณี การเปลี่ยนแปลงใน x นำไปสู่การเปลี่ยนแปลงใน y กล่าวอีกนัยหนึ่ง ความแม่นยำในการเลือกสมการถดถอยมีสูง

x x2 คุณ 2 x∙y ใช่(x) (ปปป) 2 (ป-ป(x)) 2 (x-x น) 2
78 133 6084 17689 10374 142.16 115.98 83.83 1
82 148 6724 21904 12136 148.61 17.9 0.37 9
87 134 7569 17956 11658 156.68 95.44 514.26 64
79 154 6241 23716 12166 143.77 104.67 104.67 0
89 162 7921 26244 14418 159.9 332.36 4.39 100
106 195 11236 38025 20670 187.33 2624.59 58.76 729
67 139 4489 19321 9313 124.41 22.75 212.95 144
88 158 7744 24964 13904 158.29 202.51 0.08 81
73 152 5329 23104 11096 134.09 67.75 320.84 36
87 162 7569 26244 14094 156.68 332.36 28.33 64
76 159 5776 25281 12084 138.93 231.98 402.86 9
115 173 13225 29929 19895 201.86 854.44 832.66 1296
0 0 0 16.3 20669.59 265.73 6241
1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

หมายเหตุ: ค่าของ y(x) พบได้จากสมการถดถอยผลลัพธ์:
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
... ... ...

2. การประมาณค่าพารามิเตอร์สมการถดถอย
ความสำคัญของสัมประสิทธิ์สหสัมพันธ์

ใช้ตารางของนักเรียนเราจะพบ Ttable
ตาราง T (n-m-1;α/2) = (11;0.05/2) = 1.796
เนื่องจาก Tob > Ttabl เราปฏิเสธสมมติฐานที่ว่าค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0 กล่าวอีกนัยหนึ่ง ค่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญทางสถิติ

การวิเคราะห์ความแม่นยำในการประมาณค่าสัมประสิทธิ์การถดถอย





ส=0.1712
ช่วงความเชื่อมั่นสำหรับตัวแปรตาม

ให้เราคำนวณขอบเขตของช่วงเวลาที่ 95% ของค่าที่เป็นไปได้ของ Y จะเข้มข้นด้วยการสังเกตไม่ จำกัด จำนวนและ X = 1
(-20.41;56.24)
การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิ์ของสมการการถดถอยเชิงเส้น
1) สถิติ t


นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย a ได้รับการยืนยันแล้ว

นัยสำคัญทางสถิติของสัมประสิทธิ์การถดถอย b ไม่ได้รับการยืนยัน
ช่วงความมั่นใจสำหรับสัมประสิทธิ์สมการถดถอย
ให้เรากำหนดช่วงความเชื่อมั่นของสัมประสิทธิ์การถดถอยซึ่งมีความน่าเชื่อถือ 95% จะเป็นดังนี้:
(ก - เสื้อ ส ก ; ก + เสื้อ ส ก)
(1.306;1.921)
(ข - t ข S ข ; ข + t ข ข)
(-9.2733;41.876)
โดยที่ t = 1.796
2) สถิติ F


เอฟเคพี = 4.84
เนื่องจาก F > Fkp สัมประสิทธิ์การตัดสินใจจึงมีนัยสำคัญทางสถิติ

หัวข้อ 4 วิธีการทางสถิติสำหรับการศึกษาความสัมพันธ์

สมการถดถอย -นี่คือการนำเสนอเชิงวิเคราะห์ของการพึ่งพาสหสัมพันธ์ สมการการถดถอยอธิบายความสัมพันธ์เชิงฟังก์ชันสมมุติระหว่างค่าเฉลี่ยแบบมีเงื่อนไขของคุณลักษณะผลลัพธ์กับค่าของคุณลักษณะ - ปัจจัย (ปัจจัย) เช่น แนวโน้มหลักของการติดยาเสพติด

การพึ่งพาสหสัมพันธ์แบบคู่อธิบายได้ด้วยสมการถดถอยแบบคู่ และการพึ่งพาสหสัมพันธ์แบบพหุอธิบายโดยสมการถดถอยแบบพหุคูณ

คุณลักษณะผลลัพธ์ในสมการการถดถอยคือตัวแปรตาม (การตอบสนอง ตัวแปรอธิบาย) และคุณลักษณะตัวประกอบคือตัวแปรอิสระ (อาร์กิวเมนต์ ตัวแปรอธิบาย)

สมการการถดถอยที่ง่ายที่สุดคือสมการของการพึ่งพาเชิงเส้นคู่:

โดยที่ y เป็นตัวแปรตาม (แอตทริบิวต์-ผลลัพธ์) x – ตัวแปรอิสระ (ปัจจัยลักษณะ) และ – พารามิเตอร์ของสมการถดถอย - ข้อผิดพลาดในการประมาณค่า

ฟังก์ชันทางคณิตศาสตร์ต่างๆ สามารถใช้เป็นสมการการถดถอยได้ สมการของการพึ่งพาเชิงเส้น พาราโบลา ไฮเปอร์โบลา ฟังก์ชันสเตปป์ ฯลฯ มักใช้ในทางปฏิบัติ

ตามกฎแล้ว การวิเคราะห์เริ่มต้นด้วยการประเมินความสัมพันธ์เชิงเส้น เนื่องจากผลลัพธ์นั้นง่ายต่อการตีความอย่างมีความหมาย การเลือกประเภทของสมการการมีเพศสัมพันธ์เป็นขั้นตอนการวิเคราะห์ที่สำคัญพอสมควร ในยุค "ก่อนคอมพิวเตอร์" กระบวนการนี้เกี่ยวข้องกับความยากลำบากบางประการ และนักวิเคราะห์จำเป็นต้องทราบคุณสมบัติของฟังก์ชันทางคณิตศาสตร์ ปัจจุบันบนพื้นฐานของโปรแกรมเฉพาะทางคุณสามารถสร้างสมการการสื่อสารจำนวนมากได้อย่างรวดเร็วและตัดสินใจเลือกตามเกณฑ์ที่เป็นทางการ รุ่นที่ดีที่สุด(อย่างไรก็ตาม ความรู้ทางคณิตศาสตร์ของนักวิเคราะห์ไม่ได้สูญเสียความเกี่ยวข้องไป)

สมมติฐานเกี่ยวกับประเภทของการพึ่งพาสหสัมพันธ์สามารถหยิบยกขึ้นมาได้จากผลลัพธ์ของการสร้างฟิลด์สหสัมพันธ์ (ดูการบรรยายที่ 6) ขึ้นอยู่กับลักษณะของตำแหน่งของจุดบนกราฟ (พิกัดของจุดสอดคล้องกับค่าของตัวแปรตามและตัวแปรอิสระ) แนวโน้มของความสัมพันธ์ระหว่างคุณลักษณะ (ตัวบ่งชี้) จะถูกเปิดเผย หากเส้นถดถอยผ่านทุกจุดของฟิลด์สหสัมพันธ์ แสดงว่ามีการเชื่อมต่อที่ใช้งานได้ ในการปฏิบัติการวิจัยทางเศรษฐกิจและสังคม ไม่สามารถสังเกตภาพดังกล่าวได้ เนื่องจากมีการพึ่งพาทางสถิติ (สหสัมพันธ์) ในเงื่อนไขของการพึ่งพาความสัมพันธ์ เมื่อพล็อตเส้นการถดถอยบนแผนภาพกระจาย จะสังเกตการเบี่ยงเบนของจุดของฟิลด์สหสัมพันธ์จากเส้นการถดถอย ซึ่งแสดงให้เห็นถึงสิ่งที่เรียกว่าข้อผิดพลาดที่เหลือหรือการประมาณค่า (ดูรูปที่ 7.1)

การปรากฏตัวของข้อผิดพลาดในสมการเกิดจากการที่:

§ ปัจจัยทั้งหมดที่มีอิทธิพลต่อผลลัพธ์ไม่ได้ถูกนำมาพิจารณาในสมการการถดถอย

§ รูปแบบของการเชื่อมต่ออาจถูกเลือกไม่ถูกต้อง - สมการถดถอย

§ ไม่ใช่ทุกปัจจัยที่จะรวมอยู่ในสมการ

การสร้างสมการถดถอยหมายถึงการคำนวณค่าของพารามิเตอร์ สมการการถดถอยถูกสร้างขึ้นตามค่าที่แท้จริงของคุณลักษณะที่วิเคราะห์ โดยปกติการคำนวณพารามิเตอร์จะดำเนินการโดยใช้ วิธีกำลังสองน้อยที่สุด (LSM)

สาระสำคัญของ MNCคือเป็นไปได้ที่จะได้รับค่าดังกล่าวของพารามิเตอร์สมการที่ลดผลรวมของการเบี่ยงเบนกำลังสองของค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ (คำนวณบนพื้นฐานของสมการถดถอย) จากค่าจริง:

,

โดยที่ค่าที่แท้จริงของลักษณะผลลัพธ์คือ หน่วยที่ iมวลรวม; - ค่าของลักษณะผลลัพธ์สำหรับหน่วย i-th ของประชากรที่ได้จากสมการถดถอย ()

ดังนั้นปัญหาของ extremum กำลังได้รับการแก้ไขนั่นคือมีความจำเป็นต้องค้นหาค่าของพารามิเตอร์ที่ฟังก์ชัน S ถึงค่าต่ำสุด

ดำเนินการสร้างความแตกต่างโดยเท่ากับอนุพันธ์บางส่วนเป็นศูนย์:



, (7.3)

, (7.4)

โดยที่ผลคูณเฉลี่ยของปัจจัยและค่าผลลัพธ์ - ค่าเฉลี่ยของคุณลักษณะ - ปัจจัย - ค่าเฉลี่ยของลักษณะผลลัพธ์ - ความแปรปรวนของลักษณะปัจจัย

พารามิเตอร์ในสมการการถดถอยจะแสดงลักษณะความชันของเส้นการถดถอยบนกราฟ พารามิเตอร์นี้เรียกว่า ค่าสัมประสิทธิ์การถดถอยและค่าของมันจะระบุถึงจำนวนหน่วยการวัดที่แอตทริบิวต์ผลลัพธ์จะเปลี่ยนไปเมื่อแอตทริบิวต์ของปัจจัยเปลี่ยนแปลงไปหนึ่งหน่วยของการวัด เครื่องหมายของสัมประสิทธิ์การถดถอยสะท้อนทิศทางของการพึ่งพา (โดยตรงหรือผกผัน) และเกิดขึ้นพร้อมกับเครื่องหมายของสัมประสิทธิ์สหสัมพันธ์ (ในเงื่อนไขของการพึ่งพาแบบคู่)

ในบริบทของตัวอย่างที่กำลังพิจารณา โปรแกรม STATISTICA คำนวณพารามิเตอร์ของสมการการถดถอยที่อธิบายความสัมพันธ์ระหว่างระดับรายได้ทางการเงินต่อหัวของประชากรและมูลค่าของผลิตภัณฑ์มวลรวมในภูมิภาคต่อหัวในภูมิภาคของรัสเซีย ดู ตารางที่ 7.1.

ตารางที่ 7.1 - การคำนวณและการประเมินพารามิเตอร์ของสมการที่อธิบายความสัมพันธ์ระหว่างระดับรายได้ทางการเงินเฉลี่ยต่อหัวของประชากรและมูลค่าของผลิตภัณฑ์มวลรวมในภูมิภาคต่อหัวในภูมิภาครัสเซีย 2556

คอลัมน์ "B" ของตารางมีค่าของพารามิเตอร์ของสมการการถดถอยคู่ดังนั้นเราจึงสามารถเขียนได้: = 13406.89 + 22.82 x สมการนี้อธิบายแนวโน้มความสัมพันธ์ระหว่างคุณลักษณะที่วิเคราะห์ พารามิเตอร์คือค่าสัมประสิทธิ์การถดถอย ในกรณีนี้จะเท่ากับ 22.82 และมีลักษณะดังต่อไปนี้: ด้วยการเพิ่มขึ้นของ GRP ต่อหัว 1,000 รูเบิล รายได้เงินสดเฉลี่ยต่อหัวจะเพิ่มขึ้นโดยเฉลี่ย (ตามที่ระบุด้วยเครื่องหมาย "+") 22.28 รูเบิล

ตามกฎแล้ว พารามิเตอร์สมการถดถอยในการศึกษาทางเศรษฐกิจและสังคมไม่ได้ถูกตีความอย่างมีความหมาย อย่างเป็นทางการจะสะท้อนถึงค่าของแอตทริบิวต์ - ผลลัพธ์โดยมีเงื่อนไขว่าแอตทริบิวต์ - ปัจจัยมีค่าเท่ากับศูนย์ พารามิเตอร์แสดงลักษณะตำแหน่งของเส้นถดถอยบนกราฟ ดูรูป 7.1

รูปที่ 7.1 - ช่องสหสัมพันธ์และเส้นถดถอยที่สะท้อนถึงการพึ่งพาระดับรายได้ทางการเงินต่อหัวของประชากรในภูมิภาครัสเซียและมูลค่าของ GRP ต่อหัว

ค่าพารามิเตอร์สอดคล้องกับจุดตัดของเส้นถดถอยกับแกน Y ที่ X=0

การสร้างสมการถดถอยจะมาพร้อมกับการประเมินนัยสำคัญทางสถิติของสมการโดยรวมและพารามิเตอร์ต่างๆ ความจำเป็นในขั้นตอนดังกล่าวเกี่ยวข้องกับข้อมูลจำนวนจำกัด ซึ่งอาจขัดขวางการดำเนินการตามกฎหมายที่มีจำนวนมาก และด้วยเหตุนี้ การระบุแนวโน้มที่แท้จริงในความสัมพันธ์ของตัวบ่งชี้ที่วิเคราะห์ นอกจากนี้ ประชากรใดๆ ที่อยู่ระหว่างการศึกษาถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไป และคุณลักษณะที่ได้รับระหว่างการวิเคราะห์เป็นการประเมินพารามิเตอร์ทั่วไป

การประเมินนัยสำคัญทางสถิติของพารามิเตอร์และสมการโดยรวมเป็นการพิสูจน์ความเป็นไปได้ของการใช้แบบจำลองการสื่อสารที่สร้างขึ้นเพื่อการตัดสินใจด้านการจัดการและการพยากรณ์ (การสร้างแบบจำลอง)

นัยสำคัญทางสถิติของสมการถดถอยประเมินโดยทั่วไปโดยใช้ การทดสอบ F ของฟิชเชอร์ซึ่งเป็นอัตราส่วนของปัจจัยและความแปรปรวนคงเหลือที่คำนวณตามระดับความเป็นอิสระ:

ที่ไหน - การกระจายปัจจัยของคุณลักษณะ - ผลลัพธ์; k – จำนวนดีกรีอิสระของการกระจายตัวประกอบ (จำนวนตัวประกอบในสมการการถดถอย) - ค่าเฉลี่ยของตัวแปรตาม - ค่าทางทฤษฎี (ได้มาจากสมการถดถอย) ของตัวแปรตามสำหรับหน่วย i – th ของประชากร - ความแปรปรวนคงเหลือของคุณลักษณะ - ผลลัพธ์; n คือปริมาตรของประชากร n-k-1 – จำนวนองศาอิสระของการกระจายตัวของสารตกค้าง

ตามสูตร ค่าของการทดสอบ Fisher's F จะแสดงลักษณะความสัมพันธ์ระหว่างปัจจัยและความแปรปรวนคงเหลือของตัวแปรตาม ซึ่งแสดงให้เห็นโดยพื้นฐานแล้วว่าค่าของส่วนที่อธิบายของการแปรผันนั้นเกินกว่าส่วนที่อธิบายไม่ได้กี่ครั้ง

การทดสอบ F ของฟิชเชอร์จะถูกทำเป็นตาราง ข้อมูลเข้าในตารางคือจำนวนองศาอิสระของตัวประกอบและความแปรปรวนที่เหลือ การเปรียบเทียบค่าที่คำนวณได้ของเกณฑ์กับค่าในตาราง (วิกฤต) ช่วยให้เราสามารถตอบคำถามได้: นั่นเป็นส่วนหนึ่งของการเปลี่ยนแปลงในแอตทริบิวต์ผลลัพธ์ที่สามารถอธิบายได้ด้วยปัจจัยที่รวมอยู่ในสมการประเภทนี้หรือไม่ มีนัยสำคัญทางสถิติหรือไม่ ถ้า ดังนั้นสมการการถดถอยจึงถือว่ามีนัยสำคัญทางสถิติ ดังนั้นค่าสัมประสิทธิ์การกำหนดจึงมีนัยสำคัญทางสถิติ มิฉะนั้น ( ) สมการนี้ไม่มีนัยสำคัญทางสถิติ เช่น การแปรผันของปัจจัยที่นำมาพิจารณาในสมการไม่ได้อธิบายส่วนที่มีนัยสำคัญทางสถิติของการแปรผันในลักษณะผลลัพธ์ หรือเลือกสมการความสัมพันธ์ไม่ถูกต้อง

การประมาณนัยสำคัญทางสถิติของพารามิเตอร์สมการดำเนินการบนพื้นฐาน t-สถิติซึ่งคำนวณเป็นอัตราส่วนของโมดูลัสของพารามิเตอร์ของสมการถดถอยต่อข้อผิดพลาดมาตรฐาน ( ):

, ที่ไหน ; (7.6)

, ที่ไหน ; (7.7)

ที่ไหน - ส่วนเบี่ยงเบนมาตรฐานเครื่องหมาย - ปัจจัยและเครื่องหมาย - ผลลัพธ์ - ค่าสัมประสิทธิ์การตัดสินใจ

ในโปรแกรมทางสถิติเฉพาะทางการคำนวณพารามิเตอร์จะมาพร้อมกับการคำนวณค่าของข้อผิดพลาดมาตรฐาน (ค่าเฉลี่ยกำลังสอง) และสถิติ t (ดูตารางที่ 7.1) เสมอ ค่าสถิติ t ที่คำนวณได้จะถูกนำมาเปรียบเทียบกับตารางที่ 1 หากปริมาตรของประชากรที่กำลังศึกษาน้อยกว่า 30 หน่วย (แน่นอนว่าเป็นตัวอย่างขนาดเล็ก) คุณควรอ้างอิงถึงตารางการแจกแจงค่า t ของนักเรียน หากปริมาณประชากรมีขนาดใหญ่ คุณควรใช้ตารางการแจกแจงแบบปกติ (อินทิกรัลความน่าจะเป็นของลาปลาซ) พารามิเตอร์สมการถือว่ามีนัยสำคัญทางสถิติหาก

การประมาณค่าพารามิเตอร์ตามสถิติ t นั้นเป็นการทดสอบสมมติฐานว่างว่าพารามิเตอร์ทั่วไปมีค่าเท่ากับศูนย์ (H 0: =0; H 0: =0;) นั่นคือ พารามิเตอร์ของสมการการถดถอยคือ ไม่มีนัยสำคัญทางสถิติ โดยทั่วไปจะยอมรับระดับนัยสำคัญของสมมติฐาน: = 0.05 หากระดับนัยสำคัญที่คำนวณได้น้อยกว่า 0.05 สมมติฐานว่างจะถูกปฏิเสธและสมมติฐานทางเลือกจะได้รับการยอมรับ - เกี่ยวกับนัยสำคัญทางสถิติของพารามิเตอร์

มาดูตัวอย่างกันต่อ ในตารางที่ 7.1 คอลัมน์ "B" แสดงค่าของพารามิเตอร์และคอลัมน์ Std.Err.ofB แสดงค่าของข้อผิดพลาดมาตรฐานของพารามิเตอร์ ( ) ในคอลัมน์ เสื้อ(77 – จำนวนองศาอิสระ) ค่าของ t - สถิติคำนวณโดยคำนึงถึงจำนวนองศาอิสระ ในการประเมินนัยสำคัญทางสถิติของพารามิเตอร์ต้องเปรียบเทียบค่าที่คำนวณได้ของ t - สถิติกับค่าตาราง ระดับนัยสำคัญที่ระบุ (0.05) ในตารางการแจกแจงแบบปกติสอดคล้องกับ t = 1.96 ตั้งแต่ 18.02, 10.84 เช่น ควรรับรู้นัยสำคัญทางสถิติของค่าพารามิเตอร์ที่ได้รับเช่น ค่าเหล่านี้เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สุ่มและสะท้อนถึงแนวโน้มของความสัมพันธ์ระหว่างตัวบ่งชี้ที่วิเคราะห์

เพื่อประเมินนัยสำคัญทางสถิติของสมการโดยรวม ให้เราพิจารณาค่าของการทดสอบ F ของฟิชเชอร์ (ดูตารางที่ 7.1) ค่าที่คำนวณได้ของเกณฑ์ F = 117.51 ​​ซึ่งเป็นค่าในตารางของเกณฑ์ โดยขึ้นอยู่กับจำนวนองศาอิสระที่สอดคล้องกัน (สำหรับการกระจายตัวของปัจจัย d.f. =1 สำหรับการกระจายตัวของสารตกค้าง d.f. =77) เท่ากับ 4.00 (ดูภาคผนวก .... .) ดังนั้น, ดังนั้นสมการการถดถอยโดยรวมจึงมีนัยสำคัญทางสถิติ ในสถานการณ์เช่นนี้เราสามารถพูดคุยเกี่ยวกับนัยสำคัญทางสถิติของค่าสัมประสิทธิ์การกำหนดได้เช่น ร้อยละ 60 ของการเปลี่ยนแปลงของรายได้เฉลี่ยต่อหัวของประชากรในภูมิภาคของรัสเซียสามารถอธิบายได้จากการเปลี่ยนแปลงของปริมาณผลิตภัณฑ์รวมของภูมิภาคต่อหัว

เราสามารถหาค่านัยสำคัญทางสถิติของสมการถดถอยและพารามิเตอร์ต่างๆ ได้ การรวมกันที่แตกต่างกันผลลัพธ์.

· สมการตามการทดสอบ F มีนัยสำคัญทางสถิติ และพารามิเตอร์ทั้งหมดของสมการตามสถิติ t ก็มีนัยสำคัญทางสถิติเช่นกัน สมการนี้สามารถใช้ได้ทั้งในการตัดสินใจด้านการจัดการ (ปัจจัยใดควรได้รับอิทธิพลเพื่อให้ได้ผลลัพธ์ที่ต้องการ) และสำหรับการทำนายพฤติกรรมของลักษณะผลลัพธ์ที่ค่าหนึ่งของปัจจัย

· จากการทดสอบ F สมการนี้มีนัยสำคัญทางสถิติ แต่พารามิเตอร์ (พารามิเตอร์) ของสมการไม่มีนัยสำคัญ สามารถใช้สมการในการตัดสินใจของฝ่ายบริหารได้ (เกี่ยวข้องกับปัจจัยที่ได้รับการยืนยันนัยสำคัญทางสถิติของอิทธิพล) แต่ไม่สามารถใช้สมการในการพยากรณ์ได้

· สมการการทดสอบ F ไม่มีนัยสำคัญทางสถิติ ไม่สามารถใช้สมการได้ คุณควรค้นหาสัญญาณ-ปัจจัยที่สำคัญหรือรูปแบบการวิเคราะห์ของการเชื่อมโยงระหว่างข้อโต้แย้งและการตอบสนองต่อไป

หากนัยสำคัญทางสถิติของสมการและพารามิเตอร์ได้รับการยืนยัน ก็จะสามารถรับรู้สิ่งที่เรียกว่าการพยากรณ์จุดได้ เช่น ได้รับการประมาณค่าของลักษณะผลลัพธ์ (y) สำหรับค่าที่แน่นอนของปัจจัย (x)

เห็นได้ชัดว่าค่าทำนายของตัวแปรตามซึ่งคำนวณตามสมการความสัมพันธ์ จะไม่ตรงกับค่าจริง ( ) ในภาพกราฟิก สถานการณ์นี้ได้รับการยืนยันจากข้อเท็จจริงที่ว่าไม่ใช่ทุกจุดของฟิลด์สหสัมพันธ์จะอยู่บนเส้นถดถอย เฉพาะการเชื่อมต่อเชิงฟังก์ชันเท่านั้นที่เส้นการถดถอยจะผ่านทุกจุดของแผนภาพกระจาย การปรากฏตัวของความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎีของตัวแปรตามนั้นสัมพันธ์กันก่อนอื่นด้วยสาระสำคัญของการพึ่งพาสหสัมพันธ์: ในเวลาเดียวกันผลลัพธ์จะได้รับอิทธิพลจากหลายปัจจัยซึ่งเพียงบางส่วนเท่านั้น สามารถนำมาพิจารณาในสมการการสื่อสารเฉพาะได้ นอกจากนี้ รูปแบบของการเชื่อมต่อระหว่างผลลัพธ์กับตัวประกอบ (ประเภทของสมการการถดถอย) อาจเลือกไม่ถูกต้อง ในเรื่องนี้ คำถามเกิดขึ้นว่าสมการการมีเพศสัมพันธ์ที่สร้างขึ้นมีข้อมูลมากน้อยเพียงใด ตัวบ่งชี้สองตัวตอบคำถามนี้: ค่าสัมประสิทธิ์การตัดสินใจ (ตามที่กล่าวไว้ข้างต้น) และข้อผิดพลาดมาตรฐานของการประมาณค่า

เรียกว่าความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎีของตัวแปรตาม การเบี่ยงเบนหรือข้อผิดพลาดหรือสิ่งตกค้าง- ขึ้นอยู่กับค่าเหล่านี้ จะมีการคำนวณผลต่างคงเหลือ รากที่สองจากความแปรปรวนคงเหลือ และ คือ ข้อผิดพลาดในการประมาณรากกำลังสองเฉลี่ย (มาตรฐาน):

= (7.8)

ค่าคลาดเคลื่อนมาตรฐานของสมการจะวัดในหน่วยเดียวกับค่าที่ทำนายไว้ หากข้อผิดพลาดในสมการเป็นไปตามการแจกแจงแบบปกติ (สำหรับข้อมูลจำนวนมาก) ค่า 95 เปอร์เซ็นต์ควรอยู่ภายใน 2S ของเส้นการถดถอย (ขึ้นอยู่กับคุณสมบัติของการแจกแจงแบบปกติ - กฎสามซิกมา) . ขนาด ข้อผิดพลาดมาตรฐานการประมาณค่าใช้ในการคำนวณช่วงความเชื่อมั่นเมื่อทำนายค่าของคุณลักษณะ - ผลลัพธ์สำหรับหน่วยเฉพาะของประชากร

ในการวิจัยเชิงปฏิบัติ มักมีความจำเป็นต้องทำนายค่าเฉลี่ยของคุณลักษณะหนึ่งๆ ซึ่งเป็นผลลัพธ์ของค่าเฉพาะของคุณลักษณะนั้นๆ ปัจจัยต่างๆ ในกรณีนี้ ในการคำนวณช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรตาม()

คำนึงถึงค่าของข้อผิดพลาดโดยเฉลี่ย:

(7.9)

การใช้ค่าความผิดพลาดที่แตกต่างกันอธิบายได้จากข้อเท็จจริงที่ว่าความแปรปรวนของระดับตัวบ่งชี้ในหน่วยเฉพาะของประชากรนั้นสูงกว่าความแปรปรวนของค่าเฉลี่ยมาก ดังนั้นข้อผิดพลาดในการทำนายค่าเฉลี่ยจึงน้อยกว่า

ช่วงความเชื่อมั่นสำหรับการพยากรณ์ค่าเฉลี่ยของตัวแปรตาม:

, (7.10)

ที่ไหน - ข้อผิดพลาดในการประมาณค่าสูงสุด (ดูทฤษฎีการสุ่มตัวอย่าง) เสื้อ – ค่าสัมประสิทธิ์ความเชื่อมั่น ค่าที่อยู่ในตารางที่เกี่ยวข้อง ขึ้นอยู่กับระดับความน่าจะเป็น (จำนวนระดับความเป็นอิสระ) ที่ผู้วิจัยยอมรับ (ดูทฤษฎีการสุ่มตัวอย่าง)

ช่วงความเชื่อมั่นสำหรับค่าที่คาดการณ์ไว้ของคุณลักษณะผลลัพธ์สามารถคำนวณได้โดยคำนึงถึงการแก้ไขอคติ (การเปลี่ยนแปลง) ของเส้นการถดถอย กำหนดค่าของปัจจัยการแก้ไขถูกกำหนด:

(7.11)

โดยที่ คือค่าของลักษณะเฉพาะของปัจจัย โดยขึ้นอยู่กับค่าของลักษณะผลลัพธ์ที่คาดการณ์ไว้

ตามมาว่ายิ่งค่าแตกต่างจากค่าเฉลี่ยของคุณลักษณะปัจจัยมากเท่าใด ค่าสัมประสิทธิ์การแก้ไขก็จะยิ่งมากขึ้น ข้อผิดพลาดในการพยากรณ์ก็จะยิ่งมากขึ้นเท่านั้น เมื่อคำนึงถึงค่าสัมประสิทธิ์นี้ ช่วงความเชื่อมั่นของการพยากรณ์จะถูกคำนวณ:

ความแม่นยำของการทำนายตามสมการถดถอยอาจได้รับผลกระทบ เหตุผลต่างๆ- ประการแรกควรคำนึงว่าการประเมินคุณภาพของสมการและพารามิเตอร์นั้นดำเนินการบนสมมติฐานที่ว่า การกระจายตัวแบบปกติของเหลือแบบสุ่ม การละเมิดสมมติฐานนี้อาจเกิดจากการมีค่าที่แตกต่างกันอย่างมากในข้อมูล ความแปรปรวนที่ไม่สม่ำเสมอ หรือการมีความสัมพันธ์แบบไม่เชิงเส้น ในกรณีนี้ คุณภาพของการคาดการณ์จะลดลง จุดที่สองที่ต้องจำคือค่าของปัจจัยที่นำมาพิจารณาเมื่อทำนายผลลัพธ์ไม่ควรเกินช่วงของการแปรผันของข้อมูลที่ใช้สมการ

©2015-2019 เว็บไซต์
สิทธิ์ทั้งหมดเป็นของผู้เขียน ไซต์นี้ไม่ได้อ้างสิทธิ์ในการประพันธ์ แต่ให้ใช้งานฟรี
วันที่สร้างเพจ: 2018-01-08





ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!