วิธีการระบุสมการถดถอยคู่ การถดถอยคู่เชิงเส้น

รูปแบบการถดถอยที่ง่ายที่สุดจากมุมมองของความเข้าใจ การตีความ และเทคนิคการคำนวณคือรูปแบบการถดถอยเชิงเส้น

สมการการถดถอยคู่เชิงเส้น โดยที่

a 0 , a 1 เป็นพารามิเตอร์โมเดล ε i เป็นตัวแปรสุ่ม (ค่าส่วนที่เหลือ)

พารามิเตอร์โมเดลและเนื้อหา:


สมการถดถอยเสริมด้วยตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อ ตัวบ่งชี้ดังกล่าวก็คือ ค่าสัมประสิทธิ์เชิงเส้นความสัมพันธ์ซึ่งคำนวณโดยใช้สูตร:

หรือ .

ในการประเมินคุณภาพของการปรับฟังก์ชันเชิงเส้นให้เหมาะสม จะมีการคำนวณกำลังสองของสัมประสิทธิ์สหสัมพันธ์เชิงเส้น ค่าสัมประสิทธิ์การตัดสินใจ- ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของลักษณะผลลัพธ์ที่อธิบายโดยการถดถอยใน ความแปรปรวนทั้งหมดเครื่องหมายผลลัพธ์:

,

ที่ไหน

.

ดังนั้น ค่านี้จะระบุถึงส่วนแบ่งของความแปรปรวนที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในแบบจำลอง

หลังจากสร้างสมการการถดถอยแล้ว จะมีการตรวจสอบความเพียงพอและความแม่นยำของแบบจำลองโดยอาศัยการวิเคราะห์จำนวนคงเหลือ ε i (ค่าเบี่ยงเบนของค่าที่คำนวณจากค่าจริง)

ระดับชุดสารตกค้าง

ความสัมพันธ์และ การวิเคราะห์การถดถอยดำเนินการสำหรับประชากรจำนวนจำกัด ในเรื่องนี้ ตัวบ่งชี้การถดถอย ความสัมพันธ์ และการกำหนดอาจถูกบิดเบือนโดยการกระทำของปัจจัยสุ่ม ในการตรวจสอบว่าตัวบ่งชี้เหล่านี้มีลักษณะทั่วไปสำหรับประชากรทั้งหมดเพียงใด และไม่ว่าจะเป็นผลมาจากความบังเอิญของสถานการณ์สุ่มหรือไม่ จำเป็นต้องตรวจสอบความเพียงพอของแบบจำลองที่สร้างขึ้น

การตรวจสอบความเพียงพอของแบบจำลองประกอบด้วยการกำหนดความสำคัญของแบบจำลองและการกำหนดว่ามีหรือไม่มีข้อผิดพลาดอย่างเป็นระบบ

ค่านิยม เวลา 1สอดคล้องกับข้อมูล เอ็กซ์ฉันตามค่าทางทฤษฎี 0และ 1,สุ่ม ค่าสัมประสิทธิ์ที่คำนวณจากนั้นจะเป็นแบบสุ่มเช่นกัน 0และ 1.

มีการตรวจสอบความสำคัญของสัมประสิทธิ์การถดถอยแต่ละรายการโดยใช้ แบบทดสอบของนักเรียนโดยทดสอบสมมติฐานว่าค่าสัมประสิทธิ์การถดถอยแต่ละค่ามีค่าเท่ากับศูนย์ ในเวลาเดียวกันพวกเขาพบว่าพารามิเตอร์ที่คำนวณนั้นโดยทั่วไปสำหรับการแสดงชุดเงื่อนไข: ค่าพารามิเตอร์ที่ได้รับนั้นเป็นผลมาจากการกระทำของตัวแปรสุ่มหรือไม่ มีการใช้สูตรที่เหมาะสมสำหรับค่าสัมประสิทธิ์การถดถอยที่สอดคล้องกัน

สูตรการพิจารณาค่าทีของนักเรียน

ที่ไหน

S a 0 ,S a 1 - ส่วนเบี่ยงเบนมาตรฐานของเทอมอิสระและสัมประสิทธิ์การถดถอย กำหนดโดยสูตร

ที่ไหน

ส ε - ส่วนเบี่ยงเบนมาตรฐานแบบจำลองที่เหลือ ( ข้อผิดพลาดมาตรฐานประมาณ) ซึ่งกำหนดโดยสูตร

ค่าที่คำนวณได้ของการทดสอบทีจะถูกเปรียบเทียบกับค่าที่ทำเป็นตารางของเกณฑ์ ทีαγ ซึ่งถูกกำหนดเมื่อ (n - เค— 1) ระดับความเป็นอิสระและระดับนัยสำคัญที่สอดคล้องกัน α หากค่าที่คำนวณได้ของเกณฑ์ t เกินค่าตาราง ทีαγ ดังนั้นพารามิเตอร์จึงถือว่ามีนัยสำคัญ ในกรณีนี้แทบจะเป็นไปไม่ได้เลยที่ค่าพารามิเตอร์ที่พบนั้นเกิดจากความบังเอิญแบบสุ่มเท่านั้น

ความสำคัญของสมการการถดถอยโดยรวมได้รับการประเมินตามเกณฑ์ของฟิชเชอร์ ซึ่งนำหน้าด้วยการวิเคราะห์ความแปรปรวน

ผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรจากค่าเฉลี่ยแบ่งออกเป็นสองส่วน - "อธิบาย" และ "ไม่ได้อธิบาย":

ผลรวมของการเบี่ยงเบนกำลังสอง

ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอย (หรือผลรวมตัวประกอบของการเบี่ยงเบนกำลังสอง)


- ผลรวมที่เหลือของการเบี่ยงเบนกำลังสองซึ่งแสดงถึงอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง

โครงการ การวิเคราะห์ความแปรปรวนมีรูปแบบที่นำเสนอในตารางที่ 35 ( - จำนวนการสังเกต - จำนวนพารามิเตอร์สำหรับตัวแปร)

ตารางที่ 35 - การวิเคราะห์รูปแบบความแปรปรวน

ส่วนประกอบความแปรปรวน ผลรวมของกำลังสอง จำนวนองศาความเป็นอิสระ การกระจายตัวต่อระดับความเป็นอิสระ
ทั่วไป
แฟกทอเรียล
สารตกค้าง

การกำหนดความแปรปรวนด้วยอิสระระดับหนึ่งจะทำให้ความแปรปรวนมีรูปแบบที่เทียบเคียงได้ เมื่อเปรียบเทียบปัจจัยและความแปรปรวนคงเหลือต่อระดับความเป็นอิสระ เราได้ค่าของเกณฑ์ฟิชเชอร์:

หากต้องการทดสอบความสำคัญของสมการการถดถอยโดยรวม ให้ใช้ การทดสอบ F ของฟิชเชอร์. ในกรณีของการถดถอยเชิงเส้นแบบคู่ ความสำคัญของแบบจำลองการถดถอยจะถูกกำหนดโดยสูตรต่อไปนี้: .

ที่ระดับนัยสำคัญที่กำหนด หากค่าที่คำนวณได้ของการทดสอบ F ด้วย γ 1 =k, γ 2 =( พี - เค - 1) องศาความอิสระมากกว่าตาราง จากนั้นแบบจำลองถือว่ามีนัยสำคัญ สมมติฐานเกี่ยวกับลักษณะสุ่มของคุณลักษณะโดยประมาณถูกปฏิเสธ และ นัยสำคัญทางสถิติและความน่าเชื่อถือ การตรวจสอบว่ามีหรือไม่มีข้อผิดพลาดอย่างเป็นระบบ (การปฏิบัติตามข้อกำหนดเบื้องต้นของวิธีการ) กำลังสองน้อยที่สุด— OLS) ดำเนินการตามการวิเคราะห์สารตกค้างจำนวนหนึ่ง การคำนวณข้อผิดพลาดแบบสุ่มของพารามิเตอร์การถดถอยเชิงเส้นและค่าสัมประสิทธิ์สหสัมพันธ์จะดำเนินการตามสูตร

,

หากต้องการตรวจสอบคุณสมบัติการสุ่มของชุดสารตกค้าง คุณสามารถใช้เกณฑ์ของจุดเปลี่ยน (พีค) จุดจะถือเป็นจุดเปลี่ยนหากตรงตามเงื่อนไขต่อไปนี้: ε i -1< ε i >ε ฉัน +1 หรือ ε ฉัน -1 > ε ฉัน< ε i +1

ถัดไปจะคำนวณจำนวนจุดเปลี่ยน p เกณฑ์การสุ่มที่มีระดับนัยสำคัญ 5% เช่น กับ ความน่าจะเป็นของความมั่นใจ 95% คือการเติมเต็มความไม่เท่าเทียมกัน:

วงเล็บเหลี่ยมหมายความว่านำตัวเลขที่อยู่ในวงเล็บออกทั้งหมด หากความไม่เท่าเทียมกันเป็นที่พอใจ แสดงว่าแบบจำลองนั้นถือว่าเพียงพอ

เพื่อตรวจสอบว่าความคาดหวังทางคณิตศาสตร์ของลำดับที่เหลือเท่ากับศูนย์หรือไม่ ให้คำนวณค่าเฉลี่ยของชุดของสารตกค้าง:

ถ้า = 0 จะถือว่าแบบจำลองไม่มีข้อผิดพลาดอย่างเป็นระบบคงที่ และเพียงพอตามเกณฑ์ค่าเฉลี่ยเป็นศูนย์

ถ้า ≠ 0 แสดงว่าสมมติฐานว่างที่ว่าความคาดหวังทางคณิตศาสตร์เท่ากับศูนย์จะถูกทดสอบ โดยคำนวณค่าทีทดสอบของนักเรียนโดยใช้สูตร:

โดยที่ S ε คือค่าเบี่ยงเบนมาตรฐานของแบบจำลองที่เหลือ (ข้อผิดพลาดมาตรฐาน)

ค่า t-criterion ถูกเปรียบเทียบกับ t αγที่ทำเป็นตาราง หากความไม่เท่าเทียมกัน t > t αγ เป็นที่พอใจ แสดงว่าแบบจำลองนั้นไม่เพียงพอตามเกณฑ์นี้

การกระจายตัวของระดับของสารตกค้างจำนวนหนึ่งควรเท่ากันในทุกค่า เอ็กซ์(คุณสมบัติ การรักร่วมเพศ).หากไม่ตรงตามเงื่อนไขนี้แล้ว ความไม่สมดุล .

หากต้องการประมาณค่าความต่างศักย์ต่างกันด้วยขนาดตัวอย่างขนาดเล็ก คุณสามารถใช้ได้ วิธีโกลด์เฟลด์-ควอนต์, สาระสำคัญก็คือมันจำเป็น:

จัดเรียงค่าตัวแปร เอ็กซ์ตามลำดับจากน้อยไปมาก;

แบ่งชุดของการสังเกตตามลำดับออกเป็นสองกลุ่ม

สำหรับการสังเกตแต่ละกลุ่ม ให้สร้างสมการถดถอย

กำหนดผลรวมที่เหลือของกำลังสองสำหรับกลุ่มที่หนึ่งและสองโดยใช้สูตร: ; , ที่ไหน

n 1 - จำนวนการสังเกตในกลุ่มแรก

n 2 - จำนวนการสังเกตในกลุ่มที่สอง

คำนวณเกณฑ์หรือ (ตัวเศษต้องมีผลรวมกำลังสองจำนวนมาก) เมื่อสมมติฐานว่างของความเป็นโฮโมสซิดาสติกซิตีเป็นที่พอใจ เกณฑ์การคำนวณ F จะเป็นไปตามเกณฑ์ F ด้วยระดับอิสระ γ 1 =n 1 -m, γ 2 =n - n 1 - m) สำหรับผลรวมที่เหลือของกำลังสอง (โดยที่ m จำนวนพารามิเตอร์โดยประมาณในสมการถดถอย) ยิ่งค่าที่คำนวณได้ F เกินค่าตารางของเกณฑ์ F ยิ่งมีการละเมิดสมมติฐานของความเท่าเทียมกันของความแปรปรวนของค่าคงเหลือมากขึ้น

ตรวจสอบความเป็นอิสระของลำดับของสารตกค้าง (ขาดความสัมพันธ์อัตโนมัติ) โดยใช้การทดสอบ Durbin-Watson d ถูกกำหนดโดยสูตร:

ค่าที่คำนวณได้ของเกณฑ์จะถูกเปรียบเทียบกับค่าวิกฤต d1 และ d2 ที่ต่ำกว่าของสถิติ Durbin-Watson เป็นไปได้ในกรณีต่อไปนี้:

1) ถ้า ง< d 1 , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

2) ถ้า ง 1 < < วันที่ 2 (รวมถึงค่าเหล่านี้ด้วย) ถือว่าไม่มีเหตุผลเพียงพอที่จะสรุปอย่างใดอย่างหนึ่ง จำเป็นต้องใช้เกณฑ์เพิ่มเติม เช่น ค่าสัมประสิทธิ์ความสัมพันธ์อัตโนมัติแรก:

หากค่าที่คำนวณได้ของสัมประสิทธิ์ในโมดูลัสน้อยกว่าค่าในตาราง r 1cr แสดงว่าสมมติฐานของการไม่มีความสัมพันธ์อัตโนมัติได้รับการยอมรับ มิฉะนั้นสมมติฐานนี้จะถูกปฏิเสธ

3) ถ้า วันที่ 2 < < 2, จากนั้นจึงยอมรับสมมติฐานเกี่ยวกับความเป็นอิสระของสิ่งตกค้าง และแบบจำลองถือว่าเพียงพอตามเกณฑ์นี้

4) ถ้า d> 2 แสดงว่ามีความสัมพันธ์อัตโนมัติเชิงลบของส่วนที่เหลือ ในกรณีนี้ ค่าที่คำนวณได้ของเกณฑ์จะต้องแปลงโดยใช้สูตร d′= 4 - d และเปรียบเทียบกับค่าวิกฤต d′ , ไม่ง.

การตรวจสอบว่าการกระจายของลำดับที่เหลือสอดคล้องกับกฎการกระจายแบบปกติหรือไม่สามารถทำได้โดยใช้เกณฑ์ R/S ซึ่งกำหนดโดยสูตร:

โดยที่ S ε คือค่าเบี่ยงเบนมาตรฐานของแบบจำลองที่เหลือ (ข้อผิดพลาดมาตรฐาน) ค่าที่คำนวณได้ของเกณฑ์ R/S จะถูกเปรียบเทียบกับค่าในตาราง (ขีดจำกัดล่างและบนของอัตราส่วนนี้) และหากค่าไม่อยู่ภายในช่วงเวลาระหว่างขีดจำกัดวิกฤต จากนั้นด้วยระดับนัยสำคัญที่กำหนด สมมติฐานเกี่ยวกับความปกติของการแจกแจงถูกปฏิเสธ มิฉะนั้นสมมติฐานจะได้รับการยอมรับ

เพื่อประเมินคุณภาพของแบบจำลองการถดถอย ขอแนะนำให้ใช้เช่นกัน ดัชนีความสัมพันธ์(สัมประสิทธิ์สหสัมพันธ์พหุคูณ)

สูตรกำหนดดัชนีสหสัมพันธ์

ที่ไหน

ผลรวมของการเบี่ยงเบนกำลังสองของตัวแปรตามจากค่าเฉลี่ย กำหนดโดยสูตร:

ผลรวมของการเบี่ยงเบนกำลังสองซึ่งอธิบายโดยการถดถอย กำหนดโดยสูตร:

ผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง คำนวณโดยสูตร:

สมการ สามารถแสดงได้ดังนี้:

ดัชนีสหสัมพันธ์รับค่าตั้งแต่ 0 ถึง 1 ยิ่งค่าดัชนีสูงเท่าใด ค่าที่คำนวณได้ของคุณลักษณะผลลัพธ์ก็จะยิ่งใกล้เคียงกับค่าจริงมากขึ้นเท่านั้น ดัชนีสหสัมพันธ์ใช้สำหรับการเชื่อมต่อระหว่างตัวแปรทุกรูปแบบ ด้วยการถดถอยเชิงเส้นคู่จะเท่ากับ ค่าสัมประสิทธิ์คู่ความสัมพันธ์

คุณลักษณะความแม่นยำถูกใช้เป็นการวัดความแม่นยำของโมเดล: ในการพิจารณาการวัดความแม่นยำของโมเดล ให้คำนวณ:

- ข้อผิดพลาดสูงสุด- สอดคล้องกับค่าเบี่ยงเบนของค่าเบี่ยงเบนที่คำนวณได้ของค่าที่คำนวณได้จากค่าจริง

- หมายถึงข้อผิดพลาดแน่นอน- ข้อผิดพลาดแสดงว่าค่าจริงโดยเฉลี่ยเบี่ยงเบนไปจากแบบจำลองเท่าใด

- ความแปรปรวนของอนุกรมสารตกค้าง(ผลต่างที่เหลือ)

โดยที่คือค่าเฉลี่ยของชุดสารตกค้าง กำหนดโดยสูตร

- หมายถึงค่าคลาดเคลื่อนกำลังสอง- แสดงถึงรากที่สองของความแปรปรวน: , ยังไง มูลค่าน้อยลงข้อผิดพลาด ยิ่งแบบจำลองมีความแม่นยำมากขึ้น

- เฉลี่ย ข้อผิดพลาดที่เกี่ยวข้องการประมาณ.

ข้อผิดพลาดในการประมาณโดยเฉลี่ยไม่ควรเกิน 8-10%

หากแบบจำลองการถดถอยถือว่าเพียงพอและพารามิเตอร์แบบจำลองมีนัยสำคัญ ให้ดำเนินการสร้างการคาดการณ์ .

ค่าที่คาดการณ์ไว้ตัวแปร ที่ได้จากการแทนที่ค่าคาดหวังของตัวแปรอิสระลงในสมการการถดถอย เอ็กซ์พยากรณ์

พยากรณ์นี้เรียกว่า ตามจุดความน่าจะเป็นของการคาดการณ์จุดที่จะเกิดขึ้นจริงนั้นแทบจะเป็นศูนย์ ดังนั้นช่วงความเชื่อมั่นของการพยากรณ์จึงคำนวณด้วยความน่าเชื่อถือสูง

ช่วงความเชื่อมั่นของการพยากรณ์ขึ้นอยู่กับข้อผิดพลาดมาตรฐาน การลบออก เอ็กซ์วิ่งจากค่าเฉลี่ยของมัน , จำนวนการสังเกต nและระดับนัยสำคัญของการพยากรณ์ α ช่วงความเชื่อมั่นของการคาดการณ์คำนวณโดยใช้สูตร: หรือ

ที่ไหน

ทีตาราง - พิจารณาจากตารางการแจกแจงของนักเรียนสำหรับระดับนัยสำคัญ α และจำนวนองศาอิสระ γ=n-k-1

ตัวอย่างที่ 13.

จากการสำรวจครอบครัวทั้ง 8 กลุ่ม ทราบข้อมูลเกี่ยวกับความสัมพันธ์ระหว่างค่าใช้จ่ายด้านอาหารและรายได้ของครอบครัว (ตารางที่ 36)

ตารางที่ 36 - ความสัมพันธ์ระหว่างค่าใช้จ่ายด้านอาหารและระดับรายได้ของครอบครัว

ค่าใช้จ่ายเกี่ยวกับผลิตภัณฑ์อาหาร พันรูเบิล 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
รายได้ของครอบครัวพันรูเบิล 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

สมมติว่าความสัมพันธ์ระหว่างรายได้ของครอบครัวกับรายจ่ายด้านอาหารนั้นเป็นเส้นตรง เพื่อยืนยันสมมติฐานของเรา เราจะสร้างฟิลด์สหสัมพันธ์ (รูปที่ 8)

กราฟแสดงให้เห็นว่าจุดต่างๆ เรียงกันเป็นเส้นตรงเส้นหนึ่ง

เพื่อความสะดวกในการคำนวณเพิ่มเติม เราจะรวบรวมตารางที่ 37

ลองคำนวณพารามิเตอร์กัน สมการเชิงเส้นการถดถอยแบบคู่ - ในการทำสิ่งนี้ เราใช้สูตร:

รูปที่ 8 - ฟิลด์สหสัมพันธ์

เราได้สมการ:

เหล่านั้น. ด้วยรายได้ครอบครัวเพิ่มขึ้น 1,000 รูเบิล ค่าอาหารเพิ่มขึ้น 168 รูเบิล

การคำนวณสัมประสิทธิ์สหสัมพันธ์เชิงเส้น

1. คำจำกัดความและสูตรพื้นฐาน

การถดถอยคู่- การถดถอย (ความสัมพันธ์) ระหว่างสองตัวแปร ฯลฯ มุมมองรุ่น:

โดยที่ตัวแปรตาม (แอตทริบิวต์ผลลัพธ์);

- ตัวแปรอธิบายอิสระ (ปัจจัยลักษณะ)

ตัวแปรรบกวนหรือสุ่มซึ่งรวมถึงอิทธิพลของปัจจัยที่ไม่นำมาพิจารณาในแบบจำลอง

ในเกือบทุกกรณี ค่าจะประกอบด้วยคำศัพท์สองคำ:

โดยที่ค่าที่แท้จริงของแอตทริบิวต์ผลลัพธ์คือ

ค่าทางทฤษฎีของคุณลักษณะผลลัพธ์ ซึ่งหาได้จากสมการการถดถอย เครื่องหมาย “^” หมายความว่าไม่มีความสัมพันธ์ในการทำงานที่เข้มงวดระหว่างตัวแปรและ

แยกแยะ เชิงเส้นและ ไม่เชิงเส้นการถดถอย

การถดถอยเชิงเส้นอธิบายด้วยสมการของเส้นตรง

การถดถอยแบบไม่เชิงเส้นแบ่งออกเป็นสองคลาส:

1) การถดถอย ไม่เชิงเส้นในตัวแปรอธิบาย แต่เป็นเชิงเส้นในพารามิเตอร์ที่ประมาณไว้, ตัวอย่างเช่น:

พหุนามขององศาที่ต่างกัน

ไฮเพอร์โบลาด้านเท่ากันหมด

2) การถดถอย ไม่เชิงเส้นในพารามิเตอร์โดยประมาณ, ตัวอย่างเช่น:

พลัง

บ่งชี้

เอ็กซ์โปเนนเชียล

ในการสร้างการถดถอยเชิงเส้นแบบคู่ จะมีการคำนวณปริมาณเสริม ( - จำนวนการสังเกต)

หมายถึงตัวอย่าง: และ

ความแปรปรวนร่วมตัวอย่างระหว่างและ

หรือ

ความแปรปรวนร่วมเป็นคุณลักษณะเชิงตัวเลขของการแจกแจงร่วมของตัวแปรสุ่มสองตัว

ผลต่างตัวอย่างสำหรับ

หรือ

ผลต่างตัวอย่างสำหรับ

หรือ

ความแปรปรวนตัวอย่างกำหนดลักษณะระดับการกระจายตัวของค่าของตัวแปรสุ่มรอบค่าเฉลี่ย (ความแปรปรวน, ความแปรปรวน)

มีการประเมินความใกล้ชิดของการเชื่อมโยงระหว่างปรากฏการณ์ที่กำลังศึกษา ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างระหว่างและ

ค่าสัมประสิทธิ์สหสัมพันธ์จะแตกต่างกันไปตั้งแต่ -1 ถึง +1 ยิ่งค่าโมดูโลเข้าใกล้ 1 มากเท่าใด ความสัมพันธ์ทางสถิติระหว่างและกับฟังก์ชันเชิงเส้นก็จะยิ่งใกล้ชิดมากขึ้นเท่านั้น

ถ้า =0 แสดงว่าไม่มีความสัมพันธ์เชิงเส้นระหว่าง และ;<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

ค่าบวกของสัมประสิทธิ์บ่งชี้ว่าความสัมพันธ์ระหว่างคุณลักษณะนั้นตรง (โดยการเติบโตค่าจะเพิ่มขึ้น) ค่าลบบ่งชี้ความสัมพันธ์แบบผกผัน (โดยการเติบโตค่าจะลดลง)

การสร้างการถดถอยเชิงเส้นลงมาเพื่อประมาณค่าพารามิเตอร์และวิธีการแบบคลาสสิกในการประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นนั้นขึ้นอยู่กับ วิธีกำลังสองน้อยที่สุด(เอ็มเอ็นซี) วิธีกำลังสองน้อยที่สุดช่วยให้เราได้รับการประมาณค่าพารามิเตอร์ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของลักษณะผลลัพธ์จากค่าทางทฤษฎีมีค่าน้อยที่สุดนั่นคือ

สำหรับการถดถอยเชิงเส้น พารามิเตอร์ และ พบได้จากระบบสมการปกติ:

เราพบการแก้ปัญหาระบบ วีบน

และพารามิเตอร์

ค่าสัมประสิทธิ์โดยมีตัวแปรแฟคเตอร์แสดงว่าค่าเฉลี่ยจะเปลี่ยนแปลงไปเท่าใดเมื่อแฟคเตอร์เปลี่ยนแปลงตามหน่วยการวัด

พารามิเตอร์เมื่อ If ไม่สามารถเท่ากับ 0 ได้ แสดงว่าไม่มีความหมายทางเศรษฐกิจ คุณสามารถตีความเครื่องหมายได้ก็ต่อเมื่อการเปลี่ยนแปลงสัมพัทธ์ในผลลัพธ์เกิดขึ้นช้ากว่าการเปลี่ยนแปลงปัจจัย กล่าวคือ ความแปรผันของผลลัพธ์จะน้อยกว่าความแปรผันของปัจจัยและในทางกลับกัน

คุณสามารถใช้เพื่อประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น ค่าสัมประสิทธิ์การตัดสินใจหรือ ข้อผิดพลาดในการประมาณค่าเฉลี่ย.

ถึงค่าสัมประสิทธิ์การตัดสินใจ

หรือ

แสดงส่วนแบ่งของความแปรปรวนที่อธิบายโดยการถดถอยในความแปรปรวนรวมของลักษณะผลลัพธ์ ดังนั้นค่าจึงระบุถึงส่วนแบ่งของความแปรปรวนของตัวบ่งชี้ที่เกิดจากอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลองและเหตุผลอื่น ๆ

ยิ่งเข้าใกล้ 1 มากเท่าใด โมเดลการถดถอยก็จะยิ่งดีเท่านั้น เช่น แบบจำลองที่สร้างขึ้นนั้นใกล้เคียงกับข้อมูลดั้งเดิมเป็นอย่างดี

ข้อผิดพลาดในการประมาณค่าเฉลี่ย- นี่คือค่าเบี่ยงเบนสัมพัทธ์โดยเฉลี่ยของค่าทางทฤษฎีจากค่าจริงเช่น

สมการถดถอยที่สร้างขึ้นถือว่าน่าพอใจหากค่าไม่เกิน 10-12%

สำหรับการถดถอยเชิงเส้น ค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยพบได้จากสูตร:

ค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยแสดงโดยเปอร์เซ็นต์โดยเฉลี่ยที่ผลลัพธ์จะเปลี่ยนจากค่าของมัน เมื่อปัจจัยเปลี่ยนแปลง 1% ของมูลค่า

เรตติ้งนาชิโมสต์และสมการถดถอยโดยทั่วไปให้โดยใช้การทดสอบฟิชเชอร์ซึ่งประกอบด้วยการทดสอบสมมติฐานเกี่ยวกับความไม่สำคัญทางสถิติของสมการถดถอย . เมื่อต้องการทำเช่นนี้ จะทำการเปรียบเทียบ แท้จริงท้องฟ้าและ วิกฤต(ตาราง) ค่า - การทดสอบฟิชเชอร์ .

กำหนดจากอัตราส่วนของค่าปัจจัยและความแปรปรวนคงเหลือที่คำนวณตามระดับความเป็นอิสระ กล่าวคือ

- ค่าสูงสุดที่เป็นไปได้ของเกณฑ์ภายใต้อิทธิพลของปัจจัยสุ่มที่มีระดับความอิสระ =1, =-2 และระดับนัยสำคัญพบได้จากตารางเกณฑ์ฟิชเชอร์ (ตารางที่ 1 ของภาคผนวก)

ระดับความสำคัญ- นี่คือความน่าจะเป็นที่จะปฏิเสธสมมติฐานที่ถูกต้องเนื่องจากเป็นจริง

ถ้า จากนั้นสมมติฐานเกี่ยวกับการไม่มีการเชื่อมโยงระหว่างตัวบ่งชี้ที่ศึกษาและปัจจัยจะถูกปฏิเสธ และมีการสรุปเกี่ยวกับความสำคัญของการเชื่อมโยงนี้กับระดับนัยสำคัญ (เช่น สมการถดถอยมีนัยสำคัญ)

ถ้า จากนั้นสมมติฐานจะได้รับการยอมรับและตระหนักถึงความไม่มีนัยสำคัญทางสถิติและความไม่น่าเชื่อถือของสมการการถดถอย

สำหรับการถดถอยเชิงเส้น ความสำคัญค่าสัมประสิทธิ์การถดถอยประเมินการใช้งาน - การทดสอบของนักเรียนตามที่มีการเสนอสมมติฐานเกี่ยวกับลักษณะการสุ่มของตัวบ่งชี้ ได้แก่ เกี่ยวกับความแตกต่างเล็กน้อยจากศูนย์ ถัดไปค่าที่แท้จริงของเกณฑ์จะถูกคำนวณสำหรับแต่ละค่าสัมประสิทธิ์การถดถอยโดยประมาณเช่น

ที่ไหนและ - ข้อผิดพลาดมาตรฐานพารามิเตอร์การถดถอยเชิงเส้นถูกกำหนดโดยสูตร:

- ค่าสูงสุดที่เป็นไปได้ของการทดสอบของนักเรียนภายใต้อิทธิพลของปัจจัยสุ่มสำหรับระดับความอิสระที่กำหนด = -2 และระดับนัยสำคัญพบได้จากตารางการทดสอบของนักเรียน (ตารางที่ 2 ของภาคผนวก)

ถ้า จากนั้นสมมติฐานเกี่ยวกับความไม่สำคัญของสัมประสิทธิ์การถดถอยจะถูกปฏิเสธด้วยระดับนัยสำคัญเช่น ค่าสัมประสิทธิ์ (หรือ) ไม่ได้แตกต่างจากศูนย์โดยไม่ได้ตั้งใจและถูกสร้างขึ้นภายใต้อิทธิพลของปัจจัยที่ออกฤทธิ์อย่างเป็นระบบ

ถ้า จากนั้นสมมติฐานจะไม่ถูกปฏิเสธและลักษณะการสุ่มของการก่อตัวของพารามิเตอร์ได้รับการยอมรับ

ความสำคัญของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นตรวจสอบด้วย - การทดสอบของนักเรียนเช่น

สมมติฐานเกี่ยวกับความไม่มีนัยสำคัญของสัมประสิทธิ์สหสัมพันธ์ถูกปฏิเสธด้วยระดับนัยสำคัญหาก

ความคิดเห็นสำหรับการถดถอยคู่เชิงเส้น การทดสอบสมมติฐานเกี่ยวกับความสำคัญของสัมประสิทธิ์และสัมประสิทธิ์สหสัมพันธ์จะเทียบเท่ากับการทดสอบสมมติฐานเกี่ยวกับความสำคัญของสมการการถดถอยโดยรวม กล่าวคือ

ในการคำนวณช่วงความเชื่อมั่น ให้กำหนด ข้อผิดพลาดเล็กน้อยสำหรับแต่ละตัวชี้วัด ได้แก่

ช่วงความมั่นใจสำหรับค่าสัมประสิทธิ์การถดถอยเชิงเส้น:

หากศูนย์อยู่ในช่วงความเชื่อมั่น กล่าวคือ ขีดจำกัดล่างเป็นลบและขีดจำกัดบนเป็นค่าบวก จากนั้นพารามิเตอร์ที่ประมาณไว้จะถือเป็นศูนย์ เนื่องจาก ไม่สามารถรับความหมายทั้งเชิงบวกและเชิงลบในเวลาเดียวกันได้

ค่าพยากรณ์ถูกกำหนดโดยการแทนค่าที่ทำนายไว้ลงในสมการถดถอย หมายถึงข้อผิดพลาดมาตรฐานของการพยากรณ์

ที่ไหน

และกำลังถูกสร้างขึ้น คาดการณ์ช่วงความเชื่อมั่น

ช่วงเวลาอาจค่อนข้างกว้างเนื่องจากมีการสังเกตปริมาณน้อย

การถดถอย ไม่เชิงเส้นในตัวแปรที่รวมอยู่ , จะลดลงเป็นรูปแบบเชิงเส้นโดยการเปลี่ยนแปลงตัวแปรอย่างง่าย และการประมาณค่าพารามิเตอร์เพิ่มเติมจะดำเนินการโดยใช้กำลังสองน้อยที่สุด

ไฮเปอร์โบลาการถดถอยแบบอิคัล:

การรุกราน , ไม่เชิงเส้น ตามพารามิเตอร์ที่ประเมิน , แบ่งออกเป็น 2 ประเภท คือ ภายในไม่เชิงเส้นฯลฯ (ไม่ลดเป็นรูปแบบเชิงเส้น) และ เชิงเส้นภายใน(ลดเป็นรูปแบบเชิงเส้นโดยใช้การแปลงที่เหมาะสม) เช่น

การถดถอยเอ็กซ์โปเนนเชียล:

การแปลงเชิงเส้น:

การถดถอยของกำลัง:

การแปลงเชิงเส้น:

ตัวบ่งชี้การถดถอยใหม่:

การแปลงเชิงเส้น:

ลอการิทึมการถดถอย:

การแปลงเชิงเส้น:

2. แก้ไขปัญหาทั่วไป

ตัวอย่าง9 .1 . สำหรับวิสาหกิจทางการเกษตร 15 แห่ง (ตารางที่ 9.1) เป็นที่ทราบกันดังต่อไปนี้: - จำนวนอุปกรณ์ต่อหน่วยพื้นที่หว่าน (หน่วย/เฮกตาร์) และ - ปริมาณผลผลิตที่ปลูก (พันหน่วยการเงิน) จำเป็น:

1) กำหนดการพึ่งพา

2) สร้างเขตข้อมูลสหสัมพันธ์และกราฟของสมการถดถอยเชิงเส้นบน

3) สรุปเกี่ยวกับคุณภาพของแบบจำลองและคำนวณค่าพยากรณ์ด้วยค่าพยากรณ์ 112% ของระดับเฉลี่ย

ตารางที่ 9.1

สารละลาย:

1) ใน Excel ให้สร้างตารางเสริม 9.2

ตารางที่ 9.2

ข้าว.9 .1. ตารางการคำนวณค่ากลาง

มาคำนวณจำนวนการวัดกัน โดยทำในเซลล์ บี19ใส่ = นับ(A2:A16 ) .

การใช้ฟังก์ชัน ∑ (ผลรวมอัตโนมัติ) บนแถบเครื่องมือ มาตรฐาน นายา หาผลรวมของทั้งหมด (เซลล์ B17) และ (เซลล์ ค17).

ข้าว. 9.2. การคำนวณผลรวมของค่าและค่าเฉลี่ย

ในการคำนวณค่าเฉลี่ย เราใช้ฟังก์ชัน MS Excel ในตัว AVERAGE() ช่วงของค่าในการกำหนดค่าเฉลี่ยจะแสดงอยู่ในวงเล็บ ดังนั้นปริมาณเฉลี่ยของผลิตภัณฑ์ที่ปลูกใน 15 ฟาร์มคือ 210.833 พันพัน หน่วย และจำนวนอุปกรณ์เฉลี่ย 6.248 หน่วย/เฮกตาร์

เพื่อเติมคอลัมน์ ดี, อี, เอฟใส่สูตรคำนวณผลคูณ: ลงในเซลล์ ดี2 ใส่ = B2*C2จากนั้นกด ENTER บนคีย์บอร์ดของคุณ คลิกซ้ายที่เซลล์ ดี2 และจับมุมขวาล่างของเซลล์นี้ (เครื่องหมายบวกสีดำ) แล้วดึงลงไปที่เซลล์ ดี16 - ช่วงจะถูกเติมโดยอัตโนมัติ ดี3 - ดี16 .

ในการคำนวณ เลือกสรรโอ้ ความแปรปรวนร่วมระหว่าง และ เราใช้สูตรคือ ไปที่เซลล์ บี21 ใส่ = ดี18- บี18* 18 และเราได้ 418.055 (รูปที่ 9.3)

ข้าว.9 .3. การคำนวณ

คัดเลือกว้าวการกระจายตัวคุณเพราะเราหาได้จากสูตร สำหรับสิ่งนี้ในเซลล์ บี22 ใส่ = E18-B18^2 (^- เครื่องหมายแสดงการยกกำลัง ) และเราได้ 11.337 ในทำนองเดียวกัน เรากำหนด =16745.05556 (รูปที่ 9.4)

ข้าว.9 .4. การคำนวณวาร์(x) และวาร์ ()

ต่อไป เมื่อใช้ฟังก์ชัน MS Excel มาตรฐาน "CORREL" เราจะคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นสำหรับปัญหาของเรา โดยฟังก์ชันจะมีรูปแบบ "=CORREL(B2:B16;C2:C16)" และค่า rxy= 0.96. ค่าผลลัพธ์ของค่าสัมประสิทธิ์สหสัมพันธ์บ่งชี้ถึงความเชื่อมโยงโดยตรงและแข็งแกร่งระหว่างความพร้อมของอุปกรณ์และปริมาณของผลิตภัณฑ์ที่ปลูก

เราพบ วีตัวอย่างสัมประสิทธิ์การถดถอยเชิงเส้น =36.87; พารามิเตอร์ = -17.78 ซึ่งหมายความว่าสมการการถดถอยเชิงเส้นคู่มีรูปแบบ = -17.78+36.87

ค่าสัมประสิทธิ์แสดงให้เห็นว่าเมื่อปริมาณอุปกรณ์เพิ่มขึ้น 1 หน่วย/เฮกตาร์ ปริมาณผลิตภัณฑ์ที่ปลูกจะเพิ่มขึ้นโดยเฉลี่ย 36.875 พันชิ้น หน่วย (รูปที่ 9.5)

ข้าว.9 .5. การคำนวณพารามิเตอร์สมการถดถอย

ดังนั้นสมการถดถอยจะมีลักษณะดังนี้:

เราแทนค่าจริงลงในสมการผลลัพธ์ x(ปริมาณของอุปกรณ์) เราค้นหาค่าทางทฤษฎีของปริมาตรของผลิตภัณฑ์ที่ปลูก (รูปที่ 9.6)

ข้าว.9 .6. การคำนวณค่าทางทฤษฎีของปริมาตรของผลิตภัณฑ์ที่ปลูก

โดยใช้ ตัวช่วยสร้างแผนภูมิเราสร้างฟิลด์สหสัมพันธ์ (เน้นคอลัมน์ด้วยค่า และ ) และสมการถดถอยเชิงเส้น (เน้นคอลัมน์ด้วยค่า และ ) การเลือกประเภทแผนภูมิ - ปรากฏการณ์ ในไดอะแกรมผลลัพธ์ ให้กรอกพารามิเตอร์ที่จำเป็น (ชื่อ ป้ายกำกับแกน คำอธิบาย ฯลฯ) เป็นผลให้เราได้กราฟที่แสดงในรูปที่ 1 9.7.

ข้าว.9 .7. กราฟของการพึ่งพาปริมาณของผลิตภัณฑ์ที่ปลูกกับจำนวนอุปกรณ์

เพื่อประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น เราคำนวณ:

. ถึงค่าสัมประสิทธิ์การตัดสินใจ=0.92 ซึ่งแสดงให้เห็นว่า 92% ของการเปลี่ยนแปลงต้นทุนการผลิตอธิบายได้จากการเปลี่ยนแปลงในปริมาณการผลิต และ 8% เกิดจากปัจจัยที่ไม่ได้คำนึงถึงในแบบจำลอง ซึ่งบ่งบอกถึงคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น

. กับสีแดงยูยูข้อผิดพลาดที่การประมาณ. เมื่อต้องการทำเช่นนี้ในคอลัมน์ ชมลองคำนวณความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎี a ในคอลัมน์ ฉัน- การแสดงออก. โปรดทราบว่าฟังก์ชัน MS Excel มาตรฐาน "ABS" ใช้ในการคำนวณค่าโมดูโล เมื่อคูณค่าเฉลี่ย (เซลล์ ฉัน18 ) ที่ 100% เราได้ 18.2% ดังนั้นโดยเฉลี่ยแล้วค่าทางทฤษฎีจึงเบี่ยงเบนไปจากค่าจริง 18.2% (รูปที่ 1.8)

เราประมาณการโดยใช้เกณฑ์ฟิชเชอร์ ชม.นาชิโมสต์สมการลงทะเบียนกับสิ่งเหล่านี้โดยทั่วไป: 150,74.

ที่ระดับนัยสำคัญ 0.05 = 4.67 เราพิจารณาโดยใช้ฟังก์ชันทางสถิติในตัว เร็วขึ้น(รูปที่ 1.9) จำเป็นต้องจำไว้ว่า "Degrees_freedom1" เป็นตัวส่วนและ "Degrees_freedom2" เป็นตัวเศษโดยที่จำนวนพารามิเตอร์ในสมการการถดถอยคือ (เรามี 2) n- จำนวนคู่ค่าเริ่มต้น (เรามี 15)

เพราะ ดังนั้นสมการถดถอยจะมีนัยสำคัญที่ =0.05

ข้าว.9 .8. การหาค่าสัมประสิทธิ์การตัดสินใจและข้อผิดพลาดในการประมาณค่าเฉลี่ย

ข้าว. 9 . 9 . กล่องโต้ตอบฟังก์ชั่นเร็วขึ้น

ต่อไปเราจะกำหนด กับค่าสัมประสิทธิ์ความยืดหยุ่นเฉลี่ยตามสูตร ผลการวิจัยพบว่าเมื่อปริมาณผลิตภัณฑ์ที่ผลิตเพิ่มขึ้น 1% ต้นทุนการผลิตผลิตภัณฑ์เหล่านี้โดยเฉลี่ยโดยรวมจะเพิ่มขึ้น 1.093%

มาคำนวณกัน มูลค่าการคาดการณ์โดยแทนลงในสมการถดถอย =-19.559+36.8746 ค่าทำนายของตัวประกอบ =1.12=6.248*1.12=6.9978 เราได้ =238.48. ดังนั้นด้วยจำนวนอุปกรณ์จำนวน 6.9978 หน่วย/เฮกตาร์ ปริมาณผลผลิตจะอยู่ที่ 238.48 พันหน่วย หน่วย

มาหาความแปรปรวนที่เหลือ โดยคำนวณผลรวมของกำลังสองของความแตกต่างระหว่างค่าจริงและค่าทางทฤษฎี =39.166 ใส่สูตรดังนี้ = รูท(J17/(B19-2))ไปที่เซลล์ ชม2 1 (รูปที่ 9.10)

ข้าว.9 .10. การหาค่าความแปรปรวนคงเหลือ

กับสีแดงญาญ่ามาตรฐานข้อผิดพลาดครั้งที่พยากรณ์:

ที่ระดับนัยสำคัญ = 0.05 โดยใช้ฟังก์ชันทางสถิติในตัว นักศึกษาลองกำหนด =2.1604 แล้วคำนวณค่าความคลาดเคลื่อนการคาดการณ์สูงสุด ซึ่งใน 95% ของกรณีจะไม่เกิน .

ดีคาดการณ์ช่วงความเชื่อมั่น:

หรือ .

การคาดการณ์ต้นทุนการผลิตที่สมบูรณ์มีความน่าเชื่อถือ (1-0.05 = 0.95) แต่ไม่ถูกต้อง เนื่องจากช่วงของขีดจำกัดบนและล่างของช่วงความเชื่อมั่นคือ ครั้ง สิ่งนี้เกิดขึ้นเนื่องจากการสังเกตปริมาณน้อย

จะต้องสังเกตว่า MS Excel มีฟังก์ชันทางสถิติในตัวซึ่งสามารถลดจำนวนการคำนวณระดับกลางได้อย่างมากเช่น (รูปที่ 9.11):

เพื่อคำนวณ วีเลือกสรรเอ็กซ์เฉลี่ยเอ็กซ์ใช้ฟังก์ชัน ค่าเฉลี่ย(หมายเลข 1:หมายเลขเอ็น) จากหมวดหมู่ เชิงสถิติ .

ความแปรปรวนร่วมตัวอย่างระหว่าง และ พบได้โดยใช้ฟังก์ชัน โควาร์(arrayเอ็กซ์;อาร์เรย์) จากหมวดหมู่ เชิงสถิติ .

คัดเลือกการกระจายตัวและกำหนดโดยฟังก์ชันทางสถิติ DISPR(หมายเลข 1:หมายเลขเอ็น) .

ข้าว.9 .11. การคำนวณผู้ให้บริการที่มีฟังก์ชันในตัวนางสาวเอ็กเซล

พารามิเตอร์การถดถอยเชิงเส้นใน Excel คุณสามารถกำหนดได้หลายวิธี

1 ทาง) การใช้ฟังก์ชันในตัว ไลน์- ขั้นตอนมีดังนี้:

1. เลือกพื้นที่ 5x2 ของเซลล์ว่าง (5 แถว 2 คอลัมน์) เพื่อแสดงผลลัพธ์ของสถิติการถดถอย หรือพื้นที่ 1x2 เพื่อให้ได้เฉพาะค่าสัมประสิทธิ์การถดถอย

2. ด้วย ตัวช่วยสร้างฟังก์ชั่นท่ามกลาง เชิงสถิติ เลือกฟังก์ชัน ไลน์และกรอกข้อโต้แย้ง (รูปที่ 9.12):

ข้าว. 9 . 12 . กล่องโต้ตอบสำหรับป้อนอาร์กิวเมนต์ของฟังก์ชันไลน์

รู้จัก_ค่า_

รู้จัก_ค่า_x

- ค่าตรรกะ (1 หรือ 0) ซึ่งบ่งชี้ว่ามีหรือไม่มีคำศัพท์อิสระในสมการ ชุดที่ 1;

สถิติ- ค่าตรรกะ (1 หรือ 0) ซึ่งระบุว่าจะแสดงข้อมูลเพิ่มเติมเกี่ยวกับการวิเคราะห์การถดถอยหรือไม่ ตั้งเป็น 1

3. หมายเลขแรกของตารางจะปรากฏในเซลล์ด้านซ้ายบนของพื้นที่ที่เลือก หากต้องการเปิดทั้งตาราง ให้กดปุ่ม < เอฟ2> แล้ว - ไปที่คีย์ผสม < CTRL> + < กะ> + < เข้า> .

สถิติการถดถอยเพิ่มเติมจะแสดงเป็น (ตาราง 9.3):

ตารางที่ 9.3

ค่าสัมประสิทธิ์

ค่าสัมประสิทธิ์

อาร์เอ็มเอส
ส่วนเบี่ยงเบน

อาร์เอ็มเอส
ส่วนเบี่ยงเบน

ค่าสัมประสิทธิ์
การกำหนด

อาร์เอ็มเอส
ส่วนเบี่ยงเบน

สถิติ

จำนวนองศาความเป็นอิสระ

ผลรวมการถดถอยของกำลังสอง

ผลรวมที่เหลือของกำลังสอง

อันเป็นผลมาจากการประยุกต์ใช้ฟังก์ชัน ไลน์เราได้รับ:

( 2 ทาง) การใช้เครื่องมือวิเคราะห์ข้อมูล การถดถอย คุณจะได้รับผลลัพธ์ของสถิติการถดถอย การวิเคราะห์ความแปรปรวน ช่วงความมั่นใจเศษเหลือ แผนการปรับเส้นการถดถอย เศษเหลือและแผนความน่าจะเป็นปกติ ขั้นตอนมีดังนี้:

1. คุณต้องตรวจสอบการเข้าถึง แพ็คเกจการวิเคราะห์- หากต้องการทำสิ่งนี้ในเมนูหลัก (ผ่านปุ่ม Microsoft Office เข้าถึงพารามิเตอร์ MS Excel) ในกล่องโต้ตอบ "ตัวเลือก" นางสาวเอ็กเซล» เลือกคำสั่ง “ส่วนเสริม” และเลือกส่วนเสริมทางด้านขวา การวิเคราะห์แพ็คเกจ จากนั้นคลิกปุ่ม "ไป" (รูปที่ 9.13) ในกล่องโต้ตอบที่เปิดขึ้น ให้ทำเครื่องหมายในช่องถัดจาก "แพ็คเกจการวิเคราะห์" และคลิก "ตกลง" (รูปที่ 9.14)

บนแท็บข้อมูล ในกลุ่มการวิเคราะห์ คุณจะสามารถเข้าถึง Add-in ที่ติดตั้งไว้ได้ (รูปที่ 9.15)

ข้าว.9 .13. เปิดใช้งานส่วนเสริมในนางสาวเอ็กเซล

ข้าว.9 .14. กล่องโต้ตอบ Add-Ins

ข้าว.9 .15. Add-in การวิเคราะห์ข้อมูลบน Ribbonนางสาวเอ็กเซล 2007 .

2. เลือก “ข้อมูล” ในกลุ่ม “การวิเคราะห์” และเลือกคำสั่ง การวิเคราะห์ใช่ n nykh ในกล่องโต้ตอบที่เปิดขึ้น เลือกเครื่องมือวิเคราะห์ "การถดถอย" และคลิก "ตกลง" (รูปที่ 9.16):

ข้าว.9 .16. กล่องโต้ตอบการวิเคราะห์ข้อมูล

ในกล่องโต้ตอบที่ปรากฏขึ้น (รูปที่ 9.17) ให้กรอกข้อมูลในฟิลด์:

ช่วงเวลาอินพุต- ช่วงที่มีข้อมูลของลักษณะผลลัพธ์ Y

ช่วงเวลาอินพุตเอ็กซ์- ช่วงที่มีข้อมูลที่มีลักษณะอธิบาย X;

แท็ก- ธงที่ระบุว่าบรรทัดแรกมีชื่อคอลัมน์หรือไม่

แอนต้า-ศูนย์- ธงแสดงการมีหรือไม่มีคำอิสระในสมการ

ช่วงเอาท์พุต- เพียงพอที่จะระบุเซลล์ด้านซ้ายบนของช่วงอนาคต

แผ่นงานใหม่- คุณสามารถตั้งชื่อที่กำหนดเองสำหรับแผ่นงานใหม่ที่จะแสดงผลลัพธ์

ข้าว.9 .17. กล่องโต้ตอบการถดถอย

หากต้องการรับข้อมูลเกี่ยวกับปริมาณคงเหลือ แปลงคงเหลือ ความเหมาะสม และความน่าจะเป็นปกติ คุณจะต้องทำเครื่องหมายในช่องที่เหมาะสมในกล่องโต้ตอบ

ข้าว. 9 . 18 . ผลลัพธ์จากการใช้เครื่องมือการถดถอย

ใน นางสาวเอ็กเซล เส้นแนวโน้มสามารถเพิ่มลงในแผนภูมิพื้นที่ฮิสโตแกรมหรือกราฟได้ เมื่อต้องการทำสิ่งนี้:

1. จำเป็นต้องเลือกพื้นที่การลงจุดแผนภูมิและเลือก "เค้าโครง" ใน Ribbon และในกลุ่มการวิเคราะห์ให้เลือกคำสั่ง "เส้นแนวโน้ม" (รูปที่ 9.19) เลือก "ตัวเลือกเส้นแนวโน้มขั้นสูง" จากรายการเมนูแบบเลื่อนลง

ข้าว. 1.19.ริบบิ้น

2. ในกล่องโต้ตอบที่ปรากฏขึ้น ให้เลือกค่าจริง จากนั้นกล่องโต้ตอบ "รูปแบบเส้นแนวโน้ม" จะเปิดขึ้น (รูปที่ 9.20) ซึ่งคุณเลือกประเภทของเส้นแนวโน้มและตั้งค่าพารามิเตอร์ที่เหมาะสม

ข้าว. 9 . 20 . กล่องโต้ตอบ"รูปแบบเส้นแนวโน้ม"

สำหรับแนวโน้มพหุนามจำเป็นต้องกำหนดระดับของพหุนามโดยประมาณสำหรับการกรองเชิงเส้น - จำนวนจุดเฉลี่ย

เลือก เชิงเส้นเพื่อสร้างสมการถดถอยเชิงเส้น

สำหรับข้อมูลเพิ่มเติมคุณสามารถ แสดงสมการใน diกรัมและ วางค่าบนไดอะแกรม(รูปที่ 9.21)

ข้าว. 9 . 21 . แนวโน้มเชิงเส้น

ตัวแบบการถดถอยแบบไม่เชิงเส้น จะแสดงไว้เมื่อคำนวณพารามิเตอร์ของสมการโดยใช้ฟังก์ชันทางสถิติที่เลือกใน Excel GRFPRIBL- ขั้นตอนการคำนวณเหมือนกับการใช้ฟังก์ชัน LINEST

สมการถดถอยคู่.

จากฟิลด์สหสัมพันธ์ เราสามารถตั้งสมมติฐาน (สำหรับประชากร) ว่าความสัมพันธ์ระหว่างค่าที่เป็นไปได้ทั้งหมดของ X และ Y นั้นเป็นเส้นตรง

สมการการถดถอยเชิงเส้นคือ y = bx + a + ε

ระบบสมการปกติ

n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

สำหรับข้อมูลของเรา ระบบสมการจะมีรูปแบบ

12a + 1,042 ข = 1709

1,042 ก + 91556 ข = 149367

จากสมการแรกที่เราแสดงออก และแทนลงในสมการที่สอง:

เราได้รับสัมประสิทธิ์การถดถอยเชิงประจักษ์: b = 0.9, a = 64.21

สมการการถดถอย (สมการถดถอยเชิงประจักษ์):

y = 0.9 x + 64.21

สัมประสิทธิ์การถดถอยเชิงประจักษ์ และ เป็นเพียงการประมาณค่าสัมประสิทธิ์ทางทฤษฎี β i และตัวสมการเองสะท้อนเพียงแนวโน้มทั่วไปในพฤติกรรมของตัวแปรที่อยู่ระหว่างการพิจารณา

ในการคำนวณพารามิเตอร์ของการถดถอยเชิงเส้น เราจะสร้างตารางการคำนวณ (ตารางที่ 1)

1. พารามิเตอร์สมการถดถอย

หมายถึงตัวอย่าง.

ผลต่างตัวอย่าง:

ส่วนเบี่ยงเบนมาตรฐาน

1.1. ค่าสัมประสิทธิ์สหสัมพันธ์

ความแปรปรวนร่วม.

เราคำนวณตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อ ตัวบ่งชี้นี้คือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นตัวอย่างซึ่งคำนวณโดยสูตร:

1.2. สมการถดถอย(การประมาณสมการถดถอย)

สมการการถดถอยเชิงเส้นคือ y = 0.9 x + 64.21

1.3. ค่าสัมประสิทธิ์ความยืดหยุ่น.

ค่าสัมประสิทธิ์ความยืดหยุ่นพบได้จากสูตร:

1.4. ข้อผิดพลาดโดยประมาณ.

ข้อผิดพลาดในการประมาณภายใน 5%-7% บ่งชี้ว่าสมการการถดถอยเหมาะสมกับข้อมูลต้นฉบับ

1.5. ความสัมพันธ์เชิงประจักษ์

อัตราส่วนสหสัมพันธ์เชิงประจักษ์ได้รับการคำนวณสำหรับการสื่อสารทุกรูปแบบและทำหน้าที่วัดความใกล้ชิดของความสัมพันธ์ แตกต่างกันไปภายใน

ดัชนีสหสัมพันธ์.

สำหรับการถดถอยเชิงเส้น ดัชนีสหสัมพันธ์จะเท่ากับค่าสัมประสิทธิ์สหสัมพันธ์ r xy = 0.79

สำหรับการพึ่งพารูปแบบใด ๆ ความแน่นของการเชื่อมต่อจะถูกกำหนดโดยใช้ สัมประสิทธิ์สหสัมพันธ์พหุคูณ:

1.6. ค่าสัมประสิทธิ์การตัดสินใจ

ส่วนใหญ่แล้วเมื่อตีความค่าสัมประสิทธิ์การตัดสินใจจะแสดงเป็นเปอร์เซ็นต์

R2 = 0.792 = 0.62

เพื่อประเมินคุณภาพของพารามิเตอร์การถดถอยเชิงเส้น เราจะสร้างตารางการคำนวณ (ตารางที่ 2)

2. การประมาณค่าพารามิเตอร์สมการถดถอย

2.1. ความสำคัญของสัมประสิทธิ์สหสัมพันธ์.

เพื่อทดสอบสมมติฐานว่างที่ระดับนัยสำคัญ α ว่าค่าสัมประสิทธิ์สหสัมพันธ์ทั่วไปของตัวแปรสุ่มสองมิติปกติเท่ากับศูนย์ภายใต้สมมติฐานที่แข่งขันกัน H 1 ≠ 0 จำเป็นต้องคำนวณค่าที่สังเกตได้ของเกณฑ์

และใช้ตารางจุดวิกฤติของการแจกแจงของนักเรียน ที่ระดับนัยสำคัญที่กำหนด α และจำนวนองศาอิสระ k = n - 2 ค้นหาจุดวิกฤต t crit ของบริเวณวิกฤตสองด้าน ถ้าไม่ได้< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t crit - สมมติฐานว่างถูกปฏิเสธ

เมื่อใช้ตารางนักเรียนที่มีระดับนัยสำคัญ α=0.05 และองศาอิสระ k=10 เราพบว่า t crit:

โดยที่ m = 1 คือจำนวนตัวแปรอธิบาย

2.2. การประมาณช่วงค่าสัมประสิทธิ์สหสัมพันธ์ (ช่วงความเชื่อมั่น)

2.3. การวิเคราะห์ความแม่นยำในการประมาณค่าสัมประสิทธิ์การถดถอย

ค่าประมาณการกระจายตัวของสัญญาณรบกวนที่เป็นกลางคือค่า:

S 2 y = 53.63 - ความแปรปรวนที่ไม่สามารถอธิบายได้ (การวัดการแพร่กระจายของตัวแปรตามรอบเส้นการถดถอย)

S y = 7.32 - ข้อผิดพลาดมาตรฐานของการประมาณการ (ข้อผิดพลาดมาตรฐานของการถดถอย)

S a - ค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม a

S b - ส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม b

2.4. ช่วงความเชื่อมั่นสำหรับตัวแปรตาม

(ก + ขx พี ± ε)

ให้เราคำนวณขอบเขตของช่วงเวลาที่ 95% ของค่าที่เป็นไปได้ของ Y จะเข้มข้นด้วยการสังเกตไม่ จำกัด จำนวนและ X p = 107

ช่วงความเชื่อมั่นส่วนบุคคลสำหรับ Y ที่ค่าที่กำหนดเป็น X

(a + bx ฉัน ± ε)

ค่าคริติคอล (n-m-1;α/2) = (10;0.025) = 2.228

2.5. การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิ์ของสมการการถดถอยเชิงเส้น

1) สถิติ t การทดสอบของนักเรียน

ค่าคริติคอล (n-m-1;α/2) = (10;0.025) = 2.228

ช่วงความมั่นใจสำหรับสัมประสิทธิ์สมการถดถอย.

(b - t คริติคอล S b ; b + t คริติคอล S b)

(a - t crit S a ; a + t crit S a)

2) สถิติ F เกณฑ์ฟิชเชอร์

ค่าตารางของเกณฑ์ที่มีองศาอิสระ k 1 =1 และ k 2 =10, ตาราง F = 4.96

การถดถอยคู่เชิงเส้นใช้กันอย่างแพร่หลายในเศรษฐมิติในรูปแบบของการตีความพารามิเตอร์ทางเศรษฐศาสตร์ที่ชัดเจน การถดถอยเชิงเส้นลงมาเพื่อค้นหาสมการของรูปแบบ

หรือ . (3.6)

สมการของแบบฟอร์ม อนุญาตให้ใช้ค่าปัจจัยที่กำหนด เอ็กซ์มีค่าทางทฤษฎีของลักษณะผลลัพธ์โดยแทนที่ค่าที่แท้จริงของปัจจัยลงไป x.

การสร้างการถดถอยเชิงเส้นคู่นั้นมาจากการประมาณค่าพารามิเตอร์ และ . การประมาณค่าพารามิเตอร์การถดถอยเชิงเส้นสามารถพบได้โดยใช้วิธีการต่างๆ เช่น การใช้วิธีกำลังสองน้อยที่สุด (LSM)

ตามวิธีการประมาณค่าพารามิเตอร์กำลังสองน้อยที่สุด และได้รับเลือกในลักษณะที่ผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของลักษณะผลลัพธ์ (ญ)จากการคำนวณ (ทางทฤษฎี แบบจำลอง) มีค่าน้อยที่สุด กล่าวคือ จากทั้งชุดของเส้น เส้นการถดถอยบนกราฟจะถูกเลือกเพื่อให้ผลรวมของกำลังสองของระยะทางแนวตั้งระหว่างจุดและเส้นนี้จะน้อยที่สุด (รูปที่ 3.2):

, (3.7)

ข้าว. 3.2. เส้นการถดถอยที่มีผลรวมขั้นต่ำของระยะทางแนวตั้งกำลังสองระหว่างจุดกับเส้นนี้

สำหรับข้อสรุปเพิ่มเติม เราจะแทนที่ค่าโมเดลในนิพจน์ (3.7) เช่น เราได้รับ:

ในการค้นหาฟังก์ชันขั้นต่ำ (3.8) จำเป็นต้องคำนวณอนุพันธ์ย่อยสำหรับแต่ละพารามิเตอร์ และ และตั้งค่าให้เป็นศูนย์:

การแปลงระบบนี้เราได้รับระบบสมการปกติต่อไปนี้สำหรับการประมาณค่าพารามิเตอร์ และ :

. (3.9)

รูปแบบเมทริกซ์ของการบันทึกระบบนี้มีรูปแบบ:

. (3.10)

การแก้ระบบสมการปกติ (3.10) ในรูปแบบเมทริกซ์ที่เราได้รับ:

รูปแบบพีชคณิตของการแก้โจทย์ระบบ (3.11) สามารถเขียนได้ดังนี้

หลังจากการแปลงอย่างง่าย สูตร (3.12) สามารถเขียนได้ในรูปแบบที่สะดวก:

ควรสังเกตว่าการประมาณค่าพารามิเตอร์ของสมการการถดถอยสามารถรับได้โดยใช้สูตรอื่นเช่น:

(3.14)

นี่คือตัวอย่างค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นแบบคู่

หลังจากคำนวณพารามิเตอร์การถดถอยแล้ว เราก็สามารถเขียนสมการของแบบจำลองทางคณิตศาสตร์ได้ การถดถอย:

ควรสังเกตว่าพารามิเตอร์แสดงการเปลี่ยนแปลงโดยเฉลี่ยในผลลัพธ์โดยมีการเปลี่ยนแปลงปัจจัยหนึ่งหน่วย ดังนั้นหากอยู่ในฟังก์ชันต้นทุน (ย-ค่าใช้จ่าย (พันรูเบิล) เอ็กซ์- จำนวนหน่วยการผลิต) จึงมีปริมาณการผลิตเพิ่มขึ้น (เอ็กซ์)ต่อ 1 ยูนิต ต้นทุนการผลิตเพิ่มขึ้นโดยเฉลี่ย 2,000 รูเบิลเช่น การผลิตเพิ่มขึ้นอีก 1 หน่วย จะต้องเพิ่มต้นทุนโดยเฉลี่ย 2,000 รูเบิล

ความเป็นไปได้ของการตีความทางเศรษฐศาสตร์ที่ชัดเจนของค่าสัมประสิทธิ์การถดถอยทำให้สมการการถดถอยเชิงเส้นค่อนข้างธรรมดาในการวิจัยทางเศรษฐมิติ

อย่างเป็นทางการ - ความหมาย ที่ที่ เอ็กซ์= 0 ถ้าแอตทริบิวต์-ปัจจัยไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้ แสดงว่าการตีความคำศัพท์อิสระข้างต้น ไม่สมเหตุสมผล พารามิเตอร์ อาจไม่มีเนื้อหาทางเศรษฐกิจ ความพยายามที่จะตีความพารามิเตอร์ในเชิงเศรษฐกิจ อาจนำไปสู่ความไร้สาระได้ โดยเฉพาะเมื่อ < 0.

ตัวอย่างที่ 3.2- สมมติว่ากลุ่มองค์กรที่ผลิตผลิตภัณฑ์ประเภทเดียวกัน เราจะพิจารณาฟังก์ชันต้นทุน: . ข้อมูลที่จำเป็นในการคำนวณการประมาณค่าพารามิเตอร์ และ , นำเสนอในตาราง 3.1.

ตารางที่ 3.1

คำนวณแล้วโต๊ะ

หมายเลของค์กร

ผลผลิตสินค้าพันหน่วย -

ต้นทุนการผลิต ล้านรูเบิล -

ระบบสมการปกติจะมีลักษณะดังนี้:

.

การแก้ปัญหาระบบนี้โดยใช้สูตร (4.13) ให้ผลลัพธ์:

ให้เราเขียนแบบจำลองสมการถดถอย (4.16):

การแทนค่าลงในสมการ xเรามาค้นหาค่าทางทฤษฎี (แบบจำลอง) กันดีกว่า ใช่(ดูคอลัมน์สุดท้ายของตาราง 3.1)

ในกรณีนี้คือค่าพารามิเตอร์ ไม่สมเหตุสมผลทางเศรษฐกิจ

ในตัวอย่างที่อยู่ระหว่างการพิจารณา เรามี:

สมการถดถอยจะเสริมด้วยตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อเสมอ เมื่อใช้การถดถอยเชิงเส้น ตัวบ่งชี้ดังกล่าวคือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น มีการปรับเปลี่ยนสูตรสัมประสิทธิ์สหสัมพันธ์เชิงเส้นที่แตกต่างกัน บางส่วนได้รับด้านล่าง:

ดังที่ทราบ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นอยู่ภายในขีดจำกัด:

หากค่าสัมประสิทธิ์การถดถอยคือ ดังนั้น และในทางกลับกัน เมื่อใด .

ตามตารางครับ. ในรูปที่ 4.1 ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคือ 0.993 ซึ่งค่อนข้างใกล้กับ 1 และหมายความว่ามีการพึ่งพาต้นทุนการผลิตอย่างใกล้ชิดกับปริมาณผลผลิต

โปรดทราบว่าค่าของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นจะประเมินความใกล้ชิดของการเชื่อมต่อระหว่างคุณลักษณะที่พิจารณาในรูปแบบเชิงเส้น ดังนั้นความใกล้เคียงของค่าสัมบูรณ์ของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถึงศูนย์ไม่ได้หมายความว่าไม่มีความเชื่อมโยงระหว่างคุณลักษณะดังกล่าว ด้วยสเปคที่แตกต่างกันของรุ่น ความสัมพันธ์ระหว่างฟีเจอร์ต่างๆ อาจจะใกล้เคียงกันมาก

ในการประเมินคุณภาพของการปรับฟังก์ชันเชิงเส้นให้เหมาะสม จะมีการคำนวณกำลังสองของสัมประสิทธิ์สหสัมพันธ์เชิงเส้น ค่าสัมประสิทธิ์การตัดสินใจค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรปรวนของลักษณะผลลัพธ์ ใช่อธิบายโดยการถดถอยในความแปรปรวนรวมของลักษณะผลลัพธ์

ดังนั้น ค่านี้จะระบุถึงส่วนแบ่งของความแปรปรวนที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในแบบจำลอง

ในตัวอย่างของเรา ดังนั้น สมการการถดถอยอธิบาย 98.6% ของความแปรปรวนของคุณลักษณะที่มีประสิทธิผล และปัจจัยอื่นๆ คิดเป็นเพียง 1.4% ของความแปรปรวน (นั่นคือ ความแปรปรวนที่เหลือ) ค่าสัมประสิทธิ์การกำหนดทำหน้าที่เป็นเกณฑ์หนึ่งในการประเมินคุณภาพของแบบจำลองเชิงเส้น ยิ่งสัดส่วนของการแปรผันที่อธิบายมีขนาดใหญ่เท่าใด บทบาทของปัจจัยอื่น ๆ ก็จะยิ่งน้อยลงตามลำดับ ดังนั้นแบบจำลองเชิงเส้นจะประมาณค่าข้อมูลดั้งเดิมได้ดีและสามารถใช้เพื่อทำนายค่าของคุณลักษณะผลลัพธ์ได้ ดังนั้นสมมติว่าปริมาณการผลิตขององค์กรสามารถมีได้ 6 พัน . หน่วยมูลค่าการคาดการณ์ต้นทุนการผลิตจะอยู่ที่ 221.01 พันรูเบิล

การถดถอยเชิงเส้นคู่

แบบฝึกหัด

ห้องอบไอน้ำ การถดถอยเชิงเส้น: เวิร์คช็อป. -

การศึกษาวิชาเศรษฐมิติเกี่ยวข้องกับการที่นักเรียนได้รับประสบการณ์ในการสร้างแบบจำลองทางเศรษฐมิติ การตัดสินใจเกี่ยวกับข้อกำหนดและการระบุแบบจำลอง การเลือกวิธีการประมาณค่าพารามิเตอร์ของแบบจำลอง การประเมินคุณภาพ การตีความผลลัพธ์ การขอรับค่าประมาณการคาดการณ์ ฯลฯ การประชุมเชิงปฏิบัติการจะช่วยให้นักเรียน ได้รับทักษะการปฏิบัติในประเด็นเหล่านี้

ได้รับการอนุมัติจากกองบรรณาธิการและสำนักพิมพ์

เรียบเรียงโดย: ม.บ. Perova เศรษฐศาสตร์ดุษฎีบัณฑิต ศาสตราจารย์

บทบัญญัติทั่วไป

การวิจัยทางเศรษฐมิติเริ่มต้นด้วยทฤษฎีที่สร้างความสัมพันธ์ระหว่างปรากฏการณ์ จากปัจจัยทั้งหมดที่มีอิทธิพลต่อคุณลักษณะที่มีประสิทธิผล จะมีการเน้นปัจจัยที่สำคัญที่สุด หลังจากระบุความสัมพันธ์ระหว่างคุณลักษณะที่ศึกษาแล้ว ประเภทความสัมพันธ์ที่แน่นอนจะถูกกำหนดโดยใช้การวิเคราะห์การถดถอย

การวิเคราะห์การถดถอยประกอบด้วยการกำหนดนิพจน์เชิงวิเคราะห์ (ในการกำหนดฟังก์ชัน) ซึ่งการเปลี่ยนแปลงในค่าหนึ่ง (คุณลักษณะผลลัพธ์) เกิดจากอิทธิพลของค่าอิสระ (คุณลักษณะแฟกทอเรียล) ความสัมพันธ์นี้สามารถหาปริมาณได้โดยการสร้างสมการถดถอยหรือฟังก์ชันการถดถอย

แบบจำลองการถดถอยพื้นฐานคือแบบจำลองการถดถอยแบบจับคู่ (ปัจจัยเดียว) การถดถอยคู่– สมการการเชื่อมต่อระหว่างตัวแปรสองตัว ที่และ เอ็กซ์:

ที่ไหน – ตัวแปรตาม (คุณลักษณะผลลัพธ์)

– ตัวแปรอิสระที่อธิบายได้ (ลักษณะแฟคทอเรียล)

ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลง ที่ด้วยการเปลี่ยนแปลง เอ็กซ์แยกความแตกต่างระหว่างการถดถอยเชิงเส้นและไม่เชิงเส้น

การถดถอยเชิงเส้น

ฟังก์ชันการถดถอยนี้เรียกว่าพหุนามของดีกรี 1 และใช้เพื่ออธิบายกระบวนการที่มีการพัฒนาอย่างสม่ำเสมอเมื่อเวลาผ่านไป

การมีสมาชิกแบบสุ่ม (ข้อผิดพลาดการถดถอย) มีความเกี่ยวข้องกับผลกระทบต่อตัวแปรตามของปัจจัยอื่น ๆ ที่ไม่ได้นำมาพิจารณาในสมการ กับความไม่เชิงเส้นที่เป็นไปได้ของแบบจำลอง ข้อผิดพลาดในการวัด และดังนั้นลักษณะที่ปรากฏ สมการข้อผิดพลาดแบบสุ่มการถดถอยอาจเนื่องมาจากวัตถุประสงค์ดังต่อไปนี้ เหตุผล:

1) การไม่เป็นตัวแทนของกลุ่มตัวอย่าง แบบจำลองการถดถอยแบบคู่ประกอบด้วยปัจจัยที่ไม่สามารถอธิบายความแปรผันในลักษณะผลลัพธ์ได้ครบถ้วน ซึ่งอาจได้รับอิทธิพลจากปัจจัยอื่นๆ อีกมากมาย (ละเว้นตัวแปร) ในขอบเขตที่สูงกว่ามาก ตัวอย่างเช่น ค่าจ้างอาจขึ้นอยู่กับระดับการศึกษา ประสบการณ์การทำงาน เพศ ฯลฯ นอกเหนือจากคุณสมบัติ

2) มีความเป็นไปได้ที่ตัวแปรที่เกี่ยวข้องกับแบบจำลองอาจถูกวัดโดยมีข้อผิดพลาด ตัวอย่างเช่น ข้อมูลค่าใช้จ่ายด้านอาหารในครัวเรือนรวบรวมจากบันทึกของผู้เข้าร่วมการสำรวจ ซึ่งสันนิษฐานว่าบันทึกค่าใช้จ่ายรายวันอย่างระมัดระวัง แน่นอนว่าข้อผิดพลาดก็เกิดขึ้นได้

จากการสังเกตตัวอย่าง สมการการถดถอยตัวอย่างจะถูกประมาณ ( เส้นถดถอย):

,

ที่ไหน
– การประมาณค่าพารามิเตอร์ของสมการถดถอย (
).

รูปแบบการวิเคราะห์ของการพึ่งพาระหว่างคู่คุณลักษณะที่ศึกษา (ฟังก์ชันการถดถอย) จะถูกกำหนดโดยใช้สิ่งต่อไปนี้ วิธีการ:

    ขึ้นอยู่กับการวิเคราะห์ทางทฤษฎีและตรรกะธรรมชาติของปรากฏการณ์ที่กำลังศึกษา สาระสำคัญทางเศรษฐกิจและสังคม

    ตัวอย่างเช่น หากมีการศึกษาความสัมพันธ์ระหว่างรายได้ของครัวเรือนกับขนาดของเงินฝากในครัวเรือนในธนาคาร ก็จะเห็นได้ชัดว่าความสัมพันธ์นั้นเป็นไปโดยตรงวิธีการแบบกราฟิก

เมื่อประเมินลักษณะของการเชื่อมต่อด้วยสายตา เอ็กซ์การพึ่งพานี้สามารถเห็นได้ชัดเจนหากคุณสร้างกราฟโดยพล็อตค่าของแอตทริบิวต์บนแกน x ที่และในการกำหนด - ค่าของคุณลักษณะ เอ็กซ์และ ที่- โดยการวางแผนจุดที่สอดคล้องกับค่า เราได้รับ:

สนามความสัมพันธ์

ก) หากคะแนนกระจายแบบสุ่มทั่วทั้งสนาม แสดงว่าไม่มีการพึ่งพาระหว่างคุณสมบัติเหล่านี้

b) หากจุดนั้นกระจุกตัวอยู่รอบแกนที่วิ่งจากมุมล่างซ้ายไปมุมขวาบนแสดงว่ามีความสัมพันธ์โดยตรงระหว่างคุณลักษณะนั้น

c) ถ้าจุดต่างๆ อยู่รวมกันรอบแกนที่วิ่งจากมุมซ้ายบนไปทางขวาล่าง แสดงว่าคุณลักษณะดังกล่าวมีความสัมพันธ์ผกผันกัน หากเราเชื่อมโยงจุดต่างๆ บนสนามความสัมพันธ์ด้วยส่วนตรง เราจะได้เส้นขาดที่มีแนวโน้มที่จะเติบโต นี่จะเป็นสายการสื่อสารเชิงประจักษ์หรือเส้นการถดถอยเชิงประจักษ์

- จากรูปลักษณ์ภายนอกเราสามารถตัดสินได้ไม่เพียง แต่การมีอยู่เท่านั้น แต่ยังรวมถึงรูปแบบของการพึ่งพาระหว่างลักษณะที่ศึกษาด้วย

การสร้างสมการถดถอยคู่ การสร้างสมการถดถอยมาจากการประมาณค่าพารามิเตอร์ การประมาณค่าพารามิเตอร์เหล่านี้สามารถพบได้หลายวิธี หนึ่งในนั้นคือวิธีกำลังสองน้อยที่สุด (LSM) สาระสำคัญของวิธีการมีดังนี้ แต่ละค่า สอดคล้องกับค่าเชิงประจักษ์ (สังเกตได้) - โดยการสร้างสมการถดถอย เช่น สมการเส้นตรง สำหรับแต่ละค่า จะสอดคล้องกับค่าทางทฤษฎี (คำนวณ) - ค่าที่สังเกตได้ อย่าอยู่บนเส้นถดถอยอย่างแน่นอน เช่น ไม่ตรงกัน - เรียกว่าความแตกต่างระหว่างค่าจริงและค่าที่คำนวณได้ของตัวแปรตาม:

วิธีกำลังสองน้อยที่สุดทำให้สามารถรับค่าประมาณพารามิเตอร์ดังกล่าวได้ ซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าจริงของลักษณะผลลัพธ์ ที่จากทางทฤษฎี , เช่น. ผลรวมของกำลังสองของเศษเหลือน้อยที่สุด:

สำหรับสมการเชิงเส้นและสมการไม่เชิงเส้นที่สามารถลดเป็นเชิงเส้นได้ ระบบต่อไปนี้จะได้รับการแก้ไขด้วยความเคารพ และ :

ที่ไหน n– ขนาดตัวอย่าง

เมื่อแก้ระบบสมการแล้ว เราก็จะได้ค่าต่างๆ และ ซึ่งทำให้เราสามารถเขียนได้ สมการถดถอย(สมการถดถอย):

ที่ไหน – ตัวแปรอธิบาย (อิสระ)

–ตัวแปรอธิบาย (ขึ้นอยู่กับ)

เส้นถดถอยผ่านจุด ( ,) และมีความเท่าเทียมกัน:

คุณสามารถใช้สูตรสำเร็จรูปที่ตามมาจากระบบสมการนี้:

ที่ไหน – ค่าเฉลี่ยของลักษณะเฉพาะ

– ค่าเฉลี่ยของคุณลักษณะอิสระ

– ค่าเฉลี่ยเลขคณิตของผลิตภัณฑ์ที่มีลักษณะเฉพาะและเป็นอิสระ

– ความแปรปรวนของคุณลักษณะอิสระ

– ความแปรปรวนร่วมระหว่างคุณลักษณะขึ้นอยู่กับและเป็นอิสระ

ความแปรปรวนร่วมตัวอย่างสองตัวแปร เอ็กซ์, ที่คือค่าเฉลี่ยผลคูณของการเบี่ยงเบนของตัวแปรเหล่านี้จากค่าเฉลี่ย

พารามิเตอร์ ที่ เอ็กซ์มีความสำคัญในทางปฏิบัติอย่างมาก และเรียกว่าสัมประสิทธิ์การถดถอย สัมประสิทธิ์การถดถอยแสดงจำนวนหน่วยที่ค่าเปลี่ยนแปลงโดยเฉลี่ย ที่ เอ็กซ์ต่อ 1 หน่วยของการวัด

เครื่องหมายพารามิเตอร์ ในสมการการถดถอยแบบคู่บ่งชี้ทิศทางของความสัมพันธ์:

ถ้า
จากนั้นความสัมพันธ์ระหว่างตัวชี้วัดที่ศึกษาจะเป็นทางตรงเช่น โดยมีเครื่องหมายปัจจัยเพิ่มขึ้น เอ็กซ์สัญญาณที่มีประสิทธิภาพก็เพิ่มขึ้นเช่นกัน ที่และในทางกลับกัน;

ถ้า
จากนั้นความสัมพันธ์ระหว่างตัวบ่งชี้ที่ศึกษาจะกลับกันนั่นคือ โดยมีเครื่องหมายปัจจัยเพิ่มขึ้น เอ็กซ์เครื่องหมายผลลัพธ์ ที่ลดลง และในทางกลับกัน

ค่าพารามิเตอร์ ในสมการการถดถอยคู่ในบางกรณีสามารถตีความได้ว่าเป็นค่าเริ่มต้นของคุณลักษณะผลลัพธ์ ที่- การตีความพารามิเตอร์นี้ เป็นไปได้ก็ต่อเมื่อมีค่า
สมเหตุสมผล

หลังจากสร้างสมการถดถอยแล้วจะได้ค่าที่สังเกตได้ สามารถแสดงเป็น:

ของเหลือ เหมือนความผิดพลาด , เป็น ตัวแปรสุ่มอย่างไรก็ตาม ไม่เหมือนข้อผิดพลาด , สังเกตได้. ส่วนที่เหลือคือส่วนหนึ่งของตัวแปรตาม ซึ่งไม่สามารถอธิบายได้โดยใช้สมการถดถอย

โดยอาศัยสมการถดถอยสามารถคำนวณได้ ค่าทางทฤษฎี เอ็กซ์สำหรับค่าใดๆ เอ็กซ์.

ในการวิเคราะห์ทางเศรษฐศาสตร์ มักใช้แนวคิดเรื่องความยืดหยุ่นของฟังก์ชัน ฟังก์ชั่นความยืดหยุ่น
คำนวณเป็นการเปลี่ยนแปลงสัมพัทธ์ การเปลี่ยนแปลงสัมพัทธ์ x- ความยืดหยุ่นจะแสดงตามเปอร์เซ็นต์ที่ฟังก์ชันเปลี่ยนแปลง
เมื่อตัวแปรอิสระเปลี่ยนแปลงไป 1%

เนื่องจากความยืดหยุ่นของฟังก์ชันเชิงเส้น
ไม่ใช่ค่าคงที่แต่ขึ้นอยู่กับ เอ็กซ์จากนั้นค่าสัมประสิทธิ์ความยืดหยุ่นมักจะคำนวณเป็นความยืดหยุ่นโดยเฉลี่ย

ค่าสัมประสิทธิ์ความยืดหยุ่นแสดงโดยเปอร์เซ็นต์โดยเฉลี่ยมูลค่าของลักษณะผลลัพธ์ที่จะเปลี่ยนแปลงโดยเฉลี่ย ที่เมื่อลักษณะปัจจัยเปลี่ยนแปลงไป เอ็กซ์ 1% ของมูลค่าเฉลี่ย:

ที่ไหน
– ค่าเฉลี่ยของตัวแปร เอ็กซ์และ ที่ในตัวอย่าง

การประเมินคุณภาพของแบบจำลองการถดถอยที่สร้างขึ้น

คุณภาพของโมเดลการถดถอย– ความเพียงพอของแบบจำลองที่สร้างขึ้นต่อข้อมูลต้นฉบับ (สังเกตได้)

เพื่อวัดความแน่นของการเชื่อมต่อ เช่น ในการวัดว่าค่าความใกล้เคียงกับฟังก์ชันนั้นอยู่ใกล้แค่ไหน คุณจะต้องพิจารณาความแปรปรวนซึ่งจะวัดค่าความเบี่ยงเบน ที่จาก ที่ เอ็กซ์และแสดงลักษณะความแปรผันของสารตกค้างเนื่องจากปัจจัยอื่นๆ เป็นพื้นฐานของตัวบ่งชี้ที่แสดงลักษณะของแบบจำลองการถดถอย

คุณภาพของการถดถอยแบบคู่ถูกกำหนดโดยใช้การกำหนดลักษณะสัมประสิทธิ์

1) ความใกล้ชิดของการเชื่อมต่อ - ดัชนีสหสัมพันธ์, ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่;

2) ข้อผิดพลาดในการประมาณ;

3) คุณภาพของสมการการถดถอยและพารามิเตอร์แต่ละตัว - ค่าคลาดเคลื่อนกำลังสองเฉลี่ยของสมการการถดถอยโดยรวมและพารามิเตอร์แต่ละตัว

สำหรับสมการการถดถอยประเภทใดก็ตาม จะมีการกำหนดไว้ ดัชนีความสัมพันธ์ซึ่งแสดงเฉพาะความรัดกุมของการพึ่งพาสหสัมพันธ์เท่านั้นเช่น ระดับของการประมาณการเชื่อมต่อการทำงาน:

,

ที่ไหน – การกระจายตัวแบบแฟคทอเรียล (เชิงทฤษฎี)

– ความแปรปรวนทั้งหมด

ดัชนีความสัมพันธ์ใช้ค่า
ในเวลาเดียวกัน

ถ้า

ถ้า
- การเชื่อมต่อระหว่างป้ายต่างๆ เอ็กซ์และ ที่ใช้งานได้ดียิ่งขึ้น ถึง 1 ยิ่งพิจารณาความสัมพันธ์ระหว่างคุณลักษณะที่ศึกษามากขึ้นเท่านั้น ถ้า
จากนั้นถือว่าการเชื่อมต่อปิด

ความแปรปรวนที่จำเป็นในการคำนวณตัวบ่งชี้ความหนาแน่นของข้อต่อถูกคำนวณ:

ผลต่างรวมการวัดความแปรผันรวมเนื่องจากการกระทำของปัจจัยทั้งหมด:

ความแปรปรวนของปัจจัย (ทางทฤษฎี)การวัดความแปรผันของลักษณะผลลัพธ์ ที่เนื่องจากการกระทำของเครื่องหมายปัจจัย เอ็กซ์:

ผลต่างที่เหลือบ่งบอกถึงความแปรผันของลักษณะ ที่เนื่องจากปัจจัยทั้งหมดยกเว้น เอ็กซ์(เช่น ด้วยการยกเว้น เอ็กซ์):

จากนั้นตามกฎของการบวกผลต่าง:

คุณภาพของห้องอบไอน้ำ เชิงเส้นการถดถอยยังสามารถกำหนดได้โดยใช้ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่:

,

ที่ไหน
– ความแปรปรวนร่วมของตัวแปร เอ็กซ์และ ที่;

– ส่วนเบี่ยงเบนมาตรฐานของคุณลักษณะอิสระ

– ค่าเบี่ยงเบนมาตรฐานของลักษณะเฉพาะ

ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นแสดงถึงความใกล้ชิดและทิศทางของความสัมพันธ์ระหว่างคุณลักษณะที่กำลังศึกษา มีการวัดภายใน [-1; +1]:

ถ้า
– จากนั้นความเชื่อมโยงระหว่างคุณลักษณะจะเป็นทางตรง

ถ้า
– จากนั้นความสัมพันธ์ระหว่างสัญญาณจะกลับกัน

ถ้า
– ดังนั้นจึงไม่มีความเชื่อมโยงระหว่างคุณลักษณะ

ถ้า
หรือ
– จากนั้นการเชื่อมต่อระหว่างคุณลักษณะต่างๆ จะทำงานได้ เช่น โดดเด่นด้วยการติดต่อสื่อสารที่สมบูรณ์ระหว่าง เอ็กซ์และ ที่- ยิ่งใกล้. ถึง 1 ยิ่งพิจารณาความสัมพันธ์ระหว่างคุณลักษณะที่ศึกษามากขึ้นเท่านั้น

หากดัชนีสหสัมพันธ์ (สัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่) ถูกยกกำลังสอง เราจะได้ค่าสัมประสิทธิ์การกำหนด

ค่าสัมประสิทธิ์การตัดสินใจ– แสดงถึงส่วนแบ่งของความแปรปรวนของปัจจัยในผลรวม และแสดงด้วยเปอร์เซ็นต์ของการแปรผันของคุณลักษณะผลลัพธ์ ที่อธิบายโดยการแปรผันของคุณลักษณะของปัจจัย เอ็กซ์:

มันไม่ได้แสดงลักษณะเฉพาะของรูปแบบทั้งหมด ที่จากเครื่องหมายปัจจัย เอ็กซ์แต่เฉพาะส่วนที่สอดคล้องกับสมการการถดถอยเชิงเส้นเท่านั้น กล่าวคือ การแสดง ความถ่วงจำเพาะการแปรผันของคุณลักษณะผลลัพธ์ สัมพันธ์เชิงเส้นตรงกับการแปรผันของคุณลักษณะปัจจัย

ขนาด
– สัดส่วนของการแปรผันในลักษณะผลลัพธ์ที่แบบจำลองการถดถอยไม่สามารถนำมาพิจารณาได้

การกระจายตัวของจุดในฟิลด์สหสัมพันธ์อาจมีขนาดใหญ่มากและสมการการถดถอยที่คำนวณได้อาจทำให้เกิดข้อผิดพลาดอย่างมากในการประมาณค่าตัวบ่งชี้ที่วิเคราะห์

ข้อผิดพลาดในการประมาณค่าเฉลี่ยแสดงความเบี่ยงเบนเฉลี่ยของค่าที่คำนวณได้จากค่าจริง:

ค่าสูงสุดที่อนุญาตคือ 12–15%

ข้อผิดพลาดมาตรฐานคือการวัดการแพร่กระจายของตัวแปรตามรอบเส้นการถดถอย จะมีการคำนวณสำหรับชุดค่าที่สังเกตได้ทั้งหมด มาตรฐาน (rms) ข้อผิดพลาดสมการถดถอยซึ่งเป็นค่าเบี่ยงเบนมาตรฐานของค่าจริง ที่สัมพันธ์กับค่าทางทฤษฎีที่คำนวณโดยใช้สมการถดถอย ที่ เอ็กซ์ .

,

ที่ไหน
– จำนวนระดับความเป็นอิสระ

– จำนวนพารามิเตอร์ของสมการถดถอย (สำหรับสมการเส้นตรง =2).

ประมาณการค่าเฉลี่ย ข้อผิดพลาดกำลังสองคุณสามารถเปรียบเทียบมันได้

ก) ด้วยค่าเฉลี่ยของลักษณะผลลัพธ์ ที่;

b) มีค่าเบี่ยงเบนมาตรฐานของคุณลักษณะ ที่:

ถ้า
ดังนั้นการใช้สมการถดถอยนี้มีความเหมาะสม

ประเมินแยกกัน มาตรฐาน ข้อผิดพลาด (ค่าเฉลี่ยกำลังสอง) ของพารามิเตอร์สมการและดัชนีสหสัมพันธ์:

;
;
.

เอ็กซ์– ส่วนเบี่ยงเบนมาตรฐาน เอ็กซ์.

การตรวจสอบความสำคัญของสมการถดถอยและตัวบ่งชี้ความแน่นของการเชื่อมต่อ

เพื่อให้แบบจำลองที่สร้างขึ้นนำไปใช้ในการคำนวณทางเศรษฐกิจต่อไป การตรวจสอบคุณภาพของแบบจำลองที่สร้างขึ้นนั้นยังไม่เพียงพอ นอกจากนี้ยังจำเป็นต้องตรวจสอบนัยสำคัญ (นัยสำคัญ) ของการประมาณสมการการถดถอยที่ได้รับโดยใช้วิธีกำลังสองน้อยที่สุดและตัวบ่งชี้ความแข็งแกร่งของความสัมพันธ์ เช่น จำเป็นต้องตรวจสอบความสอดคล้องกับพารามิเตอร์ที่แท้จริงของความสัมพันธ์

นี่เป็นเพราะความจริงที่ว่าตัวบ่งชี้ที่คำนวณจากประชากรที่จำกัดยังคงรักษาองค์ประกอบของการสุ่มที่มีอยู่ในค่าแต่ละค่าของคุณลักษณะ ดังนั้นจึงเป็นเพียงการประมาณการรูปแบบทางสถิติบางอย่างเท่านั้น จำเป็นต้องประเมินระดับความถูกต้องและความสำคัญ (ความน่าเชื่อถือ นัยสำคัญ) ของพารามิเตอร์การถดถอย ภายใต้ ความสำคัญเข้าใจความน่าจะเป็นที่ค่าของพารามิเตอร์ที่จะทดสอบไม่เป็นศูนย์และไม่รวมค่าของเครื่องหมายตรงกันข้าม

การตรวจสอบความสำคัญ– การตรวจสอบสมมติฐานว่าพารามิเตอร์แตกต่างจากศูนย์

การประเมินความสำคัญของสมการถดถอยคู่ลงมาเพื่อทดสอบสมมติฐานเกี่ยวกับความสำคัญของสมการถดถอยโดยรวมและพารามิเตอร์แต่ละตัว ( , ) สัมประสิทธิ์คู่ของการกำหนดหรือดัชนีสหสัมพันธ์

ในกรณีนี้สามารถหยิบยกสิ่งต่อไปนี้: สมมติฐานหลักชม 0 :

1)
– ค่าสัมประสิทธิ์การถดถอยไม่มีนัยสำคัญและสมการการถดถอยก็ไม่มีนัยสำคัญเช่นกัน

2)
– ค่าสัมประสิทธิ์การจับคู่ของการกำหนดไม่มีนัยสำคัญและสมการการถดถอยก็ไม่มีนัยสำคัญเช่นกัน

สมมติฐานต่อไปนี้เป็นทางเลือก (หรือย้อนกลับ):

1)
– ค่าสัมประสิทธิ์การถดถอยแตกต่างอย่างมีนัยสำคัญจากศูนย์ และสมการการถดถอยที่สร้างขึ้นมีนัยสำคัญ

2)
– ค่าสัมประสิทธิ์การจับคู่ของการกำหนดมีความแตกต่างอย่างมีนัยสำคัญจากศูนย์ และสมการการถดถอยที่สร้างขึ้นนั้นมีนัยสำคัญ

ทดสอบสมมติฐานเกี่ยวกับความสำคัญของสมการถดถอยคู่

เพื่อทดสอบสมมติฐานเกี่ยวกับความไม่มีนัยสำคัญทางสถิติของสมการการถดถอยโดยรวมและสัมประสิทธิ์การกำหนด เราใช้ เอฟ-เกณฑ์(การทดสอบฟิชเชอร์):

หรือ

ที่ไหน เค 1 = –1 ; เค 2 = n – จำนวนระดับความเป็นอิสระ

n– จำนวนหน่วยประชากร

– จำนวนพารามิเตอร์สมการถดถอย

– การกระจายตัวของปัจจัย

–ความแปรปรวนคงเหลือ

สมมติฐานได้รับการทดสอบดังนี้:

1) ถ้าเป็นค่าจริง (สังเกตได้) เอฟ-เกณฑ์มีค่ามากกว่าค่าวิกฤต (ตาราง) ของเกณฑ์นี้
แล้วด้วยความน่าจะเป็น
สมมติฐานหลักเกี่ยวกับความไม่มีนัยสำคัญของสมการการถดถอยหรือสัมประสิทธิ์การกำหนดคู่ถูกปฏิเสธ และถือว่าสมการการถดถอยมีนัยสำคัญ

2) ถ้าค่าจริง (สังเกตได้) ของเกณฑ์ F น้อยกว่าค่าวิกฤตของเกณฑ์นี้
แล้วมีความน่าจะเป็น (
) ยอมรับสมมติฐานหลักเกี่ยวกับความไม่มีนัยสำคัญของสมการการถดถอยหรือสัมประสิทธิ์การจับคู่ของการกำหนด และสมการการถดถอยที่สร้างขึ้นถือว่าไม่มีนัยสำคัญ

ค่าวิกฤต เอฟ-เกณฑ์จะพบได้ในตารางที่เกี่ยวข้องขึ้นอยู่กับระดับนัยสำคัญ และจำนวนระดับความเป็นอิสระ
.

จำนวนองศาความเป็นอิสระ– ตัวบ่งชี้ซึ่งหมายถึงความแตกต่างระหว่างขนาดตัวอย่าง ( n) และจำนวนพารามิเตอร์โดยประมาณสำหรับตัวอย่างที่กำหนด ( - สำหรับแบบจำลองการถดถอยแบบคู่ จำนวนองศาอิสระจะถูกคำนวณดังนี้
เนื่องจากพารามิเตอร์สองตัวถูกประมาณจากตัวอย่าง (
).

ระดับความสำคัญ – มูลค่าที่กำหนด
,

ที่ไหน – ความน่าจะเป็นความเชื่อมั่นของพารามิเตอร์โดยประมาณที่ตกอยู่ในช่วงความเชื่อมั่น โดยปกติจะยอมรับ 0.95 ดังนั้น คือความน่าจะเป็นที่พารามิเตอร์โดยประมาณจะไม่ตกอยู่ในช่วงความเชื่อมั่น เท่ากับ 0.05 (5%)

จากนั้น ในกรณีประเมินนัยสำคัญของสมการการถดถอยคู่ ค่าวิกฤตของการทดสอบ F จะถูกคำนวณดังนี้
:

.

การทดสอบสมมติฐานเกี่ยวกับความสำคัญของพารามิเตอร์ของสมการถดถอยคู่และดัชนีสหสัมพันธ์

เมื่อตรวจสอบความสำคัญของพารามิเตอร์ของสมการ (สมมติฐานว่าพารามิเตอร์แตกต่างจากศูนย์) สมมติฐานหลักจะถูกหยิบยกขึ้นมาเกี่ยวกับความไม่มีนัยสำคัญของการประมาณค่าที่ได้รับ (
- เนื่องจากมีการนำเสนอสมมติฐานทางเลือก (ผกผัน) เกี่ยวกับความสำคัญของพารามิเตอร์ของสมการ (
).

เพื่อทดสอบสมมติฐานที่หยิบยกมาใช้ ที -เกณฑ์ (ที-สถิติ) การทดสอบของนักเรียน- ค่าที่สังเกตได้ ที-เกณฑ์จะถูกเปรียบเทียบกับค่า ที-เกณฑ์ที่กำหนดจากตารางการแจกแจงนักเรียน (ค่าวิกฤต) ค่าวิกฤต ที-เกณฑ์
ขึ้นอยู่กับพารามิเตอร์สองตัว: ระดับนัยสำคัญ และจำนวนระดับความเป็นอิสระ
.

สมมติฐานที่นำเสนอได้รับการทดสอบดังนี้:

1) ถ้าเป็นค่าสัมบูรณ์ของค่าที่สังเกตได้ ที-เกณฑ์ที่มากกว่าค่าวิกฤต ที-เกณฑ์ เช่น
แล้วด้วยความน่าจะเป็น
สมมติฐานหลักเกี่ยวกับความไม่มีนัยสำคัญของพารามิเตอร์การถดถอยถูกปฏิเสธ เช่น พารามิเตอร์การถดถอยไม่เท่ากับ 0

2) ถ้าเป็นค่าสัมบูรณ์ของค่าที่สังเกตได้ ที-เกณฑ์มีค่าน้อยกว่าหรือเท่ากับค่าวิกฤต ที-เกณฑ์ เช่น
แล้วด้วยความน่าจะเป็น
ยอมรับสมมติฐานหลักเกี่ยวกับความไม่มีนัยสำคัญของพารามิเตอร์การถดถอยเช่น พารามิเตอร์การถดถอยแทบจะไม่แตกต่างจาก 0 หรือเท่ากับ 0

การประเมินความสำคัญของค่าสัมประสิทธิ์การถดถอยโดยใช้การทดสอบของนักเรียนนั้นดำเนินการโดยการเปรียบเทียบค่าประมาณกับค่าของข้อผิดพลาดมาตรฐาน:

;

เพื่อประเมินนัยสำคัญทางสถิติของดัชนีสหสัมพันธ์ (สัมประสิทธิ์เชิงเส้น) ก็ถูกนำมาใช้เช่นกัน ที-แบบทดสอบของนักเรียน





ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!