ใช้วิธีการกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุดใน Excel
ให้เราประมาณฟังก์ชันด้วยพหุนามระดับ 2 ในการทำเช่นนี้ เราคำนวณค่าสัมประสิทธิ์ของระบบสมการปกติ:
, ,
มาสร้างระบบปกติกันเถอะ กำลังสองน้อยที่สุดซึ่งดูเหมือนว่า:
วิธีแก้ระบบหาง่าย:, , .
ดังนั้นจึงพบพหุนามของดีกรี 2:
ข้อมูลทางทฤษฎี
กลับไปที่หน้า<Введение в вычислительную математику. Примеры>
ตัวอย่างที่ 2- การหาระดับที่เหมาะสมที่สุดของพหุนาม
กลับไปที่หน้า<Введение в вычислительную математику. Примеры>
ตัวอย่างที่ 3- ที่มาของระบบสมการปกติสำหรับการค้นหาพารามิเตอร์ของการพึ่งพาเชิงประจักษ์
ขอให้เราได้รับระบบสมการเพื่อกำหนดค่าสัมประสิทธิ์และฟังก์ชัน ซึ่งดำเนินการประมาณราก-ค่าเฉลี่ย-กำลังสอง ฟังก์ชันที่กำหนดตามจุด ลองเขียนฟังก์ชันกัน และเขียนมันลงไปให้เธอ สภาพที่จำเป็นสุดขีด:
จากนั้นระบบปกติจะอยู่ในรูปแบบ:
เราได้รับระบบสมการเชิงเส้นสำหรับพารามิเตอร์ที่ไม่รู้จักซึ่งแก้ไขได้ง่าย
ข้อมูลทางทฤษฎี
กลับไปที่หน้า<Введение в вычислительную математику. Примеры>
ตัวอย่าง.
ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง
จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา
โดยใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ขวาน+ข(ค้นหาพารามิเตอร์ กและ ข- ค้นหาว่าบรรทัดใดในสองบรรทัดที่ดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) เพื่อจัดแนวข้อมูลการทดลอง วาดรูป.
สาระสำคัญของวิธีกำลังสองน้อยที่สุด (LSM)
ภารกิจคือการหาค่าสัมประสิทธิ์ การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว กและ ขใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด
ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว
สูตรการหาค่าสัมประสิทธิ์
ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การหาอนุพันธ์ย่อยของฟังก์ชัน โดยตัวแปร กและ ข, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์
เราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น โดยวิธีทดแทนหรือวิธีแครเมอร์) และรับสูตรหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM)
ที่ให้ไว้ กและ ขการทำงาน ใช้ค่าที่น้อยที่สุด หลักฐานข้อเท็จจริงนี้มีระบุไว้ด้านล่างในข้อความท้ายหน้า
นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กมีผลรวม , , และพารามิเตอร์ n– จำนวนข้อมูลการทดลอง เราขอแนะนำให้คำนวณค่าของจำนวนเงินเหล่านี้แยกกัน
ค่าสัมประสิทธิ์ ขพบได้หลังการคำนวณ ก.
ถึงเวลาจำตัวอย่างดั้งเดิมแล้ว
สารละลาย.
ในตัวอย่างของเรา n=5- เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ
ค่าในแถวที่สี่ของตารางได้มาโดยการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ฉัน.
ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าในแถวที่ 2 สำหรับแต่ละตัวเลข ฉัน.
ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว
เราใช้สูตรวิธีกำลังสองน้อยที่สุดเพื่อหาค่าสัมประสิทธิ์ กและ ข- เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตารางลงไป:
เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ
มันยังคงค้นหาว่าเส้นไหน y = 0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีกว่า นั่นคือประมาณโดยใช้วิธีกำลังสองน้อยที่สุด
การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด
ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลต้นฉบับจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ประมาณข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด
ตั้งแต่นั้นมาตรง y = 0.165x+2.184ใกล้เคียงกับข้อมูลเดิมดีกว่า
ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LS)
ทุกอย่างมองเห็นได้ชัดเจนบนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y = 0.165x+2.184, เส้นสีน้ำเงินคือ จุดสีชมพูคือข้อมูลต้นฉบับ
เหตุใดจึงจำเป็น เหตุใดจึงต้องประมาณทั้งหมดนี้
โดยส่วนตัวฉันใช้มันเพื่อแก้ปัญหาการปรับข้อมูลให้เรียบ การแก้ไข และการคาดการณ์ (ในตัวอย่างดั้งเดิม พวกเขาอาจถูกขอให้ค้นหาค่าของค่าที่สังเกตได้ ยที่ x=3หรือเมื่อใด x=6โดยใช้วิธีกำลังสองน้อยที่สุด) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของเว็บไซต์ในภายหลัง
ด้านบนของหน้า
การพิสูจน์.
ดังนั้นเมื่อพบแล้ว กและ ขฟังก์ชันใช้ค่าที่น้อยที่สุด ซึ่ง ณ จุดนี้เมทริกซ์ของรูปแบบกำลังสองของดิฟเฟอเรนเชียลลำดับที่สองจำเป็นสำหรับฟังก์ชันนี้ เป็นบวกแน่นอน มาแสดงกันเถอะ
ส่วนต่างลำดับที่สองมีรูปแบบ:
นั่นก็คือ
ดังนั้นเมทริกซ์ของรูปแบบกำลังสองจึงมีรูปแบบ
และค่าขององค์ประกอบไม่ได้ขึ้นอยู่กับ กและ ข.
ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน เมื่อต้องการทำเช่นนี้ ผู้เยาว์เชิงมุมจะต้องเป็นบวก
ผู้เยาว์เชิงมุมของลำดับแรก - ความไม่เท่าเทียมกันเข้มงวดเพราะคะแนนไม่ตรงกัน ต่อไปนี้เราจะบอกเป็นนัยนี้
ผู้เยาว์เชิงมุมอันดับที่สอง
มาพิสูจน์กัน โดยวิธีการอุปนัยทางคณิตศาสตร์
บทสรุป: พบค่า กและ ขสอดคล้อง ค่าต่ำสุดฟังก์ชั่น ดังนั้นจึงเป็นพารามิเตอร์ที่จำเป็นสำหรับวิธีกำลังสองน้อยที่สุด
ไม่มีเวลาคิดออก?
สั่งซื้อวิธีแก้ปัญหา
ด้านบนของหน้า
การพยากรณ์โดยใช้วิธีกำลังสองน้อยที่สุด ตัวอย่างการแก้ปัญหา
การคาดการณ์ เป็นวิธีการ การวิจัยทางวิทยาศาสตร์ซึ่งอยู่บนพื้นฐานของการเผยแพร่แนวโน้ม รูปแบบ ความเชื่อมโยงกับการพัฒนาในอนาคตของวัตถุการคาดการณ์ในอดีตและปัจจุบัน วิธีการประมาณค่าได้แก่ วิธีค่าเฉลี่ยเคลื่อนที่, วิธี การปรับให้เรียบแบบเอกซ์โปเนนเชียลวิธีกำลังสองน้อยที่สุด
เอสเซ้นส์ วิธีกำลังสองน้อยที่สุด ประกอบด้วยการลดผลรวมของการเบี่ยงเบนกำลังสองระหว่างค่าที่สังเกตและค่าที่คำนวณได้ ค่าที่คำนวณได้จะพบโดยใช้สมการที่เลือก - สมการถดถอย ยิ่งระยะห่างระหว่างค่าจริงกับค่าที่คำนวณได้น้อยลง การพยากรณ์ตามสมการการถดถอยก็จะยิ่งแม่นยำมากขึ้นเท่านั้น
การวิเคราะห์ทางทฤษฎีเกี่ยวกับแก่นแท้ของปรากฏการณ์ที่กำลังศึกษา การเปลี่ยนแปลงซึ่งสะท้อนให้เห็นโดยอนุกรมเวลา ทำหน้าที่เป็นพื้นฐานในการเลือกเส้นโค้ง บางครั้งการพิจารณาเกี่ยวกับลักษณะของการเพิ่มระดับของซีรีส์ก็ถูกนำมาพิจารณาด้วย ดังนั้น หากคาดว่าจะมีการเติบโตของผลผลิตในการก้าวหน้าทางคณิตศาสตร์ การปรับให้เรียบจะดำเนินการเป็นเส้นตรง หากปรากฎว่าการเติบโตอยู่ในความก้าวหน้าทางเรขาคณิต การปรับให้เรียบจะต้องดำเนินการโดยใช้ฟังก์ชันเลขชี้กำลัง
สูตรการทำงานสำหรับวิธีกำลังสองน้อยที่สุด : Y t+1 = a*X + bโดยที่ t + 1 – ระยะเวลาคาดการณ์ Уt+1 – ตัวบ่งชี้ที่คาดการณ์; a และ b เป็นสัมประสิทธิ์ เอ็กซ์ - เครื่องหมายเวลา.
การคำนวณสัมประสิทธิ์ a และ b ดำเนินการโดยใช้สูตรต่อไปนี้:
โดยที่ Uf – ค่าที่แท้จริงของซีรีย์ไดนามิก n – จำนวนระดับอนุกรมเวลา
อนุกรมเวลาที่ทำให้เรียบโดยใช้วิธีกำลังสองน้อยที่สุดทำหน้าที่สะท้อนรูปแบบการพัฒนาของปรากฏการณ์ที่กำลังศึกษา ในการวิเคราะห์แนวโน้ม เวลาถือเป็นตัวแปรอิสระ และระดับของอนุกรมทำหน้าที่เป็นฟังก์ชันของตัวแปรอิสระนี้
การพัฒนาของปรากฏการณ์ไม่ได้ขึ้นอยู่กับว่าผ่านไปกี่ปีนับตั้งแต่จุดเริ่มต้น แต่ขึ้นอยู่กับปัจจัยที่มีอิทธิพลต่อการพัฒนา ทิศทางใด และความรุนแรงเพียงใด จากตรงนี้เป็นที่ชัดเจนว่าการพัฒนาปรากฏการณ์เมื่อเวลาผ่านไปเป็นผลมาจากการกระทำของปัจจัยเหล่านี้
การสร้างประเภทของเส้นโค้งอย่างถูกต้องประเภทของการพึ่งพาการวิเคราะห์ตามเวลาเป็นหนึ่งในงานที่ยากที่สุดในการวิเคราะห์เชิงคาดการณ์ .
การเลือกประเภทของฟังก์ชันที่อธิบายแนวโน้ม ซึ่งเป็นพารามิเตอร์ที่กำหนดโดยวิธีกำลังสองน้อยที่สุด ในกรณีส่วนใหญ่จะดำเนินการโดยเชิงประจักษ์ โดยการสร้างฟังก์ชันจำนวนหนึ่งแล้วเปรียบเทียบกันตามค่าของฟังก์ชัน ค่าคลาดเคลื่อนกำลังสองเฉลี่ย คำนวณโดยสูตร:
โดยที่ UV เป็นค่าที่แท้จริงของซีรีย์ไดนามิก Ur – ค่าที่คำนวณ (เรียบ) ของซีรีย์ไดนามิก n – จำนวนระดับอนุกรมเวลา p – จำนวนพารามิเตอร์ที่กำหนดในสูตรที่อธิบายแนวโน้ม (แนวโน้มการพัฒนา)
ข้อเสียของวิธีกำลังสองน้อยที่สุด :
- เมื่อพยายามอธิบายปรากฏการณ์ทางเศรษฐกิจที่กำลังศึกษาโดยใช้สมการทางคณิตศาสตร์ การพยากรณ์จะมีความแม่นยำในช่วงเวลาสั้นๆ และควรคำนวณสมการถดถอยใหม่เมื่อมีข้อมูลใหม่
- ความซับซ้อนในการเลือกสมการถดถอยที่แก้ได้โดยใช้โปรแกรมคอมพิวเตอร์มาตรฐาน
ตัวอย่างการใช้วิธีกำลังสองน้อยที่สุดในการพยากรณ์
งาน - มีข้อมูลที่แสดงถึงอัตราการว่างงานในภูมิภาค %
- สร้างการคาดการณ์อัตราการว่างงานในภูมิภาคสำหรับเดือนพฤศจิกายน ธันวาคม มกราคม โดยใช้วิธีต่อไปนี้ ค่าเฉลี่ยเคลื่อนที่ การปรับให้เรียบแบบเอกซ์โปเนนเชียล กำลังสองน้อยที่สุด
- คำนวณข้อผิดพลาดในการพยากรณ์ผลลัพธ์โดยใช้แต่ละวิธี
- เปรียบเทียบผลลัพธ์และสรุปผล
คำตอบของกำลังสองน้อยที่สุด
เพื่อแก้ปัญหานี้เราจะจัดทำตารางซึ่งเราจะทำการคำนวณที่จำเป็น:
ε = 28.63/10 = 2.86% ความแม่นยำในการพยากรณ์สูง.
บทสรุป : เปรียบเทียบผลลัพธ์ที่ได้จากการคำนวณ วิธีค่าเฉลี่ยเคลื่อนที่ , วิธีการทำให้เรียบแบบเอกซ์โปเนนเชียล และใช้วิธีกำลังสองน้อยที่สุด เราก็บอกได้ว่าค่าเฉลี่ย ข้อผิดพลาดที่เกี่ยวข้องเมื่อคำนวณโดยใช้วิธีปรับให้เรียบแบบเอ็กซ์โปเนนเชียล จะอยู่ในช่วง 20-50% ซึ่งหมายความว่าความแม่นยำของการพยากรณ์ในกรณีนี้เป็นเพียงที่น่าพอใจเท่านั้น
ในกรณีแรกและที่สาม ความแม่นยำในการคาดการณ์จะสูง เนื่องจากข้อผิดพลาดสัมพัทธ์โดยเฉลี่ยน้อยกว่า 10% แต่วิธีค่าเฉลี่ยเคลื่อนที่ทำให้ได้ผลลัพธ์ที่เชื่อถือได้มากขึ้น (คาดการณ์สำหรับเดือนพฤศจิกายน - 1.52% คาดการณ์สำหรับเดือนธันวาคม - 1.53% คาดการณ์สำหรับเดือนมกราคม - 1.49%) เนื่องจากข้อผิดพลาดสัมพัทธ์โดยเฉลี่ยเมื่อใช้วิธีนี้มีค่าน้อยที่สุด - 1 .13%.
วิธีกำลังสองน้อยที่สุด
บทความอื่น ๆ ในหัวข้อนี้:
รายชื่อแหล่งที่มาที่ใช้
- คำแนะนำทางวิทยาศาสตร์และระเบียบวิธีในการวินิจฉัยความเสี่ยงทางสังคมและการพยากรณ์ความท้าทาย ภัยคุกคาม และผลที่ตามมาทางสังคม มหาวิทยาลัยสังคมแห่งรัฐรัสเซีย มอสโก 2553;
- Vladimirova L.P. การพยากรณ์และการวางแผนในภาวะตลาด: หนังสือเรียน เบี้ยเลี้ยง. ม.: สำนักพิมพ์"Dashkov และ Co", 2544;
- Novikova N.V., Pozdeeva O.G. การพยากรณ์ เศรษฐกิจของประเทศ: คู่มือการศึกษาและระเบียบวิธี Ekaterinburg: สำนักพิมพ์อูราล สถานะ เศรษฐกิจ มหาวิทยาลัย 2550;
- Slutskin L.N. หลักสูตร MBA เกี่ยวกับการพยากรณ์ธุรกิจ อ.: หนังสือธุรกิจ Alpina, 2549.
โปรแกรมบรรษัทข้ามชาติ
กรอกรายละเอียด
ข้อมูลและการประมาณ y = ก + ข x
ฉัน- จำนวนจุดทดลอง
x ฉัน- ค่าของพารามิเตอร์คงที่ ณ จุดหนึ่ง ฉัน;
ใช่แล้ว- ค่าของพารามิเตอร์ที่วัดได้ที่จุดหนึ่ง ฉัน;
ωi- การวัดน้ำหนัก ณ จุดใดจุดหนึ่ง ฉัน;
ใช่แล้ว คำนวณ- ความแตกต่างระหว่างค่าที่วัดได้และค่าที่คำนวณการถดถอย ยตรงจุด ฉัน;
ส x ฉัน (x ฉัน)- การประมาณการข้อผิดพลาด x ฉันเมื่อทำการวัด ยตรงจุด ฉัน.
ข้อมูลและการประมาณ y = kx
ฉัน | x ฉัน | ใช่แล้ว | ωi | ใช่แล้ว คำนวณ | ∆ ฉัน | ส x ฉัน (x ฉัน) |
---|
คลิกที่แผนภูมิ
คู่มือการใช้งานโปรแกรมออนไลน์ MNC
ในช่องข้อมูล ให้ป้อนค่า `x` และ `y` ในแต่ละบรรทัดแยกกันที่จุดทดลองจุดเดียว ค่าจะต้องคั่นด้วยอักขระช่องว่าง (ช่องว่างหรือแท็บ)
ค่าที่สามอาจเป็นน้ำหนักของจุด `w` หากไม่ได้ระบุน้ำหนักของจุด จะเท่ากับหนึ่ง ในกรณีส่วนใหญ่ น้ำหนักของคะแนนการทดลองจะไม่ทราบหรือไม่ได้คำนวณ เช่น ข้อมูลการทดลองทั้งหมดถือว่าเท่าเทียมกัน บางครั้งน้ำหนักในช่วงของค่าที่ศึกษาจะไม่เท่ากันอย่างแน่นอนและสามารถคำนวณได้ทางทฤษฎีด้วยซ้ำ ตัวอย่างเช่น ในสเปกโตรโฟโตเมทรี สามารถคำนวณน้ำหนักได้โดยใช้สูตรง่ายๆ แม้ว่าส่วนใหญ่จะละเลยไปเพื่อลดต้นทุนค่าแรงก็ตาม
สามารถวางข้อมูลผ่านคลิปบอร์ดจากสเปรดชีตในชุดโปรแกรมสำนักงาน เช่น Excel จาก Microsoft Office หรือ Calc จาก Open Office ในการดำเนินการนี้ ในสเปรดชีต ให้เลือกช่วงของข้อมูลที่จะคัดลอก คัดลอกไปยังคลิปบอร์ด และวางข้อมูลลงในช่องข้อมูลในหน้านี้
ในการคำนวณโดยใช้วิธีกำลังสองน้อยที่สุด จำเป็นต้องมีจุดอย่างน้อยสองจุดเพื่อกำหนดค่าสัมประสิทธิ์ 2 ค่า `b` - ค่าแทนเจนต์ของมุมเอียงของเส้นและ `a` - ค่าที่เส้นบนแกน 'y' ตัดขวาง
ในการประมาณค่าความผิดพลาดของค่าสัมประสิทธิ์การถดถอยที่คำนวณได้ คุณต้องกำหนดจำนวนคะแนนการทดลองให้มากกว่าสองจุด
วิธีกำลังสองน้อยที่สุด (LSM)
ยิ่งจำนวนคะแนนการทดลองมากเท่าใดก็ยิ่งแม่นยำมากขึ้นเท่านั้น การประเมินทางสถิติค่าสัมประสิทธิ์ (เนื่องจากค่าสัมประสิทธิ์นักเรียนลดลง) และยิ่งค่าประมาณใกล้เคียงกับค่าประมาณของกลุ่มตัวอย่างทั่วไป
การได้รับค่าในแต่ละจุดการทดลองมักเกี่ยวข้องกับต้นทุนค่าแรงที่สำคัญ ดังนั้นจึงมักดำเนินการประนีประนอมในจำนวนการทดลองที่ให้การประมาณค่าที่สามารถจัดการได้ และไม่นำไปสู่ต้นทุนค่าแรงที่มากเกินไป ตามกฎแล้ว จำนวนคะแนนการทดลองสำหรับการพึ่งพากำลังสองน้อยที่สุดเชิงเส้นด้วยค่าสัมประสิทธิ์สองตัวจะถูกเลือกในช่วง 5-7 คะแนน
ทฤษฎีโดยย่อกำลังสองน้อยที่สุดสำหรับความสัมพันธ์เชิงเส้น
สมมติว่าเรามีชุดข้อมูลการทดลองอยู่ในรูปแบบของคู่ของค่า [`y_i`, `x_i`] โดยที่ `i` คือจำนวนของการวัดการทดลองหนึ่งครั้งตั้งแต่ 1 ถึง `n`; `y_i` - ค่าของค่าที่วัดได้ที่จุด `i`; `x_i` - ค่าของพารามิเตอร์ที่เราตั้งค่าไว้ที่จุด `i`
พิจารณาการดำเนินการของกฎของโอห์มเป็นตัวอย่าง โดยการเปลี่ยนแปลงแรงดันไฟฟ้า (ความต่างศักย์ไฟฟ้า) ระหว่างส่วนต่างๆ วงจรไฟฟ้าเราวัดปริมาณกระแสที่ไหลผ่านบริเวณนี้ ฟิสิกส์ทำให้เราพึ่งพาได้จากการทดลอง:
`ฉัน = U/R`,
โดยที่ `ฉัน` คือความแข็งแกร่งในปัจจุบัน `R` - แนวต้าน; `U` - แรงดันไฟฟ้า
ในกรณีนี้ `y_i` คือค่ากระแสที่วัดได้ และ `x_i` คือค่าแรงดันไฟฟ้า
อีกตัวอย่างหนึ่ง ให้พิจารณาการดูดกลืนแสงโดยสารละลายของสารในสารละลาย เคมีให้สูตรแก่เรา:
`A = ε ลิตร C`,
โดยที่ `A` คือความหนาแน่นเชิงแสงของสารละลาย `ε` - การส่งผ่านของตัวถูกละลาย; `l` - ความยาวเส้นทางเมื่อแสงผ่านคิวเวตต์พร้อมกับสารละลาย `C` คือความเข้มข้นของสารที่ละลาย
ในกรณีนี้ `y_i` คือค่าที่วัดได้ของความหนาแน่นของแสง `A` และ `x_i` คือค่าความเข้มข้นของสารที่เราระบุ
เราจะพิจารณากรณีที่ข้อผิดพลาดสัมพัทธ์ในงาน `x_i` มีขนาดเล็กลงอย่างมาก ข้อผิดพลาดที่เกี่ยวข้องขนาด `y_i` นอกจากนี้เรายังจะถือว่าค่าที่วัดได้ทั้งหมด `y_i` เป็นแบบสุ่มและกระจายตามปกติ เช่น ปฏิบัติตามกฎหมายการกระจายแบบปกติ
ในกรณีของการพึ่งพาเชิงเส้นของ `y` กับ `x` เราสามารถเขียนการพึ่งพาทางทฤษฎีได้:
`y = ก + ข x`
จากมุมมองทางเรขาคณิต ค่าสัมประสิทธิ์ `b` หมายถึงค่าแทนเจนต์ของมุมเอียงของเส้นกับแกน 'x' และค่าสัมประสิทธิ์ 'a' คือค่า 'y' ที่จุดตัดกันของ ตรงกับแกน `y` (ที่ `x = 0`)
การค้นหาพารามิเตอร์เส้นการถดถอย
ในการทดลอง ค่าที่วัดได้ของ `y_i` ไม่สามารถอยู่บนเส้นตรงทางทฤษฎีได้อย่างแน่นอน เนื่องจากข้อผิดพลาดในการวัดซึ่งมักมีอยู่เสมอ ชีวิตจริง- ดังนั้นสมการเชิงเส้นจะต้องแสดงด้วยระบบสมการ:
`y_i = a + b x_i + ε_i` (1),
โดยที่ `ε_i` คือข้อผิดพลาดในการวัดที่ไม่ทราบที่มาของ `y` ในการทดลองครั้งที่ 1
การพึ่งพา (1) เรียกอีกอย่างว่า การถดถอย, เช่น. การพึ่งพากันของปริมาณสองปริมาณต่อกันโดยมีนัยสำคัญทางสถิติ
งานในการฟื้นฟูการพึ่งพาคือการหาค่าสัมประสิทธิ์ `a` และ `b` จากจุดทดลอง [`y_i`, `x_i`]
โดยปกติจะใช้การหาค่าสัมประสิทธิ์ `a` และ `b` วิธีกำลังสองน้อยที่สุด(เอ็มเอ็นซี) เป็นกรณีพิเศษของหลักการความน่าจะเป็นสูงสุด
ลองเขียน (1) ใหม่ในรูปแบบ `ε_i = y_i - a - b x_i`
จากนั้นผลรวมของข้อผิดพลาดกำลังสองจะเป็น
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2` (2)
หลักการของกำลังสองน้อยที่สุด (กำลังสองน้อยที่สุด) คือการลดผลรวม (2) ให้เหลือน้อยที่สุดตามพารามิเตอร์ `a` และ `b`.
ค่าต่ำสุดจะเกิดขึ้นได้เมื่ออนุพันธ์บางส่วนของผลรวม (2) เทียบกับสัมประสิทธิ์ `a` และ `b` เท่ากับศูนย์:
`frac(บางส่วน Φ)(บางส่วน a) = frac(ผลรวมบางส่วน_(i=1)^(n) (y_i - a - b x_i)^2)(บางส่วน a) = 0`
`frac(บางส่วน Φ)(ขบางส่วน) = frac(ผลรวมบางส่วน_(i=1)^(n) (y_i - a - b x_i)^2)(ขบางส่วน) = 0`
จากการขยายอนุพันธ์ เราได้ระบบสมการสองสมการโดยไม่ทราบค่าสองตัว:
`sum_(i=1)^(n) (2a + 2bx_i — 2y_i) = sum_(i=1)^(n) (a + bx_i — y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`
เราเปิดวงเล็บและโอนผลรวมที่ไม่ขึ้นอยู่กับสัมประสิทธิ์ที่ต้องการไปยังอีกครึ่งหนึ่ง เราได้ระบบสมการเชิงเส้น:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`
เมื่อแก้ระบบผลลัพธ์เราจะค้นหาสูตรสำหรับค่าสัมประสิทธิ์ `a` และ `b`:
`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 — sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)
`b = frac(n sum_(i=1)^(n) x_iy_i — sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (น) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.2)
สูตรเหล่านี้มีคำตอบเมื่อ `n > 1` (สามารถสร้างเส้นได้โดยใช้จุดอย่างน้อย 2 จุด) และเมื่อดีเทอร์มิแนนต์ `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1 )^(n) x_i)^2 != 0` เช่น เมื่อจุด `x_i` ในการทดสอบแตกต่างกัน (เช่น เมื่อเส้นไม่อยู่ในแนวตั้ง)
การประมาณค่าความผิดพลาดของสัมประสิทธิ์เส้นถดถอย
สำหรับการประเมินข้อผิดพลาดในการคำนวณค่าสัมประสิทธิ์ `a` และ `b` ที่แม่นยำยิ่งขึ้น จำเป็นต้องมีคะแนนการทดลองจำนวนมาก เมื่อ `n = 2` มันเป็นไปไม่ได้ที่จะประมาณค่าความผิดพลาดของสัมประสิทธิ์เพราะว่า เส้นประมาณจะผ่านจุดสองจุดโดยไม่ซ้ำกัน
ข้อผิดพลาด ตัวแปรสุ่ม'V' ถูกกำหนดไว้ กฎแห่งความผิดพลาดสะสม
`S_V^2 = sum_(i=1)^p (frac(f บางส่วน)(z_i บางส่วน))^2 S_(z_i)^2`,
โดยที่ `p` คือจำนวนพารามิเตอร์ `z_i` ที่มีข้อผิดพลาด `S_(z_i)` ซึ่งส่งผลต่อข้อผิดพลาด `S_V`
`f` เป็นฟังก์ชันของการขึ้นต่อกันของ `V` กับ `z_i`
ให้เราเขียนกฎแห่งข้อผิดพลาดสะสมสำหรับข้อผิดพลาดของสัมประสิทธิ์ `a` และ `b`
`S_a^2 = sum_(i=1)^(n)(frac(บางส่วน a)(y_i บางส่วน))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(บางส่วน a )(บางส่วน x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(บางส่วน a)(y_i บางส่วน))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(b บางส่วน)(y_i บางส่วน))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(b บางส่วน )(บางส่วน x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(b บางส่วน)(y_i บางส่วน))^2 `,
เพราะ `S_(x_i)^2 = 0` (ก่อนหน้านี้เราได้จองไว้แล้วว่าข้อผิดพลาด `x` นั้นเล็กน้อย)
`S_y^2 = S_(y_i)^2` - ข้อผิดพลาด (ความแปรปรวน, กำลังสอง ส่วนเบี่ยงเบนมาตรฐาน) ในการวัดค่า `y` โดยสมมติว่าข้อผิดพลาดมีค่าเท่ากันทุกค่าของ `y`
การแทนที่สูตรสำหรับการคำนวณ 'a' และ 'b' ลงในนิพจน์ผลลัพธ์ที่เราได้รับ
`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)
`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)
ในการทดลองจริงส่วนใหญ่ ค่าของ `Sy` จะไม่ถูกวัด ในการดำเนินการนี้ จำเป็นต้องดำเนินการวัดแบบขนาน (การทดลอง) หลายครั้งที่จุดใดจุดหนึ่งหรือหลายจุดในแผน ซึ่งจะเพิ่มเวลา (และอาจมีค่าใช้จ่าย) ของการทดสอบ ดังนั้นจึงมักสันนิษฐานว่าการเบี่ยงเบนของ `y` จากเส้นการถดถอยถือได้ว่าเป็นแบบสุ่ม การประมาณความแปรปรวน `y` ในกรณีนี้คำนวณโดยใช้สูตร
`S_y^2 = S_(y, พัก)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`
ตัวหาร "n-2" ปรากฏขึ้นเนื่องจากจำนวนองศาอิสระของเราลดลงเนื่องจากการคำนวณค่าสัมประสิทธิ์สองตัวโดยใช้ตัวอย่างข้อมูลการทดลองเดียวกัน
การประมาณนี้เรียกอีกอย่างว่าความแปรปรวนคงเหลือสัมพันธ์กับเส้นการถดถอย `S_(y, ส่วนที่เหลือ)^2`
ความสำคัญของสัมประสิทธิ์ได้รับการประเมินโดยใช้แบบทดสอบของนักเรียน
`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`
หากเกณฑ์ที่คำนวณ `t_a`, `t_b` น้อยกว่าเกณฑ์ในตาราง `t(P, n-2)` จะถือว่าค่าสัมประสิทธิ์ที่สอดคล้องกันไม่แตกต่างจากศูนย์อย่างมีนัยสำคัญโดยมีความน่าจะเป็น `P` ที่กำหนด
ในการประเมินคุณภาพของคำอธิบายของความสัมพันธ์เชิงเส้น คุณสามารถเปรียบเทียบ `S_(y, ส่วนที่เหลือ)^2` และ `S_(bar y)` ที่สัมพันธ์กับค่าเฉลี่ยโดยใช้เกณฑ์ของฟิชเชอร์
`S_(แถบ y) = frac(sum_(i=1)^n (y_i — แถบ y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i= 1)^n y_i) /n)^2) (n-1)` - การประมาณค่าตัวอย่างของความแปรปรวน `y` ที่สัมพันธ์กับค่าเฉลี่ย
เพื่อประเมินประสิทธิผลของสมการถดถอยเพื่ออธิบายการพึ่งพา จะมีการคำนวณค่าสัมประสิทธิ์ฟิชเชอร์
`F = S_(บาร์ y) / S_(y, พัก)^2`,
ซึ่งเปรียบเทียบกับค่าสัมประสิทธิ์ฟิชเชอร์แบบตาราง `F(p, n-1, n-2)`
ถ้า `F > F(P, n-1, n-2)` ความแตกต่างระหว่างคำอธิบายของความสัมพันธ์ `y = f(x)` โดยใช้สมการการถดถอยและคำอธิบายที่ใช้ค่าเฉลี่ยจะถือว่ามีนัยสำคัญทางสถิติและมีความน่าจะเป็น ป. เหล่านั้น. การถดถอยอธิบายการพึ่งพาได้ดีกว่าการแพร่กระจายของ `y` รอบค่าเฉลี่ย
คลิกที่แผนภูมิ
เพื่อเพิ่มค่าลงในตาราง
วิธีกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก a, b, c ซึ่งเป็นการพึ่งพาฟังก์ชันที่ยอมรับ
วิธีกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก ก ข ค...ยอมรับการพึ่งพาการทำงาน
y = ฉ(x,a,b,c,…),
ซึ่งจะให้ค่ากำลังสองเฉลี่ยขั้นต่ำ (ความแปรปรวน) ของข้อผิดพลาด
, (24)
โดยที่ x i, y i คือชุดของตัวเลขคู่ที่ได้จากการทดลอง
เนื่องจากเงื่อนไขสำหรับส่วนปลายของฟังก์ชันของตัวแปรหลายตัวคือเงื่อนไขที่อนุพันธ์ย่อยของมันมีค่าเท่ากับศูนย์ ดังนั้นพารามิเตอร์ ก ข ค...ถูกกำหนดจากระบบสมการ:
; ; ; … (25)
ต้องจำไว้ว่าใช้วิธีกำลังสองน้อยที่สุดเพื่อเลือกพารามิเตอร์หลังประเภทของฟังก์ชัน ย = ฉ(x)กำหนดไว้
จากการพิจารณาทางทฤษฎี หากไม่สามารถสรุปได้ว่าสูตรเชิงประจักษ์ควรเป็นเช่นไร ก็จะต้องได้รับคำแนะนำจากการแสดงภาพ โดยหลักๆ แล้วจะแสดงด้วยกราฟิกของข้อมูลที่สังเกตได้
ในทางปฏิบัติ มักจำกัดอยู่เพียงฟังก์ชันประเภทต่อไปนี้:
1) เชิงเส้น ;
2) กำลังสอง
- บทช่วยสอน
การแนะนำ
ฉันเป็นนักคณิตศาสตร์และโปรแกรมเมอร์ ก้าวกระโดดครั้งใหญ่ที่สุดในอาชีพการงานของฉันคือตอนที่ฉันเรียนรู้ที่จะพูดว่า: “ฉันไม่เข้าใจอะไรเลย!”ตอนนี้ฉันไม่ละอายที่จะบอกผู้ทรงคุณวุฒิด้านวิทยาศาสตร์ว่าเขากำลังบรรยายให้ฉันฟัง ฉันไม่เข้าใจว่าเขาซึ่งเป็นผู้ทรงคุณวุฒิกำลังบอกอะไรฉัน และมันยากมาก ใช่แล้ว การยอมรับความไม่รู้ของคุณเป็นเรื่องยากและน่าอาย ใครชอบยอมรับว่าเขาไม่รู้พื้นฐานของบางสิ่งบางอย่าง? เนื่องจากอาชีพของฉันฉันต้องเข้าร่วม ปริมาณมากการนำเสนอและการบรรยาย ซึ่งฉันยอมรับว่าในกรณีส่วนใหญ่ฉันต้องการนอนเพราะฉันไม่เข้าใจอะไรเลย แต่ฉันไม่เข้าใจเพราะปัญหาใหญ่ของสถานการณ์ทางวิทยาศาสตร์ในปัจจุบันอยู่ที่คณิตศาสตร์ ถือว่าผู้ฟังทุกคนคุ้นเคยกับคณิตศาสตร์ทุกด้านอย่างแน่นอน (ซึ่งไร้สาระ) การยอมรับว่าคุณไม่รู้ว่าอนุพันธ์คืออะไร (เราจะพูดถึงมันในภายหลัง) เป็นเรื่องน่าละอาย
แต่ฉันเรียนรู้ที่จะบอกว่า ฉันไม่รู้ว่าการคูณคืออะไร ใช่ ฉันไม่รู้ว่าพีชคณิตย่อยสำหรับพีชคณิตโกหกคืออะไร ใช่ ฉันไม่รู้ว่าทำไมถึงจำเป็นในชีวิต สมการกำลังสอง- ยังไงก็ตามถ้าคุณแน่ใจว่าคุณรู้เรามีเรื่องต้องคุยกัน! คณิตศาสตร์เป็นชุดของเทคนิค นักคณิตศาสตร์พยายามสร้างความสับสนและข่มขู่สาธารณชน ที่ใดไม่สับสน ไม่มีชื่อเสียง ไม่มีอำนาจ ใช่ เป็นเรื่องน่ายกย่องที่จะพูดโดยใช้ภาษาที่เป็นนามธรรมมากที่สุดเท่าที่จะเป็นไปได้ ซึ่งถือเป็นเรื่องไร้สาระโดยสิ้นเชิง
คุณรู้หรือไม่ว่าอนุพันธ์คืออะไร? เป็นไปได้มากว่าคุณจะบอกฉันเกี่ยวกับขีดจำกัดของอัตราส่วนส่วนต่าง ในปีแรกของวิชาคณิตศาสตร์และกลศาสตร์ที่มหาวิทยาลัยแห่งรัฐเซนต์ปีเตอร์สเบิร์ก Viktor Petrovich Khavin บอกฉัน มุ่งมั่นอนุพันธ์เป็นค่าสัมประสิทธิ์ของเทอมแรกของอนุกรมเทย์เลอร์ของฟังก์ชัน ณ จุดหนึ่ง (นี่เป็นยิมนาสติกแยกต่างหากเพื่อกำหนดอนุกรมเทย์เลอร์ที่ไม่มีอนุพันธ์) ฉันหัวเราะกับคำจำกัดความนี้มานานจนในที่สุดฉันก็เข้าใจความหมายของมัน อนุพันธ์นั้นไม่มีอะไรมากไปกว่าการวัดง่ายๆ ว่าฟังก์ชันที่เราหาอนุพันธ์มีความคล้ายคลึงกับฟังก์ชัน y=x, y=x^2, y=x^3 แค่ไหน
ตอนนี้ผมได้รับเกียรติบรรยายให้กับนักศึกษาที่ เกรงกลัวคณิตศาสตร์. ถ้ากลัวคณิตเราก็ไปในทางเดียวกัน ทันทีที่คุณพยายามอ่านข้อความและดูเหมือนว่ามันซับซ้อนเกินไป จงรู้ว่ามันเขียนได้ไม่ดี ฉันยืนยันว่าไม่มีคณิตศาสตร์เพียงด้านเดียวที่ไม่สามารถพูดคุยแบบ "บนนิ้ว" ได้โดยไม่สูญเสียความแม่นยำ
งานมอบหมายสำหรับอนาคตอันใกล้นี้: ฉันมอบหมายให้นักเรียนเข้าใจว่าตัวควบคุมกำลังสองเชิงเส้นคืออะไร อย่าอาย ใช้เวลาสามนาทีในชีวิตของคุณแล้วไปตามลิงก์ หากคุณไม่เข้าใจอะไรเลยเราก็อยู่บนเส้นทางเดียวกัน ฉัน (นักคณิตศาสตร์-โปรแกรมเมอร์มืออาชีพ) ไม่เข้าใจอะไรเลยเช่นกัน และฉันรับรองกับคุณว่า คุณจะเข้าใจสิ่งนี้ได้ "ด้วยนิ้วของคุณ" บน ในขณะนี้ฉันไม่รู้ว่ามันคืออะไร แต่ฉันรับรองว่าเราจะเข้าใจมันได้
ดังนั้น การบรรยายครั้งแรกที่ฉันจะบรรยายให้กับนักเรียนของฉัน หลังจากที่พวกเขาวิ่งมาหาฉันด้วยความสยดสยองและบอกว่าตัวควบคุมกำลังสองเชิงเส้นเป็นสิ่งที่แย่ที่คุณจะไม่มีวันเชี่ยวชาญในชีวิตของคุณคือ วิธีกำลังสองน้อยที่สุด- คุณสามารถตัดสินใจ สมการเชิงเส้น- หากคุณกำลังอ่านข้อความนี้ มีแนวโน้มว่าจะไม่เป็นเช่นนั้น
ดังนั้น เมื่อพิจารณาจุดสองจุด (x0, y0), (x1, y1) เช่น (1,1) และ (3,2) ภารกิจคือการหาสมการของเส้นตรงที่ผ่านจุดสองจุดนี้:
ภาพประกอบ
บรรทัดนี้ควรมีสมการดังต่อไปนี้:
ที่นี่เราไม่รู้จักอัลฟ่าและเบต้า แต่ทราบสองประเด็นของบรรทัดนี้:
เราสามารถเขียนสมการนี้ในรูปแบบเมทริกซ์:
ที่นี่เราควรพูดนอกเรื่องโคลงสั้น ๆ: เมทริกซ์คืออะไร? เมทริกซ์ไม่มีอะไรมากไปกว่าอาร์เรย์สองมิติ นี่เป็นวิธีการจัดเก็บข้อมูล ไม่ควรแนบความหมายเพิ่มเติมเข้าไปด้วย ขึ้นอยู่กับเราว่าจะตีความเมทริกซ์บางตัวอย่างไร ผมจะตีความเป็นระยะๆ ว่าเป็นการแมปเชิงเส้น เป็นระยะๆ เป็นรูปกำลังสอง และบางครั้งก็เป็นเพียงเซตของเวกเตอร์ ทั้งหมดนี้จะมีการชี้แจงในบริบท
ลองแทนที่เมทริกซ์คอนกรีตด้วยการแสดงเชิงสัญลักษณ์:
จากนั้น (อัลฟ่า, เบต้า) สามารถพบได้ง่าย:
โดยเฉพาะอย่างยิ่งสำหรับข้อมูลก่อนหน้าของเรา:
ซึ่งนำไปสู่สมการของเส้นที่ผ่านจุด (1,1) และ (3,2) ต่อไปนี้:
โอเคทุกอย่างชัดเจนที่นี่ ลองหาสมการของเส้นที่ผ่าน สามคะแนน: (x0,y0), (x1,y1) และ (x2,y2):
โอ้ โอ้ แต่เรามีสมการสามสมการสำหรับสิ่งไม่รู้สองตัว! นักคณิตศาสตร์มาตรฐานจะบอกว่าไม่มีวิธีแก้ปัญหา โปรแกรมเมอร์จะพูดอะไร? และเขาจะเขียนระบบสมการก่อนหน้านี้ใหม่ในรูปแบบต่อไปนี้:
ในกรณีของเรา เวกเตอร์ i,j,bสามมิติ ดังนั้น (ใน กรณีทั่วไป) ไม่มีวิธีแก้ไขสำหรับระบบนี้ เวกเตอร์ใดๆ (alpha\*i + beta\*j) อยู่ในระนาบที่ทอดโดยเวกเตอร์ (i, j) ถ้า b ไม่ได้อยู่ในระนาบนี้ แสดงว่าไม่มีทางแก้ (สมการไม่สามารถบรรลุความเท่าเทียมกันได้) จะทำอย่างไร? ลองมองหาการประนีประนอม เรามาแสดงแทนด้วย อี(อัลฟา, เบต้า)เราไม่สามารถบรรลุถึงความเท่าเทียมกันได้ไกลแค่ไหน:
และเราจะพยายามลดข้อผิดพลาดนี้ให้เหลือน้อยที่สุด:
ทำไมต้องเหลี่ยม?
เราไม่ได้มองหาแค่ค่าขั้นต่ำของบรรทัดฐานเท่านั้น แต่ยังมองหาค่าขั้นต่ำของค่ากำลังสองของค่ามาตรฐานอีกด้วย ทำไม จุดต่ำสุดนั้นเกิดขึ้นพร้อมกัน และกำลังสองให้ฟังก์ชันที่ราบรื่น (ฟังก์ชันกำลังสองของอาร์กิวเมนต์ (อัลฟา, เบตา)) ในขณะที่ความยาวเพียงอย่างเดียวให้ฟังก์ชันรูปทรงกรวย ซึ่งหาความแตกต่างไม่ได้ที่จุดต่ำสุด บร. สี่เหลี่ยมจะสะดวกกว่า
แน่นอนว่าข้อผิดพลาดจะลดลงเมื่อเวกเตอร์ จตั้งฉากกับระนาบที่ทอดโดยเวกเตอร์ ฉันและ เจ.
ภาพประกอบ
กล่าวอีกนัยหนึ่ง: เรากำลังมองหาเส้นตรงที่ทำให้ผลรวมของความยาวกำลังสองของระยะทางจากจุดทั้งหมดถึงเส้นตรงนี้มีค่าน้อยที่สุด:
อัปเดต: ฉันมีปัญหาที่นี่ ควรวัดระยะห่างถึงเส้นตรงในแนวตั้ง ไม่ใช่โดยการฉายภาพแบบตั้งฉาก นักวิจารณ์พูดถูก
ภาพประกอบ
ในคำที่แตกต่างกันโดยสิ้นเชิง (อย่างระมัดระวัง มีรูปแบบที่ไม่ดี แต่ควรชัดเจน): เราจะนำเส้นที่เป็นไปได้ทั้งหมดระหว่างจุดทุกคู่และมองหาเส้นค่าเฉลี่ยระหว่างทั้งหมด:
ภาพประกอบ
คำอธิบายอีกประการหนึ่งตรงไปตรงมา: เราแนบสปริงระหว่างจุดข้อมูลทั้งหมด (ในที่นี้เรามีสามจุด) กับเส้นตรงที่เรากำลังมองหา และเส้นตรงของสถานะสมดุลคือสิ่งที่เรากำลังมองหา
รูปแบบกำลังสองขั้นต่ำ
แล้วให้เวกเตอร์นี้มา ขและระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ ก(ในกรณีนี้ (x0,x1,x2) และ (1,1,1)) เรากำลังมองหาเวกเตอร์ จด้วยความยาวกำลังสองขั้นต่ำ แน่นอนว่าค่าต่ำสุดสามารถทำได้สำหรับเวกเตอร์เท่านั้น จตั้งฉากกับระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ ก:กล่าวอีกนัยหนึ่ง เรากำลังมองหาเวกเตอร์ x=(alpha, beta) ดังนี้:
ฉันขอเตือนคุณว่าเวกเตอร์นี้ x=(alpha, beta) คือค่าต่ำสุดของฟังก์ชันกำลังสอง ||e(alpha, beta)||^2:
ในที่นี้จะมีประโยชน์ที่จะจำไว้ว่าเมทริกซ์สามารถแปลเป็นรูปแบบกำลังสองได้เช่นกัน ตัวอย่างเช่น เมทริกซ์เอกลักษณ์ ((1,0),(0,1)) สามารถตีความได้ว่าเป็นฟังก์ชัน x^2 + y^ 2:
รูปแบบกำลังสอง
ยิมนาสติกทั้งหมดนี้เรียกว่าการถดถอยเชิงเส้น
สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์
ตอนนี้งานจริงที่ง่ายที่สุด: มีพื้นผิวรูปสามเหลี่ยมบางอย่างจำเป็นต้องทำให้เรียบ ตัวอย่างเช่น ลองโหลดแบบจำลองใบหน้าของฉัน:คอมมิตดั้งเดิมพร้อมใช้งาน เพื่อลดการพึ่งพาภายนอก ฉันจึงนำโค้ดของตัวเรนเดอร์ซอฟต์แวร์ของฉันไปไว้ใน Habré แล้ว เพื่อแก้ปัญหา ระบบเชิงเส้นฉันใช้ OpenNL มันเป็นตัวแก้ปัญหาที่ยอดเยี่ยม แต่ติดตั้งได้ยากมาก: คุณต้องคัดลอกสองไฟล์ (.h+.c) ไปยังโฟลเดอร์ที่มีโปรเจ็กต์ของคุณ การปรับให้เรียบทั้งหมดทำได้ด้วยรหัสต่อไปนี้:
สำหรับ (int d=0; d<3; d++) {
nlNewContext();
nlSolverParameteri(NL_NB_VARIABLES, verts.size());
nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE);
nlBegin(NL_SYSTEM);
nlBegin(NL_MATRIX);
for (int i=0; i<(int)verts.size(); i++) {
nlBegin(NL_ROW);
nlCoefficient(i, 1);
nlRightHandSide(verts[i][d]);
nlEnd(NL_ROW);
}
for (unsigned int i=0; i
สำหรับ (int j=0; j
พิกัด X, Y และ Z แยกจากกันได้ ฉันปรับให้แยกกัน นั่นคือ ฉันแก้สมการเชิงเส้นสามระบบ โดยแต่ละระบบมีตัวแปรจำนวนหนึ่งเท่ากับจำนวนจุดยอดในแบบจำลองของฉัน n แถวแรกของเมทริกซ์ A มีเพียง 1 แถวต่อแถว และ n แถวแรกของเวกเตอร์ b มีพิกัดโมเดลดั้งเดิม นั่นคือฉันผูกสปริงระหว่างตำแหน่งใหม่ของจุดยอดกับตำแหน่งเก่าของจุดยอด - สปริงใหม่ไม่ควรเคลื่อนไปไกลจากจุดยอดเก่ามากเกินไป
อีกครั้งหนึ่ง: จุดยอดทั้งหมดเป็นตัวแปร และไม่สามารถเคลื่อนไปไกลจากตำแหน่งเดิมได้ แต่ในขณะเดียวกัน จุดยอดก็พยายามที่จะคล้ายกัน
นี่คือผลลัพธ์:
ทุกอย่างจะเรียบร้อยดี ตัวแบบมีความเรียบเนียนมาก แต่มันขยับออกไปจากขอบเดิม มาเปลี่ยนรหัสกันหน่อย:
สำหรับ (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }
ในเมทริกซ์ A ของเรา สำหรับจุดยอดที่อยู่บนขอบ ฉันไม่ได้เพิ่มแถวจากหมวดหมู่ v_i = verts[i][d] แต่เพิ่ม 1,000*v_i = 1,000*verts[i][d] สิ่งนี้สร้างความแตกต่างอะไร? และนี่เปลี่ยนรูปแบบข้อผิดพลาดกำลังสองของเรา ตอนนี้ค่าเบี่ยงเบนเดียวจากด้านบนที่ขอบจะไม่มีราคาหนึ่งหน่วยเหมือนเมื่อก่อน แต่ราคา 1,000*1,000 หน่วย นั่นคือเราแขวนสปริงที่แข็งแรงกว่าไว้ที่จุดยอดสุดขั้ว วิธีแก้ปัญหาจะชอบยืดสปริงที่เหลือให้แรงกว่า นี่คือผลลัพธ์:
เพิ่มความแรงของสปริงระหว่างจุดยอดเป็นสองเท่า:
nlค่าสัมประสิทธิ์(หน้า[ j ], 2);
nlค่าสัมประสิทธิ์(หน้า[(j+1)%3], -2);
เป็นเหตุผลที่พื้นผิวเรียบขึ้น:
และตอนนี้แข็งแกร่งขึ้นอีกร้อยเท่า:
นี่คืออะไร? ลองนึกภาพว่าเราจุ่มวงแหวนลวดลงในน้ำสบู่ เป็นผลให้ฟิล์มสบู่ที่ได้จะพยายามมีความโค้งน้อยที่สุดเท่าที่จะทำได้โดยสัมผัสกับขอบ - วงแหวนลวดของเรา นี่คือสิ่งที่เราได้จากการแก้ไขขอบและขอให้มีพื้นผิวเรียบภายใน ยินดีด้วย เราเพิ่งแก้สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์ได้ ฟังดูเจ๋งใช่ไหม? แต่ในความเป็นจริง คุณแค่ต้องแก้สมการเชิงเส้นระบบเดียว
สมการของปัวซองจำชื่อเจ๋ง ๆ อีกอันหนึ่ง
สมมติว่าฉันมีภาพเช่นนี้:
ดูดีสำหรับทุกคน แต่ฉันไม่ชอบเก้าอี้
ฉันจะตัดภาพออกครึ่งหนึ่ง:
และฉันจะเลือกเก้าอี้ด้วยมือของฉัน:
สำหรับ (int i=0; i นี่คือผลลัพธ์: จากนั้น ผมจะดึงทุกอย่างที่เป็นสีขาวในหน้ากากไปทางด้านซ้ายของภาพ และในขณะเดียวกัน ผมจะพูดทั่วทั้งภาพว่าความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันควรเท่ากับความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันบน ภาพขวา: รหัสและรูปภาพที่มีอยู่ กภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว ขใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด
ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว สูตรการหาค่าสัมประสิทธิ์ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การหาอนุพันธ์ย่อยของฟังก์ชัน โดยตัวแปร กภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว ขและ
, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์ ที่ให้ไว้ กภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว ขเราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น วิธีการแทนที่หรือวิธีแครมเมอร์) และรับสูตรสำหรับการค้นหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM) การทำงาน นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กใช้ค่าที่น้อยที่สุด nมีผลรวม , , และพารามิเตอร์ ขพบได้หลังการคำนวณ ก. พื้นที่หลักของการประยุกต์ใช้พหุนามดังกล่าวคือการประมวลผลข้อมูลการทดลอง (การสร้างสูตรเชิงประจักษ์) ความจริงก็คือพหุนามการประมาณค่าที่สร้างขึ้นจากค่าฟังก์ชันที่ได้รับจากการทดลองจะได้รับอิทธิพลอย่างมากจาก "สัญญาณรบกวนจากการทดลอง" ยิ่งไปกว่านั้น เมื่อทำการประมาณค่า โหนดการแก้ไขจะไม่สามารถทำซ้ำได้ เช่น ไม่สามารถใช้ผลการทดลองซ้ำภายใต้เงื่อนไขเดียวกันได้ พหุนามกำลังสองเฉลี่ยรากจะช่วยลดสัญญาณรบกวนและช่วยให้คุณใช้ผลลัพธ์ของการทดลองหลายรายการได้ การบูรณาการเชิงตัวเลขและการสร้างความแตกต่าง ตัวอย่าง. การบูรณาการเชิงตัวเลข– การคำนวณค่าอินทิกรัลจำกัดเขต (ปกติจะเป็นค่าประมาณ) การอินทิกรัลเชิงตัวเลขเป็นที่เข้าใจกันว่าเป็นชุดของวิธีการเชิงตัวเลขในการค้นหาค่าของอินทิกรัลจำนวนหนึ่ง ความแตกต่างเชิงตัวเลข– ชุดวิธีการคำนวณค่าอนุพันธ์ของฟังก์ชันที่ระบุแยกกัน บูรณาการ คำชี้แจงของปัญหาการกำหนดทางคณิตศาสตร์ของปัญหา: จำเป็นต้องค้นหาค่าของอินทิกรัลจำกัดเขต โดยที่ a, b มีจำนวนจำกัด f(x) ต่อเนื่องกันบน [a, b] เมื่อแก้ไขปัญหาเชิงปฏิบัติ มักจะเกิดขึ้นว่าอินทิกรัลไม่สะดวกหรือเป็นไปไม่ได้ในการวิเคราะห์: อาจไม่สามารถแสดงในฟังก์ชันเบื้องต้น สามารถกำหนดอินทิกรัลในรูปแบบของตาราง ฯลฯ ในกรณีเช่นนี้ วิธีการอินทิเกรตเชิงตัวเลขคือ ใช้แล้ว. วิธีการบูรณาการเชิงตัวเลขใช้แทนที่พื้นที่ของสี่เหลี่ยมคางหมูโค้งด้วยผลรวมจำกัดของพื้นที่ของรูปทรงเรขาคณิตที่เรียบง่ายกว่าซึ่งสามารถคำนวณได้อย่างแน่นอน ในแง่นี้ พวกเขาพูดถึงการใช้สูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัส วิธีการส่วนใหญ่ใช้การแสดงอินทิกรัลเป็นผลรวมจำกัด (สูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัส): พื้นฐานของสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสคือแนวคิดในการแทนที่กราฟของปริพันธ์ในส่วนการรวมด้วยฟังก์ชันในรูปแบบที่เรียบง่ายกว่าซึ่งสามารถรวมเข้าด้วยกันในเชิงวิเคราะห์ได้อย่างง่ายดายและคำนวณได้ง่าย งานสร้างสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสนั้นง่ายที่สุดสำหรับแบบจำลองทางคณิตศาสตร์พหุนาม สามารถแยกแยะวิธีการได้สามกลุ่ม: 1. วิธีการแบ่งส่วนการรวมออกเป็นระยะเท่ากัน การแบ่งพาร์ติชันเป็นช่วงๆ จะทำล่วงหน้า โดยปกติแล้วช่วงต่างๆ จะถูกเลือกให้เท่ากัน (เพื่อให้ง่ายต่อการคำนวณฟังก์ชันที่จุดสิ้นสุดของช่วง) คำนวณพื้นที่และสรุปผล (สี่เหลี่ยม สี่เหลี่ยมคางหมู วิธีซิมป์สัน) 2. วิธีการแบ่งพาร์ติชันส่วนการรวมโดยใช้จุดพิเศษ (วิธี Gauss) 3. การคำนวณปริพันธ์โดยใช้ตัวเลขสุ่ม (วิธีมอนติคาร์โล) วิธีสี่เหลี่ยมผืนผ้าปล่อยให้ฟังก์ชัน (รูป) จำเป็นต้องรวมเข้ากับตัวเลขในส่วนนั้น แบ่งส่วนออกเป็น N ช่วงเวลาเท่ากัน พื้นที่ของสี่เหลี่ยมคางหมูโค้ง N แต่ละอันสามารถถูกแทนที่ด้วยพื้นที่ของสี่เหลี่ยม ความกว้างของสี่เหลี่ยมทั้งหมดเท่ากันและเท่ากัน: หากต้องการเลือกความสูงของสี่เหลี่ยม คุณสามารถเลือกค่าของฟังก์ชันที่ขอบด้านซ้ายได้ ในกรณีนี้ ความสูงของสี่เหลี่ยมผืนผ้าแรกจะเป็น f(a) สี่เหลี่ยมผืนผ้าที่สอง - f(x 1),..., N-f(N-1) หากเราใช้ค่าของฟังก์ชันบนเส้นขอบด้านขวาเพื่อเลือกความสูงของสี่เหลี่ยมผืนผ้า ในกรณีนี้ ความสูงของสี่เหลี่ยมผืนผ้าแรกจะเป็น f(x 1) ส่วนที่สอง - f(x 2) ... , ยังไม่มีข้อความ - ฉ(x ยังไม่มีข้อความ). อย่างที่คุณเห็นในกรณีนี้สูตรใดสูตรหนึ่งให้ค่าประมาณอินทิกรัลที่มีส่วนเกินและสูตรที่สองมีข้อบกพร่อง มีวิธีอื่น - การใช้ค่าของฟังก์ชันที่อยู่ตรงกลางของเซ็กเมนต์การรวมสำหรับการประมาณ: การประมาณค่าความผิดพลาดสัมบูรณ์ของวิธีสี่เหลี่ยม (ตรงกลาง) การประมาณค่าความคลาดเคลื่อนสัมบูรณ์ของวิธีสี่เหลี่ยมด้านซ้ายและขวา ตัวอย่าง.คำนวณช่วงเวลาทั้งหมดและแบ่งช่วงเวลาออกเป็นสี่ส่วน
สารละลาย.การคำนวณเชิงวิเคราะห์ของอินทิกรัลนี้ให้ I=arctg(1)–arctg(0)=0.7853981634 ในกรณีของเรา: 1)ซ = 1; เอ็กซ์โอ = 0; x1 = 1; 2) ชั่วโมง = 0.25 (1/4); x0 = 0; x1 = 0.25; x2 = 0.5; x3 = 0.75; x4 = 1; ลองคำนวณโดยใช้วิธีสี่เหลี่ยมด้านซ้าย: ลองคำนวณโดยใช้วิธีสี่เหลี่ยมด้านขวา: ลองคำนวณโดยใช้วิธีสี่เหลี่ยมผืนผ้าเฉลี่ย: วิธีสี่เหลี่ยมคางหมูใช้พหุนามดีกรีหนึ่ง (เส้นตรงที่ลากผ่านจุดสองจุด) เพื่อประมาณค่าผลลัพธ์ในสูตรสี่เหลี่ยมคางหมู จุดสิ้นสุดของเซ็กเมนต์การรวมจะถูกถือเป็นโหนดการแก้ไข ดังนั้นสี่เหลี่ยมคางหมูโค้งจะถูกแทนที่ด้วยสี่เหลี่ยมคางหมูธรรมดาซึ่งพื้นที่นี้สามารถพบได้เป็นผลคูณของผลรวมครึ่งหนึ่งของฐานและความสูง ในกรณีของเซ็กเมนต์การรวม N สำหรับโหนดทั้งหมด ยกเว้นจุดที่สุดของเซกเมนต์ ค่าของฟังก์ชันจะรวมอยู่ในผลรวมทั้งหมดสองครั้ง (เนื่องจากสี่เหลี่ยมคางหมูที่อยู่ติดกันมีด้านเดียวร่วมกัน) สูตรสี่เหลี่ยมคางหมูหาได้จากผลรวมครึ่งหนึ่งของสูตรรูปสี่เหลี่ยมผืนผ้าตามขอบด้านขวาและด้านซ้ายของส่วน: ตรวจสอบความเสถียรของสารละลายตามกฎแล้ว ยิ่งความยาวของแต่ละช่วงเวลาสั้นลง เช่น ยิ่งจำนวนช่วงเวลาเหล่านี้มากขึ้นเท่าใด ความแตกต่างระหว่างค่าโดยประมาณและค่าที่แน่นอนของอินทิกรัลก็จะน้อยลงเท่านั้น นี่เป็นเรื่องจริงสำหรับฟังก์ชันส่วนใหญ่ ในวิธีสี่เหลี่ยมคางหมู ข้อผิดพลาดในการคำนวณอินทิกรัล ϭ นั้นเป็นสัดส่วนโดยประมาณกับกำลังสองของขั้นตอนการอินทิเกรต (ϭ ~ h 2) ดังนั้นในการคำนวณอินทิกรัลของฟังก์ชันบางอย่างในรูปของ a, b จึงจำเป็นต้อง แบ่งส่วนออกเป็นช่วง N 0 แล้วหาผลรวมของพื้นที่สี่เหลี่ยมคางหมู จากนั้นคุณจะต้องเพิ่มจำนวนช่วงเวลา N 1 คำนวณผลรวมของสี่เหลี่ยมคางหมูอีกครั้งและเปรียบเทียบค่าผลลัพธ์กับผลลัพธ์ก่อนหน้า ควรทำซ้ำจนกระทั่ง (N i) จนกระทั่งได้ความแม่นยำที่ระบุของผลลัพธ์ (เกณฑ์การลู่เข้า) สำหรับวิธีสี่เหลี่ยมและสี่เหลี่ยมคางหมู โดยทั่วไปในแต่ละขั้นตอนการวนซ้ำ จำนวนช่วงเวลาจะเพิ่มขึ้น 2 เท่า (N i +1 = 2N i) เกณฑ์การลู่เข้า: ข้อได้เปรียบหลักของกฎสี่เหลี่ยมคางหมูคือความเรียบง่าย อย่างไรก็ตาม หากการคำนวณอินทิกรัลต้องใช้ความแม่นยำสูง วิธีนี้อาจต้องใช้การวนซ้ำมากเกินไป ข้อผิดพลาดสัมบูรณ์ของวิธีสี่เหลี่ยมคางหมูประมาณว่า ตัวอย่าง.คำนวณอินทิกรัลจำกัดเขตโดยประมาณโดยใช้สูตรสี่เหลี่ยมคางหมู ก) การแบ่งส่วนของการบูรณาการออกเป็น 3 ส่วน สารละลาย: ดังนั้นสูตรทั่วไปของสี่เหลี่ยมคางหมูจึงลดลงเหลือขนาดที่น่าพอใจ: ในที่สุด: ฉันขอเตือนคุณว่าค่าผลลัพธ์คือค่าโดยประมาณของพื้นที่ b) มาแบ่งส่วนการรวมออกเป็น 5 ส่วนเท่า ๆ กันนั่นคือ ด้วยการเพิ่มจำนวนเซ็กเมนต์เราจะเพิ่มความแม่นยำในการคำนวณ ถ้า ดังนั้นสูตรสี่เหลี่ยมคางหมูจะอยู่ในรูปแบบต่อไปนี้: มาหาขั้นตอนของพาร์ติชั่นกัน: เมื่อจบงาน จะสะดวกในการคำนวณทั้งหมดอย่างเป็นทางการโดยใช้ตารางการคำนวณ: ในบรรทัดแรกเราเขียนว่า "ตัวนับ" เป็นผลให้: มีการชี้แจงจริงๆและเป็นเรื่องจริงจัง! สูตรซิมป์สันสูตรสี่เหลี่ยมคางหมูให้ผลลัพธ์ที่ขึ้นอยู่กับขนาดขั้นตอน h อย่างมาก ซึ่งส่งผลต่อความแม่นยำในการคำนวณอินทิกรัลบางตัว โดยเฉพาะอย่างยิ่งในกรณีที่ฟังก์ชันนั้นไม่ใช่แบบโมโนโทนิก เราสามารถสันนิษฐานได้ว่าความแม่นยำในการคำนวณเพิ่มขึ้น ถ้าเราแทนที่จะใช้ส่วนตรงมาแทนที่ส่วนโค้งของกราฟของฟังก์ชัน f(x) เราใช้ เช่น ชิ้นส่วนของพาราโบลาที่ให้ผ่านจุดสามจุดที่อยู่ติดกันของกราฟ การตีความทางเรขาคณิตนี้เป็นไปตามวิธีของซิมป์สันในการคำนวณอินทิกรัลจำกัดเขต ช่วงการรวม a,b ทั้งหมดแบ่งออกเป็นส่วน N ส่วนความยาวของส่วนจะเท่ากับ h=(b-a)/N เช่นกัน สูตรของ Simpson มีลักษณะดังนี้: ระยะเวลาที่เหลือ เมื่อความยาวของเซ็กเมนต์เพิ่มขึ้น ความแม่นยำของสูตรจะลดลง ดังนั้น เพื่อเพิ่มความแม่นยำ จึงใช้สูตรผสมของซิมป์สัน ช่วงการรวมทั้งหมดแบ่งออกเป็นเซ็กเมนต์ N ที่เหมือนกันเป็นจำนวนคู่ ความยาวของเซ็กเมนต์จะเท่ากับ h=(b-a)/N สูตรสารประกอบของซิมป์สันคือ: ในสูตร นิพจน์ในวงเล็บจะแสดงผลรวมของค่าปริพันธ์ที่ส่วนท้ายของส่วนภายในคี่และคู่ตามลำดับ สูตรที่เหลือของซิมป์สันเป็นสัดส่วนกับกำลังที่สี่ของขั้นตอน: ตัวอย่าง:ใช้กฎของซิมป์สันในการคำนวณอินทิกรัล (วิธีแก้ปัญหาที่แน่นอน - 0.2) วิธีเกาส์ สูตรกำลังสองแบบเกาส์เซียน- หลักการพื้นฐานของสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสประเภทที่สองมองเห็นได้จากรูปที่ 1.12: จำเป็นต้องวางจุดในลักษณะนี้ เอ็กซ์ 0 และ เอ็กซ์ 1 ภายในส่วน [ ก;ข] เพื่อให้พื้นที่รวมของ "สามเหลี่ยม" เท่ากับพื้นที่ของ "ส่วน" เมื่อใช้สูตรเกาส์ ส่วนเดิม [ ก;ข] ถูกลดขนาดลงเป็นส่วน [-1;1] โดยการแทนที่ตัวแปร เอ็กซ์บน 0.5∙(ข– ก)∙ที+ 0.5∙(ข + ก). แล้ว , ที่ไหน . การทดแทนดังกล่าวเป็นไปได้หาก กและ ขมีขอบเขตจำกัดและฟังก์ชัน ฉ(x) ต่อเนื่องบน [ ก;ข- สูตรเกาส์ที่ nคะแนน x ฉัน, ฉัน=0,1,..,n-1 ภายในส่วน [ ก;ข]: , (1.27) ที่ไหน ฉันและ ฉันสำหรับต่างๆ nมีระบุไว้ในหนังสืออ้างอิง เช่น เมื่อใด n=2 ก 0 =ก 1 =1; ที่ n=3: ที 0 =ต 2 "0.775, ที 1 =0, ก 0 =ก 2 "0.555, ก 1"0.889. สูตรกำลังสองแบบเกาส์เซียน ได้มาจากฟังก์ชันน้ำหนักเท่ากับความสามัคคี พี(เอ็กซ์)= 1 และโหนด x ฉันซึ่งเป็นรากของพหุนามลีเจนเดร ราคาต่อรอง ฉันคำนวณง่ายโดยใช้สูตร ฉัน=0,1,2,...n. ค่าของโหนดและค่าสัมประสิทธิ์สำหรับ n=2,3,4,5 แสดงไว้ในตาราง ตัวอย่าง.คำนวณค่าโดยใช้สูตรเกาส์สำหรับ n=2: ค่าที่แน่นอน: . อัลกอริธึมสำหรับการคำนวณอินทิกรัลโดยใช้สูตรเกาส์ไม่ได้เกี่ยวข้องกับการเพิ่มจำนวนไมโครเซ็กเมนต์เป็นสองเท่า แต่เพิ่มจำนวนการจัดลำดับ 1 และเปรียบเทียบค่าที่ได้รับของอินทิกรัล ข้อดีของสูตรเกาส์คือมีความแม่นยำสูงโดยมีจำนวนเลขลำดับค่อนข้างน้อย ข้อเสีย: ไม่สะดวกสำหรับการคำนวณด้วยตนเอง จำเป็นต้องเก็บค่าไว้ในหน่วยความจำคอมพิวเตอร์ ฉัน, ฉันสำหรับต่างๆ n. ข้อผิดพลาดของสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสเกาส์เซียนในส่วนจะเป็น สำหรับสูตรเทอมที่เหลือจะเป็น และค่าสัมประสิทธิ์ α เอ็นลดลงอย่างรวดเร็วตามการเติบโต เอ็น- ที่นี่ สูตรเกาส์เซียนให้ความแม่นยำสูงแม้จะมีจำนวนโหนดน้อย (ตั้งแต่ 4 ถึง 10) ในกรณีนี้ ในการคำนวณเชิงปฏิบัติ จำนวนโหนดมีตั้งแต่หลายร้อยถึงหลายพัน โปรดทราบด้วยว่าน้ำหนักของการสร้างสี่เหลี่ยมจัตุรัสแบบเกาส์เซียนจะเป็นค่าบวกเสมอ ซึ่งทำให้มั่นใจในความเสถียรของอัลกอริทึมในการคำนวณผลรวม ความแตกต่างเมื่อแก้ไขปัญหา มักจำเป็นต้องค้นหาอนุพันธ์ของลำดับที่แน่นอนจากฟังก์ชัน f(x) ที่ให้ไว้ในตาราง นอกจากนี้ บางครั้งเนื่องจากความซับซ้อนของนิพจน์เชิงวิเคราะห์ของฟังก์ชัน f(x) การหาอนุพันธ์โดยตรงจึงยากเกินไป เช่นเดียวกับเมื่อแก้สมการเชิงอนุพันธ์เป็นตัวเลข ในกรณีเหล่านี้ จะใช้การสร้างความแตกต่างเชิงตัวเลข ตัวอย่าง. ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา โดยใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ขวาน+ข(ค้นหาพารามิเตอร์ กและ ข- ค้นหาว่าบรรทัดใดในสองบรรทัดที่ดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) เพื่อจัดแนวข้อมูลการทดลอง วาดรูป. รหัสและรูปภาพที่มีอยู่ กและ ข ใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การค้นหาอนุพันธ์ย่อยของฟังก์ชันเทียบกับตัวแปร กและ ข, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์ เราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น โดยวิธีทดแทนหรือ ) และรับสูตรในการหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM) ที่ให้ไว้ กและ ขการทำงาน ใช้ค่าที่น้อยที่สุด มีการให้หลักฐานข้อเท็จจริงนี้ นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กมีผลรวม , , และพารามิเตอร์ nมีผลรวม , , และพารามิเตอร์ ขพบได้หลังการคำนวณ ก. ถึงเวลาจำตัวอย่างดั้งเดิมแล้ว สารละลาย. ในตัวอย่างของเรา n=5- เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ ค่าในแถวที่สี่ของตารางได้มาโดยการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ฉัน. ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าในแถวที่ 2 สำหรับแต่ละตัวเลข ฉัน. ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว เราใช้สูตรวิธีกำลังสองน้อยที่สุดเพื่อหาค่าสัมประสิทธิ์ กและ ข- เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตารางลงไป: เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ มันยังคงค้นหาว่าเส้นไหน y = 0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีกว่า นั่นคือประมาณโดยใช้วิธีกำลังสองน้อยที่สุด ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลต้นฉบับจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ประมาณข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด ตั้งแต่นั้นมาตรง y = 0.165x+2.184ใกล้เคียงกับข้อมูลเดิมดีกว่า ทุกอย่างมองเห็นได้ชัดเจนบนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y = 0.165x+2.184, เส้นสีน้ำเงินคือ จุดสีชมพูคือข้อมูลต้นฉบับ เหตุใดจึงจำเป็น เหตุใดจึงต้องประมาณทั้งหมดนี้ โดยส่วนตัวฉันใช้มันเพื่อแก้ปัญหาการปรับข้อมูลให้เรียบ การแก้ไข และการคาดการณ์ (ในตัวอย่างดั้งเดิม พวกเขาอาจถูกขอให้ค้นหาค่าของค่าที่สังเกตได้ ยที่ x=3หรือเมื่อใด x=6โดยใช้วิธีกำลังสองน้อยที่สุด) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของเว็บไซต์ในภายหลัง การพิสูจน์. ดังนั้นเมื่อพบแล้ว กและ ขฟังก์ชันใช้ค่าที่น้อยที่สุด ซึ่ง ณ จุดนี้เมทริกซ์ของรูปแบบกำลังสองของดิฟเฟอเรนเชียลลำดับที่สองจำเป็นสำหรับฟังก์ชันนี้ เป็นบวกแน่นอน มาแสดงกันเถอะ 3.5. วิธีกำลังสองน้อยที่สุด
งานแรกที่วางรากฐานของวิธีกำลังสองน้อยที่สุดดำเนินการโดย Legendre ในปี 1805 ในบทความ "วิธีการใหม่ในการกำหนดวงโคจรของดาวหาง" เขาเขียนว่า: "หลังจากใช้เงื่อนไขทั้งหมดของปัญหาอย่างเต็มที่แล้ว มีความจำเป็นต้องกำหนดค่าสัมประสิทธิ์เพื่อให้ขนาดของข้อผิดพลาดน้อยที่สุด วิธีที่ง่ายที่สุดในการบรรลุเป้าหมายนี้คือวิธีการที่ประกอบด้วยการค้นหาผลรวมขั้นต่ำของข้อผิดพลาดกำลังสอง” ในปัจจุบัน วิธีการนี้มีการใช้กันอย่างแพร่หลายมากเมื่อประมาณค่าการขึ้นต่อกันของฟังก์ชันที่ไม่รู้จักที่ระบุโดยตัวอย่างการทดลองจำนวนมาก เพื่อให้ได้นิพจน์เชิงวิเคราะห์ที่ประมาณค่าได้ดีที่สุด สู่การทดลองเต็มรูปแบบ สมมติว่าบนพื้นฐานของการทดลองจำเป็นต้องสร้างการพึ่งพาการทำงานของปริมาณคุณจาก x : ให้เราสันนิษฐานว่าจากการทดลองที่เราได้รับnค่านิยม ยสำหรับค่าที่สอดคล้องกันของอาร์กิวเมนต์x- หากจุดการทดลองอยู่บนระนาบพิกัดดังในรูป เมื่อรู้ว่ามีข้อผิดพลาดเกิดขึ้นระหว่างการทดลอง เราก็สามารถสรุปได้ว่าการพึ่งพานั้นเป็นเส้นตรง กล่าวคือย=
ขวาน+
ขโปรดทราบว่าวิธีการนี้ไม่ได้กำหนดข้อจำกัดเกี่ยวกับประเภทของฟังก์ชัน เช่น มันสามารถนำไปใช้กับการพึ่งพาการทำงานใดๆ จากมุมมองของผู้ทดลอง มักจะเป็นเรื่องธรรมชาติมากกว่าที่จะพิจารณาว่าลำดับของการสุ่มตัวอย่างกำหนดไว้ล่วงหน้า เช่น เป็นตัวแปรอิสระและนับได้ - ตัวแปรตาม จะชัดเจนเป็นพิเศษหากอยู่ภายใต้ เข้าใจว่าเป็นช่วงเวลาซึ่งใช้กันอย่างแพร่หลายในการใช้งานทางเทคนิค แต่นี่เป็นเพียงกรณีพิเศษทั่วไปเท่านั้น ตัวอย่างเช่น จำเป็นต้องจำแนกตัวอย่างบางส่วนตามขนาด จากนั้นตัวแปรอิสระจะเป็นหมายเลขตัวอย่าง ตัวแปรตามจะเป็นขนาดแต่ละตัว วิธีกำลังสองน้อยที่สุดมีการอธิบายโดยละเอียดในสิ่งพิมพ์ทางการศึกษาและวิทยาศาสตร์หลายฉบับ โดยเฉพาะอย่างยิ่งในแง่ของการประมาณฟังก์ชันในวิศวกรรมไฟฟ้าและวิทยุ ตลอดจนในหนังสือเกี่ยวกับทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ กลับไปที่การวาดภาพ เส้นประแสดงว่าข้อผิดพลาดสามารถเกิดขึ้นได้ไม่เพียงแต่เนื่องจากขั้นตอนการวัดที่ไม่สมบูรณ์เท่านั้น แต่ยังเนื่องมาจากความไม่ถูกต้องในการระบุตัวแปรอิสระด้วยประเภทของฟังก์ชันที่เลือก สิ่งที่เหลืออยู่คือการเลือกพารามิเตอร์ที่รวมอยู่ในนั้นกและ ขเป็นที่แน่ชัดว่าจำนวนพารามิเตอร์สามารถมีได้มากกว่า 2 ตัว ซึ่งเป็นเรื่องปกติสำหรับฟังก์ชันเชิงเส้นเท่านั้น โดยทั่วไปเราจะถือว่า .(1)
คุณต้องเลือกอัตราต่อรองก,
ข,
ค...จึงจะบรรลุเงื่อนไข. .
(2)
มาหาค่าต่างๆ กัน ก,
ข,
ค... โดยหมุนด้านซ้ายของ (2) ให้เหลือน้อยที่สุด ในการทำเช่นนี้ เราจะกำหนดจุดที่คงที่ (จุดที่อนุพันธ์ตัวแรกหายไป) โดยการแยกความแตกต่างทางด้านซ้ายของ (2) ด้วยความเคารพก,
ข,
ค:
(3)
เป็นต้น ระบบสมการผลลัพธ์จะมีสมการมากเท่าที่ไม่ทราบก,
ข,
ค- เป็นไปไม่ได้ที่จะแก้ระบบดังกล่าวในรูปแบบทั่วไป ดังนั้นจึงจำเป็นต้องระบุฟังก์ชันประเภทใดประเภทหนึ่งเป็นอย่างน้อย ต่อไปเราจะพิจารณาสองกรณี: ฟังก์ชันเชิงเส้นและกำลังสอง ฟังก์ชันเชิงเส้น
.
ให้เราพิจารณาผลรวมของกำลังสองของความแตกต่างระหว่างค่าทดลองและค่าฟังก์ชันที่จุดที่สอดคล้องกัน: (4)
เรามาเลือกพารามิเตอร์กันกและ ขเพื่อให้จำนวนนี้มีค่าน้อยที่สุด ดังนั้นภารกิจจึงต้องค้นหาค่าต่างๆกและ ขโดยที่ฟังก์ชันมีขั้นต่ำ นั่นคือ เพื่อศึกษาฟังก์ชันของตัวแปรอิสระสองตัวกและ ขให้น้อยที่สุด การทำเช่นนี้เราแยกความแตกต่างโดยกและ ข:
;
.
หรือ (5)
แทนที่ข้อมูลการทดลอง และ เราได้รับระบบสมการเชิงเส้นสองสมการโดยไม่ทราบค่าสองตัวกและ ข- หลังจากแก้ไขระบบนี้แล้ว เราก็สามารถเขียนฟังก์ชันได้ ให้เราตรวจสอบให้แน่ใจว่าสำหรับค่าที่พบกและ ขมีขั้นต่ำ เพื่อทำเช่นนี้ เราพบ และ : , , .
เพราะฉะนั้น, − = ,
>0,
เหล่านั้น. เป็นไปตามเงื่อนไขขั้นต่ำที่เพียงพอสำหรับฟังก์ชันของตัวแปรสองตัว ฟังก์ชันกำลังสอง .
ให้การทดลองได้ค่าฟังก์ชันที่จุด . จากข้อมูลเบื้องต้น ให้สันนิษฐานว่าฟังก์ชันเป็นแบบกำลังสอง: .
เราจำเป็นต้องหาสัมประสิทธิ์ก,
ขและ ค. เรามี – ฟังก์ชันของตัวแปร 3 ตัวก,
ข,
ค.
ในกรณีนี้ ระบบ (3) จะอยู่ในรูปแบบ: หรือ: หลังจากแก้ระบบสมการเชิงเส้นนี้แล้ว เราก็หาสิ่งที่ไม่ทราบได้ก,
ข,
ค.
ตัวอย่าง.ให้ค่าสี่ค่าของฟังก์ชันที่ต้องการได้รับจากการทดลองย = (x ) โดยมีค่าอาร์กิวเมนต์สี่ค่าซึ่งระบุไว้ในตาราง:
.
b) การแบ่งส่วนของการรวมออกเป็น 5 ส่วน
ก) ตามเงื่อนไขนั้น ส่วนบูรณาการจะต้องแบ่งออกเป็น 3 ส่วน กล่าวคือ
ลองคำนวณความยาวของแต่ละส่วนของพาร์ติชัน: .
นั่นคือความยาวของส่วนตรงกลางแต่ละส่วนคือ 0.6
หากเป็น 3 ส่วนพาร์ติชันก็จะมี 5 ส่วน หากคุณใช้ส่วนที่ใหญ่กว่านี้ => มันจะแม่นยำยิ่งขึ้นคำสั่ง โหนด ราคาต่อรอง
n=2
x1=0
x 0 =-x2=0.7745966692
เอ 1=8/9
ก 0 = ก 2=5/9
n=3
x 2 =-x1=0.3399810436
x 3 =-x 0=0.8611363116
ก 1 = ก 2=0.6521451549
ก 0 = ก 3=0.6521451549
n=4
x 2 =
0
x 3 =
-x 1 =
0.5384693101
x 4 =-x 0 =0.9061798459
ก 0 =0.568888899
ก 3 =ก 1 =0.4786286705
ก 0 =ก 4 =0.2869268851
n=5
x 5 =
-x 0 =0.9324695142
x 4 =
-x 1 =0.6612093865
x 3 =
-x 2 =0.2386191861
ก 5 =ก 0 =0.1713244924
ก 4 =ก 1 =0.3607615730
ก 3 =ก 2 =0.4679139346
สาระสำคัญของวิธีกำลังสองน้อยที่สุด (LSM)
สูตรการหาค่าสัมประสิทธิ์
การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด
ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LS)