ใช้วิธีการกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุดใน Excel

27.09.2019 | ความงาม

ให้เราประมาณฟังก์ชันด้วยพหุนามระดับ 2 ในการทำเช่นนี้ เราคำนวณค่าสัมประสิทธิ์ของระบบสมการปกติ:

, ,

มาสร้างระบบปกติกันเถอะ กำลังสองน้อยที่สุดซึ่งดูเหมือนว่า:

วิธีแก้ระบบหาง่าย:, , .

ดังนั้นจึงพบพหุนามของดีกรี 2:

ข้อมูลทางทฤษฎี

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่างที่ 2- การหาระดับที่เหมาะสมที่สุดของพหุนาม

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่างที่ 3- ที่มาของระบบสมการปกติสำหรับการค้นหาพารามิเตอร์ของการพึ่งพาเชิงประจักษ์

ขอให้เราได้รับระบบสมการเพื่อกำหนดค่าสัมประสิทธิ์และฟังก์ชัน ซึ่งดำเนินการประมาณราก-ค่าเฉลี่ย-กำลังสอง ฟังก์ชันที่กำหนดตามจุด ลองเขียนฟังก์ชันกัน และเขียนมันลงไปให้เธอ สภาพที่จำเป็นสุดขีด:

จากนั้นระบบปกติจะอยู่ในรูปแบบ:

เราได้รับระบบสมการเชิงเส้นสำหรับพารามิเตอร์ที่ไม่รู้จักซึ่งแก้ไขได้ง่าย

ข้อมูลทางทฤษฎี

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง

จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา

โดยใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ขวาน+ข(ค้นหาพารามิเตอร์ กและ ข- ค้นหาว่าบรรทัดใดในสองบรรทัดที่ดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) เพื่อจัดแนวข้อมูลการทดลอง วาดรูป.

สาระสำคัญของวิธีกำลังสองน้อยที่สุด (LSM)

ภารกิจคือการหาค่าสัมประสิทธิ์ การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว กและ ขใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว

สูตรการหาค่าสัมประสิทธิ์

ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การหาอนุพันธ์ย่อยของฟังก์ชัน โดยตัวแปร กและ ข, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์

เราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น โดยวิธีทดแทนหรือวิธีแครเมอร์) และรับสูตรหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM)

ที่ให้ไว้ กและ ขการทำงาน ใช้ค่าที่น้อยที่สุด หลักฐานข้อเท็จจริงนี้มีระบุไว้ด้านล่างในข้อความท้ายหน้า

นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กมีผลรวม , , และพารามิเตอร์ n– จำนวนข้อมูลการทดลอง เราขอแนะนำให้คำนวณค่าของจำนวนเงินเหล่านี้แยกกัน

ค่าสัมประสิทธิ์ ขพบได้หลังการคำนวณ ก.

ถึงเวลาจำตัวอย่างดั้งเดิมแล้ว

สารละลาย.

ในตัวอย่างของเรา n=5- เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางได้มาโดยการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ฉัน.

ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าในแถวที่ 2 สำหรับแต่ละตัวเลข ฉัน.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว

เราใช้สูตรวิธีกำลังสองน้อยที่สุดเพื่อหาค่าสัมประสิทธิ์ กและ ข- เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตารางลงไป:

เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ

มันยังคงค้นหาว่าเส้นไหน y = 0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีกว่า นั่นคือประมาณโดยใช้วิธีกำลังสองน้อยที่สุด

การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด

ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลต้นฉบับจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ประมาณข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด

ตั้งแต่นั้นมาตรง y = 0.165x+2.184ใกล้เคียงกับข้อมูลเดิมดีกว่า

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LS)

ทุกอย่างมองเห็นได้ชัดเจนบนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y = 0.165x+2.184, เส้นสีน้ำเงินคือ จุดสีชมพูคือข้อมูลต้นฉบับ

เหตุใดจึงจำเป็น เหตุใดจึงต้องประมาณทั้งหมดนี้

โดยส่วนตัวฉันใช้มันเพื่อแก้ปัญหาการปรับข้อมูลให้เรียบ การแก้ไข และการคาดการณ์ (ในตัวอย่างดั้งเดิม พวกเขาอาจถูกขอให้ค้นหาค่าของค่าที่สังเกตได้ ยที่ x=3หรือเมื่อใด x=6โดยใช้วิธีกำลังสองน้อยที่สุด) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของเว็บไซต์ในภายหลัง

ด้านบนของหน้า

การพิสูจน์.

ดังนั้นเมื่อพบแล้ว กและ ขฟังก์ชันใช้ค่าที่น้อยที่สุด ซึ่ง ณ จุดนี้เมทริกซ์ของรูปแบบกำลังสองของดิฟเฟอเรนเชียลลำดับที่สองจำเป็นสำหรับฟังก์ชันนี้ เป็นบวกแน่นอน มาแสดงกันเถอะ

ส่วนต่างลำดับที่สองมีรูปแบบ:

นั่นก็คือ

ดังนั้นเมทริกซ์ของรูปแบบกำลังสองจึงมีรูปแบบ

และค่าขององค์ประกอบไม่ได้ขึ้นอยู่กับ กและ ข.

ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน เมื่อต้องการทำเช่นนี้ ผู้เยาว์เชิงมุมจะต้องเป็นบวก

ผู้เยาว์เชิงมุมของลำดับแรก - ความไม่เท่าเทียมกันเข้มงวดเพราะคะแนนไม่ตรงกัน ต่อไปนี้เราจะบอกเป็นนัยนี้

ผู้เยาว์เชิงมุมอันดับที่สอง

มาพิสูจน์กัน โดยวิธีการอุปนัยทางคณิตศาสตร์

บทสรุป: พบค่า กและ ขสอดคล้อง ค่าต่ำสุดฟังก์ชั่น ดังนั้นจึงเป็นพารามิเตอร์ที่จำเป็นสำหรับวิธีกำลังสองน้อยที่สุด

ไม่มีเวลาคิดออก?
สั่งซื้อวิธีแก้ปัญหา

ด้านบนของหน้า

การพยากรณ์โดยใช้วิธีกำลังสองน้อยที่สุด ตัวอย่างการแก้ปัญหา

การคาดการณ์ เป็นวิธีการ การวิจัยทางวิทยาศาสตร์ซึ่งอยู่บนพื้นฐานของการเผยแพร่แนวโน้ม รูปแบบ ความเชื่อมโยงกับการพัฒนาในอนาคตของวัตถุการคาดการณ์ในอดีตและปัจจุบัน วิธีการประมาณค่าได้แก่ วิธีค่าเฉลี่ยเคลื่อนที่, วิธี การปรับให้เรียบแบบเอกซ์โปเนนเชียลวิธีกำลังสองน้อยที่สุด

เอสเซ้นส์ วิธีกำลังสองน้อยที่สุด ประกอบด้วยการลดผลรวมของการเบี่ยงเบนกำลังสองระหว่างค่าที่สังเกตและค่าที่คำนวณได้ ค่าที่คำนวณได้จะพบโดยใช้สมการที่เลือก - สมการถดถอย ยิ่งระยะห่างระหว่างค่าจริงกับค่าที่คำนวณได้น้อยลง การพยากรณ์ตามสมการการถดถอยก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

การวิเคราะห์ทางทฤษฎีเกี่ยวกับแก่นแท้ของปรากฏการณ์ที่กำลังศึกษา การเปลี่ยนแปลงซึ่งสะท้อนให้เห็นโดยอนุกรมเวลา ทำหน้าที่เป็นพื้นฐานในการเลือกเส้นโค้ง บางครั้งการพิจารณาเกี่ยวกับลักษณะของการเพิ่มระดับของซีรีส์ก็ถูกนำมาพิจารณาด้วย ดังนั้น หากคาดว่าจะมีการเติบโตของผลผลิตในการก้าวหน้าทางคณิตศาสตร์ การปรับให้เรียบจะดำเนินการเป็นเส้นตรง หากปรากฎว่าการเติบโตอยู่ในความก้าวหน้าทางเรขาคณิต การปรับให้เรียบจะต้องดำเนินการโดยใช้ฟังก์ชันเลขชี้กำลัง

สูตรการทำงานสำหรับวิธีกำลังสองน้อยที่สุด : Y t+1 = a*X + bโดยที่ t + 1 – ระยะเวลาคาดการณ์ Уt+1 – ตัวบ่งชี้ที่คาดการณ์; a และ b เป็นสัมประสิทธิ์ เอ็กซ์ - เครื่องหมายเวลา.

การคำนวณสัมประสิทธิ์ a และ b ดำเนินการโดยใช้สูตรต่อไปนี้:

โดยที่ Uf – ค่าที่แท้จริงของซีรีย์ไดนามิก n – จำนวนระดับอนุกรมเวลา

อนุกรมเวลาที่ทำให้เรียบโดยใช้วิธีกำลังสองน้อยที่สุดทำหน้าที่สะท้อนรูปแบบการพัฒนาของปรากฏการณ์ที่กำลังศึกษา ในการวิเคราะห์แนวโน้ม เวลาถือเป็นตัวแปรอิสระ และระดับของอนุกรมทำหน้าที่เป็นฟังก์ชันของตัวแปรอิสระนี้

การพัฒนาของปรากฏการณ์ไม่ได้ขึ้นอยู่กับว่าผ่านไปกี่ปีนับตั้งแต่จุดเริ่มต้น แต่ขึ้นอยู่กับปัจจัยที่มีอิทธิพลต่อการพัฒนา ทิศทางใด และความรุนแรงเพียงใด จากตรงนี้เป็นที่ชัดเจนว่าการพัฒนาปรากฏการณ์เมื่อเวลาผ่านไปเป็นผลมาจากการกระทำของปัจจัยเหล่านี้

การสร้างประเภทของเส้นโค้งอย่างถูกต้องประเภทของการพึ่งพาการวิเคราะห์ตามเวลาเป็นหนึ่งในงานที่ยากที่สุดในการวิเคราะห์เชิงคาดการณ์ .

การเลือกประเภทของฟังก์ชันที่อธิบายแนวโน้ม ซึ่งเป็นพารามิเตอร์ที่กำหนดโดยวิธีกำลังสองน้อยที่สุด ในกรณีส่วนใหญ่จะดำเนินการโดยเชิงประจักษ์ โดยการสร้างฟังก์ชันจำนวนหนึ่งแล้วเปรียบเทียบกันตามค่าของฟังก์ชัน ค่าคลาดเคลื่อนกำลังสองเฉลี่ย คำนวณโดยสูตร:

โดยที่ UV เป็นค่าที่แท้จริงของซีรีย์ไดนามิก Ur – ค่าที่คำนวณ (เรียบ) ของซีรีย์ไดนามิก n – จำนวนระดับอนุกรมเวลา p – จำนวนพารามิเตอร์ที่กำหนดในสูตรที่อธิบายแนวโน้ม (แนวโน้มการพัฒนา)

ข้อเสียของวิธีกำลังสองน้อยที่สุด :

เมื่อพยายามอธิบายปรากฏการณ์ทางเศรษฐกิจที่กำลังศึกษาโดยใช้สมการทางคณิตศาสตร์ การพยากรณ์จะมีความแม่นยำในช่วงเวลาสั้นๆ และควรคำนวณสมการถดถอยใหม่เมื่อมีข้อมูลใหม่
ความซับซ้อนในการเลือกสมการถดถอยที่แก้ได้โดยใช้โปรแกรมคอมพิวเตอร์มาตรฐาน

ตัวอย่างการใช้วิธีกำลังสองน้อยที่สุดในการพยากรณ์

งาน - มีข้อมูลที่แสดงถึงอัตราการว่างงานในภูมิภาค %

สร้างการคาดการณ์อัตราการว่างงานในภูมิภาคสำหรับเดือนพฤศจิกายน ธันวาคม มกราคม โดยใช้วิธีต่อไปนี้ ค่าเฉลี่ยเคลื่อนที่ การปรับให้เรียบแบบเอกซ์โปเนนเชียล กำลังสองน้อยที่สุด
คำนวณข้อผิดพลาดในการพยากรณ์ผลลัพธ์โดยใช้แต่ละวิธี
เปรียบเทียบผลลัพธ์และสรุปผล

คำตอบของกำลังสองน้อยที่สุด

เพื่อแก้ปัญหานี้เราจะจัดทำตารางซึ่งเราจะทำการคำนวณที่จำเป็น:

ε = 28.63/10 = 2.86% ความแม่นยำในการพยากรณ์สูง.

บทสรุป : เปรียบเทียบผลลัพธ์ที่ได้จากการคำนวณ วิธีค่าเฉลี่ยเคลื่อนที่ , วิธีการทำให้เรียบแบบเอกซ์โปเนนเชียล และใช้วิธีกำลังสองน้อยที่สุด เราก็บอกได้ว่าค่าเฉลี่ย ข้อผิดพลาดที่เกี่ยวข้องเมื่อคำนวณโดยใช้วิธีปรับให้เรียบแบบเอ็กซ์โปเนนเชียล จะอยู่ในช่วง 20-50% ซึ่งหมายความว่าความแม่นยำของการพยากรณ์ในกรณีนี้เป็นเพียงที่น่าพอใจเท่านั้น

ในกรณีแรกและที่สาม ความแม่นยำในการคาดการณ์จะสูง เนื่องจากข้อผิดพลาดสัมพัทธ์โดยเฉลี่ยน้อยกว่า 10% แต่วิธีค่าเฉลี่ยเคลื่อนที่ทำให้ได้ผลลัพธ์ที่เชื่อถือได้มากขึ้น (คาดการณ์สำหรับเดือนพฤศจิกายน - 1.52% คาดการณ์สำหรับเดือนธันวาคม - 1.53% คาดการณ์สำหรับเดือนมกราคม - 1.49%) เนื่องจากข้อผิดพลาดสัมพัทธ์โดยเฉลี่ยเมื่อใช้วิธีนี้มีค่าน้อยที่สุด - 1 .13%.

วิธีกำลังสองน้อยที่สุด

บทความอื่น ๆ ในหัวข้อนี้:

รายชื่อแหล่งที่มาที่ใช้

คำแนะนำทางวิทยาศาสตร์และระเบียบวิธีในการวินิจฉัยความเสี่ยงทางสังคมและการพยากรณ์ความท้าทาย ภัยคุกคาม และผลที่ตามมาทางสังคม มหาวิทยาลัยสังคมแห่งรัฐรัสเซีย มอสโก 2553;
Vladimirova L.P. การพยากรณ์และการวางแผนในภาวะตลาด: หนังสือเรียน เบี้ยเลี้ยง. ม.: สำนักพิมพ์"Dashkov และ Co", 2544;
Novikova N.V., Pozdeeva O.G. การพยากรณ์ เศรษฐกิจของประเทศ: คู่มือการศึกษาและระเบียบวิธี Ekaterinburg: สำนักพิมพ์อูราล สถานะ เศรษฐกิจ มหาวิทยาลัย 2550;
Slutskin L.N. หลักสูตร MBA เกี่ยวกับการพยากรณ์ธุรกิจ อ.: หนังสือธุรกิจ Alpina, 2549.

โปรแกรมบรรษัทข้ามชาติ

กรอกรายละเอียด

ข้อมูลและการประมาณ y = ก + ข x

ฉัน- จำนวนจุดทดลอง
x ฉัน- ค่าของพารามิเตอร์คงที่ ณ จุดหนึ่ง ฉัน;
ใช่แล้ว- ค่าของพารามิเตอร์ที่วัดได้ที่จุดหนึ่ง ฉัน;
ωi- การวัดน้ำหนัก ณ จุดใดจุดหนึ่ง ฉัน;
ใช่แล้ว คำนวณ- ความแตกต่างระหว่างค่าที่วัดได้และค่าที่คำนวณการถดถอย ยตรงจุด ฉัน;
ส x ฉัน (x ฉัน)- การประมาณการข้อผิดพลาด x ฉันเมื่อทำการวัด ยตรงจุด ฉัน.

ข้อมูลและการประมาณ y = kx

ฉัน	x ฉัน	ใช่แล้ว	ωi	ใช่แล้ว คำนวณ	∆ ฉัน	ส x ฉัน (x ฉัน)

คลิกที่แผนภูมิ

คู่มือการใช้งานโปรแกรมออนไลน์ MNC

ในช่องข้อมูล ให้ป้อนค่า `x` และ `y` ในแต่ละบรรทัดแยกกันที่จุดทดลองจุดเดียว ค่าจะต้องคั่นด้วยอักขระช่องว่าง (ช่องว่างหรือแท็บ)

ค่าที่สามอาจเป็นน้ำหนักของจุด `w` หากไม่ได้ระบุน้ำหนักของจุด จะเท่ากับหนึ่ง ในกรณีส่วนใหญ่ น้ำหนักของคะแนนการทดลองจะไม่ทราบหรือไม่ได้คำนวณ เช่น ข้อมูลการทดลองทั้งหมดถือว่าเท่าเทียมกัน บางครั้งน้ำหนักในช่วงของค่าที่ศึกษาจะไม่เท่ากันอย่างแน่นอนและสามารถคำนวณได้ทางทฤษฎีด้วยซ้ำ ตัวอย่างเช่น ในสเปกโตรโฟโตเมทรี สามารถคำนวณน้ำหนักได้โดยใช้สูตรง่ายๆ แม้ว่าส่วนใหญ่จะละเลยไปเพื่อลดต้นทุนค่าแรงก็ตาม

สามารถวางข้อมูลผ่านคลิปบอร์ดจากสเปรดชีตในชุดโปรแกรมสำนักงาน เช่น Excel จาก Microsoft Office หรือ Calc จาก Open Office ในการดำเนินการนี้ ในสเปรดชีต ให้เลือกช่วงของข้อมูลที่จะคัดลอก คัดลอกไปยังคลิปบอร์ด และวางข้อมูลลงในช่องข้อมูลในหน้านี้

ในการคำนวณโดยใช้วิธีกำลังสองน้อยที่สุด จำเป็นต้องมีจุดอย่างน้อยสองจุดเพื่อกำหนดค่าสัมประสิทธิ์ 2 ค่า `b` - ค่าแทนเจนต์ของมุมเอียงของเส้นและ `a` - ค่าที่เส้นบนแกน 'y' ตัดขวาง

ในการประมาณค่าความผิดพลาดของค่าสัมประสิทธิ์การถดถอยที่คำนวณได้ คุณต้องกำหนดจำนวนคะแนนการทดลองให้มากกว่าสองจุด

วิธีกำลังสองน้อยที่สุด (LSM)

ยิ่งจำนวนคะแนนการทดลองมากเท่าใดก็ยิ่งแม่นยำมากขึ้นเท่านั้น การประเมินทางสถิติค่าสัมประสิทธิ์ (เนื่องจากค่าสัมประสิทธิ์นักเรียนลดลง) และยิ่งค่าประมาณใกล้เคียงกับค่าประมาณของกลุ่มตัวอย่างทั่วไป

การได้รับค่าในแต่ละจุดการทดลองมักเกี่ยวข้องกับต้นทุนค่าแรงที่สำคัญ ดังนั้นจึงมักดำเนินการประนีประนอมในจำนวนการทดลองที่ให้การประมาณค่าที่สามารถจัดการได้ และไม่นำไปสู่ต้นทุนค่าแรงที่มากเกินไป ตามกฎแล้ว จำนวนคะแนนการทดลองสำหรับการพึ่งพากำลังสองน้อยที่สุดเชิงเส้นด้วยค่าสัมประสิทธิ์สองตัวจะถูกเลือกในช่วง 5-7 คะแนน

ทฤษฎีโดยย่อกำลังสองน้อยที่สุดสำหรับความสัมพันธ์เชิงเส้น

สมมติว่าเรามีชุดข้อมูลการทดลองอยู่ในรูปแบบของคู่ของค่า [`y_i`, `x_i`] โดยที่ `i` คือจำนวนของการวัดการทดลองหนึ่งครั้งตั้งแต่ 1 ถึง `n`; `y_i` - ค่าของค่าที่วัดได้ที่จุด `i`; `x_i` - ค่าของพารามิเตอร์ที่เราตั้งค่าไว้ที่จุด `i`

พิจารณาการดำเนินการของกฎของโอห์มเป็นตัวอย่าง โดยการเปลี่ยนแปลงแรงดันไฟฟ้า (ความต่างศักย์ไฟฟ้า) ระหว่างส่วนต่างๆ วงจรไฟฟ้าเราวัดปริมาณกระแสที่ไหลผ่านบริเวณนี้ ฟิสิกส์ทำให้เราพึ่งพาได้จากการทดลอง:

`ฉัน = U/R`,
โดยที่ `ฉัน` คือความแข็งแกร่งในปัจจุบัน `R` - แนวต้าน; `U` - แรงดันไฟฟ้า

ในกรณีนี้ `y_i` คือค่ากระแสที่วัดได้ และ `x_i` คือค่าแรงดันไฟฟ้า

อีกตัวอย่างหนึ่ง ให้พิจารณาการดูดกลืนแสงโดยสารละลายของสารในสารละลาย เคมีให้สูตรแก่เรา:

`A = ε ลิตร C`,
โดยที่ `A` คือความหนาแน่นเชิงแสงของสารละลาย `ε` - การส่งผ่านของตัวถูกละลาย; `l` - ความยาวเส้นทางเมื่อแสงผ่านคิวเวตต์พร้อมกับสารละลาย `C` คือความเข้มข้นของสารที่ละลาย

ในกรณีนี้ `y_i` คือค่าที่วัดได้ของความหนาแน่นของแสง `A` และ `x_i` คือค่าความเข้มข้นของสารที่เราระบุ

เราจะพิจารณากรณีที่ข้อผิดพลาดสัมพัทธ์ในงาน `x_i` มีขนาดเล็กลงอย่างมาก ข้อผิดพลาดที่เกี่ยวข้องขนาด `y_i` นอกจากนี้เรายังจะถือว่าค่าที่วัดได้ทั้งหมด `y_i` เป็นแบบสุ่มและกระจายตามปกติ เช่น ปฏิบัติตามกฎหมายการกระจายแบบปกติ

ในกรณีของการพึ่งพาเชิงเส้นของ `y` กับ `x` เราสามารถเขียนการพึ่งพาทางทฤษฎีได้:
`y = ก + ข x`

จากมุมมองทางเรขาคณิต ค่าสัมประสิทธิ์ `b` หมายถึงค่าแทนเจนต์ของมุมเอียงของเส้นกับแกน 'x' และค่าสัมประสิทธิ์ 'a' คือค่า 'y' ที่จุดตัดกันของ ตรงกับแกน `y` (ที่ `x = 0`)

การค้นหาพารามิเตอร์เส้นการถดถอย

ในการทดลอง ค่าที่วัดได้ของ `y_i` ไม่สามารถอยู่บนเส้นตรงทางทฤษฎีได้อย่างแน่นอน เนื่องจากข้อผิดพลาดในการวัดซึ่งมักมีอยู่เสมอ ชีวิตจริง- ดังนั้นสมการเชิงเส้นจะต้องแสดงด้วยระบบสมการ:
`y_i = a + b x_i + ε_i` (1),
โดยที่ `ε_i` คือข้อผิดพลาดในการวัดที่ไม่ทราบที่มาของ `y` ในการทดลองครั้งที่ 1

การพึ่งพา (1) เรียกอีกอย่างว่า การถดถอย, เช่น. การพึ่งพากันของปริมาณสองปริมาณต่อกันโดยมีนัยสำคัญทางสถิติ

งานในการฟื้นฟูการพึ่งพาคือการหาค่าสัมประสิทธิ์ `a` และ `b` จากจุดทดลอง [`y_i`, `x_i`]

โดยปกติจะใช้การหาค่าสัมประสิทธิ์ `a` และ `b` วิธีกำลังสองน้อยที่สุด(เอ็มเอ็นซี) เป็นกรณีพิเศษของหลักการความน่าจะเป็นสูงสุด

ลองเขียน (1) ใหม่ในรูปแบบ `ε_i = y_i - a - b x_i`

จากนั้นผลรวมของข้อผิดพลาดกำลังสองจะเป็น
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2` (2)

หลักการของกำลังสองน้อยที่สุด (กำลังสองน้อยที่สุด) คือการลดผลรวม (2) ให้เหลือน้อยที่สุดตามพารามิเตอร์ `a` และ `b`.

ค่าต่ำสุดจะเกิดขึ้นได้เมื่ออนุพันธ์บางส่วนของผลรวม (2) เทียบกับสัมประสิทธิ์ `a` และ `b` เท่ากับศูนย์:
`frac(บางส่วน Φ)(บางส่วน a) = frac(ผลรวมบางส่วน_(i=1)^(n) (y_i - a - b x_i)^2)(บางส่วน a) = 0`
`frac(บางส่วน Φ)(ขบางส่วน) = frac(ผลรวมบางส่วน_(i=1)^(n) (y_i - a - b x_i)^2)(ขบางส่วน) = 0`

จากการขยายอนุพันธ์ เราได้ระบบสมการสองสมการโดยไม่ทราบค่าสองตัว:
`sum_(i=1)^(n) (2a + 2bx_i — 2y_i) = sum_(i=1)^(n) (a + bx_i — y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

เราเปิดวงเล็บและโอนผลรวมที่ไม่ขึ้นอยู่กับสัมประสิทธิ์ที่ต้องการไปยังอีกครึ่งหนึ่ง เราได้ระบบสมการเชิงเส้น:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

เมื่อแก้ระบบผลลัพธ์เราจะค้นหาสูตรสำหรับค่าสัมประสิทธิ์ `a` และ `b`:

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 — sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i — sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (น) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.2)

สูตรเหล่านี้มีคำตอบเมื่อ `n > 1` (สามารถสร้างเส้นได้โดยใช้จุดอย่างน้อย 2 จุด) และเมื่อดีเทอร์มิแนนต์ `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1 )^(n) x_i)^2 != 0` เช่น เมื่อจุด `x_i` ในการทดสอบแตกต่างกัน (เช่น เมื่อเส้นไม่อยู่ในแนวตั้ง)

การประมาณค่าความผิดพลาดของสัมประสิทธิ์เส้นถดถอย

สำหรับการประเมินข้อผิดพลาดในการคำนวณค่าสัมประสิทธิ์ `a` และ `b` ที่แม่นยำยิ่งขึ้น จำเป็นต้องมีคะแนนการทดลองจำนวนมาก เมื่อ `n = 2` มันเป็นไปไม่ได้ที่จะประมาณค่าความผิดพลาดของสัมประสิทธิ์เพราะว่า เส้นประมาณจะผ่านจุดสองจุดโดยไม่ซ้ำกัน

ข้อผิดพลาด ตัวแปรสุ่ม'V' ถูกกำหนดไว้ กฎแห่งความผิดพลาดสะสม
`S_V^2 = sum_(i=1)^p (frac(f บางส่วน)(z_i บางส่วน))^2 S_(z_i)^2`,
โดยที่ `p` คือจำนวนพารามิเตอร์ `z_i` ที่มีข้อผิดพลาด `S_(z_i)` ซึ่งส่งผลต่อข้อผิดพลาด `S_V`
`f` เป็นฟังก์ชันของการขึ้นต่อกันของ `V` กับ `z_i`

ให้เราเขียนกฎแห่งข้อผิดพลาดสะสมสำหรับข้อผิดพลาดของสัมประสิทธิ์ `a` และ `b`
`S_a^2 = sum_(i=1)^(n)(frac(บางส่วน a)(y_i บางส่วน))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(บางส่วน a )(บางส่วน x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(บางส่วน a)(y_i บางส่วน))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(b บางส่วน)(y_i บางส่วน))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(b บางส่วน )(บางส่วน x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(b บางส่วน)(y_i บางส่วน))^2 `,
เพราะ `S_(x_i)^2 = 0` (ก่อนหน้านี้เราได้จองไว้แล้วว่าข้อผิดพลาด `x` นั้นเล็กน้อย)

`S_y^2 = S_(y_i)^2` - ข้อผิดพลาด (ความแปรปรวน, กำลังสอง ส่วนเบี่ยงเบนมาตรฐาน) ในการวัดค่า `y` โดยสมมติว่าข้อผิดพลาดมีค่าเท่ากันทุกค่าของ `y`

การแทนที่สูตรสำหรับการคำนวณ 'a' และ 'b' ลงในนิพจน์ผลลัพธ์ที่เราได้รับ

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n sum_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

ในการทดลองจริงส่วนใหญ่ ค่าของ `Sy` จะไม่ถูกวัด ในการดำเนินการนี้ จำเป็นต้องดำเนินการวัดแบบขนาน (การทดลอง) หลายครั้งที่จุดใดจุดหนึ่งหรือหลายจุดในแผน ซึ่งจะเพิ่มเวลา (และอาจมีค่าใช้จ่าย) ของการทดสอบ ดังนั้นจึงมักสันนิษฐานว่าการเบี่ยงเบนของ `y` จากเส้นการถดถอยถือได้ว่าเป็นแบบสุ่ม การประมาณความแปรปรวน `y` ในกรณีนี้คำนวณโดยใช้สูตร

`S_y^2 = S_(y, พัก)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`

ตัวหาร "n-2" ปรากฏขึ้นเนื่องจากจำนวนองศาอิสระของเราลดลงเนื่องจากการคำนวณค่าสัมประสิทธิ์สองตัวโดยใช้ตัวอย่างข้อมูลการทดลองเดียวกัน

การประมาณนี้เรียกอีกอย่างว่าความแปรปรวนคงเหลือสัมพันธ์กับเส้นการถดถอย `S_(y, ส่วนที่เหลือ)^2`

ความสำคัญของสัมประสิทธิ์ได้รับการประเมินโดยใช้แบบทดสอบของนักเรียน

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

หากเกณฑ์ที่คำนวณ `t_a`, `t_b` น้อยกว่าเกณฑ์ในตาราง `t(P, n-2)` จะถือว่าค่าสัมประสิทธิ์ที่สอดคล้องกันไม่แตกต่างจากศูนย์อย่างมีนัยสำคัญโดยมีความน่าจะเป็น `P` ที่กำหนด

ในการประเมินคุณภาพของคำอธิบายของความสัมพันธ์เชิงเส้น คุณสามารถเปรียบเทียบ `S_(y, ส่วนที่เหลือ)^2` และ `S_(bar y)` ที่สัมพันธ์กับค่าเฉลี่ยโดยใช้เกณฑ์ของฟิชเชอร์

`S_(แถบ y) = frac(sum_(i=1)^n (y_i — แถบ y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i= 1)^n y_i) /n)^2) (n-1)` - การประมาณค่าตัวอย่างของความแปรปรวน `y` ที่สัมพันธ์กับค่าเฉลี่ย

เพื่อประเมินประสิทธิผลของสมการถดถอยเพื่ออธิบายการพึ่งพา จะมีการคำนวณค่าสัมประสิทธิ์ฟิชเชอร์
`F = S_(บาร์ y) / S_(y, พัก)^2`,
ซึ่งเปรียบเทียบกับค่าสัมประสิทธิ์ฟิชเชอร์แบบตาราง `F(p, n-1, n-2)`

ถ้า `F > F(P, n-1, n-2)` ความแตกต่างระหว่างคำอธิบายของความสัมพันธ์ `y = f(x)` โดยใช้สมการการถดถอยและคำอธิบายที่ใช้ค่าเฉลี่ยจะถือว่ามีนัยสำคัญทางสถิติและมีความน่าจะเป็น ป. เหล่านั้น. การถดถอยอธิบายการพึ่งพาได้ดีกว่าการแพร่กระจายของ `y` รอบค่าเฉลี่ย

คลิกที่แผนภูมิ
เพื่อเพิ่มค่าลงในตาราง

วิธีกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก a, b, c ซึ่งเป็นการพึ่งพาฟังก์ชันที่ยอมรับ

วิธีกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก ก ข ค...ยอมรับการพึ่งพาการทำงาน

y = ฉ(x,a,b,c,…),

ซึ่งจะให้ค่ากำลังสองเฉลี่ยขั้นต่ำ (ความแปรปรวน) ของข้อผิดพลาด

, (24)

โดยที่ x i, y i คือชุดของตัวเลขคู่ที่ได้จากการทดลอง

เนื่องจากเงื่อนไขสำหรับส่วนปลายของฟังก์ชันของตัวแปรหลายตัวคือเงื่อนไขที่อนุพันธ์ย่อยของมันมีค่าเท่ากับศูนย์ ดังนั้นพารามิเตอร์ ก ข ค...ถูกกำหนดจากระบบสมการ:

; ; ; … (25)

ต้องจำไว้ว่าใช้วิธีกำลังสองน้อยที่สุดเพื่อเลือกพารามิเตอร์หลังประเภทของฟังก์ชัน ย = ฉ(x)กำหนดไว้

จากการพิจารณาทางทฤษฎี หากไม่สามารถสรุปได้ว่าสูตรเชิงประจักษ์ควรเป็นเช่นไร ก็จะต้องได้รับคำแนะนำจากการแสดงภาพ โดยหลักๆ แล้วจะแสดงด้วยกราฟิกของข้อมูลที่สังเกตได้

ในทางปฏิบัติ มักจำกัดอยู่เพียงฟังก์ชันประเภทต่อไปนี้:

1) เชิงเส้น ;

2) กำลังสอง

การเขียนโปรแกรม

บทช่วยสอน

การแนะนำ

ฉันเป็นนักคณิตศาสตร์และโปรแกรมเมอร์ ก้าวกระโดดครั้งใหญ่ที่สุดในอาชีพการงานของฉันคือตอนที่ฉันเรียนรู้ที่จะพูดว่า: “ฉันไม่เข้าใจอะไรเลย!”ตอนนี้ฉันไม่ละอายที่จะบอกผู้ทรงคุณวุฒิด้านวิทยาศาสตร์ว่าเขากำลังบรรยายให้ฉันฟัง ฉันไม่เข้าใจว่าเขาซึ่งเป็นผู้ทรงคุณวุฒิกำลังบอกอะไรฉัน และมันยากมาก ใช่แล้ว การยอมรับความไม่รู้ของคุณเป็นเรื่องยากและน่าอาย ใครชอบยอมรับว่าเขาไม่รู้พื้นฐานของบางสิ่งบางอย่าง? เนื่องจากอาชีพของฉันฉันต้องเข้าร่วม ปริมาณมากการนำเสนอและการบรรยาย ซึ่งฉันยอมรับว่าในกรณีส่วนใหญ่ฉันต้องการนอนเพราะฉันไม่เข้าใจอะไรเลย แต่ฉันไม่เข้าใจเพราะปัญหาใหญ่ของสถานการณ์ทางวิทยาศาสตร์ในปัจจุบันอยู่ที่คณิตศาสตร์ ถือว่าผู้ฟังทุกคนคุ้นเคยกับคณิตศาสตร์ทุกด้านอย่างแน่นอน (ซึ่งไร้สาระ) การยอมรับว่าคุณไม่รู้ว่าอนุพันธ์คืออะไร (เราจะพูดถึงมันในภายหลัง) เป็นเรื่องน่าละอาย

แต่ฉันเรียนรู้ที่จะบอกว่า ฉันไม่รู้ว่าการคูณคืออะไร ใช่ ฉันไม่รู้ว่าพีชคณิตย่อยสำหรับพีชคณิตโกหกคืออะไร ใช่ ฉันไม่รู้ว่าทำไมถึงจำเป็นในชีวิต สมการกำลังสอง- ยังไงก็ตามถ้าคุณแน่ใจว่าคุณรู้เรามีเรื่องต้องคุยกัน! คณิตศาสตร์เป็นชุดของเทคนิค นักคณิตศาสตร์พยายามสร้างความสับสนและข่มขู่สาธารณชน ที่ใดไม่สับสน ไม่มีชื่อเสียง ไม่มีอำนาจ ใช่ เป็นเรื่องน่ายกย่องที่จะพูดโดยใช้ภาษาที่เป็นนามธรรมมากที่สุดเท่าที่จะเป็นไปได้ ซึ่งถือเป็นเรื่องไร้สาระโดยสิ้นเชิง

คุณรู้หรือไม่ว่าอนุพันธ์คืออะไร? เป็นไปได้มากว่าคุณจะบอกฉันเกี่ยวกับขีดจำกัดของอัตราส่วนส่วนต่าง ในปีแรกของวิชาคณิตศาสตร์และกลศาสตร์ที่มหาวิทยาลัยแห่งรัฐเซนต์ปีเตอร์สเบิร์ก Viktor Petrovich Khavin บอกฉัน มุ่งมั่นอนุพันธ์เป็นค่าสัมประสิทธิ์ของเทอมแรกของอนุกรมเทย์เลอร์ของฟังก์ชัน ณ จุดหนึ่ง (นี่เป็นยิมนาสติกแยกต่างหากเพื่อกำหนดอนุกรมเทย์เลอร์ที่ไม่มีอนุพันธ์) ฉันหัวเราะกับคำจำกัดความนี้มานานจนในที่สุดฉันก็เข้าใจความหมายของมัน อนุพันธ์นั้นไม่มีอะไรมากไปกว่าการวัดง่ายๆ ว่าฟังก์ชันที่เราหาอนุพันธ์มีความคล้ายคลึงกับฟังก์ชัน y=x, y=x^2, y=x^3 แค่ไหน

ตอนนี้ผมได้รับเกียรติบรรยายให้กับนักศึกษาที่ เกรงกลัวคณิตศาสตร์. ถ้ากลัวคณิตเราก็ไปในทางเดียวกัน ทันทีที่คุณพยายามอ่านข้อความและดูเหมือนว่ามันซับซ้อนเกินไป จงรู้ว่ามันเขียนได้ไม่ดี ฉันยืนยันว่าไม่มีคณิตศาสตร์เพียงด้านเดียวที่ไม่สามารถพูดคุยแบบ "บนนิ้ว" ได้โดยไม่สูญเสียความแม่นยำ

งานมอบหมายสำหรับอนาคตอันใกล้นี้: ฉันมอบหมายให้นักเรียนเข้าใจว่าตัวควบคุมกำลังสองเชิงเส้นคืออะไร อย่าอาย ใช้เวลาสามนาทีในชีวิตของคุณแล้วไปตามลิงก์ หากคุณไม่เข้าใจอะไรเลยเราก็อยู่บนเส้นทางเดียวกัน ฉัน (นักคณิตศาสตร์-โปรแกรมเมอร์มืออาชีพ) ไม่เข้าใจอะไรเลยเช่นกัน และฉันรับรองกับคุณว่า คุณจะเข้าใจสิ่งนี้ได้ "ด้วยนิ้วของคุณ" บน ในขณะนี้ฉันไม่รู้ว่ามันคืออะไร แต่ฉันรับรองว่าเราจะเข้าใจมันได้

ดังนั้น การบรรยายครั้งแรกที่ฉันจะบรรยายให้กับนักเรียนของฉัน หลังจากที่พวกเขาวิ่งมาหาฉันด้วยความสยดสยองและบอกว่าตัวควบคุมกำลังสองเชิงเส้นเป็นสิ่งที่แย่ที่คุณจะไม่มีวันเชี่ยวชาญในชีวิตของคุณคือ วิธีกำลังสองน้อยที่สุด- คุณสามารถตัดสินใจ สมการเชิงเส้น- หากคุณกำลังอ่านข้อความนี้ มีแนวโน้มว่าจะไม่เป็นเช่นนั้น

ดังนั้น เมื่อพิจารณาจุดสองจุด (x0, y0), (x1, y1) เช่น (1,1) และ (3,2) ภารกิจคือการหาสมการของเส้นตรงที่ผ่านจุดสองจุดนี้:

ภาพประกอบ

บรรทัดนี้ควรมีสมการดังต่อไปนี้:

ที่นี่เราไม่รู้จักอัลฟ่าและเบต้า แต่ทราบสองประเด็นของบรรทัดนี้:

เราสามารถเขียนสมการนี้ในรูปแบบเมทริกซ์:

ที่นี่เราควรพูดนอกเรื่องโคลงสั้น ๆ: เมทริกซ์คืออะไร? เมทริกซ์ไม่มีอะไรมากไปกว่าอาร์เรย์สองมิติ นี่เป็นวิธีการจัดเก็บข้อมูล ไม่ควรแนบความหมายเพิ่มเติมเข้าไปด้วย ขึ้นอยู่กับเราว่าจะตีความเมทริกซ์บางตัวอย่างไร ผมจะตีความเป็นระยะๆ ว่าเป็นการแมปเชิงเส้น เป็นระยะๆ เป็นรูปกำลังสอง และบางครั้งก็เป็นเพียงเซตของเวกเตอร์ ทั้งหมดนี้จะมีการชี้แจงในบริบท

ลองแทนที่เมทริกซ์คอนกรีตด้วยการแสดงเชิงสัญลักษณ์:

จากนั้น (อัลฟ่า, เบต้า) สามารถพบได้ง่าย:

โดยเฉพาะอย่างยิ่งสำหรับข้อมูลก่อนหน้าของเรา:

ซึ่งนำไปสู่สมการของเส้นที่ผ่านจุด (1,1) และ (3,2) ต่อไปนี้:

โอเคทุกอย่างชัดเจนที่นี่ ลองหาสมการของเส้นที่ผ่าน สามคะแนน: (x0,y0), (x1,y1) และ (x2,y2):

โอ้ โอ้ แต่เรามีสมการสามสมการสำหรับสิ่งไม่รู้สองตัว! นักคณิตศาสตร์มาตรฐานจะบอกว่าไม่มีวิธีแก้ปัญหา โปรแกรมเมอร์จะพูดอะไร? และเขาจะเขียนระบบสมการก่อนหน้านี้ใหม่ในรูปแบบต่อไปนี้:

ในกรณีของเรา เวกเตอร์ i,j,bสามมิติ ดังนั้น (ใน กรณีทั่วไป) ไม่มีวิธีแก้ไขสำหรับระบบนี้ เวกเตอร์ใดๆ (alpha\*i + beta\*j) อยู่ในระนาบที่ทอดโดยเวกเตอร์ (i, j) ถ้า b ไม่ได้อยู่ในระนาบนี้ แสดงว่าไม่มีทางแก้ (สมการไม่สามารถบรรลุความเท่าเทียมกันได้) จะทำอย่างไร? ลองมองหาการประนีประนอม เรามาแสดงแทนด้วย อี(อัลฟา, เบต้า)เราไม่สามารถบรรลุถึงความเท่าเทียมกันได้ไกลแค่ไหน:

และเราจะพยายามลดข้อผิดพลาดนี้ให้เหลือน้อยที่สุด:

ทำไมต้องเหลี่ยม?

เราไม่ได้มองหาแค่ค่าขั้นต่ำของบรรทัดฐานเท่านั้น แต่ยังมองหาค่าขั้นต่ำของค่ากำลังสองของค่ามาตรฐานอีกด้วย ทำไม จุดต่ำสุดนั้นเกิดขึ้นพร้อมกัน และกำลังสองให้ฟังก์ชันที่ราบรื่น (ฟังก์ชันกำลังสองของอาร์กิวเมนต์ (อัลฟา, เบตา)) ในขณะที่ความยาวเพียงอย่างเดียวให้ฟังก์ชันรูปทรงกรวย ซึ่งหาความแตกต่างไม่ได้ที่จุดต่ำสุด บร. สี่เหลี่ยมจะสะดวกกว่า

แน่นอนว่าข้อผิดพลาดจะลดลงเมื่อเวกเตอร์ จตั้งฉากกับระนาบที่ทอดโดยเวกเตอร์ ฉันและ เจ.

ภาพประกอบ

กล่าวอีกนัยหนึ่ง: เรากำลังมองหาเส้นตรงที่ทำให้ผลรวมของความยาวกำลังสองของระยะทางจากจุดทั้งหมดถึงเส้นตรงนี้มีค่าน้อยที่สุด:

อัปเดต: ฉันมีปัญหาที่นี่ ควรวัดระยะห่างถึงเส้นตรงในแนวตั้ง ไม่ใช่โดยการฉายภาพแบบตั้งฉาก นักวิจารณ์พูดถูก

ภาพประกอบ

ในคำที่แตกต่างกันโดยสิ้นเชิง (อย่างระมัดระวัง มีรูปแบบที่ไม่ดี แต่ควรชัดเจน): เราจะนำเส้นที่เป็นไปได้ทั้งหมดระหว่างจุดทุกคู่และมองหาเส้นค่าเฉลี่ยระหว่างทั้งหมด:

ภาพประกอบ

คำอธิบายอีกประการหนึ่งตรงไปตรงมา: เราแนบสปริงระหว่างจุดข้อมูลทั้งหมด (ในที่นี้เรามีสามจุด) กับเส้นตรงที่เรากำลังมองหา และเส้นตรงของสถานะสมดุลคือสิ่งที่เรากำลังมองหา

รูปแบบกำลังสองขั้นต่ำ

แล้วให้เวกเตอร์นี้มา ขและระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ ก(ในกรณีนี้ (x0,x1,x2) และ (1,1,1)) เรากำลังมองหาเวกเตอร์ จด้วยความยาวกำลังสองขั้นต่ำ แน่นอนว่าค่าต่ำสุดสามารถทำได้สำหรับเวกเตอร์เท่านั้น จตั้งฉากกับระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ ก:

กล่าวอีกนัยหนึ่ง เรากำลังมองหาเวกเตอร์ x=(alpha, beta) ดังนี้:

ฉันขอเตือนคุณว่าเวกเตอร์นี้ x=(alpha, beta) คือค่าต่ำสุดของฟังก์ชันกำลังสอง ||e(alpha, beta)||^2:

ในที่นี้จะมีประโยชน์ที่จะจำไว้ว่าเมทริกซ์สามารถแปลเป็นรูปแบบกำลังสองได้เช่นกัน ตัวอย่างเช่น เมทริกซ์เอกลักษณ์ ((1,0),(0,1)) สามารถตีความได้ว่าเป็นฟังก์ชัน x^2 + y^ 2:

รูปแบบกำลังสอง

ยิมนาสติกทั้งหมดนี้เรียกว่าการถดถอยเชิงเส้น

สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์

ตอนนี้งานจริงที่ง่ายที่สุด: มีพื้นผิวรูปสามเหลี่ยมบางอย่างจำเป็นต้องทำให้เรียบ ตัวอย่างเช่น ลองโหลดแบบจำลองใบหน้าของฉัน:

คอมมิตดั้งเดิมพร้อมใช้งาน เพื่อลดการพึ่งพาภายนอก ฉันจึงนำโค้ดของตัวเรนเดอร์ซอฟต์แวร์ของฉันไปไว้ใน Habré แล้ว เพื่อแก้ปัญหา ระบบเชิงเส้นฉันใช้ OpenNL มันเป็นตัวแก้ปัญหาที่ยอดเยี่ยม แต่ติดตั้งได้ยากมาก: คุณต้องคัดลอกสองไฟล์ (.h+.c) ไปยังโฟลเดอร์ที่มีโปรเจ็กต์ของคุณ การปรับให้เรียบทั้งหมดทำได้ด้วยรหัสต่อไปนี้:

สำหรับ (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&ใบหน้า = ใบหน้า[i];<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

สำหรับ (int j=0; j

พิกัด X, Y และ Z แยกจากกันได้ ฉันปรับให้แยกกัน นั่นคือ ฉันแก้สมการเชิงเส้นสามระบบ โดยแต่ละระบบมีตัวแปรจำนวนหนึ่งเท่ากับจำนวนจุดยอดในแบบจำลองของฉัน n แถวแรกของเมทริกซ์ A มีเพียง 1 แถวต่อแถว และ n แถวแรกของเวกเตอร์ b มีพิกัดโมเดลดั้งเดิม นั่นคือฉันผูกสปริงระหว่างตำแหน่งใหม่ของจุดยอดกับตำแหน่งเก่าของจุดยอด - สปริงใหม่ไม่ควรเคลื่อนไปไกลจากจุดยอดเก่ามากเกินไป

อีกครั้งหนึ่ง: จุดยอดทั้งหมดเป็นตัวแปร และไม่สามารถเคลื่อนไปไกลจากตำแหน่งเดิมได้ แต่ในขณะเดียวกัน จุดยอดก็พยายามที่จะคล้ายกัน

นี่คือผลลัพธ์:

ทุกอย่างจะเรียบร้อยดี ตัวแบบมีความเรียบเนียนมาก แต่มันขยับออกไปจากขอบเดิม มาเปลี่ยนรหัสกันหน่อย:

สำหรับ (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

ในเมทริกซ์ A ของเรา สำหรับจุดยอดที่อยู่บนขอบ ฉันไม่ได้เพิ่มแถวจากหมวดหมู่ v_i = verts[i][d] แต่เพิ่ม 1,000*v_i = 1,000*verts[i][d] สิ่งนี้สร้างความแตกต่างอะไร? และนี่เปลี่ยนรูปแบบข้อผิดพลาดกำลังสองของเรา ตอนนี้ค่าเบี่ยงเบนเดียวจากด้านบนที่ขอบจะไม่มีราคาหนึ่งหน่วยเหมือนเมื่อก่อน แต่ราคา 1,000*1,000 หน่วย นั่นคือเราแขวนสปริงที่แข็งแรงกว่าไว้ที่จุดยอดสุดขั้ว วิธีแก้ปัญหาจะชอบยืดสปริงที่เหลือให้แรงกว่า นี่คือผลลัพธ์:

เพิ่มความแรงของสปริงระหว่างจุดยอดเป็นสองเท่า:
nlค่าสัมประสิทธิ์(หน้า[ j ], 2);

nlค่าสัมประสิทธิ์(หน้า[(j+1)%3], -2);

เป็นเหตุผลที่พื้นผิวเรียบขึ้น:

และตอนนี้แข็งแกร่งขึ้นอีกร้อยเท่า:

นี่คืออะไร? ลองนึกภาพว่าเราจุ่มวงแหวนลวดลงในน้ำสบู่ เป็นผลให้ฟิล์มสบู่ที่ได้จะพยายามมีความโค้งน้อยที่สุดเท่าที่จะทำได้โดยสัมผัสกับขอบ - วงแหวนลวดของเรา นี่คือสิ่งที่เราได้จากการแก้ไขขอบและขอให้มีพื้นผิวเรียบภายใน ยินดีด้วย เราเพิ่งแก้สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์ได้ ฟังดูเจ๋งใช่ไหม? แต่ในความเป็นจริง คุณแค่ต้องแก้สมการเชิงเส้นระบบเดียว

สมการของปัวซอง

จำชื่อเจ๋ง ๆ อีกอันหนึ่ง

สมมติว่าฉันมีภาพเช่นนี้:

ดูดีสำหรับทุกคน แต่ฉันไม่ชอบเก้าอี้

ฉันจะตัดภาพออกครึ่งหนึ่ง:

และฉันจะเลือกเก้าอี้ด้วยมือของฉัน:

สำหรับ (int i=0; i

นี่คือผลลัพธ์:

จากนั้น ผมจะดึงทุกอย่างที่เป็นสีขาวในหน้ากากไปทางด้านซ้ายของภาพ และในขณะเดียวกัน ผมจะพูดทั่วทั้งภาพว่าความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันควรเท่ากับความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันบน ภาพขวา:

รหัสและรูปภาพที่มีอยู่ กภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว ขใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว

สูตรการหาค่าสัมประสิทธิ์ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การหาอนุพันธ์ย่อยของฟังก์ชัน โดยตัวแปร กภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว ขและ

, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์

ที่ให้ไว้ กภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว ขเราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น วิธีการแทนที่หรือวิธีแครมเมอร์) และรับสูตรสำหรับการค้นหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM) การทำงาน

นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กใช้ค่าที่น้อยที่สุด nมีผลรวม , , และพารามิเตอร์ ขพบได้หลังการคำนวณ ก.

พื้นที่หลักของการประยุกต์ใช้พหุนามดังกล่าวคือการประมวลผลข้อมูลการทดลอง (การสร้างสูตรเชิงประจักษ์) ความจริงก็คือพหุนามการประมาณค่าที่สร้างขึ้นจากค่าฟังก์ชันที่ได้รับจากการทดลองจะได้รับอิทธิพลอย่างมากจาก "สัญญาณรบกวนจากการทดลอง" ยิ่งไปกว่านั้น เมื่อทำการประมาณค่า โหนดการแก้ไขจะไม่สามารถทำซ้ำได้ เช่น ไม่สามารถใช้ผลการทดลองซ้ำภายใต้เงื่อนไขเดียวกันได้ พหุนามกำลังสองเฉลี่ยรากจะช่วยลดสัญญาณรบกวนและช่วยให้คุณใช้ผลลัพธ์ของการทดลองหลายรายการได้

การบูรณาการเชิงตัวเลขและการสร้างความแตกต่าง ตัวอย่าง.

การบูรณาการเชิงตัวเลข– การคำนวณค่าอินทิกรัลจำกัดเขต (ปกติจะเป็นค่าประมาณ) การอินทิกรัลเชิงตัวเลขเป็นที่เข้าใจกันว่าเป็นชุดของวิธีการเชิงตัวเลขในการค้นหาค่าของอินทิกรัลจำนวนหนึ่ง

ความแตกต่างเชิงตัวเลข– ชุดวิธีการคำนวณค่าอนุพันธ์ของฟังก์ชันที่ระบุแยกกัน

บูรณาการ

คำชี้แจงของปัญหาการกำหนดทางคณิตศาสตร์ของปัญหา: จำเป็นต้องค้นหาค่าของอินทิกรัลจำกัดเขต

โดยที่ a, b มีจำนวนจำกัด f(x) ต่อเนื่องกันบน [a, b]

เมื่อแก้ไขปัญหาเชิงปฏิบัติ มักจะเกิดขึ้นว่าอินทิกรัลไม่สะดวกหรือเป็นไปไม่ได้ในการวิเคราะห์: อาจไม่สามารถแสดงในฟังก์ชันเบื้องต้น สามารถกำหนดอินทิกรัลในรูปแบบของตาราง ฯลฯ ในกรณีเช่นนี้ วิธีการอินทิเกรตเชิงตัวเลขคือ ใช้แล้ว. วิธีการบูรณาการเชิงตัวเลขใช้แทนที่พื้นที่ของสี่เหลี่ยมคางหมูโค้งด้วยผลรวมจำกัดของพื้นที่ของรูปทรงเรขาคณิตที่เรียบง่ายกว่าซึ่งสามารถคำนวณได้อย่างแน่นอน ในแง่นี้ พวกเขาพูดถึงการใช้สูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัส

วิธีการส่วนใหญ่ใช้การแสดงอินทิกรัลเป็นผลรวมจำกัด (สูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัส):

พื้นฐานของสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสคือแนวคิดในการแทนที่กราฟของปริพันธ์ในส่วนการรวมด้วยฟังก์ชันในรูปแบบที่เรียบง่ายกว่าซึ่งสามารถรวมเข้าด้วยกันในเชิงวิเคราะห์ได้อย่างง่ายดายและคำนวณได้ง่าย งานสร้างสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสนั้นง่ายที่สุดสำหรับแบบจำลองทางคณิตศาสตร์พหุนาม

สามารถแยกแยะวิธีการได้สามกลุ่ม:

1. วิธีการแบ่งส่วนการรวมออกเป็นระยะเท่ากัน การแบ่งพาร์ติชันเป็นช่วงๆ จะทำล่วงหน้า โดยปกติแล้วช่วงต่างๆ จะถูกเลือกให้เท่ากัน (เพื่อให้ง่ายต่อการคำนวณฟังก์ชันที่จุดสิ้นสุดของช่วง) คำนวณพื้นที่และสรุปผล (สี่เหลี่ยม สี่เหลี่ยมคางหมู วิธีซิมป์สัน)

2. วิธีการแบ่งพาร์ติชันส่วนการรวมโดยใช้จุดพิเศษ (วิธี Gauss)

3. การคำนวณปริพันธ์โดยใช้ตัวเลขสุ่ม (วิธีมอนติคาร์โล)

วิธีสี่เหลี่ยมผืนผ้าปล่อยให้ฟังก์ชัน (รูป) จำเป็นต้องรวมเข้ากับตัวเลขในส่วนนั้น แบ่งส่วนออกเป็น N ช่วงเวลาเท่ากัน พื้นที่ของสี่เหลี่ยมคางหมูโค้ง N แต่ละอันสามารถถูกแทนที่ด้วยพื้นที่ของสี่เหลี่ยม

ความกว้างของสี่เหลี่ยมทั้งหมดเท่ากันและเท่ากัน:

หากต้องการเลือกความสูงของสี่เหลี่ยม คุณสามารถเลือกค่าของฟังก์ชันที่ขอบด้านซ้ายได้ ในกรณีนี้ ความสูงของสี่เหลี่ยมผืนผ้าแรกจะเป็น f(a) สี่เหลี่ยมผืนผ้าที่สอง - f(x 1),..., N-f(N-1)

หากเราใช้ค่าของฟังก์ชันบนเส้นขอบด้านขวาเพื่อเลือกความสูงของสี่เหลี่ยมผืนผ้า ในกรณีนี้ ความสูงของสี่เหลี่ยมผืนผ้าแรกจะเป็น f(x 1) ส่วนที่สอง - f(x 2) ... , ยังไม่มีข้อความ - ฉ(x ยังไม่มีข้อความ).

อย่างที่คุณเห็นในกรณีนี้สูตรใดสูตรหนึ่งให้ค่าประมาณอินทิกรัลที่มีส่วนเกินและสูตรที่สองมีข้อบกพร่อง มีวิธีอื่น - การใช้ค่าของฟังก์ชันที่อยู่ตรงกลางของเซ็กเมนต์การรวมสำหรับการประมาณ:

การประมาณค่าความผิดพลาดสัมบูรณ์ของวิธีสี่เหลี่ยม (ตรงกลาง)

การประมาณค่าความคลาดเคลื่อนสัมบูรณ์ของวิธีสี่เหลี่ยมด้านซ้ายและขวา

ตัวอย่าง.คำนวณช่วงเวลาทั้งหมดและแบ่งช่วงเวลาออกเป็นสี่ส่วน

สารละลาย.การคำนวณเชิงวิเคราะห์ของอินทิกรัลนี้ให้ I=arctg(1)–arctg(0)=0.7853981634 ในกรณีของเรา:

1)ซ = 1; เอ็กซ์โอ = 0; x1 = 1;

2) ชั่วโมง = 0.25 (1/4); x0 = 0; x1 = 0.25; x2 = 0.5; x3 = 0.75; x4 = 1;

ลองคำนวณโดยใช้วิธีสี่เหลี่ยมด้านซ้าย:

ลองคำนวณโดยใช้วิธีสี่เหลี่ยมด้านขวา:

ลองคำนวณโดยใช้วิธีสี่เหลี่ยมผืนผ้าเฉลี่ย:

วิธีสี่เหลี่ยมคางหมูใช้พหุนามดีกรีหนึ่ง (เส้นตรงที่ลากผ่านจุดสองจุด) เพื่อประมาณค่าผลลัพธ์ในสูตรสี่เหลี่ยมคางหมู จุดสิ้นสุดของเซ็กเมนต์การรวมจะถูกถือเป็นโหนดการแก้ไข ดังนั้นสี่เหลี่ยมคางหมูโค้งจะถูกแทนที่ด้วยสี่เหลี่ยมคางหมูธรรมดาซึ่งพื้นที่นี้สามารถพบได้เป็นผลคูณของผลรวมครึ่งหนึ่งของฐานและความสูง

ในกรณีของเซ็กเมนต์การรวม N สำหรับโหนดทั้งหมด ยกเว้นจุดที่สุดของเซกเมนต์ ค่าของฟังก์ชันจะรวมอยู่ในผลรวมทั้งหมดสองครั้ง (เนื่องจากสี่เหลี่ยมคางหมูที่อยู่ติดกันมีด้านเดียวร่วมกัน)

สูตรสี่เหลี่ยมคางหมูหาได้จากผลรวมครึ่งหนึ่งของสูตรรูปสี่เหลี่ยมผืนผ้าตามขอบด้านขวาและด้านซ้ายของส่วน:

ตรวจสอบความเสถียรของสารละลายตามกฎแล้ว ยิ่งความยาวของแต่ละช่วงเวลาสั้นลง เช่น ยิ่งจำนวนช่วงเวลาเหล่านี้มากขึ้นเท่าใด ความแตกต่างระหว่างค่าโดยประมาณและค่าที่แน่นอนของอินทิกรัลก็จะน้อยลงเท่านั้น นี่เป็นเรื่องจริงสำหรับฟังก์ชันส่วนใหญ่ ในวิธีสี่เหลี่ยมคางหมู ข้อผิดพลาดในการคำนวณอินทิกรัล ϭ นั้นเป็นสัดส่วนโดยประมาณกับกำลังสองของขั้นตอนการอินทิเกรต (ϭ ~ h 2) ดังนั้นในการคำนวณอินทิกรัลของฟังก์ชันบางอย่างในรูปของ a, b จึงจำเป็นต้อง แบ่งส่วนออกเป็นช่วง N 0 แล้วหาผลรวมของพื้นที่สี่เหลี่ยมคางหมู จากนั้นคุณจะต้องเพิ่มจำนวนช่วงเวลา N 1 คำนวณผลรวมของสี่เหลี่ยมคางหมูอีกครั้งและเปรียบเทียบค่าผลลัพธ์กับผลลัพธ์ก่อนหน้า ควรทำซ้ำจนกระทั่ง (N i) จนกระทั่งได้ความแม่นยำที่ระบุของผลลัพธ์ (เกณฑ์การลู่เข้า)

สำหรับวิธีสี่เหลี่ยมและสี่เหลี่ยมคางหมู โดยทั่วไปในแต่ละขั้นตอนการวนซ้ำ จำนวนช่วงเวลาจะเพิ่มขึ้น 2 เท่า (N i +1 = 2N i)

เกณฑ์การลู่เข้า:

ข้อได้เปรียบหลักของกฎสี่เหลี่ยมคางหมูคือความเรียบง่าย อย่างไรก็ตาม หากการคำนวณอินทิกรัลต้องใช้ความแม่นยำสูง วิธีนี้อาจต้องใช้การวนซ้ำมากเกินไป

ข้อผิดพลาดสัมบูรณ์ของวิธีสี่เหลี่ยมคางหมูประมาณว่า
.

ตัวอย่าง.คำนวณอินทิกรัลจำกัดเขตโดยประมาณโดยใช้สูตรสี่เหลี่ยมคางหมู

ก) การแบ่งส่วนของการบูรณาการออกเป็น 3 ส่วน
b) การแบ่งส่วนของการรวมออกเป็น 5 ส่วน

สารละลาย:
ก) ตามเงื่อนไขนั้น ส่วนบูรณาการจะต้องแบ่งออกเป็น 3 ส่วน กล่าวคือ
ลองคำนวณความยาวของแต่ละส่วนของพาร์ติชัน: .

ดังนั้นสูตรทั่วไปของสี่เหลี่ยมคางหมูจึงลดลงเหลือขนาดที่น่าพอใจ:

ในที่สุด:

ฉันขอเตือนคุณว่าค่าผลลัพธ์คือค่าโดยประมาณของพื้นที่

b) มาแบ่งส่วนการรวมออกเป็น 5 ส่วนเท่า ๆ กันนั่นคือ ด้วยการเพิ่มจำนวนเซ็กเมนต์เราจะเพิ่มความแม่นยำในการคำนวณ

ถ้า ดังนั้นสูตรสี่เหลี่ยมคางหมูจะอยู่ในรูปแบบต่อไปนี้:

มาหาขั้นตอนของพาร์ติชั่นกัน:
นั่นคือความยาวของส่วนตรงกลางแต่ละส่วนคือ 0.6

เมื่อจบงาน จะสะดวกในการคำนวณทั้งหมดอย่างเป็นทางการโดยใช้ตารางการคำนวณ:

ในบรรทัดแรกเราเขียนว่า "ตัวนับ"

เป็นผลให้:

มีการชี้แจงจริงๆและเป็นเรื่องจริงจัง!
หากเป็น 3 ส่วนพาร์ติชันก็จะมี 5 ส่วน หากคุณใช้ส่วนที่ใหญ่กว่านี้ => มันจะแม่นยำยิ่งขึ้น

สูตรซิมป์สันสูตรสี่เหลี่ยมคางหมูให้ผลลัพธ์ที่ขึ้นอยู่กับขนาดขั้นตอน h อย่างมาก ซึ่งส่งผลต่อความแม่นยำในการคำนวณอินทิกรัลบางตัว โดยเฉพาะอย่างยิ่งในกรณีที่ฟังก์ชันนั้นไม่ใช่แบบโมโนโทนิก เราสามารถสันนิษฐานได้ว่าความแม่นยำในการคำนวณเพิ่มขึ้น ถ้าเราแทนที่จะใช้ส่วนตรงมาแทนที่ส่วนโค้งของกราฟของฟังก์ชัน f(x) เราใช้ เช่น ชิ้นส่วนของพาราโบลาที่ให้ผ่านจุดสามจุดที่อยู่ติดกันของกราฟ การตีความทางเรขาคณิตนี้เป็นไปตามวิธีของซิมป์สันในการคำนวณอินทิกรัลจำกัดเขต ช่วงการรวม a,b ทั้งหมดแบ่งออกเป็นส่วน N ส่วนความยาวของส่วนจะเท่ากับ h=(b-a)/N เช่นกัน

สูตรของ Simpson มีลักษณะดังนี้:

ระยะเวลาที่เหลือ

เมื่อความยาวของเซ็กเมนต์เพิ่มขึ้น ความแม่นยำของสูตรจะลดลง ดังนั้น เพื่อเพิ่มความแม่นยำ จึงใช้สูตรผสมของซิมป์สัน ช่วงการรวมทั้งหมดแบ่งออกเป็นเซ็กเมนต์ N ที่เหมือนกันเป็นจำนวนคู่ ความยาวของเซ็กเมนต์จะเท่ากับ h=(b-a)/N สูตรสารประกอบของซิมป์สันคือ:

ในสูตร นิพจน์ในวงเล็บจะแสดงผลรวมของค่าปริพันธ์ที่ส่วนท้ายของส่วนภายในคี่และคู่ตามลำดับ

สูตรที่เหลือของซิมป์สันเป็นสัดส่วนกับกำลังที่สี่ของขั้นตอน:

ตัวอย่าง:ใช้กฎของซิมป์สันในการคำนวณอินทิกรัล (วิธีแก้ปัญหาที่แน่นอน - 0.2)

วิธีเกาส์

สูตรกำลังสองแบบเกาส์เซียน- หลักการพื้นฐานของสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสประเภทที่สองมองเห็นได้จากรูปที่ 1.12: จำเป็นต้องวางจุดในลักษณะนี้ เอ็กซ์ 0 และ เอ็กซ์ 1 ภายในส่วน [ ก;ข] เพื่อให้พื้นที่รวมของ "สามเหลี่ยม" เท่ากับพื้นที่ของ "ส่วน" เมื่อใช้สูตรเกาส์ ส่วนเดิม [ ก;ข] ถูกลดขนาดลงเป็นส่วน [-1;1] โดยการแทนที่ตัวแปร เอ็กซ์บน

0.5∙(ข– ก)∙ที+ 0.5∙(ข + ก).

แล้ว , ที่ไหน .

การทดแทนดังกล่าวเป็นไปได้หาก กและ ขมีขอบเขตจำกัดและฟังก์ชัน ฉ(x) ต่อเนื่องบน [ ก;ข- สูตรเกาส์ที่ nคะแนน x ฉัน, ฉัน=0,1,..,n-1 ภายในส่วน [ ก;ข]:

, (1.27)

ที่ไหน ฉันและ ฉันสำหรับต่างๆ nมีระบุไว้ในหนังสืออ้างอิง เช่น เมื่อใด n=2 ก 0 =ก 1 =1; ที่ n=3: ที 0 =ต 2 "0.775, ที 1 =0, ก 0 =ก 2 "0.555, ก 1"0.889.

สูตรกำลังสองแบบเกาส์เซียน

ได้มาจากฟังก์ชันน้ำหนักเท่ากับความสามัคคี พี(เอ็กซ์)= 1 และโหนด x ฉันซึ่งเป็นรากของพหุนามลีเจนเดร

ราคาต่อรอง ฉันคำนวณง่ายโดยใช้สูตร

ฉัน=0,1,2,...n.

ค่าของโหนดและค่าสัมประสิทธิ์สำหรับ n=2,3,4,5 แสดงไว้ในตาราง

คำสั่ง	โหนด	ราคาต่อรอง
n=2	x1=0 x 0 =-x2=0.7745966692	เอ 1=8/9 ก 0 = ก 2=5/9
n=3	x 2 =-x1=0.3399810436 x 3 =-x 0=0.8611363116	ก 1 = ก 2=0.6521451549 ก 0 = ก 3=0.6521451549
n=4	x 2 = 0 x 3 = -x 1 = 0.5384693101 x 4 =-x 0 =0.9061798459	ก 0 =0.568888899 ก 3 =ก 1 =0.4786286705 ก 0 =ก 4 =0.2869268851
n=5	x 5 = -x 0 =0.9324695142 x 4 = -x 1 =0.6612093865 x 3 = -x 2 =0.2386191861	ก 5 =ก 0 =0.1713244924 ก 4 =ก 1 =0.3607615730 ก 3 =ก 2 =0.4679139346

ตัวอย่าง.คำนวณค่าโดยใช้สูตรเกาส์สำหรับ n=2:

ค่าที่แน่นอน: .

อัลกอริธึมสำหรับการคำนวณอินทิกรัลโดยใช้สูตรเกาส์ไม่ได้เกี่ยวข้องกับการเพิ่มจำนวนไมโครเซ็กเมนต์เป็นสองเท่า แต่เพิ่มจำนวนการจัดลำดับ 1 และเปรียบเทียบค่าที่ได้รับของอินทิกรัล ข้อดีของสูตรเกาส์คือมีความแม่นยำสูงโดยมีจำนวนเลขลำดับค่อนข้างน้อย ข้อเสีย: ไม่สะดวกสำหรับการคำนวณด้วยตนเอง จำเป็นต้องเก็บค่าไว้ในหน่วยความจำคอมพิวเตอร์ ฉัน, ฉันสำหรับต่างๆ n.

ข้อผิดพลาดของสูตรการสร้างพื้นที่สี่เหลี่ยมจัตุรัสเกาส์เซียนในส่วนจะเป็น สำหรับสูตรเทอมที่เหลือจะเป็น และค่าสัมประสิทธิ์ α เอ็นลดลงอย่างรวดเร็วตามการเติบโต เอ็น- ที่นี่

สูตรเกาส์เซียนให้ความแม่นยำสูงแม้จะมีจำนวนโหนดน้อย (ตั้งแต่ 4 ถึง 10) ในกรณีนี้ ในการคำนวณเชิงปฏิบัติ จำนวนโหนดมีตั้งแต่หลายร้อยถึงหลายพัน โปรดทราบด้วยว่าน้ำหนักของการสร้างสี่เหลี่ยมจัตุรัสแบบเกาส์เซียนจะเป็นค่าบวกเสมอ ซึ่งทำให้มั่นใจในความเสถียรของอัลกอริทึมในการคำนวณผลรวม

ความแตกต่างเมื่อแก้ไขปัญหา มักจำเป็นต้องค้นหาอนุพันธ์ของลำดับที่แน่นอนจากฟังก์ชัน f(x) ที่ให้ไว้ในตาราง นอกจากนี้ บางครั้งเนื่องจากความซับซ้อนของนิพจน์เชิงวิเคราะห์ของฟังก์ชัน f(x) การหาอนุพันธ์โดยตรงจึงยากเกินไป เช่นเดียวกับเมื่อแก้สมการเชิงอนุพันธ์เป็นตัวเลข ในกรณีเหล่านี้ จะใช้การสร้างความแตกต่างเชิงตัวเลข

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง

จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา

สาระสำคัญของวิธีกำลังสองน้อยที่สุด (LSM)

รหัสและรูปภาพที่มีอยู่ กและ ข ใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว

สูตรการหาค่าสัมประสิทธิ์

ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การค้นหาอนุพันธ์ย่อยของฟังก์ชันเทียบกับตัวแปร กและ ข, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์

เราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น โดยวิธีทดแทนหรือ ) และรับสูตรในการหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM)

ที่ให้ไว้ กและ ขการทำงาน ใช้ค่าที่น้อยที่สุด มีการให้หลักฐานข้อเท็จจริงนี้

นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กมีผลรวม , , และพารามิเตอร์ nมีผลรวม , , และพารามิเตอร์ ขพบได้หลังการคำนวณ ก.

ถึงเวลาจำตัวอย่างดั้งเดิมแล้ว

สารละลาย.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว

เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ

การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด

ตั้งแต่นั้นมาตรง y = 0.165x+2.184ใกล้เคียงกับข้อมูลเดิมดีกว่า

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LS)

เหตุใดจึงจำเป็น เหตุใดจึงต้องประมาณทั้งหมดนี้

การพิสูจน์.

3.5. วิธีกำลังสองน้อยที่สุด

งานแรกที่วางรากฐานของวิธีกำลังสองน้อยที่สุดดำเนินการโดย Legendre ในปี 1805 ในบทความ "วิธีการใหม่ในการกำหนดวงโคจรของดาวหาง" เขาเขียนว่า: "หลังจากใช้เงื่อนไขทั้งหมดของปัญหาอย่างเต็มที่แล้ว มีความจำเป็นต้องกำหนดค่าสัมประสิทธิ์เพื่อให้ขนาดของข้อผิดพลาดน้อยที่สุด วิธีที่ง่ายที่สุดในการบรรลุเป้าหมายนี้คือวิธีการที่ประกอบด้วยการค้นหาผลรวมขั้นต่ำของข้อผิดพลาดกำลังสอง” ในปัจจุบัน วิธีการนี้มีการใช้กันอย่างแพร่หลายมากเมื่อประมาณค่าการขึ้นต่อกันของฟังก์ชันที่ไม่รู้จักที่ระบุโดยตัวอย่างการทดลองจำนวนมาก เพื่อให้ได้นิพจน์เชิงวิเคราะห์ที่ประมาณค่าได้ดีที่สุด สู่การทดลองเต็มรูปแบบ

สมมติว่าบนพื้นฐานของการทดลองจำเป็นต้องสร้างการพึ่งพาการทำงานของปริมาณคุณจาก x : ให้เราสันนิษฐานว่าจากการทดลองที่เราได้รับnค่านิยม ยสำหรับค่าที่สอดคล้องกันของอาร์กิวเมนต์x- หากจุดการทดลองอยู่บนระนาบพิกัดดังในรูป เมื่อรู้ว่ามีข้อผิดพลาดเกิดขึ้นระหว่างการทดลอง เราก็สามารถสรุปได้ว่าการพึ่งพานั้นเป็นเส้นตรง กล่าวคือย= ขวาน+ ขโปรดทราบว่าวิธีการนี้ไม่ได้กำหนดข้อจำกัดเกี่ยวกับประเภทของฟังก์ชัน เช่น มันสามารถนำไปใช้กับการพึ่งพาการทำงานใดๆ

จากมุมมองของผู้ทดลอง มักจะเป็นเรื่องธรรมชาติมากกว่าที่จะพิจารณาว่าลำดับของการสุ่มตัวอย่างกำหนดไว้ล่วงหน้า เช่น เป็นตัวแปรอิสระและนับได้ - ตัวแปรตาม จะชัดเจนเป็นพิเศษหากอยู่ภายใต้ เข้าใจว่าเป็นช่วงเวลาซึ่งใช้กันอย่างแพร่หลายในการใช้งานทางเทคนิค แต่นี่เป็นเพียงกรณีพิเศษทั่วไปเท่านั้น ตัวอย่างเช่น จำเป็นต้องจำแนกตัวอย่างบางส่วนตามขนาด จากนั้นตัวแปรอิสระจะเป็นหมายเลขตัวอย่าง ตัวแปรตามจะเป็นขนาดแต่ละตัว

วิธีกำลังสองน้อยที่สุดมีการอธิบายโดยละเอียดในสิ่งพิมพ์ทางการศึกษาและวิทยาศาสตร์หลายฉบับ โดยเฉพาะอย่างยิ่งในแง่ของการประมาณฟังก์ชันในวิศวกรรมไฟฟ้าและวิทยุ ตลอดจนในหนังสือเกี่ยวกับทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์

กลับไปที่การวาดภาพ เส้นประแสดงว่าข้อผิดพลาดสามารถเกิดขึ้นได้ไม่เพียงแต่เนื่องจากขั้นตอนการวัดที่ไม่สมบูรณ์เท่านั้น แต่ยังเนื่องมาจากความไม่ถูกต้องในการระบุตัวแปรอิสระด้วยประเภทของฟังก์ชันที่เลือก สิ่งที่เหลืออยู่คือการเลือกพารามิเตอร์ที่รวมอยู่ในนั้นกและ ขเป็นที่แน่ชัดว่าจำนวนพารามิเตอร์สามารถมีได้มากกว่า 2 ตัว ซึ่งเป็นเรื่องปกติสำหรับฟังก์ชันเชิงเส้นเท่านั้น โดยทั่วไปเราจะถือว่า

.(1)

คุณต้องเลือกอัตราต่อรองก, ข, ค...จึงจะบรรลุเงื่อนไข.

. (2)

มาหาค่าต่างๆ กัน ก, ข, ค... โดยหมุนด้านซ้ายของ (2) ให้เหลือน้อยที่สุด ในการทำเช่นนี้ เราจะกำหนดจุดที่คงที่ (จุดที่อนุพันธ์ตัวแรกหายไป) โดยการแยกความแตกต่างทางด้านซ้ายของ (2) ด้วยความเคารพก, ข, ค:

(3)

เป็นต้น ระบบสมการผลลัพธ์จะมีสมการมากเท่าที่ไม่ทราบก, ข, ค- เป็นไปไม่ได้ที่จะแก้ระบบดังกล่าวในรูปแบบทั่วไป ดังนั้นจึงจำเป็นต้องระบุฟังก์ชันประเภทใดประเภทหนึ่งเป็นอย่างน้อย ต่อไปเราจะพิจารณาสองกรณี: ฟังก์ชันเชิงเส้นและกำลังสอง

ฟังก์ชันเชิงเส้น .

ให้เราพิจารณาผลรวมของกำลังสองของความแตกต่างระหว่างค่าทดลองและค่าฟังก์ชันที่จุดที่สอดคล้องกัน:

(4)

เรามาเลือกพารามิเตอร์กันกและ ขเพื่อให้จำนวนนี้มีค่าน้อยที่สุด ดังนั้นภารกิจจึงต้องค้นหาค่าต่างๆกและ ขโดยที่ฟังก์ชันมีขั้นต่ำ นั่นคือ เพื่อศึกษาฟังก์ชันของตัวแปรอิสระสองตัวกและ ขให้น้อยที่สุด การทำเช่นนี้เราแยกความแตกต่างโดยกและ ข:

;