ทฤษฎีเกมทางคณิตศาสตร์. ตัวอย่างการบันทึกและแก้เกมจากชีวิต

ทฤษฎีเกม - ชุดวิธีการทางคณิตศาสตร์สำหรับแก้ไขสถานการณ์ความขัดแย้ง (การชนกันของผลประโยชน์) ในทฤษฎีเกม เกมคือ แบบจำลองทางคณิตศาสตร์ของสถานการณ์ความขัดแย้ง หัวข้อที่น่าสนใจเป็นพิเศษในทฤษฎีเกมคือการศึกษากลยุทธ์การตัดสินใจของผู้เข้าร่วมเกมภายใต้เงื่อนไขที่ไม่แน่นอน ความไม่แน่นอนเกิดจากการที่ฝ่ายสองฝ่ายขึ้นไปมีเป้าหมายที่ตรงกันข้ามกัน และผลลัพธ์ของการกระทำใดๆ ของแต่ละฝ่ายขึ้นอยู่กับการเคลื่อนไหวของพันธมิตร ในขณะเดียวกัน แต่ละฝ่ายก็พยายามตัดสินใจอย่างเหมาะสมเพื่อให้บรรลุเป้าหมายที่ตั้งไว้ในระดับสูงสุด

ทฤษฎีเกมถูกนำไปใช้อย่างสม่ำเสมอมากที่สุดในระบบเศรษฐกิจ ซึ่งสถานการณ์ความขัดแย้งเกิดขึ้น ตัวอย่างเช่น ในความสัมพันธ์ระหว่างซัพพลายเออร์กับผู้บริโภค ผู้ซื้อกับผู้ขาย ธนาคารกับลูกค้า การประยุกต์ใช้ทฤษฎีเกมยังสามารถพบได้ในด้านการเมือง สังคมวิทยา ชีววิทยา และศิลปะการทหาร

จากประวัติศาสตร์ของทฤษฎีเกม

ประวัติทฤษฎีเกม เมื่อระเบียบวินัยอิสระเริ่มขึ้นในปี 1944 เมื่อ John von Neumann และ Oscar Morgenstern ตีพิมพ์หนังสือ "Theory of Games and Economic Behavior" ("Theory of Games and Economic Behavior") แม้ว่าจะเคยพบตัวอย่างทฤษฎีเกมมาก่อน: ตำราทัลมุดของชาวบาบิโลนเกี่ยวกับการแบ่งทรัพย์สินของสามีที่เสียชีวิตระหว่างภรรยาของเขา, เกมไพ่ในศตวรรษที่ 18, การพัฒนาทฤษฎีหมากรุกในต้นศตวรรษที่ 20, การพิสูจน์ ของทฤษฎีบทขั้นต่ำของ John von Neumann คนเดียวกันในปี 1928 หากไม่มีทฤษฎีเกมก็จะไม่มี

ในปี 1950 เมลวิน เดรสเชอร์และเมอรีล ฟลัดจาก แรนด์ คอร์ปอเรชั่นจอห์น แนช คนแรกที่ใช้ปัญหาภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ ในงานของเขาเกี่ยวกับสภาวะสมดุลในเกมที่มีผู้เล่นสองคน ได้พัฒนาแนวคิดเรื่องสมดุลของแนช

Reinhard Salten ในปี 1965 ได้ตีพิมพ์หนังสือ "Oligopoly processing in game theory on demand" ("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit") ซึ่งการประยุกต์ใช้ทฤษฎีเกมในเศรษฐศาสตร์ได้รับแรงผลักดันใหม่ ก้าวไปข้างหน้าในวิวัฒนาการของทฤษฎีเกมเกี่ยวข้องกับงานของ John Maynard Smith "Evolutionary Stable Strategy" ("Evolutionary Stable Strategy", 1974) ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษได้รับความนิยมในหนังสือ The Evolution of Cooperation ของ Robert Axelrod ซึ่งตีพิมพ์ในปี 1984 ในปี 1994 John Nash, John Harsanyi และ Reinhard Salten ได้รับรางวัลโนเบลสาขาทฤษฎีเกม

ทฤษฎีเกมในชีวิตและธุรกิจ

ให้เราอาศัยรายละเอียดเพิ่มเติมเกี่ยวกับสาระสำคัญของสถานการณ์ความขัดแย้ง (การปะทะกันของผลประโยชน์) ตามความหมายที่เข้าใจในทฤษฎีเกมสำหรับการสร้างแบบจำลองเพิ่มเติมของสถานการณ์ต่างๆ ในชีวิตและธุรกิจ ให้บุคคลอยู่ในสถานะที่นำไปสู่ผลลัพธ์ที่เป็นไปได้อย่างใดอย่างหนึ่ง และบุคคลนั้นมีความชอบส่วนตัวบางประการเกี่ยวกับผลลัพธ์เหล่านี้ แต่ถึงแม้ว่าเขาจะสามารถควบคุมปัจจัยผันแปรที่กำหนดผลลัพธ์ได้ในระดับหนึ่ง แต่เขาก็ไม่สามารถควบคุมสิ่งเหล่านี้ได้อย่างสมบูรณ์ บางครั้งการควบคุมก็อยู่ในมือของคนไม่กี่คนที่ชอบผลลัพธ์ที่เป็นไปได้ เช่นเดียวกับเขา กรณีทั่วไปผลประโยชน์ของบุคคลเหล่านี้ไม่เห็นด้วย ในกรณีอื่นๆ ผลลัพธ์สุดท้ายอาจขึ้นอยู่กับทั้งอุบัติเหตุ (บางครั้งเรียกว่าภัยธรรมชาติในทางกฎหมาย) และบุคคลอื่นๆ ทฤษฎีเกมจัดระบบการสังเกตสถานการณ์และสูตรดังกล่าว หลักการทั่วไปเพื่อเป็นแนวทางในการดำเนินการที่เหมาะสมในสถานการณ์ดังกล่าว

ในบางแง่มุม ชื่อ "ทฤษฎีเกม" เป็นสิ่งที่น่าเสียดาย เนื่องจากมันบ่งบอกว่าทฤษฎีเกมเกี่ยวข้องเฉพาะกับ คุณค่าทางสังคมการปะทะกันที่เกิดขึ้นในเกมห้องนั่งเล่น แต่ทฤษฏีนี้ยังมีความหมายที่กว้างกว่ามาก

สถานการณ์ทางเศรษฐกิจต่อไปนี้สามารถให้แนวคิดเกี่ยวกับการประยุกต์ใช้ทฤษฎีเกม สมมติว่ามีผู้ประกอบการหลายราย แต่ละคนพยายามที่จะเพิ่มผลกำไร ในขณะที่มีอำนาจจำกัดเหนือตัวแปรที่กำหนดกำไรนี้ ผู้ประกอบการไม่สามารถควบคุมตัวแปรที่ผู้ประกอบการรายอื่นควบคุมได้ แต่อาจส่งผลกระทบอย่างมากต่อรายได้ของผู้ประกอบการรายแรก การตีความสถานการณ์นี้เป็นเกมอาจก่อให้เกิดข้อโต้แย้งดังต่อไปนี้ รูปแบบเกมถือว่าผู้ประกอบการแต่ละรายเลือกหนึ่งทางเลือกจากตัวเลือกที่เป็นไปได้และผลกำไรจะถูกกำหนดโดยตัวเลือกเดียวเหล่านี้ เห็นได้ชัดว่าแทบจะเป็นไปไม่ได้เลยในความเป็นจริง เนื่องจากในกรณีนี้ เครื่องมือการจัดการที่ซับซ้อนจะไม่มีความจำเป็นในอุตสาหกรรม เป็นเพียงว่ามีการตัดสินใจและการแก้ไขการตัดสินใจเหล่านี้จำนวนหนึ่งซึ่งขึ้นอยู่กับตัวเลือกของผู้เข้าร่วมรายอื่น ระบบเศรษฐกิจ(ผู้เล่น). แต่โดยหลักการแล้ว เราสามารถจินตนาการได้ว่าผู้ดูแลระบบคนใดคาดการณ์ถึงเหตุการณ์ที่อาจเกิดขึ้นทั้งหมดและอธิบายรายละเอียดเกี่ยวกับการดำเนินการในแต่ละกรณี แทนที่จะแก้ไขแต่ละงานที่เกิดขึ้น

ความขัดแย้งทางทหารตามคำนิยาม คือการปะทะกันของผลประโยชน์ซึ่งทั้งสองฝ่ายไม่มีอำนาจควบคุมตัวแปรที่กำหนดผลลัพธ์อย่างเต็มที่ ซึ่งตัดสินโดยการต่อสู้ต่อเนื่องกัน คุณสามารถพิจารณาผลลัพธ์ว่าชนะหรือแพ้และกำหนดค่าตัวเลข 1 และ 0 ให้กับพวกเขา

หนึ่งในสถานการณ์ความขัดแย้งที่ง่ายที่สุดที่สามารถเขียนและแก้ไขได้ในทฤษฎีเกมคือการต่อสู้กันตัวต่อตัว ซึ่งเป็นความขัดแย้งระหว่างผู้เล่นสองคนที่ 1 และ 2 ซึ่งมีตามลำดับ หน้าและ ถามนัด สำหรับผู้เล่นแต่ละคนมีฟังก์ชั่นระบุความน่าจะเป็นที่ผู้เล่นยิง ผมในเวลานั้น ทีจะให้ตีที่จะพิสูจน์ถึงอันตรายถึงชีวิต

เป็นผลให้ทฤษฎีเกมมาถึงการกำหนดระดับของความขัดแย้งทางผลประโยชน์ต่อไปนี้: มี ผู้เล่น และผู้เล่นแต่ละคนต้องเลือกความเป็นไปได้หนึ่งอย่างจากชุด 100 ที่แน่นอน และเมื่อทำการเลือก ผู้เล่นไม่มีข้อมูลใด ๆ เกี่ยวกับตัวเลือกของผู้เล่นอื่น พื้นที่ตัวเลือกที่เป็นไปได้ของผู้เล่นอาจมีรายการเช่น "ย้ายเอซโพดำ" "สร้างรถถังแทนรถยนต์" หรือใน ความรู้สึกทั่วไปกลยุทธ์ที่กำหนดการกระทำทั้งหมดที่ต้องดำเนินการในทุกสถานการณ์ที่เป็นไปได้ ผู้เล่นแต่ละคนต้องเผชิญกับงาน: เขาควรเลือกอะไรเพื่อให้อิทธิพลส่วนตัวของเขาที่มีต่อผลลัพธ์ทำให้เขาได้รับผลประโยชน์มากที่สุด

แบบจำลองทางคณิตศาสตร์ในทฤษฎีเกมและการทำให้เป็นทางการของปัญหา

ดังที่เราได้กล่าวไปแล้ว เกมดังกล่าวเป็นแบบจำลองทางคณิตศาสตร์ของสถานการณ์ความขัดแย้ง และต้องการส่วนประกอบดังนี้

  1. ผู้มีส่วนได้เสีย;
  2. การกระทำที่เป็นไปได้ในแต่ละด้าน
  3. ผลประโยชน์ของคู่สัญญา

ฝ่ายที่สนใจในเกมจะเรียกว่าผู้เล่น แต่ละคนสามารถดำเนินการได้อย่างน้อยสองการกระทำ (หากผู้เล่นมีเพียงหนึ่งการกระทำ แสดงว่าเขาไม่ได้มีส่วนร่วมในเกมจริง ๆ เนื่องจากเป็นที่ทราบล่วงหน้าว่าเขาจะทำอะไร) ผลของเกมเรียกว่าชนะ .

สถานการณ์ความขัดแย้งที่แท้จริงไม่ได้เกิดขึ้นเสมอไป แต่เกม (ในแนวคิดของทฤษฎีเกม) - ดำเนินไปพร้อมกันเสมอ กฎบางอย่าง ซึ่งกำหนดว่า:

  1. ตัวเลือกผู้เล่น;
  2. จำนวนข้อมูลที่ผู้เล่นแต่ละคนมีเกี่ยวกับพฤติกรรมของพันธมิตร
  3. ผลตอบแทนที่การกระทำแต่ละชุดนำไปสู่

ตัวอย่างของเกมที่เป็นทางการ เช่น ฟุตบอล เกมไพ่ หมากรุก

แต่ในเชิงเศรษฐศาสตร์ พฤติกรรมของผู้เล่นจะเกิดขึ้นได้ เช่น เมื่อหลายบริษัทพยายามหาตำแหน่งที่ได้เปรียบกว่าในตลาด บุคคลหลายคนพยายามแบ่งปันสิ่งที่ดี (ทรัพยากร การเงิน) ระหว่างกัน เพื่อให้ทุกคนได้รับผลประโยชน์มากที่สุด . ผู้เล่นในสถานการณ์ความขัดแย้งในระบบเศรษฐกิจที่สามารถจำลองเป็นเกมได้คือบริษัท ธนาคาร บุคคล และตัวแทนทางเศรษฐกิจอื่นๆ ในทางกลับกัน ในสภาวะสงคราม จะใช้รูปแบบเกม เช่น ในการเลือกเพิ่มเติม อาวุธที่ดีที่สุด(จากที่มีอยู่หรืออาจเป็นไปได้) เพื่อเอาชนะข้าศึกหรือป้องกันการโจมตี

เกมมีลักษณะที่ไม่แน่นอนของผลลัพธ์ . สาเหตุของความไม่แน่นอนสามารถแบ่งออกเป็นกลุ่มต่อไปนี้:

  1. combinatorial (ในหมากรุก);
  2. อิทธิพลของปัจจัยสุ่ม (เช่นในเกม "หัวหรือก้อย", ลูกเต๋า, เกมไพ่);
  3. เชิงกลยุทธ์ (ผู้เล่นไม่รู้ว่าฝ่ายตรงข้ามจะทำอะไร)

กลยุทธ์ของผู้เล่น เป็นชุดของกฎที่กำหนดการกระทำในแต่ละการเคลื่อนไหวขึ้นอยู่กับสถานการณ์

เป้าหมายของทฤษฎีเกม คือการกำหนดกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่นแต่ละคน การกำหนดกลยุทธ์ดังกล่าวคือการแก้เกม การเพิ่มประสิทธิภาพกลยุทธ์ จะสำเร็จได้เมื่อผู้เล่นคนใดคนหนึ่งต้องได้รับผลตอบแทนสูงสุด ในขณะที่คนที่สองปฏิบัติตามกลยุทธ์ของเขา และผู้เล่นคนที่สองควรมีการสูญเสียขั้นต่ำหากผู้เล่นคนแรกยึดมั่นในกลยุทธ์ของเขา

การจัดประเภทเกม

  1. จำแนกตามจำนวนผู้เล่น (เกมสำหรับสองคนขึ้นไป) เกมสองคนเป็นศูนย์กลางของทฤษฎีเกมทั้งหมด แนวคิดพื้นฐานของทฤษฎีเกมสำหรับเกมที่มีผู้เล่นสองคนเป็นการสรุปแนวคิดที่สำคัญมากเกี่ยวกับความสมดุล ซึ่งปรากฏโดยธรรมชาติในเกมที่มีผู้เล่นสองคน สำหรับเกม บุคคล ดังนั้นส่วนหนึ่งของทฤษฎีเกมอุทิศให้กับเกมที่ห้ามไม่ให้ผู้เล่นร่วมมือกัน ในอีกส่วนหนึ่งของทฤษฎีเกม บุคคลจะสันนิษฐานว่าผู้เล่นสามารถร่วมมือกันเพื่อผลประโยชน์ร่วมกัน (ดูต่อไปในย่อหน้านี้เกี่ยวกับเกมที่ไม่ให้ความร่วมมือและร่วมมือกัน)
  2. จำแนกตามจำนวนผู้เล่นและกลยุทธ์ของพวกเขา (จำนวนของกลยุทธ์อย่างน้อยสอง อาจเป็นอนันต์)
  3. จำแนกตามจำนวนข้อมูล เกี่ยวกับการเคลื่อนไหวที่ผ่านมา: เกมที่มีข้อมูลครบถ้วนและข้อมูลไม่ครบถ้วน ให้มีผู้เล่น 1 - ผู้ซื้อและผู้เล่น 2 - ผู้ขาย หากผู้เล่น 1 ไม่มีข้อมูลที่ครบถ้วนเกี่ยวกับการกระทำของผู้เล่น 2 ดังนั้นผู้เล่น 1 อาจไม่สามารถแยกแยะระหว่างสองทางเลือกที่เขาต้องเลือกได้ ตัวอย่างเช่น การเลือกระหว่างสองประเภทของผลิตภัณฑ์บางอย่างและไม่ทราบว่าผลิตภัณฑ์นั้นตามลักษณะบางอย่าง แย่กว่าสินค้า ผู้เล่น 1 อาจไม่เห็นความแตกต่างระหว่างทางเลือก
  4. การจำแนกตามหลักการของการแบ่งเงินรางวัล : สหกรณ์, แนวร่วมในแง่หนึ่งและไม่ร่วมมือ, ไม่ร่วมมือในอีกด้านหนึ่ง. ที่ เกมที่ไม่ให้ความร่วมมือ หรือมิฉะนั้น - เกมที่ไม่ให้ความร่วมมือ ผู้เล่นเลือกกลยุทธ์พร้อมกันโดยไม่รู้ว่าผู้เล่นคนที่สองจะเลือกกลยุทธ์ใด ไม่สามารถสื่อสารระหว่างผู้เล่นได้ ที่ เกมสหกรณ์ หรือมิฉะนั้น - เกมพันธมิตร ผู้เล่นสามารถสร้างพันธมิตรและดำเนินการร่วมกันเพื่อเพิ่มชัยชนะ
  5. เกมผลรวมศูนย์ จำกัด สองคน หรือเกมที่เป็นปรปักษ์กันคือ เกมกลยุทธ์พร้อมข้อมูลที่ครบถ้วนของฝ่ายที่มีส่วนได้ส่วนเสีย เกมที่เป็นปฏิปักษ์กันคือ เกมเมทริกซ์ .

ตัวอย่างคลาสสิกจากทฤษฎีเกมคือภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

ผู้ต้องสงสัยทั้งสองถูกควบคุมตัวและแยกออกจากกัน อัยการเขตเชื่อว่าพวกเขาก่ออาชญากรรมร้ายแรง แต่ไม่มีหลักฐานเพียงพอที่จะตั้งข้อหาพวกเขาในการพิจารณาคดี เขาบอกนักโทษแต่ละคนว่าเขามีสองทางเลือก: สารภาพกับอาชญากรรมที่ตำรวจเชื่อว่าเขาก่อ หรือไม่สารภาพ หากทั้งคู่ไม่สารภาพ อัยการเขตจะตั้งข้อหาก่ออาชญากรรมเล็กๆ น้อยๆ เช่น การลักเล็กขโมยน้อยหรือมีอาวุธไว้ในครอบครองโดยผิดกฎหมาย และทั้งคู่จะได้รับโทษเล็กน้อย หากทั้งคู่สารภาพ พวกเขาจะถูกดำเนินคดี แต่ไม่จำเป็นต้องได้รับโทษหนักที่สุด หากคนหนึ่งสารภาพและอีกคนไม่สารภาพ ผู้ที่ถูกสารภาพจะถูกลดโทษสำหรับการส่งผู้สมรู้ร่วมคิดเป็นผู้ร้ายข้ามแดน ในขณะที่คนดื้อรั้นจะได้รับ "อย่างเต็มที่"

หากภารกิจเชิงกลยุทธ์นี้ถูกกำหนดขึ้นในแง่ของข้อสรุป ก็จะสรุปได้ดังต่อไปนี้:

ดังนั้นหากผู้ต้องหาทั้งสองไม่รับสารภาพ จะได้รับโทษคนละ 1 ปี หากทั้งคู่สารภาพ แต่ละคนจะได้รับ 8 ปี และถ้าคนหนึ่งสารภาพ อีกคนไม่สารภาพ คนที่สารภาพจะถูกจำคุก 3 เดือน ส่วนคนที่ไม่สารภาพจะถูกจำคุก 10 ปี เมทริกซ์ข้างต้นสะท้อนภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษได้อย่างถูกต้อง: ทุกคนต้องเผชิญกับคำถามว่าจะสารภาพหรือไม่สารภาพ เกมที่อัยการเขตเสนอให้กับนักโทษคือ เกมที่ไม่ให้ความร่วมมือ หรือไม่เช่นนั้น - เกมที่ไม่ใช่แนวร่วม . หากผู้ต้องขังทั้งสองสามารถร่วมมือกันได้ (เช่น เกมจะร่วมมือกัน หรือไม่เช่นนั้น เกมพันธมิตร ) จากนั้นทั้งคู่ก็ไม่ยอมสารภาพและถูกจำคุกคนละหนึ่งปี

ตัวอย่างการใช้วิธีการทางคณิตศาสตร์ของทฤษฎีเกม

ตอนนี้เราหันไปพิจารณาวิธีแก้ปัญหาสำหรับตัวอย่างเกมประเภททั่วไปซึ่งมีวิธีการตรวจสอบและการแก้ปัญหาในทฤษฎีเกม

ตัวอย่างของเกมที่ไม่ร่วมมือ (ไม่ร่วมมือ) อย่างเป็นทางการของคนสองคน

ในย่อหน้าที่แล้ว เราได้พิจารณาตัวอย่างเกมที่ไม่ร่วมมือ (ไม่ให้ความร่วมมือ) (ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ) มาเสริมทักษะของเรากันเถอะ พล็อตคลาสสิกที่ได้รับแรงบันดาลใจจาก The Adventures of Sherlock Holmes ของ Arthur Conan Doyle ก็เหมาะสำหรับเรื่องนี้เช่นกัน แน่นอนว่าเราสามารถคัดค้านได้: ตัวอย่างไม่ได้มาจากชีวิต แต่มาจากวรรณกรรม แต่โคนันดอยล์ไม่ได้พิสูจน์ตัวเองว่าเป็นนักเขียนนิยายวิทยาศาสตร์! คลาสสิกเพราะงานเสร็จสมบูรณ์โดย Oscar Morgenstern ซึ่งเราได้สร้างไว้แล้ว - หนึ่งในผู้ก่อตั้งทฤษฎีเกม

ตัวอย่างที่ 1ข้อความที่ตัดตอนมาโดยย่อจากหนึ่งใน The Adventures of Sherlock Holmes จะได้รับ ตามแนวคิดที่รู้จักกันดีของทฤษฎีเกม ให้สร้างแบบจำลองของสถานการณ์ความขัดแย้งและเขียนเกมอย่างเป็นทางการ

เชอร์ล็อก โฮล์มส์ตั้งใจจะเดินทางจากลอนดอนไปยังโดเวอร์โดยมีเป้าหมายต่อไปคือการไปยังทวีป (ยุโรป) เพื่อหนีจากศาสตราจารย์มอริอาร์ตี้ซึ่งกำลังไล่ล่าเขา เมื่อขึ้นรถไฟ เขาเห็นศาสตราจารย์โมริอาร์ตีอยู่บนชานชาลาของสถานี เชอร์ล็อก โฮล์มส์ยอมรับว่ามอริอาร์ตี้สามารถเลือกรถไฟขบวนพิเศษและแซงหน้ามันได้ เชอร์ล็อก โฮล์มส์มีทางเลือกสองทาง: เดินทางต่อไปยังโดเวอร์หรือลงที่สถานีแคนเทอร์เบอรีซึ่งเป็นสถานีกลางแห่งเดียวในเส้นทางของเขา เราคิดว่าศัตรูของเขาฉลาดพอที่จะกำหนดทางเลือกของโฮล์มส์ได้ ดังนั้นเขาจึงมีทางเลือกเหมือนกันสองทาง ฝ่ายตรงข้ามทั้งสองต้องเลือกสถานีที่จะลงจากรถไฟโดยไม่รู้ว่าแต่ละคนจะตัดสินใจอย่างไร หากผลของการตัดสินใจทั้งคู่ลงเอยที่สถานีเดียวกัน เราสามารถสรุปได้ว่าศาสตราจารย์ Moriarty สังหารเชอร์ล็อก โฮล์มส์อย่างแน่นอน ถ้าเชอร์ล็อก โฮล์มส์ไปถึงโดเวอร์อย่างปลอดภัย เขาจะรอด

การตัดสินใจ. วีรบุรุษของ Conan Doyle ถือได้ว่าเป็นผู้เข้าร่วมในเกมนั่นคือผู้เล่น ในการกำจัดของผู้เล่นแต่ละคน ผม (ผม=1,2) สองกลยุทธ์บริสุทธิ์:

  • ลงที่ Dover (กลยุทธ์ i1 ( ผม=1,2) );
  • ลงที่สถานีระหว่างทาง (กลยุทธ์ ไอทู ( ผม=1,2) )

ขึ้นอยู่กับว่ากลยุทธ์ใดในสองกลยุทธ์ที่ผู้เล่นแต่ละคนเลือก การผสมผสานกลยุทธ์พิเศษจะถูกสร้างขึ้นเป็นคู่ = (1 , 2 ) .

ชุดค่าผสมแต่ละชุดสามารถเชื่อมโยงกับเหตุการณ์ - ผลของการพยายามฆ่าเชอร์ล็อก โฮล์มส์ โดยศาสตราจารย์โมริอาร์ตี เราสร้างเมทริกซ์ของเกมนี้ด้วยเหตุการณ์ที่เป็นไปได้

ในแต่ละเหตุการณ์จะมีการระบุดัชนีซึ่งหมายถึงการได้มาของศาสตราจารย์ Moriarty และคำนวณขึ้นอยู่กับความรอดของโฮล์มส์ ฮีโร่ทั้งสองเลือกกลยุทธ์พร้อมกันโดยไม่รู้ว่าฝ่ายตรงข้ามจะเลือกอะไร ดังนั้น เกมนี้ไม่ให้ความร่วมมือ เพราะประการแรก ผู้เล่นอยู่บนรถไฟคนละขบวน และประการที่สอง พวกเขามีความสนใจตรงข้ามกัน

ตัวอย่างของพิธีการและการแก้ปัญหาของเกมสหกรณ์ (แนวร่วม) คน

ณ จุดนี้ภาคปฏิบัติซึ่งก็คือการแก้ปัญหาตัวอย่างจะนำหน้าด้วยภาคทฤษฎีซึ่งเราจะทำความคุ้นเคยกับแนวคิดของทฤษฎีเกมสำหรับการแก้ปัญหาเกมแบบร่วมมือ (ไม่ร่วมมือ) สำหรับภารกิจนี้ ทฤษฎีเกมแนะนำ:

  • ฟังก์ชั่นที่เป็นลักษณะเฉพาะ (พูดง่าย ๆ มันสะท้อนถึงคุณค่าของผลประโยชน์จากการเข้าร่วมกับผู้เล่นในแนวร่วม)
  • แนวคิดของการเพิ่ม (คุณสมบัติของปริมาณซึ่งประกอบด้วยความจริงที่ว่ามูลค่าของปริมาณที่สอดคล้องกับวัตถุทั้งหมดเท่ากับผลรวมของค่าของปริมาณที่สอดคล้องกับส่วนต่าง ๆ ในการแบ่งพาร์ติชันของวัตถุในระดับหนึ่ง เป็นส่วน) และ superadditivity (ค่าของปริมาณที่สอดคล้องกับวัตถุทั้งหมดมากกว่าผลรวมของค่าของปริมาณที่สอดคล้องกับส่วนต่าง ๆ ของมัน) ของฟังก์ชันลักษณะเฉพาะ

การเพิ่มพิเศษของฟังก์ชั่นลักษณะเฉพาะบ่งชี้ว่าพันธมิตรมีประโยชน์สำหรับผู้เล่น เนื่องจากในกรณีนี้ ผลตอบแทนของพันธมิตรจะเพิ่มขึ้นตามจำนวนผู้เล่น

ในการทำให้เกมเป็นทางการ เราจำเป็นต้องแนะนำสัญกรณ์ที่เป็นทางการสำหรับแนวคิดข้างต้น

สำหรับเกม หมายถึงชุดของผู้เล่นทั้งหมดเป็น เอ็น= (1,2,...,n) เซตย่อยที่ไม่ว่างใดๆ ของเซต เอ็นแสดงว่า (รวมทั้งตนเอง เอ็นและเซตย่อยทั้งหมดที่ประกอบด้วยองค์ประกอบเดียว) มีกิจกรรมบนเว็บไซต์ เซตและการดำเนินการกับเซตซึ่งจะเปิดในหน้าต่างใหม่เมื่อคุณคลิกที่ลิงก์

ฟังก์ชั่นลักษณะจะแสดงเป็น โวลต์และโดเมนของคำจำกัดความประกอบด้วยเซตย่อยที่เป็นไปได้ของเซต เอ็น. โวลต์() - ค่าของฟังก์ชันลักษณะเฉพาะสำหรับชุดย่อยเฉพาะ ตัวอย่างเช่น รายได้ที่ได้รับจากกลุ่มพันธมิตร ซึ่งรวมถึง อาจประกอบด้วยผู้เล่นหนึ่งคน สิ่งนี้มีความสำคัญเนื่องจากทฤษฎีเกมต้องการการตรวจสอบการมีอยู่ของการเพิ่มพิเศษสำหรับค่าของฟังก์ชันลักษณะเฉพาะของแนวร่วมที่ไม่ทับซ้อนกันทั้งหมด

สำหรับสองแนวร่วมของชุดย่อยที่ไม่ว่างเปล่า 1 และ 2 การเพิ่มฟังก์ชั่นลักษณะของเกมสหกรณ์ (แนวร่วม) เขียนได้ดังนี้:

และความเหนือชั้นเป็นดังนี้:

ตัวอย่างที่ 2นักเรียน 3 คนของโรงเรียนดนตรีแห่งหนึ่งได้รับเงินพิเศษจากชมรมต่างๆ พวกเขาได้รับเงินจากผู้เข้าชมชมรม พิจารณาว่าการร่วมมือกันสร้างผลกำไรหรือไม่ (ถ้าเป็นเช่นนั้นภายใต้เงื่อนไขใด) โดยใช้แนวคิดของทฤษฎีเกมเพื่อแก้ปัญหาเกมแบบร่วมมือ บุคคล โดยมีข้อมูลเบื้องต้นดังต่อไปนี้

โดยเฉลี่ยแล้ว รายได้ต่อคืนของพวกเขาคือ:

  • นักไวโอลินมี 600 หน่วย
  • มือกีตาร์มี 700 หน่วย
  • นักร้องมี 900 หน่วย

ในความพยายามที่จะเพิ่มรายได้ นักเรียนได้สร้างกลุ่มต่างๆ เป็นเวลาหลายเดือน ผลการวิจัยพบว่าการรวมทีมกันสามารถเพิ่มรายได้ในช่วงเย็นดังนี้:

  • นักไวโอลิน + นักกีตาร์ได้รับ 1,500 หน่วย
  • นักไวโอลิน + นักร้องได้รับ 1,800 หน่วย
  • นักกีตาร์ + นักร้องได้รับ 1,900 หน่วย
  • นักไวโอลิน + นักกีตาร์ + นักร้อง ได้ 3,000 หน่วย

การตัดสินใจ. ในตัวอย่างนี้ จำนวนผู้เข้าร่วมในเกม = 3 ดังนั้นโดเมนของฟังก์ชันลักษณะเฉพาะของเกมจึงประกอบด้วย 2³ = 8 ชุดย่อยที่เป็นไปได้ของชุดของผู้เล่นทั้งหมด รายชื่อพันธมิตรที่เป็นไปได้ทั้งหมด :

  • การรวมตัวกันขององค์ประกอบหนึ่งซึ่งแต่ละองค์ประกอบประกอบด้วยผู้เล่นหนึ่งคน - นักดนตรี: {1} , {2} , {3} ;
  • การรวมกันของสององค์ประกอบ: {1,2} , {1,3} , {2,3} ;
  • แนวร่วมของ สามองค์ประกอบ: {1,2,3} .

เรากำหนดหมายเลขซีเรียลให้กับผู้เล่นแต่ละคน:

  • นักไวโอลิน - ผู้เล่นคนที่ 1;
  • นักกีตาร์ - ผู้เล่นคนที่ 2;
  • นักร้องคือผู้เล่นคนที่ 3

ตามข้อมูลปัญหา เรากำหนดลักษณะเฉพาะของเกม โวลต์:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; ค่าของฟังก์ชันลักษณะเฉพาะเหล่านี้จะพิจารณาจากผลตอบแทนของผู้เล่นคนแรก คนที่สอง และคนที่สาม ตามลำดับ เมื่อพวกเขาไม่ได้รวมกันเป็นพันธมิตร

v(T(1,2)) = 1,500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; ค่าของฟังก์ชั่นลักษณะเฉพาะเหล่านี้ถูกกำหนดโดยรายได้ของผู้เล่นแต่ละคู่ที่รวมกันเป็นพันธมิตร

v(T(1,2,3)) = 3000 ; ค่าของฟังก์ชันคุณลักษณะนี้ถูกกำหนดโดยรายได้เฉลี่ยในกรณีที่ผู้เล่นรวมกันเป็นแฝดสาม

ดังนั้นเราจึงได้แสดงรายการแนวร่วมที่เป็นไปได้ทั้งหมดของผู้เล่น ซึ่งมีทั้งหมดแปดกลุ่มตามที่ควรจะเป็น เนื่องจากโดเมนของคำจำกัดความของฟังก์ชันลักษณะเฉพาะของเกมประกอบด้วยชุดย่อยที่เป็นไปได้แปดชุดของชุดของผู้เล่นทั้งหมด ซึ่งเป็นสิ่งที่ทฤษฎีเกมต้องการ เนื่องจากเราจำเป็นต้องตรวจสอบการมีอยู่ของการเพิ่มพิเศษสำหรับค่าของฟังก์ชันลักษณะเฉพาะของแนวร่วมที่ไม่ทับซ้อนกันทั้งหมด

เงื่อนไขของสารเติมแต่งยิ่งยวดเป็นจริงได้อย่างไรในตัวอย่างนี้ ให้เรากำหนดว่าผู้เล่นสร้างแนวร่วมที่ไม่ทับซ้อนกันอย่างไร 1 และ 2 . หากผู้เล่นบางคนอยู่ในแนวร่วม 1 จากนั้นผู้เล่นอื่นทั้งหมดอยู่ในแนวร่วม 2 และตามคำนิยาม แนวร่วมนี้เกิดขึ้นจากความแตกต่างระหว่างชุดผู้เล่นทั้งหมดและชุด 1 . แล้วถ้า 1 - แนวร่วมของผู้เล่นหนึ่งคน จากนั้นเป็นแนวร่วม 2 จะมีผู้เล่นคนที่สองและสามหากอยู่ในแนวร่วม 1 จะเป็นผู้เล่นคนแรกและคนที่สามจากนั้นเป็นพันธมิตร 2 จะประกอบด้วยผู้เล่นคนที่สองเท่านั้น เป็นต้น

ทฤษฎีเกมเนื่องจากสาขาของการวิจัยการดำเนินงานเป็นทฤษฎี แบบจำลองทางคณิตศาสตร์การตัดสินใจที่เหมาะสมที่สุดในสภาวะความไม่แน่นอนหรือความขัดแย้งของหลายฝ่ายที่มีผลประโยชน์ต่างกัน ทฤษฎีเกมสำรวจกลยุทธ์ที่เหมาะสมในสถานการณ์ที่เป็นธรรมชาติของเกม ซึ่งรวมถึงสถานการณ์ที่เกี่ยวข้องกับการเลือกโซลูชันการผลิตที่ได้เปรียบที่สุดสำหรับระบบการทดลองทางวิทยาศาสตร์และเศรษฐกิจ องค์กรควบคุมทางสถิติ และความสัมพันธ์ทางเศรษฐกิจระหว่างองค์กรในอุตสาหกรรมและอุตสาหกรรมอื่น ๆ โดยการทำให้สถานการณ์ความขัดแย้งเป็นแบบแผนทางคณิตศาสตร์ พวกเขาสามารถแสดงเป็นเกมสอง สาม ฯลฯ ผู้เล่นซึ่งแต่ละคนต่างแสวงหาเป้าหมายในการเพิ่มผลประโยชน์สูงสุดให้กับตนเอง กำไรของผู้เล่นแต่ละคนต้องเสียไป

ส่วน "ทฤษฎีเกม" แสดงด้วยสามส่วน เครื่องคิดเลขออนไลน์:

  1. กลยุทธ์ผู้เล่นที่เหมาะสมที่สุด ในปัญหาดังกล่าวจะมีการให้เมทริกซ์ผลตอบแทน จำเป็นต้องค้นหากลยุทธ์ที่บริสุทธิ์หรือผสมผสานของผู้เล่นและ ราคาเกม. ในการแก้ปัญหา คุณต้องระบุขนาดของเมทริกซ์และวิธีการแก้ปัญหา บริการใช้วิธีการต่อไปนี้เพื่อแก้ปัญหาเกมที่มีผู้เล่นสองคน:
    1. มินิแม็กซ์ หากคุณต้องการค้นหากลยุทธ์ที่แท้จริงของผู้เล่นหรือตอบคำถามเกี่ยวกับจุดอานของเกม ให้เลือกวิธีแก้ปัญหานี้
    2. วิธีซิมเพล็กซ์ ใช้เพื่อแก้ปัญหาเกมกลยุทธ์แบบผสมโดยวิธีการ การเขียนโปรแกรมเชิงเส้น.
    3. วิธีการกราฟิก ใช้เพื่อแก้ปัญหาเกมกลยุทธ์แบบผสม หากมีจุดอาน การแก้ปัญหาจะหยุดลง ตัวอย่าง: กำหนดเมทริกซ์ผลตอบแทน ค้นหากลยุทธ์ผู้เล่นแบบผสมและราคาเกมที่ดีที่สุดโดยใช้ วิธีการกราฟิกโซลูชั่นเกม
    4. วิธีการทำซ้ำของ Brown-Robinson วิธีการวนซ้ำจะใช้เมื่อไม่สามารถใช้วิธีกราฟิกและเมื่อพีชคณิตและ เมทริกซ์เมธอด. วิธีนี้ทำให้ได้ค่าประมาณของเกม และสามารถรับค่าจริงได้ตามระดับความแม่นยำที่ต้องการ วิธีนี้ไม่เพียงพอสำหรับการค้นหากลยุทธ์ที่เหมาะสมที่สุด แต่จะช่วยให้คุณติดตามไดนามิกของเกมแบบเทิร์นเบสและกำหนดต้นทุนของเกมสำหรับผู้เล่นแต่ละคนในแต่ละขั้นตอน
    ตัวอย่างเช่น งานอาจดูเหมือน "ระบุกลยุทธ์ที่ดีที่สุดของผู้เล่นสำหรับเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน".
    วิธีการทั้งหมดใช้การตรวจสอบสำหรับแถวและคอลัมน์ที่โดดเด่น
  2. เกม Bimatrix โดยปกติในเกมดังกล่าวจะมีการตั้งค่าเมทริกซ์สองรายการที่มีขนาดเท่ากันของการจ่ายผลตอบแทนของผู้เล่นคนแรกและคนที่สอง แถวของเมทริกซ์เหล่านี้สอดคล้องกับกลยุทธ์ของผู้เล่นคนแรก และคอลัมน์ของเมทริกซ์สอดคล้องกับกลยุทธ์ของผู้เล่นคนที่สอง ในกรณีนี้ เมทริกซ์แรกแสดงถึงผลตอบแทนของผู้เล่นคนแรก และเมทริกซ์ที่สองจะแสดงผลตอบแทนของผู้เล่นคนที่สอง
  3. เกมกับธรรมชาติ ใช้เมื่อจำเป็นต้องเลือกการตัดสินใจด้านการจัดการตามเกณฑ์ของ Maximax, Bayes, Laplace, Wald, Savage, Hurwitz
    สำหรับเกณฑ์ Bayes จำเป็นต้องแนะนำความน่าจะเป็นของการเกิดเหตุการณ์ด้วย หากไม่ได้ตั้งค่าไว้ ให้ปล่อยค่าเริ่มต้นไว้ (จะมีเหตุการณ์ที่เทียบเท่ากัน)
    สำหรับเกณฑ์ของ Hurwitz ให้ระบุระดับของการมองโลกในแง่ดี λ หากไม่ได้ระบุพารามิเตอร์นี้ในเงื่อนไข สามารถใช้ค่า 0, 0.5 และ 1 ได้

ในหลาย ๆ ปัญหาจำเป็นต้องหาทางออกโดยใช้คอมพิวเตอร์ หนึ่งในเครื่องมือดังกล่าวคือบริการและฟังก์ชันข้างต้น

  • กลยุทธ์ผู้เล่นผสม ค้นหากลยุทธ์ผสมของผู้เล่น
  • การสร้างแบบจำลองวงจรเกมในทฤษฎีเกม องค์กรมีโอกาสที่จะวางแผนปริมาณผลผลิตของผลิตภัณฑ์ตามฤดูกาล P 1, P 2, P 3 อย่างอิสระ
  • การแก้เกมเมทริกซ์ด้วยวิธีกราฟิก

    การแก้เกมเมทริกซ์ด้วยวิธีการเขียนโปรแกรมเชิงเส้น

    1. เกมเมทริกซ์ โดยใช้วิธีซิมเพล็กซ์ เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = สูงสุด(a i) = 2 ซึ่งระบุถึงกลยุทธ์บริสุทธิ์สูงสุด A 1
    2. ตัวอย่างการแก้เกมเมทริกซ์ด้วยโปรแกรมเชิงเส้น แก้เกมเมทริกซ์โดยใช้โปรแกรมเชิงเส้น

    แสดงภาพกราฟิก ทำให้เป็นมาตรฐาน และค้นหาวิธีแก้ปัญหาของเกมตำแหน่งด้วยฟังก์ชันผลตอบแทนต่อไปนี้:
    ผู้เล่น A ทำการเคลื่อนไหวครั้งแรก: เขาเลือกหมายเลข x จากชุดของตัวเลขสองตัว
    ผู้เล่น B ทำการย้ายครั้งที่ 2: ไม่รู้เกี่ยวกับตัวเลือกของผู้เล่น A ในการย้ายครั้งที่ 1 เขาเลือกหมายเลข y จากชุดของตัวเลขสองตัว
    ผู้เล่น A ทำการย้ายครั้งที่ 3: เขาเลือกหมายเลข z จากชุดของตัวเลขสองตัว โดยรู้ค่าของ y ที่ผู้เล่น B เลือกในการย้ายครั้งที่ 2 แต่จำการเลือก x ของตัวเองไม่ได้ในการย้ายครั้งที่ 1

    เกมกับธรรมชาติ

    1. เกมสถิติ
      องค์กรการเกษตรสามารถขายผลิตภัณฑ์บางอย่างได้:
      A1) ทันทีหลังจากทำความสะอาด
      A2) ในช่วงฤดูหนาว
      A3) ในเดือนฤดูใบไม้ผลิ
      กำไรขึ้นอยู่กับราคาขายในช่วงเวลาที่กำหนด ต้นทุนการจัดเก็บ และการสูญเสียที่อาจเกิดขึ้น จำนวนกำไรที่คำนวณสำหรับอัตราส่วนรายได้และต้นทุนของรัฐที่แตกต่างกัน (S1, S2 และ S3) ในช่วงระยะเวลาการดำเนินการทั้งหมดจะแสดงในรูปแบบของเมทริกซ์ (ล้านรูเบิล)
    2. บริษัท ผลิตชุดและชุดสูทซึ่งการขายขึ้นอยู่กับสภาพอากาศ ต้นทุนของบริษัทในช่วงเดือนเมษายนถึงพฤษภาคมต่อหน่วยของผลผลิตจะอยู่ที่ ...
    3. แก้ปัญหาสต๊อกวัตถุดิบ ในช่วงระยะเวลาหนึ่งที่องค์กร ปริมาณการใช้วัตถุดิบขึ้นอยู่กับคุณภาพคือ 1, 2, 3 และ 4
    4. การมองโลกในแง่ร้ายแบบสุดโต่ง การมองโลกในแง่ดีแบบสุดโต่ง และกลยุทธ์การมองโลกในแง่ดี-มองโลกในแง่ร้าย

    เกม Bimatrix

    ต้นไม้การตัดสินใจในทฤษฎีเกม (ตัวอย่างการแก้ปัญหา)

    ดูเพิ่มเติมที่ชุดของการแก้ปัญหาเกี่ยวกับทฤษฎีเกม (การแก้ปัญหาของเกมเมทริกซ์) ปัญหาทั่วไปเกี่ยวกับ EMM (การเขียนโปรแกรมเชิงเส้น ทฤษฎีเกม)

    มีบริษัททีวีสามแห่งที่เปิดดำเนินการในเมือง: เอบีซี, ซีบีเอสและ กสช. บริษัทเหล่านี้อาจเริ่มรายการข่าวภาคค่ำในเวลา 6:30 น. หรือ 7:00 น. 60% ของผู้ชมชอบดูข่าวภาคค่ำเวลา 6.30 น. และ 40% - เวลา 7.00 น. รายการข่าวภาคค่ำที่ได้รับความนิยมสูงสุดของบริษัท เอบีซี, ข่าวที่จัดทำโดยบริษัทได้รับความนิยมน้อยที่สุด กสช. ส่วนแบ่งผู้ชมรายการข่าวภาคค่ำแสดงในตาราง (NBC, СBS, АВС)

    เอบีซี: 6.30

    เอ็นดวงอาทิตย์

    สว

    เอบีซี: 7.00

    หมายเหตุจาก

    สว

    ค้นหากลยุทธ์ที่ดีที่สุดสำหรับบริษัทตามช่วงเวลาของรายการข่าว

    คำแนะนำในการแก้ปัญหา: เกมนี้มีกลยุทธ์ที่โดดเด่น

    เรียกว่าเกมผลรวมศูนย์สำหรับสองคน ซึ่งแต่ละคนมีชุดกลยุทธ์ที่จำกัด กฎของเกมเมทริกซ์ถูกกำหนดโดยเมทริกซ์การจ่ายผลตอบแทน ซึ่งมีองค์ประกอบคือผลตอบแทนของผู้เล่นคนแรก ซึ่งเป็นผลขาดทุนของผู้เล่นคนที่สองด้วย

    เกมเมทริกซ์ เป็นเกมที่เป็นปฏิปักษ์ ผู้เล่นคนแรกจะได้รับผลตอบแทนสูงสุดที่รับประกัน (ไม่ขึ้นอยู่กับพฤติกรรมของผู้เล่นคนที่สอง) เท่ากับราคาของเกม ในทำนองเดียวกัน ผู้เล่นคนที่สองจะได้รับการสูญเสียขั้นต่ำที่รับประกัน

    ภายใต้ กลยุทธ์ เป็นที่เข้าใจกันว่าเป็นชุดของกฎ (หลักการ) ที่กำหนดทางเลือกของการกระทำที่แตกต่างกันสำหรับการเคลื่อนไหวส่วนตัวของผู้เล่นแต่ละคน ขึ้นอยู่กับสถานการณ์ปัจจุบัน

    ตอนนี้เกี่ยวกับทุกอย่างตามลำดับและในรายละเอียด

    เมทริกซ์ผลตอบแทน กลยุทธ์บริสุทธิ์ ราคาเกม

    ที่ เกมเมทริกซ์ กฎของมันถูกกำหนด เมทริกซ์ผลตอบแทน .

    พิจารณาเกมที่มีผู้เข้าร่วมสองคน: ผู้เล่นคนแรกและผู้เล่นคนที่สอง ให้ผู้เล่นคนแรกมี กลยุทธ์ที่บริสุทธิ์และผู้เล่นคนที่สอง - กลยุทธ์ที่บริสุทธิ์ เนื่องจากเกมกำลังพิจารณาอยู่ เป็นเรื่องธรรมดาที่เกมนี้จะมีแพ้และชนะ

    ที่ เมทริกซ์การชำระเงิน องค์ประกอบคือตัวเลขที่แสดงการได้และเสียของผู้เล่น การชนะและแพ้สามารถแสดงเป็นคะแนน เงิน หรือหน่วยอื่นๆ

    มาสร้างเมทริกซ์ผลตอบแทน:

    หากผู้เล่นคนแรกเลือก ผม-th กลยุทธ์ที่บริสุทธิ์และผู้เล่นคนที่สอง เจ- กลยุทธ์ที่บริสุทธิ์จากนั้นผลตอบแทนของผู้เล่นคนแรกคือ ไอเจหน่วยและการสูญเสียของผู้เล่นคนที่สองก็เช่นกัน ไอเจหน่วย

    เนื่องจาก อิจ + (- ij ) = 0จากนั้นเกมที่อธิบายคือเกมเมทริกซ์ผลรวมเป็นศูนย์

    ตัวอย่างที่ง่ายที่สุดของเกมเมทริกซ์คือการโยนเหรียญ กฎของเกมมีดังนี้ ผู้เล่นคนแรกและคนที่สองโยนเหรียญและผลที่ได้คือหัวหรือก้อย หากมีการทอยหัวและหัวหรือก้อยพร้อมกัน ผู้เล่นคนแรกจะชนะหนึ่งหน่วย และในกรณีอื่น ๆ เขาจะเสียหนึ่งหน่วย (ผู้เล่นคนที่สองจะชนะหนึ่งหน่วย) กลยุทธ์สองแบบเดียวกันนั้นอยู่ที่การกำจัดของผู้เล่นคนที่สอง เมทริกซ์ผลตอบแทนที่เกี่ยวข้องจะเป็น:

    งานของทฤษฎีเกมคือการกำหนดทางเลือกของกลยุทธ์ของผู้เล่นคนแรก ซึ่งจะรับประกันว่าเขาจะได้รับค่าเฉลี่ยสูงสุด เช่นเดียวกับการเลือกกลยุทธ์ของผู้เล่นคนที่สอง ซึ่งจะรับประกันว่าเขาจะได้รับการสูญเสียโดยเฉลี่ยสูงสุด

    วิธีการเลือกกลยุทธ์ในเกมเมทริกซ์?

    ลองดูเมทริกซ์ผลตอบแทนอีกครั้ง:

    ขั้นแรก เราจะกำหนดผลตอบแทนของผู้เล่นคนแรกหากเขาใช้ ผมกลยุทธ์ที่บริสุทธิ์ หากผู้เล่นคนแรกใช้ ผม-th กลยุทธ์ที่บริสุทธิ์ ดังนั้นจึงมีเหตุผลที่จะสันนิษฐานว่าผู้เล่นคนที่สองจะใช้กลยุทธ์ที่บริสุทธิ์ดังกล่าว เนื่องจากผลตอบแทนของผู้เล่นคนแรกจะน้อยที่สุด ในทางกลับกัน ผู้เล่นคนแรกจะใช้กลยุทธ์ที่แท้จริงที่จะให้ผลตอบแทนสูงสุดแก่เขา ตามเงื่อนไขเหล่านี้ ผลตอบแทนของผู้เล่นคนแรกซึ่งเราแสดงว่าเป็น โวลต์1 , ถูกเรียก ชนะสูงสุด หรือ ราคาเกมที่ต่ำกว่า .

    ที่ สำหรับค่าเหล่านี้ ผู้เล่นคนแรกควรดำเนินการดังนี้ จากแต่ละบรรทัด ให้เขียนค่าขององค์ประกอบขั้นต่ำและเลือกค่าสูงสุดจากองค์ประกอบเหล่านั้น ดังนั้น ผลตอบแทนของผู้เล่นคนแรกจะสูงสุดจากขั้นต่ำ ดังนั้นชื่อ - ชนะสูงสุด หมายเลขบรรทัดขององค์ประกอบนี้จะเป็นหมายเลขของกลยุทธ์บริสุทธิ์ที่ผู้เล่นคนแรกเลือก

    ตอนนี้เรามาพิจารณาการสูญเสียของผู้เล่นคนที่สองหากเขาใช้ เจ-th กลยุทธ์ ในกรณีนี้ ผู้เล่นคนแรกใช้กลยุทธ์ของตัวเอง ซึ่งผู้เล่นคนที่สองจะสูญเสียมากที่สุด ผู้เล่นคนที่สองต้องเลือกกลยุทธ์ที่บริสุทธิ์ซึ่งการสูญเสียของเขาจะน้อยที่สุด การสูญเสียผู้เล่นคนที่สองซึ่งเราแสดงว่า โวลต์2 , ถูกเรียก การสูญเสียขั้นต่ำ หรือ ราคาเกมชั้นนำ .

    ที่ การแก้ปัญหาราคาของเกมและการกำหนดกลยุทธ์ เพื่อกำหนดค่าเหล่านี้สำหรับผู้เล่นคนที่สองให้ดำเนินการดังนี้ จากแต่ละคอลัมน์ ให้เขียนค่าขององค์ประกอบสูงสุดและเลือกค่าต่ำสุดจากองค์ประกอบเหล่านั้น ดังนั้น การสูญเสียของผู้เล่นคนที่สองจะเป็นค่าต่ำสุดของค่าสูงสุด ดังนั้นชื่อ - กำไรขั้นต่ำ หมายเลขคอลัมน์ขององค์ประกอบนี้จะเป็นหมายเลขของกลยุทธ์บริสุทธิ์ที่ผู้เล่นคนที่สองเลือก หากผู้เล่นคนที่สองใช้ "minimax" ผู้เล่นคนแรกจะแพ้มากที่สุดโดยไม่คำนึงถึงการเลือกกลยุทธ์ โวลต์2 หน่วย

    ตัวอย่างที่ 1

    .

    ที่ใหญ่ที่สุดในองค์ประกอบที่เล็กที่สุดของแถวคือ 2 นี่คือราคาที่ต่ำกว่าของเกม แถวแรกสอดคล้องกับมัน ดังนั้นกลยุทธ์สูงสุดของผู้เล่นคนแรกคือคนแรก องค์ประกอบที่เล็กที่สุดของคอลัมน์ที่ใหญ่ที่สุดคือ 5 ซึ่งเป็นราคาสูงสุดของเกม คอลัมน์ที่สองสอดคล้องกับมัน ดังนั้นกลยุทธ์ขั้นต่ำสุดของผู้เล่นคนที่สองจึงเป็นที่สอง

    ตอนนี้เราได้เรียนรู้วิธีหาราคาที่ต่ำและสูงของเกม กลยุทธ์ maximin และ minimax แล้วก็ถึงเวลาเรียนรู้วิธีกำหนดแนวคิดเหล่านี้อย่างเป็นทางการ

    ดังนั้นการรับประกันผลตอบแทนของผู้เล่นคนแรกคือ:

    ผู้เล่นคนแรกต้องเลือกกลยุทธ์ที่บริสุทธิ์ที่จะให้ผลตอบแทนขั้นต่ำสูงสุดแก่เขา กำไร (สูงสุด) นี้แสดงดังนี้:

    .

    ผู้เล่นคนแรกใช้กลยุทธ์ที่บริสุทธิ์เพื่อให้ผู้เล่นคนที่สองสูญเสียมากที่สุด การสูญเสียนี้ถูกกำหนดดังนี้:

    ผู้เล่นคนที่สองต้องเลือกกลยุทธ์ที่แท้จริงเพื่อให้การสูญเสียน้อยที่สุด การสูญเสียนี้ (minimax) แสดงดังนี้:

    .

    อีกตัวอย่างหนึ่งจากซีรีส์เดียวกัน

    ตัวอย่างที่ 2กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

    .

    กำหนดกลยุทธ์สูงสุดของผู้เล่นคนแรก กลยุทธ์ขั้นต่ำของผู้เล่นคนที่สอง ราคาที่ต่ำกว่าและสูงกว่าของเกม

    การตัดสินใจ. ทางด้านขวาของเมทริกซ์ payoff เราเขียนองค์ประกอบที่เล็กที่สุดในแถวและทำเครื่องหมายค่าสูงสุดและจากด้านล่างของเมทริกซ์ - องค์ประกอบที่ใหญ่ที่สุดในคอลัมน์และเลือกค่าต่ำสุด:

    ที่ใหญ่ที่สุดในองค์ประกอบที่เล็กที่สุดของแถวคือ 3 นี่คือราคาที่ต่ำกว่าของเกม แถวที่สองสอดคล้องกับมัน ดังนั้นกลยุทธ์สูงสุดของผู้เล่นคนแรกคือคนที่สอง องค์ประกอบที่เล็กที่สุดของคอลัมน์ที่ใหญ่ที่สุดคือ 5 นี่คือราคาสูงสุดของเกม คอลัมน์แรกสอดคล้องกับมัน ดังนั้นกลยุทธ์ขั้นต่ำของผู้เล่นคนที่สองจึงเป็นกลยุทธ์แรก

    จุดอานในเกมเมทริกซ์

    หากราคาบนและล่างของเกมเท่ากัน เกมเมทริกซ์จะถือว่ามีจุดอาน ในทางกลับกันก็เป็นความจริงเช่นกัน: หากเกมเมทริกซ์มีจุดอาน ราคาบนและล่างของเกมเมทริกซ์จะเท่ากัน องค์ประกอบที่สอดคล้องกันนั้นเป็นทั้งองค์ประกอบที่เล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์ และมีค่าเท่ากับราคาของเกม

    ดังนั้น ถ้า เป็นกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดสำหรับผู้เล่นคนแรก และเป็นกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดของผู้เล่นคนที่สอง นั่นคือ ราคาที่ต่ำกว่าและสูงกว่าของเกมจะเท่ากันในกลยุทธ์คู่เดียวกัน

    ในกรณีนี้ เกมเมทริกซ์มีวิธีแก้ปัญหาด้วยกลยุทธ์ที่บริสุทธิ์ .

    ตัวอย่างที่ 3กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

    .

    การตัดสินใจ. ทางด้านขวาของเมทริกซ์ payoff เราเขียนองค์ประกอบที่เล็กที่สุดในแถวและทำเครื่องหมายค่าสูงสุดและจากด้านล่างของเมทริกซ์ - องค์ประกอบที่ใหญ่ที่สุดในคอลัมน์และเลือกค่าต่ำสุด:

    ราคาที่ต่ำกว่าของเกมจะเหมือนกับราคาที่สูงขึ้นของเกม ดังนั้นราคาของเกมคือ 5 นั่นคือ ราคาของเกมจะเท่ากับมูลค่าของอานม้า กลยุทธ์สูงสุดของผู้เล่นคนแรกคือกลยุทธ์บริสุทธิ์ที่สอง และกลยุทธ์ขั้นต่ำสูงสุดของผู้เล่นคนที่สองคือกลยุทธ์บริสุทธิ์ที่สาม เกมเมทริกซ์นี้มีวิธีแก้ปัญหาด้วยกลยุทธ์ที่บริสุทธิ์

    แก้ปัญหาเกมเมทริกซ์ด้วยตัวคุณเอง แล้วดูวิธีแก้ปัญหา

    ตัวอย่างที่ 4กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

    .

    ค้นหาราคาที่ต่ำกว่าและสูงกว่าของเกม เกมเมทริกซ์นี้มีจุดอานหรือไม่?

    เกมเมทริกซ์พร้อมกลยุทธ์ผสมที่ดีที่สุด

    ในกรณีส่วนใหญ่ เกมเมทริกซ์ไม่มีอานม้า ดังนั้นเกมเมทริกซ์ที่เกี่ยวข้องจึงไม่มีวิธีแก้ปัญหาเชิงกลยุทธ์อย่างแท้จริง

    แต่มีวิธีแก้ปัญหาในกลยุทธ์ผสมที่เหมาะสมที่สุด ในการค้นหาพวกเขาจะต้องสันนิษฐานว่าเกมนั้นเล่นซ้ำหลายครั้งพอสมควรซึ่งขึ้นอยู่กับประสบการณ์ที่ใคร ๆ ก็สามารถเดาได้ว่ากลยุทธ์ใดดีกว่า ดังนั้นการตัดสินใจจึงเกี่ยวข้องกับแนวคิดของความน่าจะเป็นและค่าเฉลี่ย (ความคาดหวัง) ในการแก้ปัญหาขั้นสุดท้ายมีทั้งแบบอะนาล็อกของจุดอานม้า (นั่นคือความเท่าเทียมกันของราคาที่ต่ำกว่าและสูงกว่าของเกม) และแบบอะนาล็อกของกลยุทธ์ที่เกี่ยวข้อง

    ดังนั้น เพื่อให้ผู้เล่นคนแรกได้กำไรเฉลี่ยสูงสุด และสำหรับผู้เล่นคนที่สองได้ขาดทุนเฉลี่ยน้อยที่สุด ควรใช้กลยุทธ์บริสุทธิ์ด้วยความน่าจะเป็นที่แน่นอน

    หากผู้เล่นคนแรกใช้กลยุทธ์ที่บริสุทธิ์ด้วยความน่าจะเป็น แล้วเวกเตอร์ เรียกว่ากลยุทธ์ผสมของผู้เล่นคนแรก กล่าวอีกนัยหนึ่ง มันเป็น "ส่วนผสม" ของกลยุทธ์บริสุทธิ์ ผลรวมของความน่าจะเป็นเหล่านี้เท่ากับหนึ่ง:

    .

    หากผู้เล่นคนที่สองใช้กลยุทธ์ที่บริสุทธิ์ด้วยความน่าจะเป็น แล้วเวกเตอร์ เรียกว่ากลยุทธ์ผสมของผู้เล่นคนที่สอง ผลรวมของความน่าจะเป็นเหล่านี้เท่ากับหนึ่ง:

    .

    หากผู้เล่นคนแรกใช้กลยุทธ์แบบผสม หน้าและผู้เล่นคนที่สอง - กลยุทธ์แบบผสม ถามแล้วมันสมเหตุสมผล มูลค่าที่คาดหวัง ผู้เล่นคนแรกชนะ (ผู้เล่นคนที่สองแพ้) ในการหามัน คุณต้องคูณเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนแรก (ซึ่งจะเป็นเมทริกซ์หนึ่งแถว) เมทริกซ์ผลตอบแทน และเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนที่สอง (ซึ่งจะเป็นเมทริกซ์แบบหนึ่งคอลัมน์):

    .

    ตัวอย่างที่ 5กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

    .

    กำหนดความคาดหวังทางคณิตศาสตร์ของกำไรของผู้เล่นคนแรก (การสูญเสียของผู้เล่นคนที่สอง) หากกลยุทธ์แบบผสมของผู้เล่นคนแรกคือ และกลยุทธ์แบบผสมของผู้เล่นคนที่สองคือ

    การตัดสินใจ. ตามสูตรสำหรับความคาดหวังทางคณิตศาสตร์ของการได้รับของผู้เล่นคนแรก (การสูญเสียของผู้เล่นคนที่สอง) จะเท่ากับผลคูณของเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนแรก เมทริกซ์ผลตอบแทน และเวกเตอร์กลยุทธ์แบบผสมของผู้เล่นคนที่สอง:

    ผู้เล่นคนแรกเรียกว่ากลยุทธ์แบบผสมที่จะให้ผลตอบแทนเฉลี่ยสูงสุดแก่เขาหากเกมเล่นซ้ำในจำนวนครั้งที่เพียงพอ

    กลยุทธ์ผสมที่เหมาะสมที่สุด ผู้เล่นคนที่สองเรียกว่ากลยุทธ์แบบผสมซึ่งจะทำให้เขาสูญเสียโดยเฉลี่ยน้อยที่สุดหากเกมเล่นซ้ำในจำนวนครั้งที่เพียงพอ

    โดยการเปรียบเทียบกับสัญลักษณ์ของ maximin และ minimax ในกรณีของกลยุทธ์บริสุทธิ์ กลยุทธ์ผสมที่เหมาะสมจะแสดงดังนี้ (และเชื่อมโยงกับความคาดหวังทางคณิตศาสตร์ นั่นคือ ค่าเฉลี่ยของกำไรของผู้เล่นคนแรกและการสูญเสียของผู้เล่นคนที่สอง):

    ,

    .

    ในกรณีนี้ สำหรับฟังก์ชัน อี มีจุดอาน ซึ่งหมายถึงความเท่าเทียมกัน

    เพื่อค้นหากลยุทธ์ผสมและจุดอานที่เหมาะสมที่สุด กล่าวคือ แก้เกมเมทริกซ์ด้วยกลยุทธ์แบบผสม คุณต้องลดเกมเมทริกซ์ให้เป็นปัญหาโปรแกรมเชิงเส้น นั่นคือ เป็นปัญหาการปรับให้เหมาะสม และแก้ปัญหาโปรแกรมเชิงเส้นที่สอดคล้องกัน

    การย่อเกมเมทริกซ์ให้เป็นปัญหาการเขียนโปรแกรมเชิงเส้น

    ในการแก้เกมเมทริกซ์ด้วยกลยุทธ์แบบผสม คุณต้องสร้างเส้นตรง ปัญหาการโปรแกรมเชิงเส้นและ งานคู่ของมัน. ในปัญหาคู่ เมทริกซ์เสริมซึ่งเก็บค่าสัมประสิทธิ์ของตัวแปรในระบบจำกัด ค่าคงที่ และค่าสัมประสิทธิ์ของตัวแปรในฟังก์ชันเป้าหมายจะถูกย้าย ในกรณีนี้ ฟังก์ชันเป้าหมายขั้นต่ำของปัญหาเดิมจะสัมพันธ์กับค่าสูงสุดในปัญหาคู่

    ฟังก์ชันเป้าหมายในปัญหาการโปรแกรมเชิงเส้นตรง:

    .

    ระบบข้อจำกัดในปัญหาโดยตรงของโปรแกรมเชิงเส้น:

    ฟังก์ชั่นเป้าหมายในปัญหาคู่:

    .

    ระบบข้อ จำกัด ในปัญหาคู่:

    แสดงแผนที่เหมาะสมที่สุดของปัญหาการโปรแกรมเชิงเส้นตรง

    ,

    และแผนที่ดีที่สุดของปัญหาคู่จะแสดงด้วย

    รูปแบบเชิงเส้นสำหรับการออกแบบที่เหมาะสมที่สุดจะแสดงด้วย และ ,

    และคุณต้องค้นหาผลรวมของพิกัดที่สอดคล้องกันของแผนที่เหมาะสมที่สุด

    ตามคำจำกัดความของส่วนก่อนหน้าและพิกัดของแผนที่ดีที่สุด กลยุทธ์แบบผสมต่อไปนี้ของผู้เล่นคนแรกและคนที่สองใช้ได้:

    .

    นักคณิตศาสตร์ได้พิสูจน์แล้วว่า ราคาเกม จะแสดงในรูปแบบเส้นตรงของแผนที่เหมาะสมดังนี้

    ,

    นั่นคือเป็นผลรวมของพิกัดของแผนที่เหมาะสมที่สุด

    เราผู้ปฏิบัติงานสามารถใช้สูตรนี้เพื่อแก้ปัญหาเกมเมทริกซ์ในกลยุทธ์แบบผสม ชอบ สูตรสำหรับการค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด ผู้เล่นคนแรกและคนที่สองตามลำดับ:

    ซึ่งปัจจัยที่สองคือเวกเตอร์ กลยุทธ์แบบผสมที่เหมาะสมที่สุดคือเวกเตอร์ ดังที่เราได้กำหนดไว้ในย่อหน้าก่อนหน้า ดังนั้นการคูณจำนวน (ราคาของเกม) ด้วยเวกเตอร์ (ด้วยพิกัดของแผนที่เหมาะสมที่สุด) เราก็จะได้เวกเตอร์ด้วย

    ตัวอย่างที่ 6กำหนดเกมเมทริกซ์ด้วยเมทริกซ์ผลตอบแทน

    .

    ค้นหาราคาของเกม วีและกลยุทธ์ผสมที่เหมาะสมที่สุด และ

    การตัดสินใจ. เราสร้างปัญหาการเขียนโปรแกรมเชิงเส้นที่สอดคล้องกับเกมเมทริกซ์นี้:

    เราได้รับวิธีแก้ปัญหาโดยตรง:

    .

    เราพบรูปแบบเชิงเส้นของแผนที่ดีที่สุดเป็นผลรวมของพิกัดที่พบ

    การบรรยาย 11: ทฤษฎีเกมและการตัดสินใจ

    วิชาและภารกิจของทฤษฎีเกม

    ปัญหาคลาสสิกของการวิเคราะห์ระบบคือปัญหาของเกมในการตัดสินใจภายใต้ความเสี่ยงและความไม่แน่นอน

    ทั้งเป้าหมายของการปฏิบัติการ เงื่อนไขในการปฏิบัติการ และการกระทำโดยเจตนาของฝ่ายตรงข้ามหรือบุคคลอื่นซึ่งขึ้นอยู่กับความสำเร็จของการปฏิบัติการ อาจไม่แน่นอน

    พิเศษ วิธีการทางคณิตศาสตร์ออกแบบมาเพื่อปรับการตัดสินใจภายใต้ความเสี่ยงและความไม่แน่นอน ในบางกรณี วิธีที่ง่ายที่สุดช่วยให้ค้นหาและเลือกวิธีแก้ปัญหาที่เหมาะสมที่สุดได้ ในกรณีที่ซับซ้อนมากขึ้น วิธีการเหล่านี้จะให้ข้อมูลสนับสนุนที่ช่วยให้คุณเจาะลึกเข้าไปในสถานการณ์ที่ซับซ้อนและประเมินสถานการณ์แต่ละอย่างได้ การแก้ปัญหาที่เป็นไปได้จากมุมมองที่แตกต่างกัน และตัดสินใจโดยพิจารณาจากผลลัพธ์ที่เป็นไปได้ หนึ่งในเงื่อนไขที่สำคัญสำหรับการตัดสินใจในกรณีนี้คือการลดความเสี่ยง

    เมื่อแก้ปัญหาเชิงปฏิบัติจำนวนหนึ่งของการวิจัยปฏิบัติการ (ในด้านนิเวศวิทยา การรับรองความปลอดภัยในชีวิต ฯลฯ) เราจะต้องวิเคราะห์สถานการณ์ที่ฝ่ายสงครามสองฝ่าย (หรือมากกว่า) ปะทะกัน ไล่ตามเป้าหมายที่แตกต่างกัน และผลลัพธ์ของสิ่งใดสิ่งหนึ่ง กิจกรรมของแต่ละฝ่ายขึ้นอยู่กับว่าศัตรูจะเลือกดำเนินการอย่างไร สถานการณ์ดังกล่าวสามารถเรียกได้ว่าเป็น สถานการณ์ความขัดแย้ง.

    ทฤษฎีเกมคือ ทฤษฎีทางคณิตศาสตร์สถานการณ์ความขัดแย้งด้วยความช่วยเหลือซึ่งเป็นไปได้ที่จะพัฒนาคำแนะนำเกี่ยวกับแนวทางปฏิบัติที่มีเหตุผลของผู้เข้าร่วมในความขัดแย้ง เพื่อให้สามารถวิเคราะห์สถานการณ์ทางคณิตศาสตร์โดยไม่ต้องคำนึงถึงปัจจัยรอง จึงมีการสร้างแบบจำลองสถานการณ์แบบง่าย ๆ ขึ้น ซึ่งเรียกว่า เกม. เกมเล่นตามกฎที่กำหนดไว้อย่างดีซึ่งเป็นระบบเงื่อนไขที่ควบคุมตัวเลือกที่เป็นไปได้สำหรับการกระทำของผู้เล่น จำนวนข้อมูลที่แต่ละฝ่ายมีเกี่ยวกับพฤติกรรมของอีกฝ่ายหนึ่ง ผลลัพธ์ของเกมที่แต่ละชุดของการเคลื่อนไหวนำไปสู่

    ผลลัพธ์ของเกม (ชนะหรือแพ้) ไม่ได้มีนิพจน์เชิงปริมาณเสมอไป แต่โดยปกติแล้ว เป็นไปได้ อย่างน้อยตามเงื่อนไขจะแสดงด้วยค่าตัวเลข

    การย้ายคือการเลือกหนึ่งในการกระทำที่กำหนดโดยกฎของเกมและการนำไปใช้ การเคลื่อนไหวจะแบ่งออกเป็นส่วนบุคคลและแบบสุ่ม การเคลื่อนไหวส่วนบุคคลคือตัวเลือกที่ใส่ใจโดยผู้เล่นหนึ่งในตัวเลือกที่เป็นไปได้สำหรับการดำเนินการและการนำไปใช้ การย้ายแบบสุ่มคือการเลือกจากความเป็นไปได้หลายอย่าง ซึ่งไม่ได้ดำเนินการโดยการตัดสินใจของผู้เล่น แต่เกิดจากกลไกบางอย่างของการเลือกแบบสุ่ม (การโยนเหรียญ การเลือกไพ่จากสำรับที่สับ ฯลฯ) สำหรับการย้ายแบบสุ่มแต่ละครั้ง กฎของเกมจะกำหนดการแจกแจงความน่าจะเป็นของผลลัพธ์ที่เป็นไปได้ เกมอาจประกอบด้วยเฉพาะการเคลื่อนไหวส่วนบุคคลหรือการเคลื่อนไหวแบบสุ่มหรือทั้งสองอย่างรวมกัน แนวคิดพื้นฐานถัดไปของทฤษฎีเกมคือแนวคิดของกลยุทธ์ กลยุทธ์คือระบบการตัดสินใจเบื้องต้นที่ผู้เล่นนำมาใช้ (ประเภท “ถ้า-แล้ว”) ซึ่งเขาปฏิบัติตามในระหว่างเกม ซึ่งสามารถแสดงเป็นอัลกอริทึมและดำเนินการโดยอัตโนมัติ

    เป้าหมายของทฤษฎีเกมคือการพัฒนาคำแนะนำสำหรับพฤติกรรมที่สมเหตุสมผลของผู้เล่นในสถานการณ์ที่มีความขัดแย้ง นั่นคือ เพื่อกำหนด "กลยุทธ์ที่เหมาะสมที่สุด" สำหรับผู้เล่นแต่ละคน กลยุทธ์ที่เหมาะสมที่สุดในมาตรการหนึ่งอาจไม่จำเป็นต้องเหมาะสมที่สุดในการวัดอื่นๆ เมื่อตระหนักถึงข้อจำกัดเหล่านี้ และดังนั้นจึงไม่ปฏิบัติตามคำแนะนำที่ได้รับจากวิธีการเล่นเกมอย่างสุ่มสี่สุ่มห้า เรายังคงสามารถใช้เครื่องมือทางคณิตศาสตร์ของทฤษฎีเกมเพื่อพัฒนาได้ หากไม่เหมาะสมที่สุด อย่างน้อยก็ควรใช้กลยุทธ์ที่ "ยอมรับได้"

    เกมสามารถจำแนกได้: ตามจำนวนผู้เล่น จำนวนกลยุทธ์ ลักษณะการโต้ตอบของผู้เล่น ลักษณะของผลตอบแทน จำนวนการเคลื่อนไหว สถานะของข้อมูล ฯลฯ .

    ขึ้นอยู่กับจำนวนผู้เล่นแยกแยะความแตกต่างระหว่างเกมของผู้เล่นสองคนและผู้เล่น n คน คนแรกคือคนที่ศึกษามากที่สุด เกมที่มีผู้เล่นสามคนขึ้นไปได้รับการศึกษาน้อยลงเนื่องจากปัญหาพื้นฐานที่เกิดขึ้นและความเป็นไปได้ทางเทคนิคในการหาทางออก

    เกมแบ่งออกเป็น " สุดท้าย" และ " ไม่มีที่สิ้นสุด».

    กล่าวกันว่าเกมมีขอบเขตจำกัดหากผู้เล่นแต่ละคนมีจำนวนกลยุทธ์จำกัด และไม่มีที่สิ้นสุดหากผู้เล่นอย่างน้อยหนึ่งคนมีกลยุทธ์จำนวนไม่จำกัด

    โดยธรรมชาติของการโต้ตอบเกมแบ่งออกเป็นแบบไม่ร่วมมือ: ผู้เล่นไม่มีสิทธิ์ทำข้อตกลง, จัดตั้งพันธมิตร; แนวร่วม (สหกรณ์) - สามารถเข้าร่วมแนวร่วมได้

    ในเกมความร่วมมือ แนวร่วมถูกกำหนดไว้แล้ว

    โดยธรรมชาติของการชนะเกมแบ่งออกเป็น: เกมผลรวมเป็นศูนย์ (ทุนรวมของผู้เล่นทั้งหมดไม่เปลี่ยนแปลง แต่จะถูกแจกจ่ายระหว่างผู้เล่น ผลรวมของผลตอบแทนของผู้เล่นทั้งหมดเป็นศูนย์) และเกมที่ไม่ใช่ผลรวมศูนย์

    ตามประเภทของฟังก์ชันผลตอบแทนเกมแบ่งออกเป็น: เมทริกซ์, บิเมทริกซ์, ต่อเนื่อง, นูน ฯลฯ

    เมทริกซ์เกมดังกล่าวเป็นเกมสุดท้ายของผู้เล่นสองคนโดยมีผลรวมเป็นศูนย์ ซึ่งผลตอบแทนของผู้เล่น 1 จะได้รับในรูปแบบของเมทริกซ์ (แถวของเมทริกซ์ตรงกับจำนวนกลยุทธ์ที่ใช้ของผู้เล่น 1 คอลัมน์สอดคล้องกับ จำนวนของกลยุทธ์ที่ใช้ของผู้เล่นที่จุดตัดของแถวและคอลัมน์ของเมทริกซ์ พบผลตอบแทนของผู้เล่น 1 ที่สอดคล้องกับกลยุทธ์ที่ใช้ )

    สำหรับเกมเมทริกซ์ ได้รับการพิสูจน์แล้วว่าเกมใดเกมหนึ่งมีวิธีแก้ปัญหาและสามารถหาได้ง่ายโดยลดเกมให้เป็นปัญหาการเขียนโปรแกรมเชิงเส้น

    บิเมทริกซ์เกมดังกล่าวเป็นเกมที่จำกัดของผู้เล่นสองคนที่ผลรวมไม่เป็นศูนย์ ซึ่งผลตอบแทนของผู้เล่นแต่ละคนจะได้รับโดยเมทริกซ์แยกกันสำหรับผู้เล่นที่เกี่ยวข้อง (ในแต่ละเมทริกซ์ แถวสอดคล้องกับกลยุทธ์ของผู้เล่น 1 คอลัมน์สอดคล้องกัน สำหรับกลยุทธ์ของผู้เล่น 2 ที่จุดตัดของแถวและคอลัมน์ในเมทริกซ์แรกคือผลตอบแทนของผู้เล่น 1 ในเมทริกซ์ที่สองคือผลตอบแทนของผู้เล่น)

    ต่อเนื่องเกมจะถือว่าการจ่ายเงินของผู้เล่นแต่ละคนเป็นไปอย่างต่อเนื่อง ได้รับการพิสูจน์แล้วว่าเกมในชั้นเรียนนี้มีวิธีแก้ปัญหา แต่วิธีการที่ยอมรับได้จริงในการค้นหายังไม่ได้รับการพัฒนา

    หากฟังก์ชันการจ่ายผลตอบแทนมีลักษณะนูน แสดงว่าเกมดังกล่าวถูกเรียก นูน. สำหรับพวกเขา วิธีการแก้ปัญหาที่ยอมรับได้ได้รับการพัฒนา ซึ่งประกอบด้วยการค้นหากลยุทธ์ที่เหมาะสมที่สุดอย่างแท้จริง (จำนวนหนึ่ง) สำหรับผู้เล่นหนึ่งคน และความน่าจะเป็นของการใช้กลยุทธ์ที่เหมาะสมที่สุดอย่างแท้จริงของผู้เล่นอีกคนหนึ่ง งานนี้ค่อนข้างง่ายในการแก้ปัญหา

    การบันทึกเกม Matrix เป็น Payoff Matrix

    พิจารณาเกมที่จำกัดซึ่งผู้เล่นคนแรก A มีกลยุทธ์ m และผู้เล่นคนที่สอง กลยุทธ์ B-n. เกมดังกล่าวเรียกว่าเกม m×n แสดงกลยุทธ์ A 1 , A 2 , ... , A m ; และ B 1 , B 2 , ..., B n สมมติว่าแต่ละฝ่ายได้เลือกกลยุทธ์บางอย่าง: A i หรือ Bj หากเกมประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น การเลือกกลยุทธ์จะเป็นตัวกำหนดผลลัพธ์ของเกมโดยเฉพาะ นั่นคือการชนะของฝ่ายใดฝ่ายหนึ่ง a ij หากเกมมี นอกเหนือจากการเคลื่อนไหวแบบสุ่มส่วนบุคคล ผลตอบแทนสำหรับคู่ของกลยุทธ์ A i และ B จะเป็นตัวแปรสุ่มที่ขึ้นอยู่กับผลลัพธ์ของการเคลื่อนไหวแบบสุ่มทั้งหมด ในกรณีนี้ การประมาณตามธรรมชาติของผลตอบแทนที่คาดหวังคือผลตอบแทนที่คาดหวัง ซึ่งแสดงด้วย ij

    สมมติว่าเรารู้ค่าของ ij สำหรับกลยุทธ์แต่ละคู่ ค่าเหล่านี้สามารถเขียนในรูปแบบของตารางสี่เหลี่ยม (เมทริกซ์) แถวที่สอดคล้องกับกลยุทธ์ A ผม และคอลัมน์สอดคล้องกับกลยุทธ์ B j .

    จากนั้น โดยทั่วไป เกมเมทริกซ์สามารถเขียนเป็นเมทริกซ์ผลตอบแทนต่อไปนี้:

    บี1 บี2 ... บี เอ็น
    เอ 1 11 12 ... 1n
    A2 21 22 ... 2น
    ... ... ... ... ...
    เป็น m1 ตารางเมตร ... สาธุ

    ตาราง - แบบฟอร์มทั่วไปเมทริกซ์ผลตอบแทนของเกมเมทริกซ์

    โดยที่ A i คือชื่อกลยุทธ์ของผู้เล่น 1, B j คือชื่อของกลยุทธ์ของผู้เล่น 2, a ij คือผลตอบแทนของผู้เล่น 1 เมื่อเขาเลือกกลยุทธ์ i-th และผู้เล่น 2 — กลยุทธ์ j-th. เนื่องจากเกมนี้เป็นเกมผลรวมเป็นศูนย์ มูลค่าผลตอบแทนสำหรับผู้เล่น 2 จึงตรงกันข้ามกับมูลค่าผลตอบแทนสำหรับผู้เล่น 1

    แนวคิดของราคาล่างและบนของเกม ทางออกของเกมด้วยกลยุทธ์ที่บริสุทธิ์

    ผู้เล่นแต่ละคนพยายามเพิ่มผลตอบแทนสูงสุดโดยคำนึงถึงพฤติกรรมของผู้เล่นฝ่ายตรงข้าม ดังนั้นสำหรับผู้เล่นที่ 1 จำเป็นต้องกำหนดค่าขั้นต่ำของผลตอบแทนในแต่ละกลยุทธ์ จากนั้นค้นหาค่าสูงสุดของค่าเหล่านี้ นั่นคือ กำหนดค่า

    V n \u003d สูงสุด ฉัน นาที j a ij

    หรือค้นหาค่าต่ำสุดสำหรับแถวเมทริกซ์ผลตอบแทนแต่ละแถว จากนั้นกำหนดค่าสูงสุดของค่าเหล่านี้ ค่าของ Vn เรียกว่า สูงสุดเมทริกซ์หรือ ราคาเกมที่ต่ำกว่า. กลยุทธ์ของผู้เล่นที่สอดคล้องกับ maximin V n เรียกว่ากลยุทธ์ maximin

    เห็นได้ชัดว่าหากเราปฏิบัติตามกลยุทธ์สูงสุดสำหรับพฤติกรรมใด ๆ ของฝ่ายตรงข้ามเรารับประกันผลตอบแทนไม่น้อยกว่า V n ดังนั้นมูลค่าของ Vn จึงเป็นค่าต่ำสุดที่รับประกันได้ซึ่งเราสามารถจัดหาได้เอง โดยยึดมั่นในกลยุทธ์ที่ระมัดระวังที่สุดของเรา

    มูลค่าของกำไรของผู้เล่น 1 ตามนิยามของเกมเมทริกซ์คือมูลค่าของการสูญเสียของผู้เล่น ดังนั้น สำหรับผู้เล่น 2 จึงจำเป็นต้องกำหนดค่า

    V in = นาที j สูงสุด i a ij

    หรือค้นหาค่าสูงสุดสำหรับแต่ละคอลัมน์ของเมทริกซ์ผลตอบแทน จากนั้นกำหนดค่าต่ำสุดของค่าเหล่านี้ ค่า V in เรียกว่า มินิแม็กซ์เมทริกซ์, ราคาเกมชั้นนำหรือผลตอบแทนขั้นต่ำ กลยุทธ์ของฝ่ายตรงข้ามที่สอดคล้องกับผลตอบแทนเรียกว่ากลยุทธ์ขั้นต่ำสุดของเขา ด้วยการปฏิบัติตามกลยุทธ์ขั้นต่ำที่ระมัดระวังที่สุดของเขา คู่ต่อสู้รับประกันได้ว่าไม่ว่าในกรณีใดเขาจะสูญเสียไม่เกิน V c

    หากค่าของ V н และ V в ไม่ตรงกัน ในขณะที่ยังคงรักษากฎของเกม (ค่าสัมประสิทธิ์ a ij) ในระยะยาว การเลือกกลยุทธ์ของผู้เล่นแต่ละคนจะไม่เสถียร มันได้รับความเสถียรก็ต่อเมื่อ V n \u003d V in \u003d V ในกรณีนี้ พวกเขาบอกว่าเกมนี้มี โซลูชันในกลยุทธ์ที่บริสุทธิ์และกลยุทธ์ที่ทำให้ V ประสบความสำเร็จคือ กลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด. ค่า V ถูกเรียก ราคาสุทธิของเกม .

    ตัวอย่างเช่น ในเมทริกซ์:

    บี1 บี2 บี3 บี4 นาทีเจ
    เอ 1 17 16 15 14 14
    A2 11 18 12 13 11
    3 18 11 13 12 11
    แม็กซ์ ไอ 18 18 15 14

    ตาราง — Payoff matrix ซึ่งมีวิธีแก้ปัญหาในกลยุทธ์ล้วน ๆ

    มีวิธีแก้ปัญหาในกลยุทธ์ที่บริสุทธิ์ ในกรณีนี้ สำหรับผู้เล่น 1 กลยุทธ์บริสุทธิ์ที่ดีที่สุดคือกลยุทธ์ A 1 และสำหรับผู้เล่น 2 กลยุทธ์ B 4

    ในเมทริกซ์ ไม่มีวิธีแก้ปัญหาในกลยุทธ์ล้วน เนื่องจากราคาเกมที่ต่ำกว่ามาถึงในกลยุทธ์ A 1 และมูลค่าของมันคือ 12 ในขณะที่ราคาเกมบนถึงในกลยุทธ์ B 4 และมูลค่าของมันคือ 13

    บี1 บี2 บี3 บี4 นาทีเจ
    เอ 1 17 16 15 12 12
    A2 11 18 12 13 11
    3 18 11 13 12 11
    แม็กซ์ ไอ 18 18 15 13

    ตาราง - เมทริกซ์ผลตอบแทนซึ่งไม่มีทางออกในกลยุทธ์ล้วน ๆ

    การลดลำดับของเมทริกซ์ผลตอบแทน

    ลำดับของเมทริกซ์ผลตอบแทน (จำนวนแถวและคอลัมน์) สามารถลดลงได้โดยการกำจัดกลยุทธ์ที่โดดเด่นและซ้ำซ้อน

    เรียกว่ากลยุทธ์ K* ถูกครอบงำกลยุทธ์ K** ถ้าสำหรับตัวแปรใดๆ ของพฤติกรรมของผู้เล่นฝ่ายตรงข้าม ความสัมพันธ์

    ก*< A k** ,

    โดยที่ A k* และ A k** เป็นค่าของผลตอบแทนเมื่อผู้เล่นเลือกกลยุทธ์ K* และ K** ตามลำดับ

    ถ้าความสัมพันธ์

    กลยุทธ์ K* นั้นซ้ำซ้อนกับกลยุทธ์ K**

    ตัวอย่างเช่น ในเมทริกซ์ที่มีกลยุทธ์ที่โดดเด่นและซ้ำซ้อน กลยุทธ์ A 1 มีความโดดเด่นเมื่อเทียบกับกลยุทธ์ A 2 กลยุทธ์ B 6 ถูกครอบงำด้วยความเคารพ กลยุทธ์ B 3 , B 4 และ B 5 และกลยุทธ์ B 5 นั้นซ้ำกันด้วยความเคารพ สู่กลยุทธ์บีโฟร์

    บี1 บี2 บี3 บี4 บี5 B6
    เอ 1 1 2 3 4 4 7
    A2 7 6 5 4 4 8
    3 1 8 2 3 3 6
    A4 8 1 3 2 2 5

    ตาราง - เมทริกซ์ผลตอบแทนพร้อมกลยุทธ์ที่โดดเด่นและซ้ำซ้อน

    ผู้เล่นจะไม่เลือกกลยุทธ์เหล่านี้ เนื่องจากเห็นได้ชัดว่าพวกเขาแพ้ และการลบกลยุทธ์เหล่านี้ออกจากเมทริกซ์ผลตอบแทนจะไม่ส่งผลต่อการกำหนดราคาที่ต่ำกว่าและราคาสูงของเกมที่อธิบายไว้ในเมทริกซ์นี้

    ชุดของกลยุทธ์ที่ไม่ครอบงำที่ได้รับหลังจากลดมิติของเมทริกซ์ผลตอบแทนเรียกอีกอย่างว่าชุด Pareto

    ตัวอย่างเกม

    1. เกม "ไก่"

    เกม "ไก่" ประกอบด้วยผู้เล่นที่เข้าสู่การโต้ตอบที่นำไปสู่การก่อให้เกิดอันตรายร้ายแรงต่อพวกเขาแต่ละคนจนกว่าผู้เล่นคนใดคนหนึ่งจะออกจากเกม ตัวอย่างของการใช้เกมนี้คือการโต้ตอบ ยานยนต์ตัวอย่างเช่น สถานการณ์ที่รถสองคันสวนทางกัน และคันแรกหันไปทางด้านข้างถือเป็น "ไก่อ่อน" หรือ "ไก่" ความหมายของเกมคือการสร้างความตึงเครียดที่จะนำไปสู่การกำจัดผู้เล่น สถานการณ์นี้มักพบในวัยรุ่นหรือเยาวชนที่ก้าวร้าว แม้ว่าบางครั้งจะมีความเสี่ยงน้อยกว่าก็ตาม แอปพลิเคชั่นอื่นของเกมนี้คือสถานการณ์ที่สอง พรรคการเมืองสัมผัสกันโดยที่พวกเขาไม่สามารถชนะอะไรได้เลย และมีเพียงความหยิ่งผยองเท่านั้นที่ทำให้พวกเขาเผชิญหน้ากันต่อไป ภาคีช้าที่จะให้สัมปทานจนกว่าจะถึงจุดสุดท้าย ความเครียดทางจิตใจที่เกิดขึ้นสามารถนำผู้เล่นคนใดคนหนึ่งไปสู่กลยุทธ์พฤติกรรมที่ผิด: หากไม่มีผู้เล่นคนใดยอมจำนน การปะทะกันและข้อไขเค้าความร้ายแรงก็เป็นสิ่งที่หลีกเลี่ยงไม่ได้

    เมทริกซ์ผลตอบแทนสำหรับเกมมีลักษณะดังนี้:

    ผลผลิต อย่ายอมแพ้
    ผลผลิต 0, 0 -1, +1
    อย่ายอมแพ้ +1, -1 -100, -100

    2. เกม "ว่าวและนกพิราบ"

    เกมว่าวและนกพิราบเป็นตัวอย่างทางชีววิทยาของเกม ในเวอร์ชันนี้ ผู้เล่นสองคนที่มีทรัพยากรไม่จำกัดจะเลือกหนึ่งในสองกลยุทธ์เชิงพฤติกรรม แบบแรก ("นกพิราบ") คือผู้เล่นแสดงความแข็งแกร่งโดยข่มขู่คู่ต่อสู้ และแบบที่สอง ("ว่าว") คือผู้เล่นโจมตีคู่ต่อสู้ทางร่างกาย หากผู้เล่นทั้งสองเลือกกลยุทธ์การเล่นว่าว พวกเขาต่อสู้โดยทำร้ายซึ่งกันและกัน หากผู้เล่นคนใดคนหนึ่งเลือกกลยุทธ์ "ว่าว" และ "นกพิราบ" คนที่สอง คนแรกจะเอาชนะคนที่สอง หากผู้เล่นทั้งสองฝ่ายเป็นนกพิราบ ฝ่ายตรงข้ามก็จะประนีประนอมกัน โดยได้รับผลตอบแทนที่น้อยกว่าผลตอบแทนของว่าวที่เอาชนะนกพิราบได้ ดังจากตารางผลตอบแทนของเกมนี้

    ที่นี่ V คือราคาของข้อตกลง C คือราคาของความขัดแย้ง และ V

    มีจุดสมดุลของแนชสามจุดในเกมว่าวและนกพิราบ:

    1. ผู้เล่นคนแรกเลือกว่าว และผู้เล่นคนที่สองเลือกนกพิราบ
    2. ผู้เล่นคนแรกเลือกนกพิราบ และคนที่สองเลือกว่าว
    3. ผู้เล่นทั้งสองเลือกกลยุทธ์แบบผสมโดยเลือก "ว่าว" ด้วยความน่าจะเป็น p และ "นกพิราบ" ด้วยความน่าจะเป็น 1-p

    3. ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

    ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษเป็นหนึ่งในสถานการณ์ความขัดแย้งที่พบบ่อยที่สุดในทฤษฎีเกม

    ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษคลาสสิกมีดังนี้: ผู้ต้องสงสัยสองคน A และ B อยู่ในห้องขังต่างกัน ผู้สอบสวนไปเยี่ยมพวกเขาทีละคนเสนอข้อตกลงต่อไปนี้: หากหนึ่งในนั้นให้การต่อต้านอีกคนหนึ่งและคนที่สองยังคงนิ่งเฉย นักโทษคนแรกจะได้รับการปล่อยตัวและคนที่สองจะถูกตัดสินจำคุก 10 ปี หากทั้งคู่ยังนิ่งเฉย พวกเขาจะทำหน้าที่ 6 เดือน หากทั้งคู่หักหลังกัน แต่ละคนจะได้รับ 2 ปี นักโทษแต่ละคนต้องตัดสินใจ: ทรยศผู้สมรู้ร่วมคิดหรือนิ่งเงียบโดยไม่รู้ว่าอีกฝ่ายตัดสินใจอย่างไร ภาวะที่กลืนไม่เข้าคายไม่ออก: นักโทษจะตัดสินใจอย่างไร?

    เมทริกซ์ผลตอบแทนของเกม:

    ในกรณีนี้ผลขึ้นอยู่กับการตัดสินใจของผู้ต้องขังแต่ละคน ตำแหน่งของผู้เล่นมีความซับซ้อนเนื่องจากพวกเขาไม่รู้ว่าอีกฝ่ายตัดสินใจอย่างไรและไม่ไว้วางใจซึ่งกันและกัน

    กลยุทธ์ที่ดีที่สุดของผู้เล่นคือความร่วมมือ ซึ่งทั้งคู่เงียบและได้รับผลตอบแทนสูงสุด (ระยะเวลาที่น้อยกว่า) วิธีแก้ปัญหาของกันและกันจะชนะน้อยกว่า

    เรามาวิเคราะห์ "ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ" โดยผ่านเมทริกซ์ผลตอบแทนของรูปแบบมาตรฐานเพื่อความชัดเจน:

    ความร่วมมือ ปฏิเสธที่จะให้ความร่วมมือ
    ความร่วมมือ 3, 3 0, 5
    ปฏิเสธที่จะให้ความร่วมมือ 5, 0 1, 1

    ตามเมทริกซ์นี้ ต้นทุนของการไม่ร่วมมือซึ่งกันและกัน (S) คือ 1 คะแนนสำหรับผู้เล่นแต่ละคน ต้นทุนของความร่วมมือ (R) คือ 3 คะแนน และราคาของการล่อลวงให้หักหลังอีกฝ่ายหนึ่ง (T) คือ 5 คะแนน . เราสามารถเขียนความไม่เท่าเทียมกันได้ดังนี้: T > R > S เมื่อเกมเล่นซ้ำหลายๆ ครั้ง การเลือกความร่วมมือจะเอาชนะการล่อลวงให้หักหลังและรับผลตอบแทนสูงสุด: 2 R > T + S

    สมดุลของแนช

    ความสมดุลของ Nash คือสถานการณ์ที่ไม่มีผู้เล่นคนใดมีแรงจูงใจที่จะเปลี่ยนกลยุทธ์ของตน เนื่องจากกลยุทธ์ของผู้เล่นรายอื่น (บริษัทอื่น) ทำให้ผู้เล่นสามารถหาทางออกที่ประนีประนอมได้

    นิยามของสมดุลแนชและการมีอยู่ของมันกำหนดไว้ดังนี้

    ให้ (S, f) เป็นเกมที่ S คือชุดของกลยุทธ์ และ f คือชุดของผลตอบแทน เมื่อผู้เล่นแต่ละคน i ∈ (1, ..., n) เลือกกลยุทธ์ x i &อยู่ใน S โดยที่ x = (x 1 , ..., x n) จากนั้นผู้เล่น i จะได้รับผลตอบแทน f i (x) ผลตอบแทนขึ้นอยู่กับกลยุทธ์ที่ผู้เล่นทุกคนเลือก กลยุทธ์ x* ∈ S คือความสมดุลของแนช ถ้าไม่มีการเบี่ยงเบนจากมันโดยผู้เล่นคนใดคนหนึ่งทำให้เขาได้กำไร นั่นคือ ความไม่เท่าเทียมกันต่อไปนี้มีไว้สำหรับ i ทั้งหมด:

    ฉ ฉัน (x*) ≥ ฉ ฉัน (x ผม , x* -i)

    ตัวอย่างเช่น เกมภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษมีความสมดุลของ Nash ซึ่งเป็นสถานการณ์ที่นักโทษทั้งสองหักหลังกัน

    วิธีที่ง่ายที่สุดในการกำหนดสมดุลของแนชคือการใช้เมทริกซ์ผลตอบแทน โดยเฉพาะอย่างยิ่งในกรณีที่ผู้เล่นสองคนมีส่วนร่วมในเกม โดยมีกลยุทธ์มากกว่าสองกลยุทธ์ในคลังแสง เนื่องจากในกรณีนี้การวิเคราะห์อย่างเป็นทางการจะค่อนข้างซับซ้อนจึงใช้กฎช่วยจำซึ่งมีดังนี้: เซลล์ของเมทริกซ์ผลตอบแทนคือความสมดุลของแนชหากตัวเลขแรกในนั้นคือค่าสูงสุดในบรรดาค่าทั้งหมด แสดงในคอลัมน์ และตัวเลขที่สอง อยู่ในเซลล์ - จำนวนสูงสุดในทุกบรรทัด

    ตัวอย่างเช่น ใช้กฎนี้กับเมทริกซ์ 3x3:

    0, 0 25, 40 5, 10
    40, 25 0, 0 5, 15
    10, 5 15, 5 10, 10

    จุดสมดุลแนช: (B,A), (A,B) และ (C,C) อันที่จริง สำหรับเซลล์ (B,A) เนื่องจาก 40 เป็นค่าสูงสุดในคอลัมน์แรก 25 เป็นค่าสูงสุดในแถวที่สอง สำหรับเซลล์ (A,B) 25 คือค่าสูงสุดในคอลัมน์ที่สอง 40 คือค่าสูงสุดในแถวที่สอง เช่นเดียวกับเซลล์ (C,C)

    พิจารณาตัวอย่างเกมมลพิษ ( สิ่งแวดล้อม). ที่นี่จะเน้นของเรา ผลข้างเคียงการผลิตเป็นมลพิษ หากบริษัทต่างๆ ไม่เคยขอให้ใครทำอะไรเลย บริษัทเหล่านั้นย่อมสร้างมลพิษมากกว่าติดตั้งน้ำยาทำความสะอาดราคาแพง หากบริษัทใดตัดสินใจที่จะลดการปล่อยมลพิษที่เป็นอันตราย ต้นทุนและผลที่ตามมาคือราคาของผลิตภัณฑ์จะเพิ่มขึ้น และความต้องการจะลดลง เป็นไปได้ทีเดียวที่บริษัทนี้จะล้มละลาย การใช้ชีวิตในโลกที่โหดร้ายของการคัดเลือกโดยธรรมชาติ บริษัทต่างๆ ค่อนข้างจะอยู่ในสมดุลของแนช (เซลล์ D) ซึ่งไม่จำเป็นต้องเสียเงินไปกับโรงบำบัดน้ำเสียและเทคโนโลยี ไม่มีบริษัทใดสามารถเพิ่มผลกำไรโดยการลดมลพิษ

    บริษัท 1
    บริษัท 2 มลพิษต่ำ มลพิษในระดับสูง
    มลพิษต่ำ และ
    100,100
    ที่
    -30,120
    มลพิษในระดับสูง จาก
    120,-30

    100,100

    ตาราง - เมทริกซ์ผลตอบแทนของเกมในมลพิษทางสิ่งแวดล้อม

    เมื่อเข้าสู่เกมเศรษฐกิจ บริษัทเหล็กทุกแห่งที่ไม่มีการควบคุมและทำกำไรสูงสุดจะสร้างมลพิษทางน้ำและอากาศ หากบริษัทใดพยายามที่จะกำจัดการปล่อยมลพิษ บริษัทนั้นจะถูกบังคับให้ขึ้นราคาและต้องสูญเสีย พฤติกรรมที่ไม่ร่วมมือจะสร้างสมดุลของแนชภายใต้สภาวะผิดปกติสูง รัฐบาลสามารถดำเนินการเพื่อย้ายสมดุลไปที่เซลล์ A ในตำแหน่งนี้ มลพิษจะเล็กน้อย แต่ผลกำไรจะยังคงเหมือนเดิม

    เกมมลพิษเป็นหนึ่งในกรณีที่กลไกของ "มือที่มองไม่เห็น" ไม่ทำงาน นี่คือสถานการณ์ที่สมดุลของ Nash ไม่มีประสิทธิภาพ บางครั้งเกมที่อยู่เหนือการควบคุมเหล่านี้กลายเป็นภัยคุกคามและรัฐบาลสามารถเข้าแทรกแซงได้ โดยการจัดตั้งระบบค่าปรับและโควตาการปล่อยมลพิษ รัฐบาลสามารถชักจูงให้บริษัทต่างๆ เลือกผลลัพธ์ A ที่สอดคล้องกับมลพิษต่ำ บริษัทมีรายได้เท่าเดิม ด้วยการปล่อยมลพิษจำนวนมาก และโลกก็สะอาดขึ้น

    ตัวอย่างของการแก้เกมเมทริกซ์ด้วยกลยุทธ์ล้วน ๆ

    ให้เราพิจารณาตัวอย่างการแก้เกมเมทริกซ์ด้วยกลยุทธ์ล้วน ๆ ในเศรษฐกิจจริง ในสถานการณ์ที่องค์กรสองแห่งต่อสู้เพื่อตลาดผลิตภัณฑ์ของภูมิภาค

    งาน.

    องค์กรสองแห่งผลิตผลิตภัณฑ์และจัดหาให้กับตลาดระดับภูมิภาค พวกเขาเป็นผู้จัดหาผลิตภัณฑ์เพียงรายเดียวในภูมิภาค ดังนั้นจึงเป็นผู้กำหนดตลาดสำหรับผลิตภัณฑ์เหล่านี้ในภูมิภาคอย่างสมบูรณ์

    แต่ละองค์กรมีความสามารถในการผลิตผลิตภัณฑ์โดยใช้หนึ่งในสามเทคโนโลยีที่แตกต่างกัน ขึ้นอยู่กับความเป็นมิตรต่อสิ่งแวดล้อมของกระบวนการทางเทคโนโลยีและคุณภาพของผลิตภัณฑ์ที่ผลิตโดยแต่ละเทคโนโลยี องค์กรสามารถกำหนดราคาต่อหน่วยการผลิตที่ระดับ 10, 6 และ 2 หน่วยการเงินตามลำดับ ในเวลาเดียวกัน องค์กรต่างๆ มีค่าใช้จ่ายที่แตกต่างกันสำหรับการผลิตต่อหน่วยของผลผลิต

    ตาราง - ต้นทุนต่อหน่วยของผลผลิตที่ผลิตในองค์กรของภูมิภาค (หน่วยสกุลเงิน)

    จากผลการวิจัยการตลาดของตลาดผลิตภัณฑ์ในภูมิภาค ฟังก์ชันความต้องการผลิตภัณฑ์ถูกกำหนด:

    Y = 6 - 0.5⋅X,

    โดยที่ Y คือจำนวนสินค้าที่ประชากรในภูมิภาคจะซื้อ (พันหน่วย) และ X คือราคาเฉลี่ยของผลิตภัณฑ์ขององค์กร c.u.

    ข้อมูลความต้องการสินค้าขึ้นอยู่กับราคาขายแสดงไว้ในตาราง:

    ราคาขาย 1 หน่วย ผลิตภัณฑ์ม.ยู.

    ราคาขายเฉลี่ย 1 ยูนิต ผลิตภัณฑ์ม.ยู.

    ความต้องการสินค้าพันหน่วย

    เอ็นเตอร์ไพรส์1 เอ็นเตอร์ไพรส์2
    10 10 10 1
    10 6 8 2
    10 2 6 3
    6 10 8 2
    6 6 6 3
    6 2 4 4
    2 10 6 3
    2 6 4 4
    2 2 2 5

    ตาราง - ความต้องการสินค้าในภูมิภาค พันหน่วย

    มูลค่าของหุ้นของผลิตภัณฑ์ขององค์กร 1 ที่ซื้อโดยประชากรขึ้นอยู่กับอัตราส่วนของราคาสำหรับผลิตภัณฑ์ขององค์กร 1 และองค์กร จากผลการวิจัยทางการตลาดการพึ่งพาอาศัยกันนี้ถูกสร้างขึ้นและค่าต่างๆ คำนวณ:

    ตาราง - ส่วนแบ่งของผลิตภัณฑ์ขององค์กร 1 ที่ซื้อโดยประชากรขึ้นอยู่กับอัตราส่วนของราคาสำหรับผลิตภัณฑ์

    ตามสภาพของปัญหามีเพียง 2 องค์กรเท่านั้นที่ดำเนินการในตลาดระดับภูมิภาค ดังนั้นส่วนแบ่งของผลิตภัณฑ์ขององค์กรที่สองที่ซื้อโดยประชากรขึ้นอยู่กับอัตราส่วนของราคาของผลิตภัณฑ์สามารถกำหนดเป็นหน่วยลบด้วยส่วนแบ่งขององค์กรแรก

    กลยุทธ์ขององค์กรในปัญหานี้คือการตัดสินใจเกี่ยวกับเทคโนโลยีการผลิต การตัดสินใจเหล่านี้กำหนดต้นทุนและราคาขายของหน่วยการผลิต งานต้องกำหนด:

    1. มีสถานการณ์สมดุลในปัญหานี้ในการเลือกเทคโนโลยีการผลิตของทั้งสององค์กรหรือไม่?
    2. มีเทคโนโลยีใดบ้างที่องค์กรจะไม่เลือกอย่างชัดเจนเนื่องจากความเสียเปรียบ
    3. สถานการณ์ดุลยภาพจะขายได้กี่ผลิตภัณฑ์ บริษัทใดจะเป็นผู้ชนะ?

    ทางออกของปัญหา

    1. มากำหนดกันเถอะ ความรู้สึกทางเศรษฐกิจค่าสัมประสิทธิ์ผลตอบแทนในเมทริกซ์ผลตอบแทนของปัญหา แต่ละองค์กรพยายามที่จะเพิ่มผลกำไรจากการผลิตสินค้า นอกจากนี้ ในกรณีนี้ องค์กรต่าง ๆ กำลังต่อสู้เพื่อตลาดผลิตภัณฑ์ในภูมิภาค ในขณะเดียวกัน การที่องค์กรหนึ่งได้กำไรก็หมายถึงการสูญเสียอีกองค์กรหนึ่งไปด้วย ปัญหาดังกล่าวสามารถลดลงเป็นเกมเมทริกซ์ผลรวมศูนย์ ในกรณีนี้ ค่าสัมประสิทธิ์ของกำไรจะเป็นผลต่างระหว่างกำไรขององค์กร 1 และองค์กร 2 จากการผลิตผลิตภัณฑ์ หากความแตกต่างนี้เป็นค่าบวก องค์กร 1 จะชนะ และถ้าเป็นลบ องค์กร 2 จะเป็นผู้ชนะ
    2. คำนวณค่าสัมประสิทธิ์ของผลตอบแทนเมทริกซ์ ในการทำเช่นนี้จำเป็นต้องกำหนดค่ากำไรขององค์กร 1 และองค์กร 2 จากการผลิตผลิตภัณฑ์

    กำไรขององค์กรในปัญหานี้ขึ้นอยู่กับ:

    • จากราคาและต้นทุนการผลิต
    • จำนวนสินค้าที่ซื้อโดยประชากรในภูมิภาคนั้น
    • จากส่วนแบ่งของผลิตภัณฑ์ที่ซื้อโดยประชากรจากองค์กร

    ดังนั้นมูลค่าของความแตกต่างในผลกำไรขององค์กรที่สอดคล้องกับค่าสัมประสิทธิ์ของเมทริกซ์ผลตอบแทนจะต้องถูกกำหนดโดยสูตร:

    D = p⋅(S⋅R1 - S⋅C1) - (1 - p)⋅(S⋅R2 - S⋅C2),

    โดยที่ D คือค่าความแตกต่างของกำไรจากการผลิตผลิตภัณฑ์ขององค์กร 1 และองค์กร

    p คือส่วนแบ่งของผลิตภัณฑ์ขององค์กร 1 ที่ซื้อโดยประชากรในภูมิภาค

    S คือจำนวนสินค้าที่ซื้อโดยประชากรในภูมิภาค

    R1 และ R2 คือราคาขายของหน่วยการผลิตโดยวิสาหกิจ 1 และ

    C1 และ C2 คือต้นทุนรวมของหน่วยการผลิตที่ผลิตในวิสาหกิจ 1 และ

    ลองคำนวณหนึ่งในค่าสัมประสิทธิ์เมทริกซ์ผลตอบแทน

    ตัวอย่างเช่น องค์กร 1 ตัดสินใจเกี่ยวกับการผลิตผลิตภัณฑ์ตามเทคโนโลยี III และองค์กร 2 - ตามเทคโนโลยี II แล้วราคาขายต่อหน่วย. ผลิตภัณฑ์สำหรับองค์กร 1 จะเป็น CU 2 ในราคาต่อหน่วย สินค้า CU 1.5 สำหรับ Enterprise 2 ราคาขายต่อหน่วย การผลิตจะเป็น CU 6 ในราคา CU 4

    จำนวนของผลิตภัณฑ์ที่ประชากรในภูมิภาคจะได้รับด้วย ราคาเฉลี่ย 4 ลบ.ม. เท่ากับ 4 พันหน่วย (ตารางที่ 1). ส่วนแบ่งของผลิตภัณฑ์ที่ประชากรจะซื้อจากองค์กร 1 จะเท่ากับ 0.85 และจากองค์กร 2 - 0.15 (ตารางที่ 1.3) คำนวณค่าสัมประสิทธิ์เมทริกซ์ผลตอบแทน 32 โดยใช้สูตร:

    a 32 \u003d 0.85⋅ (4⋅2 - 4 × 1.5) - 0.15⋅ (4⋅6 - 4⋅4) \u003d 0.5 พันหน่วย

    โดยที่ i=3 คือหมายเลขเทคโนโลยีขององค์กรแรก และ j=2 คือหมายเลขเทคโนโลยีขององค์กรที่สอง

    ในทำนองเดียวกัน เราคำนวณค่าสัมประสิทธิ์ทั้งหมดของเมทริกซ์ผลตอบแทน ในเมทริกซ์ผลตอบแทน กลยุทธ์ A 1 - A 3 - แสดงถึงการตัดสินใจเกี่ยวกับเทคโนโลยีการผลิตโดยองค์กร 1 กลยุทธ์ B 1 - B 3 - การตัดสินใจเกี่ยวกับเทคโนโลยีการผลิตโดยองค์กร 2 อัตราส่วนผลตอบแทน - ความแตกต่างของผลกำไรระหว่างองค์กร 1 และองค์กร

    บี1 บี2 บี3 นาทีเจ
    เอ 1 0,17 0,62 0,24 0,17
    A2 0,3 -1,5 -0,8 -1
    3 0,9 0,5 0,4 0,4
    แม็กซ์ ไอ 3 0,62 0,4

    ตาราง - เมทริกซ์ผลตอบแทนในเกม "การต่อสู้ของสององค์กร"

    ไม่มีกลยุทธ์ที่ครอบงำหรือซ้ำซ้อนในเมทริกซ์นี้ ซึ่งหมายความว่าสำหรับทั้งสององค์กรไม่มีเทคโนโลยีการผลิตที่ไม่เกิดประโยชน์อย่างเห็นได้ชัด ให้เรากำหนดองค์ประกอบขั้นต่ำของแถวของเมทริกซ์ สำหรับองค์กร 1 แต่ละองค์ประกอบมีค่าของผลตอบแทนขั้นต่ำที่รับประกันเมื่อเลือกกลยุทธ์ที่เหมาะสม องค์ประกอบขั้นต่ำของเมทริกซ์ตามแถวมีค่าต่อไปนี้: 0.17, -1.5, 0.4

    ให้เรากำหนดองค์ประกอบสูงสุดของคอลัมน์เมทริกซ์ สำหรับองค์กร 2 แต่ละองค์ประกอบเหล่านี้ยังมีมูลค่าของผลตอบแทนขั้นต่ำที่รับประกันเมื่อเลือกกลยุทธ์ที่เหมาะสม องค์ประกอบสูงสุดของเมทริกซ์ตามคอลัมน์มีค่าต่อไปนี้: 3, 0.62, 0.4

    ราคาที่ต่ำกว่าของเกมในเมทริกซ์คือ 0.4 ราคาสูงสุดของเกมเท่ากับ 0.4 ดังนั้นราคาที่ต่ำกว่าและสูงกว่าของเกมในเมทริกซ์จึงเท่ากัน ซึ่งหมายความว่ามีเทคโนโลยีการผลิตที่เหมาะสมที่สุดสำหรับทั้งสององค์กรภายใต้เงื่อนไขของงานนี้ เทคโนโลยีนี้คือ III ซึ่งสอดคล้องกับกลยุทธ์ A 3 องค์กร 1 และ B 3 องค์กร กลยุทธ์ A 3 และ B 3 เป็นกลยุทธ์ที่เหมาะสมที่สุดในปัญหานี้

    ค่าของผลต่างระหว่างกำไรขององค์กร 1 และองค์กร 2 เมื่อเลือกกลยุทธ์สุทธิที่เหมาะสมจะเป็นค่าบวก ซึ่งหมายความว่า Enterprise 1 จะชนะเกมนี้ เอ็นเตอร์ไพรส์ 1 จะได้ CU 0.4 พันล. ในเวลาเดียวกัน 5,000 หน่วยจะขายในตลาด สินค้า (ยอดขายเท่ากับความต้องการสินค้า ตารางที่ 1) ทั้งสองวิสาหกิจจะกำหนดราคาต่อหน่วยของผลผลิตที่ CU 2 ในกรณีนี้ สำหรับองค์กรแรก ต้นทุนเต็มของหน่วยการผลิตจะเป็น CU 1.5 และสำหรับองค์กรที่สอง - CU 1 องค์กร 1 จะได้รับประโยชน์เนื่องจากมีส่วนแบ่งสูงของผลิตภัณฑ์ที่ประชากรจะซื้อจากมัน

    เกณฑ์การตัดสินใจ

    ผู้ตัดสินใจกำหนดกลยุทธ์ที่ให้ผลกำไรสูงสุดขึ้นอยู่กับการกำหนดเป้าหมายซึ่งเขานำไปใช้ในกระบวนการแก้ปัญหา ผู้ตัดสินใจกำหนดผลลัพธ์ของการแก้ปัญหาโดยหนึ่งในนั้น เกณฑ์การตัดสินใจ. เพื่อให้ได้ผลลัพธ์ที่ชัดเจนและหากเป็นไปได้ โซลูชันที่ได้เปรียบที่สุด จำเป็นต้องแนะนำฟังก์ชันการประเมิน (เป้าหมาย) ในขณะเดียวกัน กลยุทธ์ของผู้ตัดสินใจแต่ละราย (A i) จะได้รับผลลัพธ์บางอย่าง W i ซึ่งระบุลักษณะผลลัพธ์ทั้งหมดของการตัดสินใจนี้ จากอาร์เรย์ของผลการตัดสินใจ ผู้ตัดสินใจเลือกองค์ประกอบ W ที่สะท้อนถึงแรงจูงใจในพฤติกรรมของเขาได้ดีที่สุด

    ขึ้นอยู่กับเงื่อนไข สภาพแวดล้อมภายนอกและระดับความให้ข้อมูลของผู้ตัดสินใจ จำแนกประเภทของงานตัดสินใจดังต่อไปนี้:

    • มีความเสี่ยง;
    • ในสภาวะที่ไม่แน่นอน
    • ในเงื่อนไขของความขัดแย้งหรือการต่อต้าน (ศัตรูที่แข็งขัน)

    การตัดสินใจภายใต้ความเสี่ยง

    1. เกณฑ์มูลค่าที่คาดว่าจะได้รับ

    การใช้เกณฑ์มูลค่าที่คาดหวังนั้นเกิดจากความต้องการที่จะเพิ่มผลกำไรที่คาดหวังให้สูงสุด (หรือลดค่าใช้จ่ายที่คาดหวังให้น้อยที่สุด) การใช้ค่าที่คาดหวังแสดงถึงความเป็นไปได้ในการแก้ปัญหาเดียวกันหลาย ๆ ครั้งจนกว่าจะได้สูตรการคำนวณที่แม่นยำเพียงพอ ในทางคณิตศาสตร์ ดูเหมือนว่าให้ X - ค่าสุ่มด้วยความคาดหวังทางคณิตศาสตร์ MX และความแปรปรวน DX ถ้า x 1 , x 2 , ..., x n เป็นค่าของตัวแปรสุ่ม (r.v.) X ดังนั้นค่าเฉลี่ยเลขคณิตของค่า (ค่าเฉลี่ยตัวอย่าง) x^=(x 1 +x 2 +.. .+x n)/ n มีความแปรปรวนเป็น DX/n ดังนั้น เมื่อ n→∞ DX/n→∞ และ X→MX

    กล่าวอีกนัยหนึ่ง ด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ ความแตกต่างระหว่างค่าเฉลี่ยเลขคณิตและความคาดหวังทางคณิตศาสตร์มีแนวโน้มที่จะเป็นศูนย์ (เรียกว่าทฤษฎีบทขีดจำกัดของทฤษฎีความน่าจะเป็น) ดังนั้นการใช้เกณฑ์มูลค่าที่คาดไว้จะใช้ได้เฉพาะในกรณีที่ต้องใช้โซลูชันเดียวกันจำนวนมากเพียงพอ สิ่งที่ตรงกันข้ามก็เป็นจริงเช่นกัน: การวางแนวความคาดหวังจะนำไปสู่ผลลัพธ์ที่ไม่ถูกต้องสำหรับการตัดสินใจที่ต้องทำหลายครั้ง

    ตัวอย่างที่ 1. จำเป็นต้องตัดสินใจว่าเมื่อใดจำเป็นต้องดำเนินการบำรุงรักษาเชิงป้องกันของพีซีเพื่อลดการสูญเสียเนื่องจากการทำงานผิดพลาดให้เหลือน้อยที่สุด หากมีการซ่อมแซมบ่อยเกินไป ค่าบำรุงรักษาจะสูงโดยสูญเสียเพียงเล็กน้อยเนื่องจากการเสียโดยไม่ตั้งใจ

    เนื่องจากไม่สามารถคาดการณ์ล่วงหน้าได้ว่าจะเกิดความผิดปกติเมื่อใด จึงจำเป็นต้องค้นหาความน่าจะเป็นที่พีซีจะล้มเหลวในช่วงเวลา t นี่คือองค์ประกอบของความเสี่ยง

    ในทางคณิตศาสตร์ ดูเหมือนว่าพีซีจะได้รับการซ่อมแซมทีละเครื่องหากเครื่องหยุดทำงานเนื่องจากการเสีย หลังจากช่วงเวลา T การบำรุงรักษาเชิงป้องกันของพีซีทั้งหมด n เครื่องจะดำเนินการ จำเป็นต้องกำหนดค่าที่เหมาะสมที่สุดของ m ซึ่งจะช่วยลดต้นทุนรวมของการซ่อมพีซีที่ผิดพลาดและดำเนินการซ่อมแซมเชิงป้องกันต่อช่วงเวลาหนึ่ง

    ให้ p t เป็นความน่าจะเป็นของพีซีหนึ่งเครื่องที่ล้มเหลวในเวลา t และ n t เป็นตัวแปรสุ่มเท่ากับจำนวนพีซีทั้งหมดที่ล้มเหลวในเวลาเดียวกัน ให้เพิ่มเติม C 1 - ค่าซ่อมพีซีที่ชำรุด และ C 2 - ค่าบำรุงรักษาเชิงป้องกันของเครื่องหนึ่งเครื่อง

    การประยุกต์ใช้เกณฑ์มูลค่าที่คาดไว้ในกรณีนี้ถือว่าสมเหตุสมผลหากใช้งานพีซีเป็นเวลานาน ในกรณีนี้ ค่าใช้จ่ายที่คาดไว้สำหรับหนึ่งช่วงเวลาจะเท่ากับ

    OZ = (C 1 ∑M(n t)+C 1 n)/T,

    โดยที่ M(n t) คือค่าคาดหมายทางคณิตศาสตร์ของจำนวนพีซีที่ล้มเหลว ณ เวลา t เนื่องจากไม่มี การกระจายทวินามด้วยพารามิเตอร์ (n, p t) จากนั้น M(n t) = np t . ทางนี้

    OZ \u003d n (C 1 ∑p t + C 2) / T

    เงื่อนไขที่เหมาะสมที่สุดที่จำเป็น T * มีรูปแบบ:

    ออนซ์ (T * -1) ≥ ออนซ์ (T *),

    ออนซ์ (T * +1) ≥ ออนซ์ (T *)

    ดังนั้น เริ่มจากค่า T น้อยๆ ให้คำนวณ OZ(

    ต) จนกว่าจะพอใจ เงื่อนไขที่จำเป็นความเหมาะสม

    ให้ C 1 = 100; ค 2 = 10; n = 50 ค่า pt คือ:

    พี ที ∑р t ออนซ์(T)
    1 0.05 0 50(100⋅0+10)/1=500
    2 0.07 0.05 375
    3 0.10 0.12 366.7
    4 0.13 02 400
    5 0.18 0.35 450

    T * →3, OZ(T *)→366.7

    ดังนั้นการบำรุงรักษาเชิงป้องกันต้องทำผ่าน T * = 3 ช่วงเวลา

    เกณฑ์ "ค่าที่คาดหวัง - ความแปรปรวน"

    เกณฑ์มูลค่าที่คาดหวังสามารถแก้ไขได้เพื่อให้สามารถใช้กับสถานการณ์ที่ไม่ค่อยเกิดขึ้น

    ถ้า x - s ใน. ด้วยความแปรปรวน DX ดังนั้นค่าเฉลี่ยเลขคณิต x^ จะมีความแปรปรวน DX/n โดยที่ n คือจำนวนพจน์ใน x^ ดังนั้น หาก DX ลดลงและความน่าจะเป็นที่ x^ ใกล้เคียงกับ MX จะเพิ่มขึ้น ดังนั้นจึงแนะนำให้แนะนำเกณฑ์ที่รวมมูลค่าสูงสุดของกำไรที่คาดว่าจะได้รับรวมกับการลดความแปรปรวนให้น้อยที่สุด

    ตัวอย่างที่ 2. ลองใช้เกณฑ์ "ค่าที่คาดหวัง - ความแปรปรวน" เช่น 1 ในการทำเช่นนี้ คุณต้องค้นหาผลต่างของต้นทุนสำหรับช่วงเวลาหนึ่ง เช่น การกระจายตัว

    s T \u003d (C 1 ∑n t + C 2 n) / T

    เพราะ n t , t = (1, T-1) คือ r.v. แล้ว s T ก็คือ r.v. เอส.วี. n t มีการแจกแจงแบบทวินามด้วย M(n t) = np t และ D(n t) = np t (1–p t) เพราะเหตุนี้,

    D(s T) = D((C 1 ∑n t +C 2 n)/T) = (C 1 /T) 2 D(∑n t) =

    = (C 1 /T) 2 ∑Dn t = (C 1 /T) 2 ∑np t (1-p t) = (C 1 /T) 2 (∑p t - ∑p t 2 ),

    โดยที่ C 2 n = const

    จากตัวอย่างที่ 1 เป็นไปตามนั้น

    M(s T) = M(s(T)).

    ดังนั้นเกณฑ์ที่ต้องการจะเป็นนิพจน์ขั้นต่ำ

    M(s(T)) + ถึง D(s T)

    ความคิดเห็น. ค่าคงที่ "k" ถือได้ว่าเป็นระดับ ไม่ชอบความเสี่ยง, เพราะ "k" กำหนด "ระดับของความเป็นไปได้" ของการกระจาย D(s T) ที่สัมพันธ์กับ ความคาดหวังทางคณิตศาสตร์. ตัวอย่างเช่น หากผู้ประกอบการมีความอ่อนไหวเป็นพิเศษต่อการเบี่ยงเบนของกำไรในเชิงลบอย่างมากจาก M(s(T)) เขาสามารถเลือก "k" ที่มากกว่า 1 มาก สิ่งนี้ให้น้ำหนักมากขึ้นกับความแปรปรวนและนำไปสู่การแก้ปัญหาที่ ลดโอกาสในการสูญเสียผลกำไรจำนวนมาก

    สำหรับ k=1 เราได้รับปัญหา

    M(s(T))+D(s(T)) = n ( (C 1 /T+C 1 2 /T 2)∑p t - C 1 2 /T 2 ∑p t 2 + C 2 /T )

    โดยใช้ข้อมูลจากตัวอย่างที่ 1 คุณสามารถสร้างตารางต่อไปนี้

    พีที 2 ∑p t ∑p เสื้อ 2 M(s(T))+D(s(T))
    1 0,05 0,0025 0 0 500.00
    2 0,07 0,0049 0,05 0,0025 6312,50
    3 0,10 0,0100 0,12 0,0074 6622,22
    4 0,13 0,0169 0,2 0,0174 6731,25
    5 0,18 0,0324 0,35 0,0343 6764,00

    ตารางแสดงการบำรุงรักษาเชิงป้องกันในแต่ละช่วง T * = 1

    3. เกณฑ์การจำกัด

    เกณฑ์การจำกัดไม่ได้ให้โซลูชันที่เหมาะสมที่สุด เช่น เพิ่มผลกำไรหรือลดต้นทุนให้เหลือน้อยที่สุด ค่อนข้างจะตรงกับคำนิยาม ยอมรับได้วิธีการดำเนินการ

    ตัวอย่างที่ 3. สมมติว่าปริมาณความต้องการ x ต่อหน่วยเวลา (ความเข้มของความต้องการ) สำหรับผลิตภัณฑ์บางอย่างกำหนดโดยฟังก์ชันการกระจายแบบต่อเนื่อง f(x) หากสต็อกมีขนาดเล็กในช่วงแรก สินค้าอาจขาดแคลนในอนาคต มิฉะนั้น เมื่อสิ้นสุดระยะเวลาการตรวจสอบ สต็อกสินค้าที่ขายไม่ออกอาจมีจำนวนมาก ในทั้งสองกรณี การสูญเสียเป็นไปได้

    เพราะ เป็นการยากมากที่จะระบุความสูญเสียจากการขาดแคลน ผู้ตัดสินใจสามารถกำหนดระดับที่ต้องการของหุ้นในลักษณะที่มูลค่า ที่คาดหวังขาดไม่เกิน A 1 หน่วยและมูลค่า ที่คาดหวังส่วนเกินไม่เกิน A 2 หน่วย กล่าวอีกนัยหนึ่ง ให้ฉันเป็นระดับสินค้าคงคลังที่ต้องการ แล้ว

    การขาดดุลที่คาดไว้ = ∫(x-I)f(x)dx ≤ A 1 ,

    ส่วนเกินที่คาดไว้ = ∫(I-x)f(x)dx ≤ A 2 .

    ด้วยการเลือก A 1 และ A 2 โดยพลการ เงื่อนไขเหล่านี้อาจขัดแย้งกัน ในกรณีนี้ ข้อจำกัดข้อใดข้อหนึ่งต้องได้รับการผ่อนปรนเพื่อให้ยอมรับได้

    ตัวอย่างเช่น

    ฉ(x) = 20/x 2 , 10≤x≤20,

    f(x) = 0, x≤10 และ x≥20

    ∫(x-I)f(x)dx = ∫(x-I)(20/x 2)dx = 20(ln(20/I) + I/20 – 1)

    ∫(I-x)f(x)dx = ∫(I-x)(20/x 2)dx = 20(ln(10/I) + I/10 – 1)

    การใช้เกณฑ์จำกัดระดับนำไปสู่ความไม่เท่าเทียมกัน

    ln(I) - I/20 ≥ ln(20) - A 1/20 - 1 = 1.996 - A 1/20

    ln(I) - I/10 ≥ ln(10) - A 2 /20 - 1 = 1.302 - A 2 /20

    ต้องเลือกค่าขีดจำกัด A 1 และ A 2 เพื่อให้อสมการทั้งสองมีค่า I อย่างน้อยหนึ่งค่า

    ตัวอย่างเช่น ถ้า A 1 = 2 และ A 2 = 4 ความไม่เท่าเทียมกันจะกลายเป็น

    ln(I) - I/20 ≥ 1.896

    ln(I) - I/10 ≥ 1.102

    ค่าของ I ต้องอยู่ระหว่าง 10 ถึง 20 เนื่องจาก มันอยู่ในขอบเขตเหล่านี้ที่ต้องการการเปลี่ยนแปลง ตารางแสดงให้เห็นว่าเงื่อนไขทั้งสองเป็นไปตาม I จากช่วงเวลา (13.17)

    ฉัน 10 11 12 13 14 15 16 17 18 19 20
    ลน(ฉัน) - ฉัน/20 1,8 1,84 1,88 1,91 1,94 1,96 1,97 1,98 1,99 1,99 1,99
    ลน(ฉัน) - ฉัน/10 1,3 19 18 16 14 11 1,17 1,13 1,09 1,04 0,99

    ค่าใด ๆ เหล่านี้เป็นไปตามเงื่อนไขของปัญหา

    การตัดสินใจภายใต้ความไม่แน่นอน

    เราจะถือว่าผู้ตัดสินใจไม่ได้เผชิญหน้า มีเหตุผลศัตรู.

    ข้อมูลที่จำเป็นในการตัดสินใจภายใต้ความไม่แน่นอนมักจะได้รับในรูปของเมทริกซ์ แถวที่สอดคล้องกับการดำเนินการที่เป็นไปได้ และคอลัมน์ไปยังสถานะที่เป็นไปได้ของระบบ

    ตัวอย่างเช่น จำเป็นต้องผลิตผลิตภัณฑ์จากวัสดุบางชนิด ซึ่งไม่สามารถกำหนดความทนทานได้ในราคาที่รับได้ โหลดจะถือว่าเป็นที่รู้จัก จำเป็นต้องตัดสินใจว่าขนาดของผลิตภัณฑ์จากวัสดุนี้ควรมีขนาดเท่าใด

    ตัวเลือกการแก้ปัญหาคือ:

    E 1 - การเลือกขนาดด้วยเหตุผลของความทนทานสูงสุด

    E m - การเลือกขนาดด้วยเหตุผลของความทนทานขั้นต่ำ

    E ฉันเป็นวิธีแก้ปัญหาระดับกลาง

    เงื่อนไขที่ต้องพิจารณาคือ:

    F 1 - เงื่อนไขที่ให้ความทนทานสูงสุด

    F n - เงื่อนไขที่ให้ความทนทานขั้นต่ำ

    F i - เงื่อนไขระดับกลาง

    ภายใต้ผลลัพธ์ของการตัดสินใจ e ij = e(E i ; F j) ที่นี่ เราสามารถเข้าใจการประมาณการที่สอดคล้องกับตัวเลือก E i และเงื่อนไข F j และการระบุลักษณะกำไร ยูทิลิตี้ หรือความน่าเชื่อถือ โดยปกติเราจะเรียกผลลัพธ์ดังกล่าวว่า ประโยชน์ของการตัดสินใจ.

    จากนั้นครอบครัว (เมทริกซ์) ของโซลูชัน ||e ij || ดูเหมือนกับ:

    F1 F2 ...
    อี 1 จ 11 จ 12 ... จ 1n
    อี 2 จ 21 จ 22 ... อี 2 น
    ... ... ... ... ...
    อี ม อี m1 อี m2 ...

    เพื่อให้ได้ผลลัพธ์ที่ชัดเจนและหากเป็นไปได้ โซลูชันที่ได้เปรียบที่สุด จำเป็นต้องแนะนำฟังก์ชันการประเมิน (เป้าหมาย) ในกรณีนี้ เมทริกซ์การตัดสินใจ ||e ij || ลดลงเหลือหนึ่งคอลัมน์ แต่ละตัวเลือก E ผม ถูกกำหนดดังนั้นผลลัพธ์บางอย่าง e ir , ลักษณะโดยทั่วไป, ผลที่ตามมาทั้งหมดของการตัดสินใจนี้ ผลลัพธ์ดังกล่าวจะแสดงเพิ่มเติมด้วยสัญลักษณ์เดียวกัน e ir

    เกณฑ์การตัดสินใจแบบคลาสสิก

    1. เกณฑ์ขั้นต่ำ

    กฎสำหรับการเลือกโซลูชันตามเกณฑ์ขั้นต่ำสุด (MM-เกณฑ์) สามารถตีความได้ดังนี้:

    เมทริกซ์การตัดสินใจถูกเสริมด้วยอีกหนึ่งคอลัมน์ของผลลัพธ์ที่เล็กที่สุด e ir ของแต่ละแถว จำเป็นต้องเลือกตัวเลือกเหล่านั้นในแถวที่มีค่ามากที่สุด e ir ของคอลัมน์นี้

    ที่เลือกไว้อย่างนั้น ตัวเลือกช่วยลดความเสี่ยงได้อย่างสมบูรณ์ ซึ่งหมายความว่าผู้ตัดสินใจจะต้องเผชิญกับผลลัพธ์ที่แย่กว่าเป้าหมายที่เขาตั้งเป้าไว้ไม่ได้ คุณสมบัตินี้ทำให้สามารถพิจารณาเกณฑ์ MM เป็นหนึ่งในเกณฑ์พื้นฐานได้

    การใช้เกณฑ์ MM นั้นสมเหตุสมผลหากสถานการณ์ในการตัดสินใจเป็นดังนี้:

    1. ไม่มีใครรู้เกี่ยวกับความเป็นไปได้ของการปรากฏตัวของสถานะภายนอก F j;
    2. เราต้องคำนึงถึงรูปลักษณ์ภายนอกต่างๆ F j ;
    3. โซลูชันนี้ดำเนินการเพียงครั้งเดียว
    4. จะต้องไม่รวมความเสี่ยงใด ๆ

    2. เกณฑ์ Bayes-Laplace

    ให้ q i แสดงถึงความน่าจะเป็นของสถานะภายนอก F j .

    กฎการเลือกที่เกี่ยวข้องสามารถตีความได้ดังนี้:

    เมทริกซ์การตัดสินใจเสริมด้วยอีกหนึ่งคอลัมน์ที่มีความคาดหวังทางคณิตศาสตร์ของค่าของแต่ละแถว ตัวเลือกเหล่านั้นจะถูกเลือก ในบรรทัดที่มีค่า e ir มากที่สุดของคอลัมน์นี้

    สันนิษฐานว่าสถานการณ์ในการตัดสินใจมีลักษณะตามสถานการณ์ต่อไปนี้:

    1. ความน่าจะเป็นของการปรากฏตัวของสถานะ F j นั้นเป็นที่รู้จักและไม่ขึ้นกับเวลา
    2. วิธีแก้ปัญหานั้นเกิดขึ้นจริง (ในทางทฤษฎี) หลายครั้งไม่รู้จบ
    3. สำหรับการใช้งานโซลูชันจำนวนเล็กน้อย อนุญาตให้มีความเสี่ยงได้

    เมื่อเพียงพอ ในจำนวนมากการใช้งานค่าเฉลี่ยจะค่อยๆคงที่ ดังนั้นด้วยการใช้งานเต็มรูปแบบ (ไม่สิ้นสุด) ความเสี่ยงใด ๆ จะถูกแยกออกไปในทางปฏิบัติ

    ที่. เกณฑ์ Bayes-Laplace (เกณฑ์ B-L) นั้นมองโลกในแง่ดีมากกว่าเกณฑ์ขั้นต่ำสุด อย่างไรก็ตาม มันบ่งบอกถึงความตระหนักรู้ที่มากขึ้นและการนำไปปฏิบัติค่อนข้างนาน

    3. เกณฑ์ของ Savage

    a ij:= สูงสุด i (e ij) - e ij

    อี ir:= สูงสุด ผม (a ij) = สูงสุด j (สูงสุด ผม (e ij) - e ij)

    ค่าของ ij สามารถตีความได้ว่าเป็นค่าเกนเพิ่มเติมสูงสุด ซึ่งทำได้หากในสถานะ F j เลือกตัวแปรอื่นที่เหมาะสมที่สุดสำหรับสถานะภายนอกนี้แทนตัวแปร E i ค่าของ ij ยังสามารถตีความได้ว่าเป็นการสูญเสีย (บทลงโทษ) ที่เกิดขึ้นในสถานะ F j เมื่อแทนที่ตัวแปรที่เหมาะสมที่สุดสำหรับมันด้วยตัวแปร E i ในกรณีหลัง e ir คือค่าสูงสุดที่เป็นไปได้ (ในสถานะภายนอกทั้งหมด F j , j = (1,n)) การสูญเสียในกรณีของการเลือกตัวแปร E i

    กฎการเลือกที่สอดคล้องกับเกณฑ์ของ Savage ถูกตีความดังนี้:

    1. แต่ละองค์ประกอบของเมทริกซ์การตัดสินใจ ||e ij || ถูกลบออกจากผลลัพธ์สูงสุด max(e ij) ของคอลัมน์ที่เกี่ยวข้อง
    2. ความแตกต่าง a ij สร้างเมทริกซ์ของเศษเหลือ ||e ij || เมทริกซ์นี้ได้รับการปรับปรุงด้วยคอลัมน์ผลต่างที่ใหญ่ที่สุด e ir เลือกตัวเลือกเหล่านั้นในแถวที่มีค่าน้อยที่สุดสำหรับคอลัมน์นี้

    ข้อกำหนดสำหรับสถานการณ์ที่มีการตัดสินใจตรงกับข้อกำหนดสำหรับเกณฑ์ MM

    4. ตัวอย่างและข้อสรุป

    จากข้อกำหนดสำหรับเกณฑ์การพิจารณา เป็นที่ชัดเจนว่าเนื่องจากตำแหน่งเริ่มต้นที่เข้มงวด จึงใช้ได้กับอุดมคติเท่านั้น แนวทางปฏิบัติ. ในกรณีที่เป็นไปได้ในอุดมคติที่แข็งแกร่งเกินไป เกณฑ์ที่แตกต่างกันสามารถนำมาใช้พร้อมกันได้ หลังจากนั้น ในหลายทางเลือก ผู้ตัดสินใจเลือกการตัดสินใจขั้นสุดท้ายด้วยวิธีการสมัครใจ วิธีการนี้ช่วยให้ประการแรก เจาะเข้าไปในความเชื่อมโยงภายในทั้งหมดของปัญหาการตัดสินใจได้ดีขึ้น และประการที่สอง ทำให้อิทธิพลของปัจจัยอัตวิสัยอ่อนแอลง

    ตัวอย่าง. ในระหว่างการทำงานของคอมพิวเตอร์จำเป็นต้องระงับการประมวลผลข้อมูลเป็นระยะและตรวจสอบคอมพิวเตอร์ว่ามีไวรัสอยู่หรือไม่ การระงับการประมวลผลข้อมูลทำให้เกิดต้นทุนทางเศรษฐกิจบางประการ หากตรวจไม่พบไวรัสทันเวลา ข้อมูลบางส่วนอาจสูญหาย ซึ่งจะนำไปสู่การสูญเสียที่มากกว่าเดิม

    ตัวเลือกการแก้ปัญหาคือ:

    E 1 - ตรวจสอบเต็ม;

    E 2 - การตรวจสอบขั้นต่ำ

    E 3 - ปฏิเสธที่จะตรวจสอบ

    คอมพิวเตอร์สามารถอยู่ในสถานะต่อไปนี้:

    F 1 - ไม่มีไวรัส

    F 2 - มีไวรัส แต่ไม่มีเวลาทำลายข้อมูล

    F 3 - มีไฟล์ที่ต้องกู้คืน

    ผลลัพธ์ รวมทั้งค่าใช้จ่ายในการค้นหาไวรัสและการกำจัด ตลอดจนค่าใช้จ่ายที่เกี่ยวข้องกับการกู้คืนข้อมูล มีลักษณะดังนี้:

    F1 F2 F3 MM-เกณฑ์ เกณฑ์ B-L
    e ir = นาที j (e ij) สูงสุดฉัน (e ir) อี ir = ∑e ij สูงสุดฉัน (e ir)
    อี 1 -20,0 -20 -25,0 -25,0 -25,0 -22,33
    อี 2 -14,0 -23,0 -31,0 -31,0 -22,67
    อี 3 0 -24.0 -40.0 -40.0 -21.33 -21.33

    ตามเกณฑ์ MM ควรทำการตรวจสอบอย่างเต็มรูปแบบ เกณฑ์ Bayes-Laplace สมมติว่าทุกสถานะของเครื่องมีความเป็นไปได้เท่ากัน

    F1 F2 F3 เกณฑ์ของ Savage
    อี ir = นาที j (a ij) นาที j (e ir)
    อี 1 +20,0 0 0 +20,0
    อี 2 +14,0 +1,0 +6,0 +14,0 +14,0
    อี 3 0 +2,0 +15,0 +15,0

    ตัวอย่างนี้ได้รับการคัดเลือกมาเป็นพิเศษเพื่อให้เกณฑ์แต่ละข้อนำเสนอโซลูชันใหม่ ความไม่แน่นอนของสถานะที่เช็คพบคอมพิวเตอร์กลายเป็นความคลุมเครือว่าต้องปฏิบัติตามเกณฑ์ใด

    เนื่องจากเกณฑ์ต่าง ๆ เกี่ยวข้องกับ เงื่อนไขต่างๆในการตัดสินใจวิธีที่ดีที่สุดสำหรับการประเมินเปรียบเทียบคำแนะนำของเกณฑ์บางอย่างคือการรับข้อมูลเพิ่มเติมเกี่ยวกับสถานการณ์ โดยเฉพาะอย่างยิ่ง หากการตัดสินใจอ้างถึงเครื่องจักรหลายร้อยเครื่องที่มีพารามิเตอร์เดียวกัน ขอแนะนำให้ใช้เกณฑ์ Bayes-Laplace หากจำนวนเครื่องไม่มาก ควรใช้เกณฑ์ minimax หรือ Savage จะดีกว่า

    เกณฑ์ที่ได้รับ

    1. เกณฑ์ Hurwitz

    พยายามที่จะเข้ารับตำแหน่งที่สมดุลที่สุด Hurwitz แนะนำฟังก์ชันการประเมินที่อยู่ระหว่างมุมมองของการมองโลกในแง่ดีสุดโต่งและการมองโลกในแง่ร้ายสุดโต่ง:

    สูงสุด i (e ir) = ( C⋅min j (e ij) + (1-C)⋅max j (e ij) ),

    โดยที่ C เป็นตัวประกอบน้ำหนัก

    กฎการเลือกตามเกณฑ์ของ Hurwitz มีรูปแบบดังนี้:

    เมทริกซ์การตัดสินใจ ||e ij || เสริมด้วยคอลัมน์ที่มีค่าเฉลี่ยถ่วงน้ำหนักของผลลัพธ์ที่เล็กที่สุดและใหญ่ที่สุดสำหรับแต่ละแถว เลือกเฉพาะตัวเลือกเหล่านั้นในแถวที่มีองค์ประกอบที่ใหญ่ที่สุด e e ir ของคอลัมน์นี้

    ที่ C=1 เกณฑ์ Hurwitz เปลี่ยนเป็นเกณฑ์ MM ที่ C = 0 จะกลายเป็นเกณฑ์ "นักพนัน"

    สูงสุด i (e ir) = สูงสุด i (สูงสุด j (e ij)),

    เหล่านั้น. เรามองจากมุมมองของนักเดิมพันว่าโอกาสดีที่สุดที่จะ “หลุด”

    ในการใช้งานด้านเทคนิค การเลือกปัจจัยน้ำหนัก C เป็นเรื่องยากเนื่องจาก เป็นการยากที่จะหาลักษณะเชิงปริมาณสำหรับหุ้นของการมองโลกในแง่ดีและการมองโลกในแง่ร้ายที่มีอยู่ในการตัดสินใจ ดังนั้นส่วนใหญ่มักจะเป็น C: \u003d 1/2

    เกณฑ์ของ Hurwitz จะใช้เมื่อ:

    1. ไม่มีใครรู้เกี่ยวกับความน่าจะเป็นของการปรากฏตัวของสถานะ F j;
    2. จะต้องคำนึงถึงลักษณะที่ปรากฏของรัฐ F j;
    3. มีวิธีแก้ปัญหาเพียงเล็กน้อยเท่านั้น
    4. อนุญาตให้เสี่ยงได้

    2. เกณฑ์ Hodge–Lehmann

    เกณฑ์นี้ใช้พร้อมกันกับเกณฑ์ MM และเกณฑ์ Bayes-Laplace การใช้พารามิเตอร์ n จะแสดงระดับความเชื่อมั่นในการแจกแจงความน่าจะเป็นที่ใช้ หากความเชื่อมั่นสูง เกณฑ์ Bayes-Laplace จะครอบงำ มิฉะนั้น เกณฑ์ MM เช่น เรากำลังมองหา

    สูงสุด i (e ir) = max i (v⋅∑e ij ⋅q i + (1-v) min j (e ir)), 0 ≤ n ≤ 1

    กฎการเลือกที่สอดคล้องกับเกณฑ์ Hodge-Lehman มีรูปแบบดังนี้:

    เมทริกซ์การตัดสินใจ ||e ij || เสริมด้วยคอลัมน์ที่ประกอบด้วยค่าเฉลี่ยถ่วงน้ำหนัก (พร้อมน้ำหนัก v≡const) ความคาดหวังทางคณิตศาสตร์และผลลัพธ์ที่น้อยที่สุดของแต่ละแถว (*) โซลูชันเหล่านั้นจะถูกเลือกในแถวซึ่งเป็นค่าที่ใหญ่ที่สุดของคอลัมน์นี้

    ที่ v = 1 เกณฑ์ Hodge-Lehman เปลี่ยนเป็นเกณฑ์ Bayes-Laplace และที่ v = 0 เกณฑ์จะกลายเป็นค่าต่ำสุด

    ตัวเลือกของ v เป็นอัตนัยเพราะระดับความน่าเชื่อถือของฟังก์ชันการแจกแจงใดๆ นั้นเป็นสสารมืด

    ในการใช้เกณฑ์ Hodge-Lehman เป็นที่พึงปรารถนาว่าสถานการณ์ที่การตัดสินใจนั้นเป็นไปตามคุณสมบัติต่อไปนี้:

    1. ความน่าจะเป็นของการเกิดขึ้นของสถานะ F j ไม่เป็นที่รู้จัก แต่มีสมมติฐานบางประการเกี่ยวกับการแจกแจงความน่าจะเป็นที่เป็นไปได้
    2. โซลูชันที่ได้รับการยอมรับในทางทฤษฎียอมรับการใช้งานจำนวนมากอย่างไม่มีที่สิ้นสุด
    3. สำหรับจำนวนการใช้งานที่น้อย อนุญาตให้มีความเสี่ยงได้

    3. เกณฑ์ของ Germeier

    เกณฑ์นี้เน้นที่จำนวนการสูญเสีย เช่น เป็นค่าลบของทั้งหมด e ij . ในนั้น

    สูงสุด i (e ir) = สูงสุด i (ต่ำสุด j (e ij)q j) .

    เพราะ ในงานเศรษฐกิจ ส่วนใหญ่เกี่ยวข้องกับราคาและต้นทุน เงื่อนไข e e ij<0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij -a при подходящем образом подобранном a>0. ในกรณีนี้ ทางออกที่ดีที่สุดขึ้นอยู่กับก.

    กฎการเลือกตามเกณฑ์ Germeier มีการกำหนดดังนี้:

    เมทริกซ์การตัดสินใจ ||e ij || เสริมด้วยอีกหนึ่งคอลัมน์ที่มีในแต่ละแถวผลคูณที่น้อยที่สุดของผลลัพธ์ที่มีอยู่ในนั้นและความน่าจะเป็นของสถานะที่สอดคล้องกัน F j . ตัวเลือกเหล่านั้นจะถูกเลือกในแถวซึ่งพบค่า e e ij ที่ใหญ่ที่สุดของคอลัมน์นี้

    ในแง่หนึ่ง เกณฑ์ Germeier ทำให้เกณฑ์ MM มีลักษณะทั่วไป: ในกรณีของการแจกแจงแบบสม่ำเสมอ q j = 1/n, j=(1,n) เกณฑ์เหล่านั้นจะเหมือนกัน

    เงื่อนไขสำหรับการบังคับใช้คือ:

    1. ด้วยการปรากฏตัวของสถานะบางอย่างแยกกันหรือรวมกันจำเป็นต้องคำนึงถึง
    2. อนุญาตให้เสี่ยงได้
    3. โซลูชันนี้สามารถนำไปใช้ได้ตั้งแต่หนึ่งครั้งขึ้นไป

    หากฟังก์ชันการกระจายไม่เป็นที่รู้จักอย่างน่าเชื่อถือ และจำนวนการรับรู้มีน้อย ดังนั้น ตามเกณฑ์ของ Germeier บุคคลหนึ่งจะได้รับความเสี่ยงสูงเกินสมควร

    4. การทดสอบ Bayes-Laplace และ minimax แบบรวม

    ความปรารถนาที่จะได้รับเกณฑ์ที่จะปรับให้เข้ากับสถานการณ์ที่มีอยู่ได้ดีกว่าเกณฑ์ที่พิจารณาทั้งหมดนำไปสู่การสร้างเกณฑ์รวมที่เรียกว่า ตัวอย่างเช่น พิจารณาเกณฑ์ที่ได้รับจากการรวมเกณฑ์ Bayes-Laplace และเกณฑ์ขั้นต่ำสุด (BL(MM))

    กฎการเลือกสำหรับเกณฑ์นี้มีการกำหนดดังนี้:

    เมทริกซ์การตัดสินใจ ||e ij || เพิ่มด้วยอีกสามคอลัมน์ ในครั้งแรกมีการเขียนความคาดหวังทางคณิตศาสตร์ของแต่ละแถวในส่วนที่สอง - ความแตกต่างระหว่างค่าอ้างอิง

    ei 0 j 0 = max i (สูงสุด j (e ij))

    และมีค่าน้อยที่สุด

    บรรทัดที่สอดคล้องกัน คอลัมน์ที่สามประกอบด้วยความแตกต่างระหว่างค่าที่มากที่สุด

    แต่ละแถวและค่าสูงสุดสูงสุด j (e i 0 j) ของแถวที่มีค่า e i 0 j 0 ตัวเลือกเหล่านั้นถูกเลือก แถวที่ (ขึ้นอยู่กับอัตราส่วนต่อไปนี้ระหว่างองค์ประกอบของคอลัมน์ที่สองและสาม) ให้ความคาดหวังทางคณิตศาสตร์สูงสุด กล่าวคือค่าที่สอดคล้องกัน

    ฉัน 0 j 0 - สูงสุด j (e ij)

    จากคอลัมน์ที่สองจะต้องเท่ากับหรือเท่ากับระดับความเสี่ยง E ที่กำหนดไว้ล่วงหน้าบางส่วน ค่าในคอลัมน์ที่สามต้องมากกว่าค่าในคอลัมน์ที่สอง

    การใช้เกณฑ์นี้เกิดจากคุณลักษณะต่อไปนี้ของสถานการณ์ที่มีการตัดสินใจ:

    1. ความน่าจะเป็นของการเกิดขึ้นของสถานะ F j ไม่เป็นที่รู้จัก แต่มีข้อมูลเบื้องต้นสนับสนุนการแจกแจงเฉพาะบางอย่าง
    2. จำเป็นต้องคำนึงถึงรูปลักษณ์ของสถานะต่าง ๆ ทั้งแบบเดี่ยวและแบบรวมกัน
    3. อนุญาตความเสี่ยงที่จำกัด;
    4. การตัดสินใจดำเนินการเพียงครั้งเดียวหรือหลายครั้ง

    เกณฑ์ BL(MM) นั้นเหมาะสมอย่างยิ่งสำหรับการสร้างโซลูชันที่ใช้งานได้จริง โดยเฉพาะในสาขาเทคโนโลยี และถือได้ว่าค่อนข้างน่าเชื่อถือ อย่างไรก็ตาม ขอบเขตความเสี่ยงที่กำหนด E เพิ่มและดังนั้น การประมาณความเสี่ยง E i ไม่ได้คำนึงถึงจำนวนของการใช้โซลูชันหรือข้อมูลอื่นที่คล้ายคลึงกัน อิทธิพลของปัจจัยอัตนัยแม้ว่าจะอ่อนแอลง แต่ก็ไม่ได้รับการยกเว้นอย่างสมบูรณ์

    สูงสุด j (e ij)-สูงสุด j (e i 0 j)≥E i

    จำเป็นในกรณีที่ดำเนินการแก้ไขเพียงครั้งเดียวหรือจำนวนน้อย ภายใต้เงื่อนไขเหล่านี้ การมุ่งเน้นไปที่ความเสี่ยงที่เกี่ยวข้องกับสภาวะภายนอกที่ไม่เอื้ออำนวยและค่าเฉลี่ยเท่านั้นไม่เพียงพอ อย่างไรก็ตาม ด้วยเหตุนี้ คุณอาจประสบความสูญเสียในสถานะภายนอกที่ประสบความสำเร็จ ด้วยการใช้งานจำนวนมาก เงื่อนไขนี้จึงหมดความสำคัญไป มันยังอนุญาตให้มีทางเลือกที่สมเหตุสมผล อย่างไรก็ตาม ไม่มีข้อบ่งชี้เชิงปริมาณที่ชัดเจนในกรณีที่ควรละเว้นเงื่อนไขนี้

    5. เกณฑ์ของงาน

    สูงสุด i (e ir):= สูงสุด i (∏e ij)

    กฎการเลือกในกรณีนี้กำหนดดังนี้:

    เมทริกซ์การตัดสินใจ ||e ij || เสริมด้วยคอลัมน์ใหม่ที่มีผลคูณของผลลัพธ์ทั้งหมดของแต่ละแถว ตัวเลือกเหล่านั้นถูกเลือกในบรรทัดที่มี ค่าสูงสุดคอลัมน์นี้

    การใช้เกณฑ์นี้เกิดจากสถานการณ์ต่อไปนี้:

    1. ความน่าจะเป็นของการปรากฏตัวของสถานะ F j ไม่เป็นที่รู้จัก
    2. ด้วยรูปลักษณ์ของแต่ละสถานะ F j ต้องพิจารณาแยกกัน
    3. เกณฑ์นี้ยังใช้กับการใช้งานโซลูชันจำนวนเล็กน้อย
    4. อนุญาตให้เสี่ยงได้

    เกณฑ์ของผลิตภัณฑ์ได้รับการปรับใช้เป็นหลักสำหรับกรณีที่ e ij ทั้งหมดเป็นบวก หากเงื่อนไขเชิงบวกถูกละเมิด ควรทำ shift e ij +a ที่มีค่าคงที่ a>|min ij (e ij)| ผลลัพธ์จะขึ้นอยู่กับ ในทางปฏิบัติบ่อยที่สุด

    a:= |นาที ij (e ij)|+1.

    หากไม่มีค่าคงที่ใดที่สามารถรับรู้ได้ว่ามีความหมาย เกณฑ์ของผลิตภัณฑ์จะไม่สามารถใช้ได้

    ตัวอย่าง.

    พิจารณาตัวอย่างเดียวกันกับก่อนหน้านี้ (ดูด้านบน)

    การสร้างโซลูชันที่เหมาะสมที่สุดสำหรับเมทริกซ์การตัดสินใจเกี่ยวกับเช็คตามเกณฑ์ของ Hurwitz มีรูปแบบ (ที่ С=0 ใน 10 3):

    ||e ij || С⋅นาที j (e ij) (1-С)⋅สูงสุด j (e ij) อี ir สูงสุดฉัน (e ir)
    -20,0 -22,0 -25,0 -12,5 -10.0 -22,5
    -14,0 -23.0 -31.0 -15,5 -7.0 -22,5
    0 -24.0 -40.0 -20.0 0 -20.0 -20.0

    ในตัวอย่างนี้ โซลูชันมีจุดเปลี่ยนที่เกี่ยวข้องกับตัวประกอบน้ำหนัก C: ถึง C = 0.57, E 3 ถูกเลือกเป็นค่าที่เหมาะสมที่สุด และที่ค่ามาก E 1

    การประยุกต์ใช้การทดสอบ Hodge-Lehman (q=0.33, v=0, ที่ 103):

    ∑e ij ⋅q j มินจ(eij) v⋅∑e ij ⋅q j (1-v)⋅∑e ij ⋅q j อี ir สูงสุดฉัน (e ir)
    -22,33 -25,0 -11,17 -12,5 -23,67 -23,67
    -22,67 -31,0 -11,34 -15,5 -26,84
    -21,33 -40,0 -10,67 -20,0 -30,76

    การทดสอบ Hodge-Lehman แนะนำตัวเลือก E 1 (การตรวจสอบทั้งหมด) - เช่นเดียวกับการทดสอบ MM การเปลี่ยนแปลงของตัวแปรที่แนะนำจะเกิดขึ้นที่ v=0.94 เท่านั้น ดังนั้น การกระจายแบบสม่ำเสมอของสถานะของเครื่องภายใต้การพิจารณาจะต้องรับรู้ด้วยความน่าจะเป็นที่สูงมาก เพื่อให้สามารถเลือกได้โดยความคาดหวังทางคณิตศาสตร์ที่ใหญ่กว่า จำนวนการใช้งานโซลูชันยังคงเป็นไปตามอำเภอใจเสมอ

    เกณฑ์ Germeier ที่ q j = 0.33 ให้ผลลัพธ์ต่อไปนี้ (ใน 10 3):

    ||e ij || ||e ij q j || e ir = นาที j (e ij q j) สูงสุดฉัน (e ir)
    -20,0 -22,0 -25,0 -6,67 -7,33 -8,33 -8,33 -8,33
    -14,0 -23,0 -31,.0 -4,67 -7,67 -10,33 -10,33
    0 -24,0 -40,0 0 -8,0 -13,33 -13,33

    ตัวเลือก E 1 ได้รับเลือกให้เป็นตัวเลือกที่ดีที่สุด การเปรียบเทียบตัวแปรโดยใช้ค่า e ir แสดงให้เห็นว่าวิธีการทำงานของการทดสอบ Germeier มีความยืดหยุ่นมากกว่าการทดสอบ MM

    ในตารางด้านล่าง โซลูชันจะถูกเลือกตามเกณฑ์ BL(MM) โดยมี q 1 =q 2 =q 3 =1/2 (ข้อมูลใน 10 3)

    ||e ij || ∑e อิจ คิว เจ ฉัน 0 j 0 - นาที j (e ij) สูงสุด j (e ij) สูงสุด j (e ij) - สูงสุด j (e ฉัน 0 j)
    -20,0 -22,0 -25,0 -23,33 0 -20,0 0
    -14,0 -23,0 -31,0 -22,67 +6,0 -14,0 +6,0
    0 -24,0 -40,0 -21,33 +15,0 0 +20,0

    ตัวเลือก E 3 (ปฏิเสธที่จะตรวจสอบ) เป็นที่ยอมรับโดยเกณฑ์นี้เฉพาะเมื่อความเสี่ยงเข้าใกล้ E ที่เป็นไปได้ = 15⋅10 3 . มิฉะนั้น E 1 จะเหมาะสมที่สุด ในงานด้านเทคนิคและเศรษฐกิจหลายๆ งาน ความเสี่ยงที่ยอมรับได้จะต่ำกว่ามาก ซึ่งโดยปกติแล้วจะเป็นเพียงเปอร์เซ็นต์เล็กน้อยของต้นทุนทั้งหมด ในกรณีเช่นนี้ จะมีประโยชน์อย่างยิ่งหากค่าที่ไม่ถูกต้องของการแจกแจงความน่าจะเป็นไม่ส่งผลกระทบมากนัก หากในเวลาเดียวกันเป็นไปไม่ได้ที่จะสร้างความเสี่ยงที่ยอมรับได้ E เพิ่มเติมล่วงหน้า โดยไม่คำนึงถึงการตัดสินใจ การคำนวณความเสี่ยงที่คาดว่าจะเป็นไปได้ E สามารถช่วยได้ จากนั้นจึงเป็นไปได้ที่จะพิจารณาว่าความเสี่ยงดังกล่าวสมเหตุสมผลหรือไม่ การวิจัยดังกล่าวมักจะง่ายกว่า

    ผลลัพธ์ของการใช้เกณฑ์ผลิตภัณฑ์สำหรับ a = 41⋅10 3 และ a = 200⋅10 3 คือ:

    ||เอย์ + เอ|| อี ir = ∏ เจ อิจ สูงสุด ฉัน อี ir
    41 +21 +19 +16 6384 6384
    +27 +18 +10 4860
    +41 +17 +1 697
    200 +180 +178 +175 5607
    +186 +177 +169 5563
    +200 +176 +160 5632 5632

    เงื่อนไข e ij > 0 ไม่สามารถทำได้สำหรับเมทริกซ์นี้ ดังนั้นจึงมีการเพิ่มองค์ประกอบของเมทริกซ์ (ตามความเด็ดขาดภายนอก) ก่อน a = 41⋅10 3 แล้ว a = 200⋅10 3 .

    สำหรับ а = 41⋅10 3 ตัวแปร Е 1 นั้นเหมาะสมที่สุด และสำหรับ а = 200⋅10 3 — ตัวแปร Е 3 เพื่อให้การพึ่งพาของตัวแปรที่เหมาะสมที่สุดกับ а นั้นชัดเจน



    ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!