ทฤษฎีเกมทางคณิตศาสตร์. ตัวอย่างการบันทึกและแก้เกมจากชีวิต


มหาวิทยาลัยแห่งรัฐเบลารุส

คณะเศรษฐศาสตร์

เก้าอี้…

ทฤษฎีเกมและการประยุกต์ใช้ในทางเศรษฐศาสตร์

โครงการหลักสูตร

นักศึกษาชั้นปีที่ 2

แผนก "การจัดการ"

หัวหน้างาน

มินสค์, 2553

1. บทนำ. หน้า 3

2. แนวคิดพื้นฐานของทฤษฎีเกม หน้า 4

3. การนำเสนอเกมส์ หน้า 7

4. ประเภทของเกม หน้า 9

5. การประยุกต์ทฤษฎีเกมทางเศรษฐศาสตร์ น.14

6. ปัญหาการใช้งานจริงในการจัดการ p.21

7. สรุป p.23

รายการเอกสารอ้างอิง หน้า 24

1. บทนำ

ในทางปฏิบัติ บ่อยครั้งที่จำเป็นต้องประสานงานการดำเนินการของบริษัท สมาคม กระทรวง และผู้เข้าร่วมโครงการอื่น ๆ ในกรณีที่ผลประโยชน์ของพวกเขาไม่ตรงกัน ในสถานการณ์เช่นนี้ ทฤษฎีเกมช่วยให้คุณหาทางออกที่ดีที่สุดสำหรับพฤติกรรมของผู้เข้าร่วมซึ่งมีหน้าที่ต้องประสานการดำเนินการในกรณีที่เกิดความขัดแย้งทางผลประโยชน์ ทฤษฎีเกมกำลังแทรกซึมเข้าไปในแนวทางปฏิบัติของการตัดสินใจและการวิจัยทางเศรษฐกิจมากขึ้นเรื่อยๆ ถือได้ว่าเป็นเครื่องมือที่ช่วยเพิ่มประสิทธิภาพการวางแผนและการตัดสินใจในการจัดการ มันมี ความสำคัญอย่างยิ่งในการแก้ไขปัญหาด้านอุตสาหกรรม การเกษตร การขนส่ง การค้า โดยเฉพาะการทำสัญญากับคู่ค้าต่างประเทศไม่ว่าในระดับใด ดังนั้นจึงเป็นไปได้ที่จะกำหนดระดับทางวิทยาศาสตร์ของการลดราคาขายปลีกและระดับที่เหมาะสมของสต็อกสินค้า, การแก้ปัญหาของบริการท่องเที่ยวและการเลือกเส้นทางใหม่ของการขนส่งในเมือง, งานของการวางแผนขั้นตอนสำหรับการจัดระเบียบการใช้ประโยชน์จากแร่ เงินฝากในประเทศ ฯลฯ งานเลือกที่ดินสำหรับพืชผลทางการเกษตรกลายเป็นงานคลาสสิก วิธีการของทฤษฎีเกมสามารถใช้ในการสำรวจตัวอย่างของประชากรจำกัด ในการทดสอบสมมติฐานทางสถิติ

ทฤษฎีเกมเป็นวิธีการทางคณิตศาสตร์สำหรับการศึกษากลยุทธ์ที่เหมาะสมที่สุดในเกม เกมนี้เข้าใจว่าเป็นกระบวนการที่ฝ่ายตั้งแต่สองฝ่ายขึ้นไปเข้าร่วมต่อสู้เพื่อผลประโยชน์ของตน แต่ละฝ่ายมีเป้าหมายของตัวเองและใช้กลยุทธ์บางอย่าง ซึ่งอาจนำไปสู่การชนะหรือแพ้ ขึ้นอยู่กับพฤติกรรมของผู้เล่นคนอื่นๆ ทฤษฎีเกมช่วยในการเลือกกลยุทธ์ที่ดีที่สุด โดยคำนึงถึงแนวคิดเกี่ยวกับผู้เข้าร่วมคนอื่นๆ ทรัพยากรของพวกเขา และการดำเนินการที่เป็นไปได้

ทฤษฎีเกมเป็นสาขาหนึ่งของคณิตศาสตร์ประยุกต์ การวิจัยการดำเนินงาน ส่วนใหญ่มักจะใช้วิธีการของทฤษฎีเกมในด้านเศรษฐศาสตร์ซึ่งมักจะน้อยกว่าในสังคมศาสตร์อื่น ๆ - สังคมวิทยา, รัฐศาสตร์, จิตวิทยา, จริยธรรมและอื่น ๆ ตั้งแต่ทศวรรษ 1970 นักชีววิทยาได้นำมาใช้เพื่อศึกษาพฤติกรรมสัตว์และทฤษฎีวิวัฒนาการ มีความสำคัญอย่างยิ่งสำหรับ ปัญญาประดิษฐ์และไซเบอร์เนติกส์ โดยเฉพาะอย่างยิ่งกับความสนใจในตัวแทนอัจฉริยะ

ทฤษฎีเกมมีต้นกำเนิดมาจากเศรษฐศาสตร์แบบนีโอคลาสสิก แง่มุมทางคณิตศาสตร์และการประยุกต์ใช้ทฤษฎีนี้ถูกนำเสนอครั้งแรกในหนังสือ Theory of Games and Economic Behavior สุดคลาสสิกในปี 1944 โดย John von Neumann และ Oscar Morgenstern

สาขาคณิตศาสตร์นี้พบการสะท้อนบางอย่างในวัฒนธรรมสาธารณะ ในปี 1998 นักเขียนและนักข่าวชาวอเมริกัน Sylvia Nazar ได้ตีพิมพ์หนังสือเกี่ยวกับชะตากรรมของ John Nash ผู้ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์และนักวิทยาศาสตร์สาขาทฤษฎีเกม และในปี 2544 ภาพยนตร์เรื่อง A Beautiful Mind ถูกสร้างขึ้นจากหนังสือ รายการโทรทัศน์อเมริกันบางรายการ เช่น "Friend or Foe", "Alias" หรือ "NUMB3RS" กล่าวถึงทฤษฎีในตอนต่างๆ เป็นระยะๆ

ทฤษฎีเกมในรูปแบบที่ไม่ใช่คณิตศาสตร์มีการนำเสนอในผลงานของ Thomas Schelling ผู้ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ประจำปี 2548

ผู้ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากความสำเร็จในสาขาทฤษฎีเกมได้แก่: Robert Aumann, Reinhard Zelten, John Nash, John Harsanyi, Thomas Schelling

2. แนวคิดพื้นฐานของทฤษฎีเกม

มาทำความรู้จักกับแนวคิดพื้นฐานของทฤษฎีเกมกันเถอะ แบบจำลองทางคณิตศาสตร์ของสถานการณ์ความขัดแย้งเรียกว่าเกม ฝ่ายที่เกี่ยวข้องในความขัดแย้งเรียกว่าผู้เล่น และผลลัพธ์ของความขัดแย้งเรียกว่าฝ่ายชนะ สำหรับเกมที่เป็นทางการแต่ละเกม จะมีการแนะนำกฎ เช่น ระบบเงื่อนไขที่กำหนด: 1) ตัวเลือกสำหรับการกระทำของผู้เล่น; 2) ปริมาณข้อมูลของผู้เล่นแต่ละคนเกี่ยวกับพฤติกรรมของพันธมิตร 3) ผลตอบแทนที่การดำเนินการแต่ละชุดนำไปสู่ โดยปกติแล้ว กำไร (หรือขาดทุน) สามารถวัดเป็นปริมาณได้ ตัวอย่างเช่น คุณสามารถประเมินการแพ้เป็นศูนย์ ชนะด้วย 1 และเสมอด้วย ½

เกมจะเรียกว่าเกมคู่หากมีผู้เล่นสองคนเข้าร่วม และเรียกหลายเกมหากจำนวนผู้เล่นมากกว่าสองคน

เกมเรียกว่าเกมผลรวมศูนย์หรือเป็นปรปักษ์กัน หากผู้เล่นคนใดคนหนึ่งได้รับเท่ากับการสูญเสียอีกคนหนึ่ง นั่นคือ เพื่อให้งานของเกมเสร็จสมบูรณ์ ก็เพียงพอที่จะระบุมูลค่าของหนึ่งใน พวกเขา. หากเราระบุว่า a - ผลตอบแทนของผู้เล่นคนใดคนหนึ่ง b - ผลตอบแทนของอีกคนหนึ่ง ดังนั้นสำหรับเกมผลรวมศูนย์ b = -a ดังนั้น แค่พิจารณาก็เพียงพอแล้ว เช่น a

ทางเลือกและการนำหนึ่งในการกระทำที่กำหนดโดยกฎเรียกว่าการย้ายของผู้เล่น การเคลื่อนไหวอาจเป็นเรื่องส่วนตัวและเป็นการสุ่ม การเคลื่อนไหวส่วนบุคคลคือการเลือกอย่างมีสติโดยผู้เล่นของหนึ่งในการกระทำที่เป็นไปได้ (เช่น การเคลื่อนไหวในเกมหมากรุก) การย้ายแบบสุ่มคือการกระทำที่เลือกแบบสุ่ม (เช่น การเลือกไพ่จากสำรับที่สับ) ต่อไปนี้เราจะพิจารณาเฉพาะการเคลื่อนไหวส่วนบุคคลของผู้เล่น

กลยุทธ์ของผู้เล่นคือชุดของกฎที่กำหนดทางเลือกของการกระทำของเขาสำหรับการเคลื่อนไหวส่วนตัวแต่ละครั้ง ขึ้นอยู่กับสถานการณ์ โดยปกติแล้วในระหว่างเกม ในการเคลื่อนไหวส่วนตัวแต่ละครั้ง ผู้เล่นจะเลือกได้ขึ้นอยู่กับสถานการณ์เฉพาะ อย่างไรก็ตาม โดยหลักการแล้ว การตัดสินใจทั้งหมดอาจกระทำโดยผู้เล่นล่วงหน้า (เพื่อตอบสนองต่อสถานการณ์ที่กำหนด) ซึ่งหมายความว่าผู้เล่นได้เลือกกลยุทธ์บางอย่าง ซึ่งสามารถกำหนดได้ในรูปแบบของรายการกฎหรือโปรแกรม (เพื่อให้คุณสามารถเล่นเกมโดยใช้คอมพิวเตอร์). กล่าวกันว่าเกมมีขอบเขตจำกัดหากผู้เล่นแต่ละคนมีกลยุทธ์ในจำนวนจำกัด และไม่สิ้นสุด

ในการแก้เกมหรือหาทางออกของเกม เราควรเลือกกลยุทธ์ที่สอดคล้องกับเงื่อนไขที่เหมาะสมที่สุดสำหรับผู้เล่นแต่ละคน เช่น ผู้เล่นคนหนึ่งควรได้รับผลตอบแทนสูงสุดเมื่ออีกคนยึดมั่นในกลยุทธ์ของเขา ในเวลาเดียวกัน ผู้เล่นคนที่สองควรสูญเสียขั้นต่ำหากคนแรกยึดมั่นในกลยุทธ์ของเขา กลยุทธ์ดังกล่าวเรียกว่าดีที่สุด กลยุทธ์ที่เหมาะสมที่สุดจะต้องเป็นไปตามเงื่อนไขความเสถียร เช่น จะต้องไม่เกิดประโยชน์สำหรับผู้เล่นรายใดที่จะละทิ้งกลยุทธ์ของตนในเกมนี้

หากเกมเล่นซ้ำหลายครั้ง ผู้เล่นอาจไม่สนใจการชนะและแพ้ในแต่ละเกม แต่อยู่ที่การชนะ (แพ้) โดยเฉลี่ยในทุกเกม

เป้าหมายของทฤษฎีเกมคือการกำหนดกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่นแต่ละคน เมื่อเลือกกลยุทธ์ที่เหมาะสมที่สุด เป็นเรื่องปกติที่จะถือว่าผู้เล่นทั้งสองฝ่ายมีพฤติกรรมที่สมเหตุสมผลจากมุมมองของความสนใจของพวกเขา ข้อจำกัดที่สำคัญที่สุดของทฤษฎีเกมคือความเป็นธรรมชาติของผลตอบแทนเป็นการวัดประสิทธิภาพ ในขณะที่ปัญหาทางเศรษฐกิจที่แท้จริงส่วนใหญ่มีการวัดประสิทธิภาพมากกว่าหนึ่งอย่าง นอกจากนี้ ตามกฎแล้ว ในระบบเศรษฐกิจมีงานที่ผลประโยชน์ของคู่ค้าไม่จำเป็นต้องเป็นปรปักษ์กัน

3. การนำเสนอเกม

เกมเป็นวัตถุทางคณิตศาสตร์ที่กำหนดไว้อย่างเคร่งครัด เกมถูกสร้างขึ้นโดยผู้เล่น ชุดของกลยุทธ์สำหรับผู้เล่นแต่ละคน และการบ่งชี้ถึงผลตอบแทนหรือผลตอบแทนของผู้เล่นสำหรับแต่ละกลยุทธ์ที่ผสมผสานกัน เกมแบบร่วมมือส่วนใหญ่อธิบายด้วยฟังก์ชันที่เป็นลักษณะเฉพาะ ในขณะที่เกมประเภทอื่นๆ มักจะใช้รูปแบบปกติหรือแบบครอบคลุมมากกว่า

รูปแบบที่กว้างขวาง

เกม "Ultimatum" ในรูปแบบที่กว้างขวาง

เกมในรูปแบบที่กว้างขวางหรือขยายจะแสดงเป็นต้นไม้กำกับ ซึ่งแต่ละจุดสุดยอดจะสอดคล้องกับสถานการณ์ที่ผู้เล่นเลือกกลยุทธ์ของเขา ผู้เล่นแต่ละคนจะได้รับจุดยอดทั้งหมด การชำระเงินจะถูกบันทึกไว้ที่ด้านล่างของต้นไม้ ใต้จุดยอดของใบไม้แต่ละใบ

ภาพด้านซ้ายเป็นเกมสำหรับผู้เล่นสองคน ผู้เล่น 1 เคลื่อนไหวก่อนและเลือกกลยุทธ์ F หรือ U ผู้เล่น 2 วิเคราะห์ตำแหน่งของเขาและตัดสินใจว่าจะเลือกกลยุทธ์ A หรือ R เป็นไปได้มากว่าผู้เล่นคนแรกจะเลือก U และคนที่สอง - A (สำหรับแต่ละกลยุทธ์เหล่านี้เป็นกลยุทธ์ที่เหมาะสมที่สุด ); จากนั้นพวกเขาจะได้รับ 8 และ 2 คะแนนตามลำดับ

รูปแบบที่กว้างขวางมีภาพประกอบมาก สะดวกอย่างยิ่งในการนำเสนอเกมที่มีผู้เล่นมากกว่าสองคนและเกมที่มีการเคลื่อนไหวติดต่อกัน หากผู้เข้าร่วมทำการเคลื่อนไหวพร้อมกัน จุดยอดที่เกี่ยวข้องจะเชื่อมต่อกันด้วยเส้นประหรือเส้นทึบ

รูปแบบปกติ

ผู้เล่น 2
กลยุทธ์ 1

ผู้เล่น 2
กลยุทธ์ที่ 2

ผู้เล่น 1
กลยุทธ์ 1

4 , 3

1 , –1

ผู้เล่น 1
กลยุทธ์ที่ 2

0 , 0

3 , 4

รูปแบบปกติสำหรับเกมที่มีผู้เล่น 2 คน แต่ละคนมี 2 กลยุทธ์

ในรูปแบบปกติหรือกลยุทธ์ เกมอธิบายโดยเมทริกซ์ผลตอบแทน แต่ละด้าน (มิติที่แม่นยำยิ่งขึ้น) ของเมทริกซ์คือผู้เล่น แถวกำหนดกลยุทธ์ของผู้เล่นคนแรก และคอลัมน์กำหนดกลยุทธ์ของผู้เล่นคนที่สอง ที่จุดตัดของทั้งสองกลยุทธ์ คุณจะเห็นผลตอบแทนที่ผู้เล่นจะได้รับ ในตัวอย่างด้านขวา หากผู้เล่น 1 เลือกกลยุทธ์แรก และผู้เล่น 2 เลือกกลยุทธ์ที่สอง จากนั้นเราจะเห็น (−1, −1) ที่ทางแยก ซึ่งหมายความว่าผู้เล่นทั้งสองเสียคะแนนไปฝ่ายละหนึ่งแต้มอันเป็นผลมาจาก เคลื่อนไหว.

ผู้เล่นเลือกกลยุทธ์ที่มีผลสูงสุดสำหรับตัวเอง แต่แพ้เนื่องจากไม่รู้การเคลื่อนไหวของผู้เล่นคนอื่น โดยปกติแล้ว รูปแบบปกติหมายถึงเกมที่มีการเคลื่อนไหวพร้อมกัน หรืออย่างน้อยก็สันนิษฐานว่าผู้เล่นทุกคนไม่รู้ว่าผู้เข้าร่วมคนอื่นๆ กำลังทำอะไร เกมดังกล่าวที่มีข้อมูลไม่ครบถ้วนจะได้รับการพิจารณาด้านล่าง

สูตรเฉพาะ

ในเกมแบบร่วมมือที่มียูทิลิตี้ที่สามารถถ่ายโอนได้ นั่นคือความสามารถในการโอนเงินจากผู้เล่นคนหนึ่งไปยังอีกคนหนึ่ง มันเป็นไปไม่ได้ที่จะใช้แนวคิดของการชำระเงินแต่ละรายการ จะใช้ฟังก์ชันลักษณะเฉพาะที่เรียกว่าแทน ซึ่งจะกำหนดผลตอบแทนของผู้เล่นแต่ละกลุ่ม สันนิษฐานว่าผลตอบแทนของกลุ่มพันธมิตรที่ว่างเปล่าเป็นศูนย์

เหตุผลสำหรับแนวทางนี้สามารถพบได้ในหนังสือของฟอน นอยมันน์และมอร์เกนสเติร์น การศึกษารูปแบบปกติของเกมแนวร่วมพวกเขาให้เหตุผลว่าหากแนวร่วม C เกิดขึ้นในเกมที่มี 2 ฝ่าย แนวร่วม N \ C จะต่อต้าน เกมสำหรับผู้เล่น 2 คนจะถูกสร้างขึ้นเหมือนเดิม แต่เนื่องจากแนวร่วมที่เป็นไปได้มีหลายแบบ (เช่น 2N โดยที่ N คือจำนวนผู้เล่น) ผลตอบแทนสำหรับ C จะเป็นค่าลักษณะบางอย่างขึ้นอยู่กับองค์ประกอบของแนวร่วม อย่างเป็นทางการ เกมในรูปแบบนี้ (เรียกอีกอย่างว่าเกม TU) จะแสดงด้วยคู่ (N, v) โดยที่ N คือเซตของผู้เล่นทั้งหมด และ v: 2N → R คือฟังก์ชันคุณลักษณะ

รูปแบบการนำเสนอนี้สามารถใช้ได้กับทุกเกม รวมถึงเกมที่ไม่มียูทิลิตี้ที่สามารถถ่ายโอนได้ ปัจจุบัน มีวิธีการแปลงเกมจากรูปแบบปกติเป็นลักษณะเฉพาะ แต่การแปลงในทิศทางตรงกันข้ามไม่สามารถทำได้ในทุกกรณี

4. ประเภทของเกม

สหกรณ์และไม่สหกรณ์

เกมนี้เรียกว่าสหกรณ์หรือแนวร่วม ถ้าผู้เล่นสามารถรวมกันเป็นกลุ่ม รับภาระหน้าที่บางอย่างกับผู้เล่นคนอื่นและประสานการกระทำของพวกเขา ในเกมนี้จะแตกต่างจากเกมที่ไม่ให้ความร่วมมือซึ่งทุกคนต้องเล่นเพื่อตัวเอง เกมที่ให้ความบันเทิงไม่ค่อยให้ความร่วมมือ แต่กลไกดังกล่าวไม่ใช่เรื่องแปลกในชีวิตประจำวัน

มักจะสันนิษฐานว่าเกมแบบร่วมมือมีความแตกต่างกันอย่างชัดเจนในความสามารถของผู้เล่นในการสื่อสารระหว่างกัน ที่ กรณีทั่วไปนี่ไม่เป็นความจริง. มีบางเกมที่อนุญาตให้สื่อสารได้ แต่ผู้เล่นทำตามเป้าหมายส่วนตัว และในทางกลับกัน

ในบรรดาเกมทั้งสองประเภท เกมที่ไม่ร่วมมือจะอธิบายสถานการณ์อย่างละเอียดและให้ผลลัพธ์ที่แม่นยำกว่า สหกรณ์พิจารณากระบวนการของเกมโดยรวม ความพยายามที่จะผสมผสานทั้งสองแนวทางเข้าด้วยกันได้ผลลัพธ์ที่มากมาย โปรแกรมแนชที่เรียกว่าได้ค้นพบวิธีแก้ปัญหาสำหรับเกมแบบร่วมมือบางเกมแล้วว่าเป็นสถานการณ์ที่สมดุลสำหรับเกมแบบไม่ร่วมมือ

เกมแบบผสมผสานประกอบด้วยองค์ประกอบของเกมแบบร่วมมือและแบบไม่ให้ความร่วมมือ ตัวอย่างเช่น ผู้เล่นสามารถสร้างกลุ่มได้ แต่เกมจะเล่นในรูปแบบที่ไม่ให้ความร่วมมือ ซึ่งหมายความว่าผู้เล่นแต่ละคนจะแสวงหาผลประโยชน์ของกลุ่มของตน ในขณะเดียวกันก็พยายามแสวงหาผลประโยชน์ส่วนตัว

ทฤษฎีเกม- ทฤษฎี แบบจำลองทางคณิตศาสตร์การตัดสินใจที่เหมาะสมที่สุดในสถานการณ์ความขัดแย้ง เนื่องจากฝ่ายที่เกี่ยวข้องในความขัดแย้งส่วนใหญ่สนใจที่จะซ่อนความตั้งใจของตนจากศัตรู ตามกฎแล้วการตัดสินใจในความขัดแย้งจึงเกิดขึ้นภายใต้เงื่อนไขที่ไม่แน่นอน ในทางตรงกันข้าม ปัจจัยของความไม่แน่นอนสามารถตีความได้ว่าเป็นปรปักษ์กับบุคคลที่ทำการตัดสินใจ (ดังนั้น การตัดสินใจภายใต้เงื่อนไขของความไม่แน่นอนสามารถเข้าใจได้ว่าเป็นการตัดสินใจภายใต้เงื่อนไขของความขัดแย้ง) โดยเฉพาะอย่างยิ่ง ข้อความทางสถิติทางคณิตศาสตร์จำนวนมากถูกกำหนดให้เป็นทฤษฎีเกมโดยธรรมชาติ

ทฤษฎีเกมเป็นสาขาหนึ่งของคณิตศาสตร์ประยุกต์ที่ใช้ในสังคมศาสตร์ (ส่วนใหญ่อยู่ในเศรษฐศาสตร์) ชีววิทยา รัฐศาสตร์ วิทยาการคอมพิวเตอร์ (ส่วนใหญ่สำหรับปัญญาประดิษฐ์) และปรัชญา ทฤษฎีเกมพยายามที่จะแก้ไขพฤติกรรมทางคณิตศาสตร์ใน สถานการณ์เชิงกลยุทธ์ซึ่งความสำเร็จของการเลือกหัวข้อขึ้นอยู่กับการเลือกของผู้เข้าร่วมรายอื่น หากในตอนแรกการวิเคราะห์เกมได้รับการพัฒนาโดยฝ่ายตรงข้ามฝ่ายใดฝ่ายหนึ่งชนะด้วยค่าใช้จ่ายของอีกฝ่าย (เกมผลรวมศูนย์) จากนั้นพวกเขาก็เริ่มพิจารณาการโต้ตอบที่หลากหลายซึ่งจำแนกตามเกณฑ์ที่แน่นอน วันนี้ "ทฤษฎีเกมเป็นเหมือนร่มหรือทฤษฎีสากลสำหรับด้านเหตุผลของสังคมศาสตร์ ซึ่งสังคมสามารถเข้าใจได้กว้างๆ รวมถึงผู้เล่นทั้งที่เป็นมนุษย์และไม่ใช่มนุษย์ (คอมพิวเตอร์ สัตว์ พืช)" (โรเบิร์ต โอมันน์ , 2530)

สาขาคณิตศาสตร์นี้ได้รับการสะท้อนบางอย่างใน วัฒนธรรมสมัยนิยม. ในปี 1998 นักเขียนและนักหนังสือพิมพ์ชาวอเมริกัน Sylvia Nazar ได้ตีพิมพ์หนังสือเกี่ยวกับชีวิตของ John Nash ผู้ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากความสำเร็จของเขาในทฤษฎีเกม และในปี 2001 ภาพยนตร์เรื่อง A Beautiful Mind ถูกสร้างขึ้นจากหนังสือ (ดังนั้น ทฤษฎีเกมจึงเป็นหนึ่งในไม่กี่สาขาของคณิตศาสตร์ที่คุณจะได้รับ รางวัลโนเบล). รายการโทรทัศน์ของอเมริกาบางรายการเช่น เพื่อนหรือศัตรู, นามแฝงหรือ ตัวเลขใช้ทฤษฎีเกมเป็นระยะในการเผยแพร่

จอห์น แนช - นักคณิตศาสตร์ ผู้ได้รับรางวัลโนเบล เป็นที่รู้จักของสาธารณชนทั่วไปจากภาพยนตร์เรื่อง A Beautiful Mind

แนวคิดของทฤษฎีเกม

พื้นฐานเชิงตรรกะของทฤษฎีเกมคือการทำให้แนวคิดสามประการรวมอยู่ในคำจำกัดความและเป็นพื้นฐานของทฤษฎีทั้งหมด:

  • ขัดแย้ง,
  • การตัดสินใจในความขัดแย้ง
  • ความเหมาะสมของการตัดสินใจ

แนวคิดเหล่านี้ได้รับการพิจารณาในทฤษฎีเกมในความหมายที่กว้างที่สุด พิธีการของพวกเขาสอดคล้องกับการแสดงความหมายของวัตถุที่เกี่ยวข้อง

หากคุณตั้งชื่อผู้เข้าร่วมในความขัดแย้ง แนวร่วมปฏิบัติ(แสดงว่าเซตของพวกเขาเป็น D การกระทำที่เป็นไปได้ของแต่ละแนวร่วมปฏิบัติการคือของมัน กลยุทธ์(ชุดยุทธศาสตร์แนวร่วมปฏิบัติการทั้งหมด เคแสดงเป็น ) ผลของความขัดแย้ง - สถานการณ์(ชุดของสถานการณ์ทั้งหมดจะแสดงเป็น ; เป็นที่เชื่อกันว่าแต่ละสถานการณ์พัฒนาขึ้นอันเป็นผลมาจากการเลือกแนวร่วมปฏิบัติของแต่ละกลยุทธ์ ดังนั้น ) ฝ่ายที่เกี่ยวข้อง - กลุ่มผลประโยชน์(มีหลายคน - ฉัน) และสุดท้ายพูดคุยเกี่ยวกับผลประโยชน์ที่เป็นไปได้สำหรับกลุ่มผลประโยชน์แต่ละกลุ่ม เคสถานการณ์หนึ่ง "ต่อหน้าคนอื่น "(ข้อเท็จจริงนี้แสดงว่า) จากนั้นความขัดแย้งโดยรวมสามารถอธิบายได้เป็นระบบ

.

ระบบที่แสดงถึงความขัดแย้งดังกล่าวเรียกว่า เกม. การสรุปองค์ประกอบที่กำหนดเกมนำไปสู่เกมประเภทต่างๆ

การจำแนกประเภทเกม

แยกประเภทของเกมที่ไม่ให้ความร่วมมือคือ:

  • เกมที่เป็นปฏิปักษ์รวมถึง เกมเมทริกซ์และเกมบนตารางหน่วย
  • เกมไดนามิกรวมถึงเกมที่แตกต่างกัน
  • เกมแบบเรียกซ้ำ
  • เกมเอาชีวิตรอด

และอื่น ๆ ยังหมายถึงเกมที่ไม่ร่วมมือ

เครื่องมือทางคณิตศาสตร์

ทฤษฎีเกมใช้ประโยชน์ได้หลากหลาย วิธีการทางคณิตศาสตร์และผลลัพธ์ของทฤษฎีความน่าจะเป็น การวิเคราะห์แบบดั้งเดิม การวิเคราะห์เชิงหน้าที่ (ทฤษฎีบทเกี่ยวกับจุดคงที่มีความสำคัญเป็นพิเศษ) โทโพโลยีเชิงผสม ทฤษฎีสมการเชิงอนุพันธ์และสมการอินทิกรัล และอื่นๆ ความเฉพาะเจาะจงของทฤษฎีเกมมีส่วนช่วยในการพัฒนาด้านคณิตศาสตร์ต่างๆ (เช่น ทฤษฎีเซตนูน การเขียนโปรแกรมเชิงเส้นฯลฯ).

การตัดสินใจในทฤษฎีเกมถือเป็นการเลือกปฏิบัติของกลุ่มพันธมิตร หรือโดยเฉพาะอย่างยิ่ง การเลือกกลยุทธ์บางอย่างของผู้เล่น ตัวเลือกนี้สามารถจินตนาการได้ว่าเป็นการกระทำเพียงครั้งเดียวและสามารถยกขึ้นอย่างเป็นทางการเพื่อเป็นทางเลือกขององค์ประกอบจากชุด เรียกว่าเกมที่มีความเข้าใจในการเลือกกลยุทธ์ เกมในรูปแบบปกติ. ซึ่งแตกต่างจากเกมไดนามิกซึ่งการเลือกกลยุทธ์เป็นกระบวนการที่เกิดขึ้นในช่วงเวลาหนึ่ง ซึ่งมาพร้อมกับการขยายและหดตัวของโอกาส การได้รับและการสูญเสียข้อมูลเกี่ยวกับสถานการณ์ปัจจุบัน ฯลฯ อย่างเป็นทางการ กลยุทธ์ใน เกมดังกล่าวเป็นฟังก์ชันที่กำหนดไว้ในชุดสถานะข้อมูลทั้งหมดของผู้ตัดสินใจ การใช้ "อิสระในการเลือก" ของกลยุทธ์อย่างไร้เหตุผลสามารถนำไปสู่ปรากฏการณ์ที่ขัดแย้งกัน

การเพิ่มประสิทธิภาพและการแยกส่วน

คำถามของการทำให้เป็นทางการของแนวคิดเรื่องความเหมาะสมนั้นซับซ้อนมาก ไม่มีแนวคิดเรื่องความเหมาะสมในทฤษฎีเกมเพียงแนวคิดเดียว ดังนั้นเราต้องพิจารณาหลักการหลายประการเกี่ยวกับความเหมาะสม ขอบเขตของการประยุกต์ใช้หลักการแห่งความเหมาะสมแต่ละข้อที่ใช้ในทฤษฎีเกมนั้นจำกัดเฉพาะคลาสที่ค่อนข้างแคบของเกม หรือเกี่ยวข้องกับการพิจารณาในแง่มุมที่จำกัด

ภายใต้หลักการเหล่านี้แต่ละข้อเป็นสัญชาตญาณบางอย่างเกี่ยวกับสิ่งที่ดีที่สุดว่าเป็นสิ่งที่ "มั่นคง" หรือ "ยุติธรรม" การทำให้เป็นทางการของการเป็นตัวแทนเหล่านี้ทำให้ข้อกำหนดที่กำหนดไว้เหมาะสมที่สุดและมีลักษณะของสัจพจน์

ในบรรดาข้อกำหนดเหล่านี้อาจมีข้อกำหนดที่ขัดแย้งกัน (ตัวอย่างเช่น คุณสามารถแสดงความขัดแย้งที่ฝ่ายต่างๆ ถูกบังคับให้พอใจกับผลประโยชน์เล็กน้อย เนื่องจากผลประโยชน์จำนวนมากสามารถทำได้ในสถานการณ์ที่ไม่แน่นอนเท่านั้น) ดังนั้น หลักการรวมของความเหมาะสมจึงไม่สามารถกำหนดขึ้นได้ในทฤษฎีเกม

สถานการณ์ (หรือชุดของสถานการณ์) ที่ตอบสนองความต้องการที่เหมาะสมที่สุดในบางเกมเรียกว่า การตัดสินใจเกมส์นี้. เนื่องจากแนวคิดเรื่องการเพิ่มประสิทธิภาพนั้นไม่คลุมเครือ จึงมีผลลัพธ์ของเกมในความหมายที่แตกต่างกัน การสร้างคำจำกัดความสำหรับโซลูชันเกม การทำให้มันมีอยู่จริง และการพัฒนาวิธีการค้นหาคำตอบจริงๆ คือคำถามหลักสามข้อของทฤษฎีเกมสมัยใหม่ ที่เกี่ยวข้องอย่างใกล้ชิดคือคำถามเกี่ยวกับเอกลักษณ์ของโซลูชันเกมเกี่ยวกับการมีอยู่ในเกมโซลูชันบางประเภทที่มีคุณสมบัติที่กำหนดไว้ล่วงหน้า

ประวัติศาสตร์

ในฐานะที่เป็นระเบียบวินัยทางคณิตศาสตร์ ทฤษฎีเกมถือกำเนิดขึ้นในเวลาเดียวกับทฤษฎีความน่าจะเป็นในศตวรรษที่ 17 แต่เป็นเวลาเกือบ 300 ปีที่มันไม่ได้พัฒนามากนัก งานสำคัญชิ้นแรกเกี่ยวกับทฤษฎีเกมควรได้รับการพิจารณาจากบทความของ J. von Neumann “เกี่ยวกับทฤษฎี เกมกลยุทธ์"(1928) และด้วยการตีพิมพ์เอกสารโดยนักคณิตศาสตร์ชาวอเมริกัน J. von Neumann และ O. Morgenstern "ทฤษฎีเกมและพฤติกรรมทางเศรษฐกิจ" (1944) ทฤษฎีเกมถูกสร้างขึ้นเป็นวินัยทางคณิตศาสตร์อิสระ ซึ่งแตกต่างจากสาขาอื่น ๆ ของคณิตศาสตร์ซึ่งมีแหล่งกำเนิดทางกายภาพหรือเทคโนโลยีทางกายภาพเป็นส่วนใหญ่ ทฤษฎีเกมตั้งแต่เริ่มต้นของการพัฒนามุ่งเป้าไปที่การแก้ปัญหาที่เกิดขึ้นในระบบเศรษฐกิจ (กล่าวคือ ในระบบเศรษฐกิจที่มีการแข่งขัน)

ต่อมาความคิด วิธีการ และผลลัพธ์ของทฤษฎีเกมได้เริ่มนำไปใช้ในความรู้ด้านอื่น ๆ ที่เกี่ยวข้องกับความขัดแย้ง: ในกิจการทหาร ในเรื่องเกี่ยวกับศีลธรรม ในการศึกษาพฤติกรรมมวลชนของบุคคลที่มีความสนใจต่างกัน (เช่น ใน เรื่องการอพยพของประชากร หรือเมื่อพิจารณาถึงการต่อสู้ทางชีววิทยาเพื่อการดำรงอยู่) วิธีการตามทฤษฎีเกมสำหรับการตัดสินใจที่เหมาะสมที่สุดภายใต้ความไม่แน่นอนสามารถมีได้ แอพพลิเคชั่นกว้างการแพทย์ การวางแผนและการพยากรณ์ทางเศรษฐกิจและสังคม วิทยาศาสตร์และเทคโนโลยีหลายประเด็น บางครั้งทฤษฎีเกมถูกอ้างถึงเป็นเครื่องมือทางคณิตศาสตร์ของไซเบอร์เนติกส์ หรือทฤษฎีการวิจัยการดำเนินงาน

ในทางปฏิบัติ บ่อยครั้งที่จำเป็นต้องตัดสินใจต่อหน้าการต่อต้านจากอีกฝ่าย ซึ่งอาจมีเป้าหมายที่ตรงกันข้ามหรือต่างกัน แทรกแซงการกระทำหรือสถานะบางอย่าง สภาพแวดล้อมภายนอกบรรลุเป้าหมายที่ตั้งใจไว้ ยิ่งไปกว่านั้น อิทธิพลของฝั่งตรงข้ามเหล่านี้สามารถเป็นแบบพาสซีฟหรือแอคทีฟก็ได้ ในกรณีเช่นนี้ จำเป็นต้องคำนึงถึงพฤติกรรมที่เป็นไปได้ของฝั่งตรงข้าม การดำเนินการตอบโต้ และผลที่ตามมาที่เป็นไปได้

ตัวเลือกที่เป็นไปได้สำหรับพฤติกรรมของทั้งสองฝ่ายและผลลัพธ์สำหรับแต่ละตัวเลือกและสถานะที่รวมกันมักจะนำเสนอในรูปแบบของแบบจำลองทางคณิตศาสตร์ เรียกว่าเกม .

หากฝ่ายตรงข้ามเป็นฝ่ายเฉย ๆ เฉย ๆ ซึ่งไม่ได้ต่อต้านความสำเร็จของเป้าหมายที่ตั้งใจไว้อย่างมีสติ เกมนี้มีชื่อว่า เล่นกับธรรมชาติ ธรรมชาติมักจะเข้าใจว่าเป็นชุดของสถานการณ์ที่ต้องทำการตัดสินใจ (ความไม่แน่นอนของสภาพอากาศ ความไม่แน่นอนของพฤติกรรมลูกค้าในกิจกรรมเชิงพาณิชย์ ความไม่แน่นอนของปฏิกิริยาของประชากรต่อสินค้าและบริการประเภทใหม่ ฯลฯ)

ในสถานการณ์อื่น ๆ ฝ่ายตรงข้ามอย่างแข็งขันคัดค้านความสำเร็จของเป้าหมายที่ตั้งใจไว้ ในกรณีดังกล่าวมีการปะทะกันของผลประโยชน์ ความคิดเห็น ความคิดที่ขัดแย้งกัน สถานการณ์ดังกล่าว เรียกว่าความขัดแย้ง และการตัดสินใจในสถานการณ์ความขัดแย้งถูกขัดขวางโดยความไม่แน่นอนของพฤติกรรมของศัตรู เป็นที่ทราบกันดีว่าศัตรูพยายามอย่างมีสติที่จะดำเนินการที่เป็นประโยชน์น้อยที่สุดสำหรับคุณเพื่อให้แน่ใจว่าตัวเขาเองจะประสบความสำเร็จมากที่สุด ไม่ทราบว่าศัตรูสามารถประเมินสถานการณ์และผลที่ตามมาได้มากน้อยเพียงใด เขาประเมินความสามารถและความตั้งใจของคุณอย่างไร ทั้งสองฝ่ายไม่สามารถคาดเดาการกระทำร่วมกันได้ แม้จะมีความไม่แน่นอน แต่ก็ขึ้นอยู่กับความขัดแย้งแต่ละด้านในการตัดสินใจ

ในทางเศรษฐกิจ สถานการณ์ความขัดแย้งเป็นเรื่องปกติมากและมีลักษณะที่หลากหลาย สิ่งเหล่านี้รวมถึง ตัวอย่างเช่น ความสัมพันธ์ระหว่างซัพพลายเออร์กับผู้บริโภค ผู้ซื้อกับผู้ขาย ธนาคารกับลูกค้า เป็นต้น ในตัวอย่างทั้งหมดนี้ สถานการณ์ความขัดแย้งเกิดขึ้นจากความแตกต่างในผลประโยชน์ของหุ้นส่วนและ ความปรารถนาของแต่ละคนในการตัดสินใจที่ดีที่สุด ในเวลาเดียวกันทุกคนต้องคำนึงถึงเป้าหมายของตนเองเท่านั้น แต่ยังรวมถึงเป้าหมายของพันธมิตรด้วยและคำนึงถึงการกระทำที่เป็นไปได้ของเขาที่ไม่ทราบล่วงหน้า

ความจำเป็นในการปรับแก้ที่เหมาะสมในสถานการณ์ความขัดแย้งได้นำไปสู่การเกิดขึ้น ทฤษฎีเกม.

ทฤษฎีเกม - เป็นทฤษฎีทางคณิตศาสตร์ของสถานการณ์ความขัดแย้ง. จุดเริ่มต้นของทฤษฎีนี้คือสมมติฐานของหน่วยสืบราชการลับ "ในอุดมคติ" ที่สมบูรณ์ของศัตรูและการยอมรับการตัดสินใจที่รอบคอบที่สุดในการแก้ไขความขัดแย้ง

ฝ่ายที่ขัดแย้งกันเรียกว่า ผู้เล่น การใช้งานอย่างหนึ่งของเกมคือ งานสังสรรค์ , ผลของเกมคือ ชนะหรือแพ้ . การกระทำใด ๆ ที่เป็นไปได้สำหรับผู้เล่น (ภายในกฎที่กำหนดของเกม) จะเรียกว่าการกระทำของเขา กลยุทธ์ .

ความหมายของเกมคือผู้เล่นแต่ละคนภายใต้กฎที่กำหนดของเกม พยายามใช้กลยุทธ์ที่เหมาะสมที่สุดสำหรับเขา นั่นคือกลยุทธ์ที่จะนำไปสู่ผลลัพธ์ที่ดีที่สุดสำหรับเขา หนึ่งในหลักการของพฤติกรรมที่เหมาะสมที่สุด (สมควร) คือความสำเร็จของสถานการณ์สมดุลซึ่งไม่มีผู้เล่นคนใดสนใจ

มันเป็นสถานการณ์ที่สมดุลซึ่งอาจเป็นเรื่องของสัญญาที่มั่นคงระหว่างผู้เล่น นอกจากนี้ สถานการณ์สมดุลยังเป็นประโยชน์สำหรับผู้เล่นแต่ละคน: ในสถานการณ์สมดุล ผู้เล่นแต่ละคนจะได้รับผลตอบแทนสูงสุดตามขอบเขตที่ขึ้นอยู่กับตัวเขาเอง

แบบจำลองทางคณิตศาสตร์ของสถานการณ์ความขัดแย้ง เรียกว่าเกม คู่กรณีในความขัดแย้ง เรียกว่าผู้เล่น

มีการแนะนำกฎสำหรับแต่ละเกมที่เป็นทางการ ในกรณีทั่วไป กฎของเกมจะกำหนดตัวเลือกสำหรับการกระทำของผู้เล่น จำนวนข้อมูลที่ผู้เล่นแต่ละคนมีเกี่ยวกับพฤติกรรมของพันธมิตร ผลตอบแทนที่การกระทำแต่ละชุดนำไปสู่

การพัฒนาเกมตามเวลาเกิดขึ้นตามลำดับ เป็นขั้นเป็นตอนหรือเป็นการเคลื่อนไหว ในทฤษฎีเกม การเคลื่อนไหวเรียกว่า เลือกหนึ่งในการกระทำที่กำหนดโดยกฎของเกมและการนำไปใช้ การเคลื่อนไหวเป็นเรื่องส่วนตัวและเป็นการสุ่ม ย้ายส่วนบุคคล เรียกว่าตัวเลือกที่ใส่ใจโดยผู้เล่นหนึ่งในตัวเลือกที่เป็นไปได้สำหรับการกระทำและการนำไปใช้ การย้ายแบบสุ่ม พวกเขาเรียกตัวเลือกที่ไม่ได้เกิดจากการตัดสินใจโดยสมัครใจของผู้เล่น แต่โดยกลไกบางอย่างของการเลือกแบบสุ่ม (การโยนเหรียญ การจ่ายบอล การแจกไพ่ ฯลฯ)

ขึ้นอยู่กับสาเหตุที่ทำให้เกิดความไม่แน่นอนของผลลัพธ์ เกมสามารถแบ่งออกเป็นกลุ่มหลักดังต่อไปนี้:

เกมคอมโบ, โดยหลักการแล้วกฎให้โอกาสสำหรับผู้เล่นแต่ละคนในการวิเคราะห์ตัวเลือกต่าง ๆ ทั้งหมดสำหรับพฤติกรรมของเขาและเปรียบเทียบตัวเลือกเหล่านี้ เลือกตัวเลือกที่นำไปสู่ผลลัพธ์ที่ดีที่สุดสำหรับผู้เล่นรายนี้ ความไม่แน่นอนของผลลัพธ์มักจะเกี่ยวข้องกับความจริงที่ว่าจำนวนของพฤติกรรมที่เป็นไปได้ (การเคลื่อนไหว) นั้นมากเกินไป และผู้เล่นไม่สามารถจัดเรียงและวิเคราะห์พฤติกรรมทั้งหมดได้

การพนัน ซึ่งผลลัพธ์ไม่แน่นอนเนื่องจากอิทธิพลของปัจจัยสุ่มต่างๆ เกมการพนันประกอบด้วยการเคลื่อนไหวแบบสุ่มเท่านั้นในการวิเคราะห์ซึ่งใช้ทฤษฎีความน่าจะเป็น ทฤษฎีเกมทางคณิตศาสตร์ไม่ได้เกี่ยวข้องกับการพนัน

เกมกลยุทธ์ ซึ่งความไม่แน่นอนอย่างสมบูรณ์ของตัวเลือกนั้นได้รับการพิสูจน์โดยข้อเท็จจริงที่ว่าเมื่อผู้เล่นแต่ละคนตัดสินใจเลือกการเคลื่อนไหวที่กำลังจะมาถึง ไม่รู้ว่ากลยุทธ์ใดที่ผู้เข้าร่วมคนอื่น ๆ ในเกมจะทำตาม และความไม่รู้ของผู้เล่นเกี่ยวกับ พฤติกรรมและความตั้งใจของคู่ค้ามีลักษณะพื้นฐานเนื่องจากไม่มีข้อมูลเกี่ยวกับการกระทำที่ตามมาของฝ่ายตรงข้าม (คู่ค้า)

มีเกมที่รวมคุณสมบัติของเกมแบบผสมผสานและเกมการพนัน ลักษณะเชิงกลยุทธ์ของเกมสามารถใช้ร่วมกับการรวมกันได้ เป็นต้น

ขึ้นอยู่กับจำนวนผู้เข้าร่วมในเกม แบ่งออกเป็นคู่และหลาย ในเกมคู่ จำนวนผู้เข้าร่วมคือสองคน ในเกมหลายเกม จำนวนผู้เข้าร่วมมากกว่าสองคน ผู้เข้าร่วมหลายเกมสามารถสร้างพันธมิตรได้ ในกรณีนี้จะเรียกว่าเกม แนวร่วม . เกมหลายเกมกลายเป็นเกมคู่หากผู้เข้าร่วมสร้างแนวร่วมถาวรสองกลุ่ม

หนึ่งในแนวคิดพื้นฐานของทฤษฎีเกมคือกลยุทธ์ กลยุทธ์ของผู้เล่น เป็นชุดของกฎที่กำหนดตัวเลือกของการกระทำที่แตกต่างกันสำหรับการเคลื่อนไหวส่วนตัวของผู้เล่นรายนี้ขึ้นอยู่กับสถานการณ์ที่พัฒนาขึ้นในระหว่างเกม

กลยุทธ์ที่เหมาะสมที่สุด กลยุทธ์ของผู้เล่นคือกลยุทธ์ที่เมื่อเกมที่มีการเคลื่อนไหวส่วนตัวและการสุ่มเล่นซ้ำหลายๆ ครั้ง จะให้ผู้เล่นได้รับค่าเฉลี่ยสูงสุดที่เป็นไปได้หรือการสูญเสียขั้นต่ำที่เป็นไปได้ โดยไม่คำนึงถึงพฤติกรรมของฝ่ายตรงข้าม

เกมนี้มีชื่อว่า สุดยอด หากจำนวนกลยุทธ์ของผู้เล่นมีจำกัด และ ไม่มีที่สิ้นสุด หากผู้เล่นอย่างน้อยหนึ่งคนมีกลยุทธ์จำนวนไม่สิ้นสุด

ในปัญหามัลติพาสของทฤษฎีเกม แนวคิดของ "กลยุทธ์" และ "รูปแบบต่างๆ ของการกระทำที่เป็นไปได้" แตกต่างกันอย่างมีนัยสำคัญ ในปัญหาเกมง่ายๆ (การเคลื่อนไหวครั้งเดียว) เมื่อในเกมแต่ละเกม ผู้เล่นแต่ละคนสามารถเคลื่อนไหวได้ 1 ครั้ง แนวคิดเหล่านี้ตรงกัน และด้วยเหตุนี้ ชุดของกลยุทธ์ของผู้เล่นจึงครอบคลุมการกระทำที่เป็นไปได้ทั้งหมดที่เขาสามารถทำได้ในทุกสถานการณ์ที่เป็นไปได้และสำหรับสถานการณ์ใดๆ ข้อมูลจริงที่เป็นไปได้

มีเกมและจำนวนเงินที่ชนะ เกมนี้มีชื่อว่า ศูนย์ ซูโม่ ไทย, หากผู้เล่นแต่ละคนชนะด้วยค่าใช้จ่ายของผู้อื่น และผลรวมของกำไรของฝ่ายหนึ่งจะเท่ากับผลรวมของการสูญเสียของอีกฝ่ายหนึ่ง ในเกมคู่ผลรวมเป็นศูนย์ ความสนใจของผู้เล่นจะตรงกันข้าม เรียกว่าเกมคู่ผลรวมศูนย์ ฉันเกมที่เป็นปฏิปักษ์ .

เกมที่การได้ของผู้เล่นคนหนึ่งและการเสียของอีกคนหนึ่งไม่เท่ากัน เรียกว่าเกมผลรวมที่ไม่ใช่ศูนย์ .

มีสองวิธีในการอธิบายเกม: ตำแหน่งและปกติ . วิธีการกำหนดตำแหน่งนั้นสัมพันธ์กับรูปแบบที่ขยายของเกม และถูกลดขนาดลงเป็นกราฟของขั้นตอนต่อเนื่องกัน (ผังเกม) วิธีปกติคือการแสดงชุดกลยุทธ์ของผู้เล่นอย่างชัดเจนและ ฟังก์ชั่นการชำระเงิน . ฟังก์ชันผลตอบแทนในเกมกำหนดผลตอบแทนสำหรับแต่ละด้านสำหรับแต่ละชุดของกลยุทธ์ที่ผู้เล่นเลือก

จากบล็อกยอดนิยมของอเมริกา Cracked

ทฤษฎีเกมเป็นเรื่องเกี่ยวกับการเรียนรู้วิธีทำให้ดีที่สุด และเป็นผลให้ได้รับชิ้นส่วนที่ใหญ่ที่สุดของวงกลมที่ชนะโดยการตัดบางส่วนจากผู้เล่นคนอื่น สอนให้คุณวิเคราะห์ปัจจัยต่างๆ และสรุปผลอย่างมีเหตุผล ผมว่าควรเรียนหลังเลขก่อนอักษรนะครับ เพียงเพราะมีคนจำนวนมากเกินไปที่ตัดสินใจเรื่องสำคัญตามสัญชาตญาณ คำพยากรณ์ลับ การจัดตำแหน่งของดวงดาว และอื่นๆ ฉันได้ศึกษาทฤษฎีเกมอย่างถี่ถ้วนแล้ว และตอนนี้ฉันอยากจะบอกคุณเกี่ยวกับพื้นฐานของมัน บางทีนี่อาจเพิ่มสามัญสำนึกให้กับชีวิตของคุณ

1. ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

Berto และ Robert ถูกจับในข้อหาปล้นธนาคารหลังจากไม่สามารถใช้รถที่ขโมยมาหลบหนีได้อย่างถูกต้อง ตำรวจพิสูจน์ไม่ได้ว่าเป็นคนปล้นธนาคาร แต่จับได้คาหนังคาเขาในคดีขโมยรถ พวกเขาถูกพาไปที่ห้องต่างๆ และแต่ละคนได้รับข้อเสนอ: ส่งตัวผู้สมรู้ร่วมคิดและส่งเขาเข้าคุกเป็นเวลา 10 ปี และปล่อยตัวเขาเอง แต่ถ้าทั้งคู่หักหลังกัน แต่ละคนจะได้รับ 7 ปี หากไม่มีใครพูดอะไรทั้งคู่ก็จะนั่งลงเป็นเวลา 2 ปีสำหรับการขโมยรถเท่านั้น

ปรากฎว่าถ้า Berto เงียบ แต่ Robert ทรยศเขา Berto จะเข้าคุกเป็นเวลา 10 ปี และ Robert ก็เป็นอิสระ

นักโทษแต่ละคนเป็นผู้เล่น และผลประโยชน์ของแต่ละคนสามารถแสดงเป็น "สูตรสำเร็จ" (สิ่งที่ทั้งคู่ได้รับ สิ่งที่อีกฝ่ายได้รับ) ตัวอย่างเช่น ถ้าฉันตีคุณ รูปแบบการชนะของฉันจะเป็นแบบนี้ (ฉันชนะแบบคร่าวๆ คุณทนไหว อาการปวดอย่างรุนแรง). เนื่องจากนักโทษแต่ละคนมีสองทางเลือก เราจึงสามารถนำเสนอผลลัพธ์ในตารางได้

การประยุกต์ใช้จริง: การตรวจจับผู้ต่อต้านสังคม

ในที่นี้เราจะเห็นการประยุกต์ใช้ทฤษฎีเกมเป็นหลัก: ระบุผู้ต่อต้านสังคมที่คิดแต่เรื่องของตัวเองทฤษฎีเกมจริงเป็นเครื่องมือวิเคราะห์ที่ทรงพลัง และมือสมัครเล่นมักจะทำหน้าที่เป็นธงสีแดง โดยมีหัวหน้าที่ทรยศต่อบุคคลที่ไร้เกียรติ คนที่มีสัญชาตญาณคิดว่าการน่าเกลียดจะดีกว่าเพราะจะทำให้โทษจำคุกสั้นลงไม่ว่าผู้เล่นคนอื่นจะทำอะไรก็ตาม ในทางเทคนิคแล้ว สิ่งนี้ถูกต้อง แต่ถ้าคุณเป็นคนสายตาสั้นที่ทำให้ตัวเลขสูงขึ้น ชีวิตมนุษย์. นี่คือเหตุผลที่ทฤษฎีเกมเป็นที่นิยมอย่างมากในด้านการเงิน

ปัญหาที่แท้จริงของ Prisoner's Dilemma คือมันไม่สนใจข้อมูลตัวอย่างเช่น มันไม่ได้พิจารณาถึงความเป็นไปได้ที่คุณจะได้พบกับเพื่อน ญาติ หรือแม้แต่เจ้าหนี้ของบุคคลที่คุณจำคุกเป็นเวลา 10 ปี

ที่เลวร้ายที่สุดคือ ทุกคนที่เกี่ยวข้องกับ Prisoner's Dilemma ทำเหมือนไม่เคยได้ยินเรื่องนี้มาก่อน

และการดำเนินการที่ดีที่สุดคือการนิ่งเฉย และอีก 2 ปีต่อมาร่วมกับ เพื่อนที่ดีใช้เงินประชาชน.

2. กลยุทธ์ที่โดดเด่น

นี่คือสถานการณ์ที่การกระทำของคุณให้ผลประโยชน์มากที่สุด โดยไม่คำนึงถึงการกระทำของฝ่ายตรงข้ามไม่ว่าจะเกิดอะไรขึ้น คุณทำทุกอย่างถูกต้องแล้ว นั่นเป็นเหตุผลที่หลายคนใน Prisoner's Dilemma เชื่อว่าการทรยศนำไปสู่ผลลัพธ์ที่ "ดีที่สุด" ไม่ว่าอีกฝ่ายจะทำอะไรก็ตาม และการเพิกเฉยต่อความเป็นจริงในวิธีการนี้ทำให้ทุกอย่างดูเรียบง่ายมาก

เกมส่วนใหญ่ที่เราเล่นไม่มีกลยุทธ์ที่โดดเด่นเพราะไม่เช่นนั้นจะแย่มาก ลองนึกภาพว่าคุณมักจะทำสิ่งเดิมๆ ไม่มีกลยุทธ์ที่โดดเด่นในเกมเป่ายิ้งฉุบ แต่ถ้าคุณเล่นกับคนที่สวมถุงมือเตาอบและทำได้แค่โชว์ก้อนหินหรือกระดาษ คุณก็จะมีกลยุทธ์ที่โดดเด่นนั่นคือกระดาษ กระดาษของคุณจะห่อหินของเขาหรือผลเสมอกัน และคุณจะแพ้ไม่ได้เพราะคู่ต่อสู้ของคุณไม่สามารถแสดงกรรไกรได้ ตอนนี้คุณมีกลยุทธ์ที่โดดเด่นแล้ว การลองทำสิ่งอื่นอาจกลายเป็นเรื่องโง่เขลา

3. ศึกระหว่างเพศ

เกมจะน่าสนใจมากขึ้นเมื่อไม่มีกลยุทธ์ที่โดดเด่น ตัวอย่างเช่นการต่อสู้ของเพศ อันจาลีกับบอริสลาฟไปเดทกันแต่ยังตัดสินใจไม่ได้ระหว่างบัลเล่ต์กับมวยสากล อันจาลีชอบชกมวยเพราะเธอชอบที่จะเห็นการไหลเวียนของเลือดเพื่อความสุขของผู้ชมที่กรีดร้องซึ่งคิดว่าตัวเองมีอารยธรรมเพียงเพราะพวกเขาจ่ายค่าหัวหักของใครบางคน

Borislav ต้องการดูบัลเล่ต์เพราะเขาเข้าใจว่านักบัลเล่ต์ต้องผ่านการบาดเจ็บมากมายและการฝึกฝนที่ยากที่สุดโดยรู้ว่าการบาดเจ็บครั้งเดียวสามารถจบทุกสิ่งได้ นักเต้นบัลเล่ต์เป็นนักกีฬาที่ยิ่งใหญ่ที่สุดในโลก นักบัลเล่ต์อาจเตะหัวคุณ แต่เธอจะไม่มีวันทำ เพราะขาของเธอมีค่ามากกว่าใบหน้าของคุณมาก

พวกเขาแต่ละคนต้องการไปงานที่พวกเขาชื่นชอบ แต่พวกเขาไม่ต้องการสนุกกับมันคนเดียว ดังนั้นนี่คือแผนการที่ชนะของพวกเขา: ค่าสูงสุด- ทำในสิ่งที่ชอบ ค่าที่น้อยที่สุด- แค่อยู่กับคนอื่นและศูนย์ - อยู่คนเดียว

บางคนแนะนำให้รักษาสมดุลอย่างดื้อรั้นในช่วงที่เกิดสงคราม: หากคุณทำในสิ่งที่คุณต้องการ ไม่ว่ายังไงก็ตาม อีกฝ่ายต้องยอมทำตามที่คุณเลือกไม่เช่นนั้นจะสูญเสียทุกอย่าง อย่างที่ฉันพูดไปแล้ว ทฤษฎีเกมอย่างง่ายนั้นยอดเยี่ยมในการจับคนโง่

การใช้งานจริง: หลีกเลี่ยงมุมที่แหลมคม

แน่นอนว่ากลยุทธ์นี้มีข้อเสียที่สำคัญเช่นกัน ก่อนอื่น หากคุณปฏิบัติต่อคู่เดทเหมือนเป็น "การต่อสู้ระหว่างเพศ" ก็จะไม่ได้ผล แยกกันเพื่อให้คุณแต่ละคนได้พบกับคนที่เขาชอบ และปัญหาที่สองคือในสถานการณ์นี้ผู้เข้าร่วมไม่แน่ใจในตัวเองมากจนไม่สามารถทำมันได้

กลยุทธ์แห่งชัยชนะอย่างแท้จริงสำหรับทุกคนคือการทำสิ่งที่พวกเขาต้องการและหลังจากนั้นหรือวันถัดไปที่ว่างก็ไปร้านกาแฟด้วยกัน หรือสลับมวยกับบัลเล่ต์จนกระทั่งโลกบันเทิงถูกปฏิวัติและประดิษฐ์บัลเล่ต์มวย

4. สมดุลแนช

ความสมดุลของแนชเป็นชุดของการเคลื่อนไหวที่ไม่มีใครต้องการทำสิ่งที่แตกต่างออกไปหลังจากข้อเท็จจริงและถ้าเราทำให้มันได้ผล ทฤษฎีเกมจะเข้ามาแทนที่ระบบปรัชญา ศาสนา และระบบการเงินทั้งหมดบนโลกนี้ เพราะ "ความปรารถนาที่จะไม่ล้มเหลว" ได้กลายเป็นแรงผลักดันที่ทรงพลังสำหรับมนุษยชาติมากกว่าไฟ

มาแบ่งเงิน 100 ดอลลาร์กันอย่างรวดเร็ว คุณและฉันตัดสินใจว่าเราต้องการกี่ร้อยและในเวลาเดียวกันก็ประกาศจำนวนเงิน หากยอดรวมของเราไม่ถึงร้อย ทุกคนจะได้สิ่งที่ต้องการ หากยอดรวมมากกว่าหนึ่งร้อย คนที่ขอจำนวนน้อยที่สุดจะได้จำนวนที่ต้องการ ในขณะที่คนโลภมากจะได้รับสิ่งที่เหลืออยู่ ถ้าเราขอเงินเท่ากัน คนละ 50 เหรียญ คุณจะถามเท่าไหร่? คุณจะแบ่งเงินอย่างไร? มีเพียงหนึ่งการเคลื่อนไหวที่ชนะ

ข้อกำหนด $51 จะให้จำนวนเงินสูงสุดแก่คุณไม่ว่าฝ่ายตรงข้ามจะเลือกอะไรก็ตาม ถ้าเขาขอเพิ่ม คุณจะได้รับ $51 ถ้าเขาขอ $50 หรือ $51 คุณจะได้ $50 และถ้าเขาขอน้อยกว่า 50 ดอลลาร์ คุณจะได้รับ 51 ดอลลาร์ ไม่ว่าในกรณีใด ๆ จะไม่มีทางเลือกอื่นที่จะนำมาให้คุณ เงินมากขึ้นกว่านี้ ดุลยภาพแนชเป็นสถานการณ์ที่เราทั้งคู่เลือก $51

การใช้งานจริง: คิดก่อน

นี่คือจุดรวมของทฤษฎีเกม คุณไม่จำเป็นต้องชนะ ไม่ต้องพูดถึงการทำร้ายผู้เล่นคนอื่น แต่คุณต้องทำสิ่งที่ดีที่สุดเพื่อตัวคุณเอง ไม่ว่าคนอื่นจะมีอะไรรอคุณอยู่ และดียิ่งขึ้นหากการย้ายครั้งนี้เป็นประโยชน์ต่อผู้เล่นคนอื่น นี่คือคณิตศาสตร์ประเภทหนึ่งที่สามารถเปลี่ยนแปลงสังคมได้

ความแตกต่างที่น่าสนใจของแนวคิดนี้คือการดื่ม ซึ่งสามารถเรียกได้ว่าเป็นสมดุลของแนชโดยขึ้นอยู่กับเวลา เมื่อคุณดื่มมากพอ คุณจะไม่สนใจการกระทำของคนอื่นไม่ว่าพวกเขาจะทำอะไร แต่ในวันถัดไป คุณจะเสียใจจริงๆ ที่คุณไม่ได้ทำอย่างอื่น

5. เกมโยน

ผู้เล่น 1 และผู้เล่น 2 เข้าร่วมในการโยน ผู้เล่นแต่ละคนเลือกหัวหรือก้อยพร้อม ๆ กัน หากทายถูก ผู้เล่นที่ 1 จะได้รับเพนนีของผู้เล่นที่ 2 หากทายไม่ถูก ผู้เล่นที่ 2 จะได้รับเหรียญของผู้เล่นที่ 1

เมทริกซ์ที่ชนะนั้นง่าย...

…กลยุทธ์ที่ดีที่สุด: เล่นแบบสุ่มมันยากกว่าที่คิดเพราะการเลือกจะต้องสุ่มทั้งหมด หากคุณชอบออกหัวหรือก้อย คู่ต่อสู้สามารถใช้มันเพื่อเอาเงินของคุณ

แน่นอนว่าปัญหาที่แท้จริงคือมันจะดีกว่ามากหากพวกเขาโยนเงินให้กัน ผลที่ตามมาคือผลกำไรของพวกเขาจะเท่าเดิม และความบอบช้ำที่ตามมาอาจช่วยให้ผู้เคราะห์ร้ายเหล่านี้รู้สึกอย่างอื่นที่ไม่ใช่ความเบื่อหน่าย เกมนี้เป็นเกมที่แย่ที่สุดที่เคยมีมา และนี่คือโมเดลที่สมบูรณ์แบบสำหรับการยิงจุดโทษ

การใช้งานจริง: บทลงโทษ

ในเกมฟุตบอล ฮอกกี้ และเกมอื่นๆ อีกมากมาย การต่อเวลาพิเศษคือการดวลจุดโทษ และจะน่าสนใจกว่านี้หากอิงจากจำนวนครั้งที่ผู้เล่นเต็มรูปแบบสามารถทำ "วงล้อ" ได้ เพราะอย่างน้อยจะเป็นตัวบ่งชี้ความสามารถทางกายภาพของพวกเขา และคงจะสนุกน่าดู ผู้รักษาประตูไม่สามารถระบุการเคลื่อนที่ของลูกบอลหรือลูกบอลได้อย่างชัดเจนในช่วงเริ่มต้นของการเคลื่อนไหว เพราะน่าเสียดายที่หุ่นยนต์ยังไม่มีส่วนร่วมในกีฬาของเรา ผู้รักษาประตูต้องเลือกทิศทางซ้ายหรือขวาและหวังว่าทางเลือกของเขาจะตรงกับทางเลือกของฝ่ายตรงข้ามที่เตะเข้าประตู มีบางอย่างที่เหมือนกันกับเกมเหรียญ

อย่างไรก็ตาม โปรดทราบว่านี่ไม่ใช่ตัวอย่างที่สมบูรณ์แบบของความคล้ายคลึงกับเกมหัวและหาง เพราะแม้ว่า ทางเลือกที่เหมาะสมทิศทางผู้รักษาประตูอาจจับบอลไม่ได้และผู้โจมตีอาจไม่โดนประตู

แล้วข้อสรุปของเราตามทฤษฎีเกมคืออะไร? เกมบอลควรจบลงในลักษณะ “หลายลูก” ซึ่งทุก ๆ นาทีจะมีการแจกลูกพิเศษ/ลูกบอลให้ผู้เล่นแบบตัวต่อตัว จนกว่าฝ่ายใดฝ่ายหนึ่งจะได้ผลลัพธ์ที่แน่นอนซึ่งบ่งบอกถึงทักษะที่แท้จริงของผู้เล่น และไม่ใช่เรื่องบังเอิญที่น่าทึ่ง

ท้ายที่สุดแล้วควรใช้ทฤษฎีเกมเพื่อทำให้เกมฉลาดขึ้น และนั่นหมายความว่าดีกว่า



ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!