Mathematische Spieltheorie. Beispiele für das Aufzeichnen und Lösen von Spielen aus dem Leben

Spieltheorie - eine Reihe mathematischer Methoden zur Lösung von Konfliktsituationen (Interessenkollisionen). In der Spieltheorie ist ein Spiel mathematisches Modell einer Konfliktsituation. Ein Gegenstand von besonderem Interesse in der Spieltheorie ist die Untersuchung von Entscheidungsstrategien von Spielteilnehmern unter Unsicherheitsbedingungen. Unsicherheit ergibt sich aus der Tatsache, dass zwei oder mehr Seiten gegensätzliche Ziele verfolgen und die Ergebnisse jeder Aktion jeder der Parteien von den Bewegungen des Partners abhängen. Gleichzeitig strebt jede der Parteien danach, optimale Entscheidungen zu treffen, die die gesetzten Ziele weitestgehend realisieren.

Die Spieltheorie wird am konsequentesten in der Wirtschaft angewendet, wo Konfliktsituationen beispielsweise in Beziehungen zwischen einem Lieferanten und einem Verbraucher, einem Käufer und einem Verkäufer, einer Bank und einem Kunden auftreten. Die Anwendung der Spieltheorie findet sich auch in Politik, Soziologie, Biologie und Militärkunst.

Aus der Geschichte der Spieltheorie

Geschichte der Spieltheorie als eigenständige Disziplin beginnt 1944, als John von Neumann und Oscar Morgenstern das Buch „Theory of Games and Economic Behavior“ („Theory of Games and Economic Behavior“) veröffentlichten. Obwohl Beispiele der Spieltheorie schon früher begegnet sind: die babylonische Talmud-Abhandlung über die Aufteilung des Vermögens eines verstorbenen Mannes zwischen seinen Frauen, Kartenspiele im 18. Jahrhundert, die Entwicklung der Schachspieltheorie im frühen 20. Jahrhundert, der Beweis dafür das Minimax-Theorem desselben John von Neumann im Jahr 1928, ohne das es keine Spieltheorie gäbe.

In den 1950er Jahren traten Melvin Drescher und Meryl Flood auf Rand Corporation Der erste, der das Gefangenendilemma experimentell anwandte, John Nash, entwickelte in seiner Arbeit über den Gleichgewichtszustand in Zwei-Personen-Spielen das Konzept des Nash-Gleichgewichts.

Reinhard Salten veröffentlichte 1965 das Buch „Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit“, mit dem die Anwendung der Spieltheorie in der Wirtschaftswissenschaft neue Impulse erhielt. Ein Schritt vorwärts in der Evolution der Spieltheorie ist mit der Arbeit von John Maynard Smith "Evolutionary Stable Strategy" ("Evolutionary Stable Strategy", 1974) verbunden. Das Gefangenendilemma wurde in Robert Axelrods Buch The Evolution of Cooperation, das 1984 veröffentlicht wurde, populär gemacht. 1994 wurden John Nash, John Harsanyi und Reinhard Salten mit dem Nobelpreis für Spieltheorie ausgezeichnet.

Spieltheorie in Leben und Wirtschaft

Gehen wir näher auf das Wesen einer Konfliktsituation (Interessenkonflikt) in dem Sinne ein, wie sie in der Spieltheorie zur weiteren Modellierung verschiedener Lebens- und Geschäftssituationen verstanden wird. Lassen Sie das Individuum in einer Position sein, die zu einem von mehreren möglichen Ergebnissen führt, und das Individuum hat einige persönliche Präferenzen in Bezug auf diese Ergebnisse. Aber obwohl er die variablen Faktoren, die das Ergebnis bestimmen, bis zu einem gewissen Grad kontrollieren kann, hat er keine vollständige Kontrolle über sie. Manchmal liegt die Kontrolle in den Händen einiger weniger Personen, die wie er eine gewisse Vorliebe für mögliche Ergebnisse haben, aber in Allgemeiner Fall die Interessen dieser Personen stimmen nicht überein. In anderen Fällen kann das Endergebnis sowohl von Unfällen (in den Rechtswissenschaften manchmal als Naturkatastrophen bezeichnet) als auch von anderen Personen abhängen. Die Spieltheorie systematisiert Beobachtungen solcher Situationen und formuliert sie allgemeine Grundsätze um in solchen Situationen angemessene Maßnahmen zu ergreifen.

In gewisser Hinsicht ist der Name „Spieltheorie“ unglücklich, da er suggeriert, dass sich die Spieltheorie nur mit ihr befasst sozialen Wert Zusammenstöße, die in Gesellschaftsspielen auftreten, aber diese Theorie hat dennoch eine viel umfassendere Bedeutung.

Die folgende wirtschaftliche Situation kann eine Vorstellung von der Anwendung der Spieltheorie geben. Angenommen, es gibt mehrere Unternehmer, von denen jeder versucht, den Gewinn zu maximieren, während er nur begrenzte Macht über die Variablen hat, die diesen Gewinn bestimmen. Der Unternehmer hat keine Kontrolle über Variablen, die von einem anderen Unternehmer kontrolliert werden, die aber das Einkommen des ersten stark beeinflussen können. Die Interpretation dieser Situation als Spiel kann zu folgendem Einwand Anlass geben. Das Spielmodell geht davon aus, dass jeder Unternehmer eine Wahl aus dem Bereich der möglichen Entscheidungen trifft und die Gewinne durch diese einzelnen Entscheidungen bestimmt werden. Dass dies in der Realität nahezu unmöglich ist, liegt auf der Hand, da in diesem Fall in der Industrie keine aufwendigen Verwaltungsapparate benötigt würden. Es ist nur so, dass es eine Reihe von Entscheidungen und Modifikationen dieser Entscheidungen gibt, die von den Entscheidungen anderer Teilnehmer abhängen. Wirtschaftssystem(Spieler). Aber im Prinzip kann man sich vorstellen, dass jeder Administrator alle möglichen Eventualitäten antizipiert und detailliert beschreibt, was im Einzelfall zu tun ist, anstatt jede Aufgabe so zu lösen, wie sie entsteht.

Ein militärischer Konflikt ist per Definition ein Interessenkonflikt, bei dem keine Seite die volle Kontrolle über die Variablen hat, die das Ergebnis bestimmen, das durch eine Reihe von Schlachten entschieden wird. Sie können das Ergebnis einfach als Sieg oder Niederlage betrachten und ihnen die Zahlenwerte 1 und 0 zuweisen.

Eine der einfachsten Konfliktsituationen, die in der Spieltheorie niedergeschrieben und gelöst werden können, ist ein Duell, bei dem es sich um einen Konflikt zwischen zwei Spielern 1 und 2 handelt p und q Schüsse. Für jeden Spieler gibt es eine Funktion, die die Wahrscheinlichkeit angibt, dass der Spieler geschossen hat ich damals t wird einen Treffer geben, der sich als tödlich erweisen wird.

Im Ergebnis kommt die Spieltheorie zu folgender Formulierung einer bestimmten Klasse von Interessenkonflikten: Es gibt n Spieler, und jeder Spieler muss eine Möglichkeit aus einem bestimmten Satz von 100 auswählen, und wenn er eine Wahl trifft, hat der Spieler keine Informationen über die Entscheidungen anderer Spieler. Der Auswahlbereich des Spielers kann Elemente wie "das Pik-Ass bewegen", "Panzer statt Autos produzieren" oder allgemein eine Strategie enthalten, die alle Aktionen definiert, die unter allen möglichen Umständen durchgeführt werden müssen. Jeder Spieler steht vor der Aufgabe: Welche Wahl soll er treffen, damit ihm sein privater Einfluss auf das Ergebnis den größtmöglichen Gewinn bringt?

Mathematisches Modell in der Spieltheorie und Problemformalisierung

Wie wir bereits festgestellt haben, Das Spiel ist ein mathematisches Modell einer Konfliktsituation und benötigt folgende Komponenten:

  1. interessierte Parteien;
  2. mögliche Aktionen auf jeder Seite;
  3. die Interessen der Parteien.

Die am Spiel Interessierten werden Spieler genannt. , jeder von ihnen kann mindestens zwei Aktionen ausführen (wenn der Spieler nur eine Aktion hat, nimmt er eigentlich nicht am Spiel teil, da im Voraus bekannt ist, was er tun wird). Das Ergebnis des Spiels wird als Gewinn bezeichnet. .

Eine echte Konfliktsituation liegt nicht immer vor, aber das Spiel (im Sinne der Spieltheorie) geht – immer – weiter bestimmte Regeln , die genau definieren:

  1. Spieleroptionen;
  2. die Menge an Informationen, die jeder Spieler über das Verhalten des Partners hat;
  3. die Auszahlung, zu der jede Reihe von Aktionen führt.

Beispiele für formalisierte Spiele sind Fußball, Kartenspiel, Schach.

Aber in der Ökonomie entsteht ein Modell des Spielerverhaltens, wenn beispielsweise mehrere Firmen versuchen, einen vorteilhafteren Platz auf dem Markt einzunehmen, mehrere Einzelpersonen versuchen, etwas Gutes (Ressourcen, Finanzen) untereinander aufzuteilen, damit alle möglichst viel bekommen . Die als Spiel modellierbaren Akteure in Konfliktsituationen in der Wirtschaft sind Unternehmen, Banken, Einzelpersonen und andere Wirtschaftssubjekte. Unter Kriegsbedingungen wiederum wird das Spielmodell beispielsweise bei der Auswahl von mehr verwendet beste Waffe(aus dem verfügbaren oder potenziell möglichen) um den Feind zu besiegen oder vor Angriffen zu schützen.

Das Spiel ist geprägt von der Ungewissheit des Ergebnisses . Die Ursachen der Unsicherheit lassen sich in folgende Gruppen einteilen:

  1. kombinatorisch (wie beim Schach);
  2. der Einfluss zufälliger Faktoren (wie im Spiel "Kopf oder Zahl", Würfel, Kartenspiele);
  3. strategisch (der Spieler weiß nicht, was der Gegner tun wird).

Spielerstrategie ist eine Reihe von Regeln, die seine Aktionen bei jedem Zug abhängig von der Situation bestimmen.

Das Ziel der Spieltheorie ist es, die optimale Strategie für jeden Spieler zu bestimmen. Eine solche Strategie zu bestimmen heißt, das Spiel zu lösen. Strategie Optimalität ist erreicht, wenn einer der Spieler die maximale Auszahlung erzielen muss, während der zweite an seiner Strategie festhält. Und der zweite Spieler sollte einen minimalen Verlust haben, wenn der erste bei seiner Strategie bleibt.

Spielklassifizierung

  1. Klassifizierung nach Anzahl der Spieler (Spiel von zwei oder mehr Personen). Zwei-Personen-Spiele sind zentral für die gesamte Spieltheorie. Das Grundkonzept der Spieltheorie für Zwei-Personen-Spiele ist eine Verallgemeinerung der sehr wesentlichen Idee des Gleichgewichts, die natürlicherweise in Zwei-Personen-Spielen vorkommt. Was die Spiele angeht n Personen, dann widmet sich ein Teil der Spieltheorie Spielen, bei denen die Zusammenarbeit zwischen Spielern verboten ist. In einem anderen Teil der Spieltheorie n Personen wird davon ausgegangen, dass die Spieler zum gegenseitigen Nutzen zusammenarbeiten können (siehe weiter unten in diesem Abschnitt über nicht kooperative und kooperative Spiele).
  2. Klassifizierung nach Anzahl der Spieler und deren Strategien (die Anzahl der Strategien beträgt mindestens zwei, kann unendlich sein).
  3. Klassifizierung nach Informationsmenge zu vergangenen Zügen: Partien mit vollständigen Informationen und unvollständigen Informationen. Es gibt Spieler 1 - den Käufer und Spieler 2 - den Verkäufer. Wenn Spieler 1 keine vollständigen Informationen über die Aktionen von Spieler 2 hat, dann darf Spieler 1 nicht zwischen zwei Alternativen unterscheiden, zwischen denen er sich entscheiden muss. Zum Beispiel zwischen zwei Arten eines bestimmten Produkts zu wählen und nicht zu wissen, dass das Produkt einige Eigenschaften aufweist EIN schlimmer als Ware B, sieht Spieler 1 den Unterschied zwischen den Alternativen möglicherweise nicht.
  4. Einstufung nach den Grundsätzen der Gewinnteilung : einerseits kooperativ, Koalition und andererseits nicht kooperativ, nicht kooperativ. BEI nicht kooperatives Spiel , oder andernfalls - nicht kooperatives Spiel , wählen die Spieler gleichzeitig Strategien, ohne zu wissen, welche Strategie der zweite Spieler wählen wird. Eine Kommunikation zwischen den Spielern ist nicht möglich. BEI kooperatives Spiel , oder andernfalls - Koalitionsspiel können Spieler Koalitionen bilden und gemeinsam handeln, um ihre Gewinne zu erhöhen.
  5. Endliches Nullsummenspiel für zwei Personen oder antagonistisches Spiel ist Strategiespiel mit vollständigen Informationen, an denen Parteien mit gegensätzlichen Interessen beteiligt sind. Antagonistische Spiele sind Matrixspiele .

Ein klassisches Beispiel aus der Spieltheorie ist das Gefangenendilemma.

Die beiden Verdächtigen werden in Gewahrsam genommen und voneinander isoliert. Der Staatsanwalt ist überzeugt, dass sie ein schweres Verbrechen begangen haben, hat aber nicht genügend Beweise, um sie vor Gericht anzuklagen. Er sagt jedem der Gefangenen, dass er zwei Alternativen hat: das Verbrechen gestehen, von dem die Polizei glaubt, dass er es begangen hat, oder nicht gestehen. Wenn beide nicht gestehen, wird der Bezirksstaatsanwalt sie wegen eines geringfügigen Verbrechens wie geringfügigen Diebstahls oder illegalen Waffenbesitzes anklagen, und sie werden beide eine kleine Strafe erhalten. Wenn sie beide gestehen, werden sie strafrechtlich verfolgt, aber es wird nicht die härteste Strafe erfordern. Gesteht der eine und der andere nicht, dann bekommt der Geständige eine abgewandelte Strafe für die Auslieferung eines Komplizen, während der Hartnäckige "in vollen Zügen" kassiert.

Wenn diese strategische Aufgabe im Sinne des Fazits formuliert wird, dann läuft es auf Folgendes hinaus:

Wenn also beide Gefangenen kein Geständnis ablegen, erhalten sie jeweils 1 Jahr. Wenn beide gestehen, erhält jeder 8 Jahre. Und wenn einer gesteht, der andere nicht, dann kommt derjenige, der gesteht, mit drei Monaten Gefängnis davon, und derjenige, der nicht gesteht, bekommt 10 Jahre. Die obige Matrix gibt das Gefangenendilemma richtig wieder: Jeder steht vor der Frage Geständnis oder Nichtgeständnis. Das Spiel, das der Bezirksstaatsanwalt den Gefangenen anbietet, ist nicht kooperatives Spiel oder andernfalls - Nicht-Koalitionsspiel . Wenn beide Gefangene kooperieren könnten (d.h. Das Spiel wäre kooperativ oder andernfalls Koalitionsspiel ), dann wollten beide nicht gestehen und bekamen jeweils ein Jahr Gefängnis.

Beispiele für den Einsatz mathematischer Mittel der Spieltheorie

Wir wenden uns nun der Betrachtung von Lösungen zu Beispielen gängiger Klassen von Spielen zu, für die es spieltheoretische Untersuchungs- und Lösungsmethoden gibt.

Ein Beispiel für die Formalisierung eines nicht kooperativen (nicht kooperativen) Spiels von zwei Personen

Im vorherigen Absatz haben wir bereits ein Beispiel für ein nicht kooperatives (nicht kooperatives) Spiel (Gefangenendilemma) betrachtet. Lassen Sie uns unsere Fähigkeiten festigen. Dazu eignet sich auch ein klassischer Plot, der von Arthur Conan Doyles Die Abenteuer des Sherlock Holmes inspiriert ist. Man kann natürlich einwenden: Das Beispiel stammt nicht aus dem Leben, sondern aus der Literatur, aber Conan Doyle hat sich nicht als Science-Fiction-Autor etabliert! Klassisch auch deshalb, weil die Aufgabe, wie wir bereits festgestellt haben, von Oscar Morgenstern erledigt wurde – einem der Begründer der Spieltheorie.

Beispiel 1 Es wird ein gekürzter Auszug aus einem der Abenteuer von Sherlock Holmes gegeben. Erstellen Sie nach den bekannten Konzepten der Spieltheorie ein Modell einer Konfliktsituation und schreiben Sie das Spiel formal auf.

Sherlock Holmes beabsichtigt, von London nach Dover zu gehen, mit dem weiteren Ziel, auf den (europäischen) Kontinent zu gelangen, um Professor Moriarty zu entkommen, der ihn verfolgt. Als er in den Zug einstieg, sah er Professor Moriarty auf dem Bahnsteig. Sherlock Holmes gibt zu, dass Moriarty einen Sonderzug auswählen und überholen kann. Sherlock Holmes hat zwei Alternativen: Weiter nach Dover oder an der Station Canterbury aussteigen, die die einzige Zwischenstation auf seiner Route ist. Wir gehen davon aus, dass sein Gegner intelligent genug ist, Holmes Optionen zu bestimmen, also hat er die gleichen zwei Alternativen. Beide Kontrahenten müssen einen Bahnhof auswählen, an dem sie aus dem Zug aussteigen, ohne zu wissen, welche Entscheidung jeder von ihnen treffen wird. Wenn beide aufgrund der Entscheidung auf derselben Station landen, können wir definitiv davon ausgehen, dass Sherlock Holmes von Professor Moriarty getötet wird. Wenn Sherlock Holmes sicher nach Dover kommt, wird er gerettet.

Lösung. Die Helden von Conan Doyle können als Teilnehmer des Spiels betrachtet werden, dh als Spieler. Zur Verfügung jedes Spielers ich (ich=1,2) zwei reine Strategien:

  • steigen Sie in Dover aus (Strategie si1 ( ich=1,2) );
  • an einer Zwischenstation aussteigen (Strategie si2 ( ich=1,2) )

Je nachdem, welche der beiden Strategien jeder der beiden Spieler wählt, entsteht eine spezielle Kombination von Strategien als Paar s = (s1 , s 2 ) .

Jede Kombination kann mit einem Ereignis in Verbindung gebracht werden – dem Ergebnis eines Versuchs, Sherlock Holmes von Professor Moriarty zu töten. Wir erstellen eine Matrix dieses Spiels mit möglichen Ereignissen.

Unter jedem der Ereignisse ist ein Index angegeben, der die Übernahme von Professor Moriarty bedeutet und abhängig von der Rettung von Holmes berechnet wird. Beide Helden wählen gleichzeitig eine Strategie, ohne zu wissen, was der Gegner wählen wird. Das Spiel ist also nicht kooperativ, weil die Spieler erstens in unterschiedlichen Zügen sitzen und zweitens gegensätzliche Interessen haben.

Ein Beispiel für Formalisierung und Lösung eines kooperativen (Koalitions-)Spiels n Personen

An dieser Stelle wird dem praktischen Teil, also dem Lösungsprozess eines Beispielproblems, ein theoretischer Teil vorangestellt, in dem wir uns mit den Konzepten der Spieltheorie zur Lösung kooperativer (nicht kooperativer) Spiele vertraut machen. Für diese Aufgabe schlägt die Spieltheorie vor:

  • die charakteristische Funktion (vereinfacht gesagt spiegelt sie den Wert der Vorteile wider, die der Zusammenschluss der Spieler zu einer Koalition mit sich bringt);
  • das Konzept der Additivität (Eigenschaft von Mengen, die darin besteht, dass der Wert der Menge, die dem gesamten Objekt entspricht, gleich der Summe der Werte der Mengen ist, die seinen Teilen entsprechen, in einer bestimmten Klasse der Aufteilung des Objekts in Teile) und Superadditivität (der Wert der Größe, die dem gesamten Objekt entspricht, ist größer als die Summe der Werte der Größen, die seinen Teilen entsprechen) der charakteristischen Funktion.

Die Superadditivität der charakteristischen Funktion weist darauf hin, dass Koalitionen für die Spieler vorteilhaft sind, da in diesem Fall die Auszahlung der Koalition mit der Anzahl der Spieler steigt.

Um das Spiel zu formalisieren, müssen wir eine formale Notation für die obigen Konzepte einführen.

Für Spiel n bezeichne die Menge aller seiner Spieler als N= (1,2,...,n) Jede nicht leere Teilmenge der Menge N bezeichnet als T(einschließlich selbst N und alle Teilmengen, die aus einem Element bestehen). Es gibt eine Aktivität auf der Website Mengen und Operationen auf Mengen, die sich in einem neuen Fenster öffnet, wenn Sie auf den Link klicken.

Die charakteristische Funktion wird als bezeichnet v und sein Definitionsbereich besteht aus möglichen Teilmengen der Menge N. v(T) - der Wert der charakteristischen Funktion für eine bestimmte Teilmenge, zum Beispiel das Einkommen einer Koalition, die möglicherweise aus einem Spieler besteht. Dies ist wichtig, da die Spieltheorie für die Werte der charakteristischen Funktion aller nicht überlappenden Koalitionen das Vorhandensein von Superadditivität überprüfen muss.

Für zwei nicht leere Koalitionen von Teilmengen T1 und T2 die Additivität der charakteristischen Funktion eines kooperativen (Koalitions-)Spiels wird wie folgt geschrieben:

Und Superadditivität ist wie folgt:

Beispiel 2 Drei Schüler einer Musikschule verdienen sich in verschiedenen Clubs nebenbei Geld, ihre Einnahmen erhalten sie von Clubbesuchern. Stellen Sie fest, ob es für sie rentabel ist, sich zusammenzuschließen (wenn ja, unter welchen Bedingungen), indem sie die Konzepte der Spieltheorie verwenden, um kooperative Spiele zu lösen n Personen, mit folgenden Anfangsdaten.

Im Durchschnitt betrug ihr Umsatz pro Abend:

  • der Geiger hat 600 Einheiten;
  • der Gitarrist hat 700 Einheiten;
  • der Sänger hat 900 Einheiten.

Um die Einnahmen zu steigern, gründeten die Studenten mehrere Monate lang verschiedene Gruppen. Die Ergebnisse zeigten, dass sie durch die Zusammenarbeit ihre Abendeinnahmen wie folgt steigern konnten:

  • Geiger + Gitarrist verdient 1500 Einheiten;
  • Geiger + Sänger verdient 1800 Einheiten;
  • Gitarrist + Sänger verdient 1900 Einheiten;
  • Geiger + Gitarrist + Sänger verdienten 3000 Einheiten.

Lösung. In diesem Beispiel die Anzahl der Teilnehmer am Spiel n= 3 , also besteht der Definitionsbereich der charakteristischen Funktion des Spiels aus 2³ = 8 möglichen Teilmengen der Menge aller Spieler. Lassen Sie uns alle möglichen Koalitionen auflisten T:

  • Koalitionen eines Elements, die jeweils aus einem Spieler bestehen - einem Musiker: T{1} , T{2} , T{3} ;
  • Koalitionen aus zwei Elementen: T{1,2} , T{1,3} , T{2,3} ;
  • Koalition aus drei Elemente: T{1,2,3} .

Wir weisen jedem Spieler eine Seriennummer zu:

  • Geiger - 1. Spieler;
  • Gitarrist - 2. Spieler;
  • der Sänger ist der 3. Spieler.

Anhand der Problemdaten bestimmen wir die charakteristische Funktion des Spiels v:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; diese Werte der charakteristischen Funktion werden auf der Grundlage der Auszahlungen des ersten, zweiten und dritten Spielers bestimmt, wenn sie nicht in Koalitionen vereint sind;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; diese Werte der charakteristischen Funktion werden durch die Einnahmen jedes in Koalitionen vereinten Spielerpaares bestimmt;

v(T(1,2,3)) = 3000 ; Dieser Wert der charakteristischen Funktion wird durch den durchschnittlichen Umsatz in dem Fall bestimmt, in dem die Spieler in Drillingen vereint waren.

Wir haben also alle möglichen Koalitionen von Spielern aufgelistet, acht davon gibt es, wie es sein sollte, da der Definitionsbereich der charakteristischen Funktion des Spiels aus genau acht möglichen Untermengen der Menge aller Spieler besteht. Das fordert die Spieltheorie, da wir für die Werte der charakteristischen Funktion aller nicht überlappenden Koalitionen das Vorhandensein von Superadditivität prüfen müssen.

Wie werden in diesem Beispiel die Bedingungen der Superadditivität erfüllt? Lassen Sie uns definieren, wie die Spieler nicht überlappende Koalitionen bilden T1 und T2 . Wenn einige der Spieler in einer Koalition sind T1 , dann sind alle anderen Spieler in der Koalition T2 und per definitionem wird diese Koalition als die Differenz zwischen der Gesamtmenge der Spieler und der Menge gebildet T1 . Dann wenn T1 - eine Koalition von einem Spieler, dann in einer Koalition T2 es wird den zweiten und dritten Spieler geben, falls in der Koalition T1 wird der erste und dritte Spieler sein, dann die Koalition T2 besteht nur aus dem zweiten Spieler und so weiter.

Spieltheorie als Zweig des Operations Research ist eine Theorie Mathematische Modelle Treffen optimaler Entscheidungen unter Bedingungen der Ungewissheit oder des Konflikts mehrerer Parteien mit unterschiedlichen Interessen. Die Spieltheorie untersucht optimale Strategien in Situationen mit Spielcharakter. Dazu gehören Situationen im Zusammenhang mit der Auswahl der vorteilhaftesten Produktionslösungen für ein System wissenschaftlicher und wirtschaftlicher Experimente, die Organisation statistischer Kontrollen und wirtschaftliche Beziehungen zwischen Unternehmen in der Industrie und anderen Branchen. Durch die mathematische Formalisierung von Konfliktsituationen können diese als Spiel zu zweit, zu dritt usw. dargestellt werden. Akteure, die jeweils das Ziel verfolgen, ihren eigenen Nutzen zu maximieren, ihren Gewinn auf Kosten des anderen.

Der Abschnitt „Spieltheorie“ ist mit drei vertreten Online-Rechner:

  1. Optimale Spielerstrategien. Bei solchen Problemen wird eine Auszahlungsmatrix angegeben. Brauchen Sie sauber zu finden oder gemischte Strategien Spieler u Spielpreis. Zum Lösen müssen Sie die Dimension der Matrix und das Lösungsverfahren angeben. Der Dienst implementiert die folgenden Methoden zum Lösen eines Zwei-Spieler-Spiels:
    1. Minimax . Wenn Sie die reine Strategie der Spieler finden oder die Frage nach dem Sattelpunkt des Spiels beantworten müssen, wählen Sie diese Lösungsmethode.
    2. Simplex-Verfahren. Wird verwendet, um gemischte Strategiespiele nach Methoden zu lösen Lineares Programmieren.
    3. Grafische Methode. Wird verwendet, um gemischte Strategiespiele zu lösen. Wenn es einen Sattelpunkt gibt, stoppt die Lösung. Beispiel: Finden Sie anhand einer Auszahlungsmatrix die optimalen Strategien für gemischte Spieler und den Spielpreis grafische Methode Spiellösungen.
    4. Iteratives Brown-Robinson-Verfahren. Die iterative Methode wird verwendet, wenn die grafische Methode nicht anwendbar ist und wenn die algebraische und Matrixmethoden. Diese Methode gibt eine Annäherung an den Wert des Spiels, und der wahre Wert kann mit jedem gewünschten Grad an Genauigkeit erhalten werden. Diese Methode reicht nicht aus, um optimale Strategien zu finden, aber sie ermöglicht es Ihnen, die Dynamik eines rundenbasierten Spiels zu verfolgen und die Kosten des Spiels für jeden der Spieler bei jedem Schritt zu bestimmen.
    Die Aufgabe kann zum Beispiel so klingen wie "geben Sie die optimalen Strategien der Spieler für das Spiel an, die durch die Auszahlungsmatrix gegeben sind"..
    Alle Methoden wenden eine Prüfung auf dominante Zeilen und Spalten an.
  2. Bimatrix-Spiel. Üblicherweise werden bei einem solchen Spiel zwei gleich große Matrizen der Auszahlungen des ersten und zweiten Spielers gesetzt. Die Zeilen dieser Matrizen entsprechen den Strategien des ersten Spielers und die Spalten der Matrizen entsprechen den Strategien des zweiten Spielers. In diesem Fall stellt die erste Matrix die Auszahlungen des ersten Spielers dar und die zweite Matrix zeigt die Auszahlungen des zweiten.
  3. Spiele mit der Natur. Es wird verwendet, wenn es notwendig ist, eine Managemententscheidung nach den Kriterien von Maximax, Bayes, Laplace, Wald, Savage, Hurwitz zu treffen.
    Für das Bayes-Kriterium werden auch die Eintrittswahrscheinlichkeiten von Ereignissen eingeführt werden müssen. Wenn sie nicht gesetzt sind, belassen Sie die Standardwerte (es wird entsprechende Ereignisse geben).
    Geben Sie für das Hurwitz-Kriterium das Optimismusniveau λ an. Wenn dieser Parameter in den Bedingungen nicht angegeben ist, können die Werte 0, 0,5 und 1 verwendet werden.

Bei vielen Problemen ist es erforderlich, eine Lösung mit Hilfe eines Computers zu finden. Eines der Tools sind die oben genannten Dienste und Funktionen

  • Mixed-Player-Strategie. Finden Sie die gemischte Strategie der Spieler.
  • Modellierung von Spielschaltungen in der Spieltheorie. Das Unternehmen hat die Möglichkeit, das Produktionsvolumen der Saisonprodukte P 1, P 2, P 3 selbstständig zu planen.
  • Lösen eines Matrixspiels mit einer grafischen Methode

    Lösen eines Matrixspiels mit linearen Programmiermethoden

    1. Matrix-Spiel. Mit der Simplex-Methode. Wir finden die garantierte Auszahlung bestimmt durch den niedrigeren Preis des Spiels a = max(a i) = 2, was die maximale reine Strategie A 1 angibt.
    2. Ein Beispiel für das Lösen eines Matrixspiels durch lineare Programmierung. Lösen Sie das Matrixspiel mit linearer Programmierung.

    Geben Sie eine grafische Darstellung, normalisieren und finden Sie die exakte Lösung eines Positionsspiels mit der folgenden Auszahlungsfunktion:
    Spieler A macht den 1. Zug: Er wählt eine Zahl x aus einer Reihe von zwei Zahlen.
    Spieler B macht den 2. Zug: Da er die Wahl von Spieler A im 1. Zug nicht kennt, wählt er die Zahl y aus der Menge von zwei Zahlen.
    Spieler A macht den 3. Zug: Er wählt eine Zahl z aus einem Satz von zwei Zahlen, wobei er die von Spieler B im 2. Zug gewählten Werte von y kennt, sich aber nicht an seine eigene Wahl von x im 1. Zug erinnert.

    Spiele mit der Natur

    1. Statistische Spiele
      Ein landwirtschaftlicher Betrieb kann einige Produkte verkaufen:
      A1) unmittelbar nach der Reinigung;
      A2) während der Wintermonate;
      A3) in den Frühlingsmonaten.
      Der Gewinn hängt vom Verkaufspreis in einem bestimmten Zeitraum, den Lagerkosten und möglichen Verlusten ab. Die Höhe des Gewinns, der für verschiedene Staaten-Verhältnisse von Einnahmen und Kosten (S1, S2 und S3) während des gesamten Implementierungszeitraums berechnet wird, wird in Form einer Matrix (Millionen Rubel) dargestellt.
    2. Das Unternehmen produziert Kleider und Anzüge, deren Verkauf von der Wetterlage abhängt. Die Kosten des Unternehmens von April bis Mai pro Produktionseinheit betragen ...
    3. Lösung des Problems der Rohstoffvorräte. Für einen bestimmten Zeitraum im Unternehmen beträgt der Rohstoffverbrauch je nach Qualität 1, 2, 3 und 4.
    4. Strategien für extremen Pessimismus, extremen Optimismus und Optimismus-Pessimismus

    Bimatrix-Spiele

    Entscheidungsbaum in der Spieltheorie (Beispiel für Problemlösung).

    siehe auch Lösungssammlung zur Spieltheorie (Lösung von Matrixspielen), typische Probleme zur EMM (lineare Programmierung, Spieltheorie).

    In der Stadt sind drei Fernsehunternehmen tätig: ABC, CBS und ABC. Diese Unternehmen können ihre Abendnachrichten um 6:30 oder 7:00 Uhr starten. 60 % der Zuschauer ziehen es vor, die Abendnachrichten um 6.30 Uhr und 40 % um 7.00 Uhr zu sehen. Die beliebteste Abendnachrichtensendung des Unternehmens ABC, die vom Unternehmen vorbereiteten Nachrichten sind am wenigsten beliebt ABC. Der Anteil der Zuschauer von Abendnachrichtensendungen ist in der Tabelle dargestellt (NBC, СBS, АВС)

    ABC: 6.30

    NSonne

    SWS

    ABC: 7.00

    NBAUS

    SWS

    Finden Sie die besten Strategien für Unternehmen anhand des Timings von Nachrichtensendungen

    Lösungshinweis: Das Spiel hat eine dominierte Strategie

    Es wird ein Zwei-Personen-Nullsummenspiel genannt, bei dem jeder von ihnen einen endlichen Satz von Strategien hat. Die Regeln des Matrixspiels werden durch die Auszahlungsmatrix bestimmt, deren Elemente die Auszahlungen des ersten Spielers sind, die auch die Verluste des zweiten Spielers sind.

    Matrix-Spiel ist ein antagonistisches Spiel. Der erste Spieler erhält die maximal garantierte (unabhängig vom Verhalten des zweiten Spielers) Auszahlung in Höhe des Spielpreises, ebenso erzielt der zweite Spieler den garantierten Mindestverlust.

    Unter Strategie wird als Regelwerk (Prinzipien) verstanden, das die Wahl einer Handlungsvariante für jeden persönlichen Zug eines Spielers in Abhängigkeit von der aktuellen Situation bestimmt.

    Jetzt über alles in Ordnung und im Detail.

    Auszahlungsmatrix, reine Strategien, Spielpreis

    BEI Matrix-Spiel seine Regeln sind bestimmt Auszahlungsmatrix .

    Stellen Sie sich ein Spiel vor, bei dem es zwei Teilnehmer gibt: den ersten Spieler und den zweiten Spieler. Lassen Sie den ersten Spieler haben m reine Strategien und zur Verfügung des zweiten Spielers - n reine Strategien. Da ein Spiel betrachtet wird, ist es natürlich, dass es in diesem Spiel Gewinne und Verluste gibt.

    BEI Zahlungsmatrix Die Elemente sind Zahlen, die die Gewinne und Verluste der Spieler ausdrücken. Gewinne und Verluste können in Punkten, Geld oder anderen Einheiten ausgedrückt werden.

    Lassen Sie uns eine Auszahlungsmatrix erstellen:

    Wenn der erste Spieler wählt ich-th reine Strategie, und der zweite Spieler j-te reine Strategie, dann ist die Auszahlung des ersten Spielers aij Einheiten, und der Verlust des zweiten Spielers ist auch aij Einheiten.

    Als aij + (- a ij) = 0, dann ist das beschriebene Spiel ein Nullsummen-Matrixspiel.

    Das einfachste Beispiel für ein Matrixspiel ist das Werfen einer Münze. Die Spielregeln sind wie folgt. Der erste und der zweite Spieler werfen eine Münze und das Ergebnis ist Kopf oder Zahl. Wenn gleichzeitig Kopf und Kopf oder Zahl oder Zahl gewürfelt werden, gewinnt der erste Spieler eine Einheit, und in anderen Fällen verliert er eine Einheit (der zweite Spieler gewinnt eine Einheit). Dem zweiten Spieler stehen die gleichen zwei Strategien zur Verfügung. Die entsprechende Auszahlungsmatrix wäre:

    Die Aufgabe der Spieltheorie besteht darin, die Wahl der Strategie des ersten Spielers zu bestimmen, die ihm den maximalen durchschnittlichen Gewinn garantieren würde, sowie die Wahl der Strategie des zweiten Spielers, die ihm den maximalen durchschnittlichen Verlust garantieren würde.

    Wie wird eine Strategie in einem Matrixspiel gewählt?

    Schauen wir uns noch einmal die Auszahlungsmatrix an:

    Zuerst bestimmen wir die Auszahlung des ersten Spielers, wenn er verwendet ich Reine Strategie. Wenn der erste Spieler verwendet ich-te reine Strategie, dann ist es logisch anzunehmen, dass der zweite Spieler eine solche reine Strategie verwenden wird, aufgrund derer die Auszahlung des ersten Spielers minimal wäre. Der erste Spieler wird wiederum eine solche reine Strategie anwenden, die ihm die maximale Auszahlung bringen würde. Basierend auf diesen Bedingungen, die Auszahlung des ersten Spielers, die wir als bezeichnen v1 , wird genannt maximaler Gewinn oder geringerer Spielpreis .

    Bei Für diese Werte sollte der erste Spieler wie folgt vorgehen. Schreiben Sie aus jeder Zeile den Wert des minimalen Elements aus und wählen Sie das Maximum aus ihnen aus. Somit ist die Auszahlung des ersten Spielers das Maximum des Minimums. Daher der Name - maximin win. Die Zeilennummer dieses Elements ist die Nummer der reinen Strategie, die der erste Spieler gewählt hat.

    Lassen Sie uns jetzt den Verlust des zweiten Spielers bestimmen, wenn er verwendet j-te Strategie. In diesem Fall verwendet der erste Spieler seine eigene reine Strategie, bei der der Verlust des zweiten Spielers maximal wäre. Der zweite Spieler muss eine solche reine Strategie wählen, bei der sein Verlust minimal wäre. Der Verlust des zweiten Spielers, den wir so bezeichnen v2 , wird genannt minimaler Verlust oder Top Spielpreis .

    Bei Lösen von Problemen zum Preis des Spiels und Bestimmen der Strategie Um diese Werte für den zweiten Spieler zu ermitteln, gehen Sie wie folgt vor. Schreiben Sie aus jeder Spalte den Wert des maximalen Elements aus und wählen Sie das Minimum aus. Somit ist der Verlust des zweiten Spielers das Minimum des Maximums. Daher der Name - Minimax-Gewinn. Die Spaltennummer dieses Elements ist die Nummer der reinen Strategie, die der zweite Spieler gewählt hat. Wenn der zweite Spieler "Minimax" verwendet, verliert er unabhängig von der Strategiewahl des ersten Spielers höchstens v2 Einheiten.

    Beispiel 1

    .

    Das größte der kleinsten Elemente der Reihen ist 2, dies ist der niedrigere Preis des Spiels, die erste Reihe entspricht ihm, daher ist die Maximin-Strategie des ersten Spielers die erste. Das kleinste der größten Elemente der Spalten ist 5, dies ist der obere Preis des Spiels, die zweite Spalte entspricht ihm, daher ist die Minimax-Strategie des zweiten Spielers die zweite.

    Nachdem wir nun gelernt haben, wie man den unteren und oberen Preis des Spiels, die Maximin- und Minimax-Strategien findet, ist es an der Zeit zu lernen, wie man diese Konzepte formal bezeichnet.

    Die garantierte Auszahlung des ersten Spielers ist also:

    Der erste Spieler muss eine reine Strategie wählen, die ihm das Maximum der minimalen Auszahlungen bringt. Dieser Gewinn (Maximin) wird wie folgt bezeichnet:

    .

    Der erste Spieler setzt seine reine Strategie so ein, dass der Verlust des zweiten Spielers maximal ist. Dieser Verlust ist wie folgt definiert:

    Der zweite Spieler muss seine reine Strategie so wählen, dass sein Verlust minimal ist. Dieser Verlust (Minimax) wird wie folgt bezeichnet:

    .

    Ein weiteres Beispiel aus der gleichen Serie.

    Beispiel 2 Gegeben sei ein Matrixspiel mit einer Auszahlungsmatrix

    .

    Bestimmen Sie die Maximin-Strategie des ersten Spielers, die Minimax-Strategie des zweiten Spielers, den unteren und oberen Preis des Spiels.

    Lösung. Rechts von der Auszahlungsmatrix schreiben wir die kleinsten Elemente in ihren Zeilen aus und markieren das Maximum von ihnen und am unteren Rand der Matrix - die größten Elemente in den Spalten und wählen das Minimum von ihnen aus:

    Das größte der kleinsten Elemente der Reihen ist 3, dies ist der niedrigere Preis des Spiels, die zweite Reihe entspricht ihm, daher ist die Maximin-Strategie des ersten Spielers die zweite. Das kleinste der größten Elemente der Spalten ist 5, dies ist der obere Preis des Spiels, die erste Spalte entspricht ihm, daher ist die Minimax-Strategie des zweiten Spielers die erste.

    Sattelpunkt in Matrixspielen

    Wenn der obere und der untere Preis des Spiels gleich sind, wird das Matrixspiel als Sattelpunkt angesehen. Das Gegenteil gilt auch: Wenn ein Matrixspiel einen Sattelpunkt hat, dann sind die oberen und unteren Preise des Matrixspiels gleich. Das entsprechende Element ist sowohl das kleinste in der Reihe als auch das größte in der Spalte und entspricht dem Preis des Spiels.

    Wenn also , dann ist die optimale reine Strategie des ersten Spielers und die optimale reine Strategie des zweiten Spielers. Das heißt, gleiche untere und obere Preise des Spiels werden mit demselben Strategiepaar erzielt.

    In diesem Fall das Matrixspiel hat eine Lösung in reinen Strategien .

    Beispiel 3 Gegeben sei ein Matrixspiel mit einer Auszahlungsmatrix

    .

    Lösung. Rechts von der Auszahlungsmatrix schreiben wir die kleinsten Elemente in ihren Zeilen aus und markieren das Maximum von ihnen und am unteren Rand der Matrix - die größten Elemente in den Spalten und wählen das Minimum von ihnen aus:

    Der niedrigere Preis des Spiels ist derselbe wie der obere Preis des Spiels. Somit beträgt der Preis des Spiels 5. Das heißt . Der Preis des Spiels entspricht dem Wert des Sattelpunktes. Die Maximin-Strategie des ersten Spielers ist die zweite reine Strategie, und die Minimax-Strategie des zweiten Spielers ist die dritte reine Strategie. Dieses Matrixspiel hat eine Lösung in reinen Strategien.

    Lösen Sie das Matrixspielproblem selbst und sehen Sie sich dann die Lösung an

    Beispiel 4 Gegeben sei ein Matrixspiel mit einer Auszahlungsmatrix

    .

    Finden Sie den unteren und oberen Preis des Spiels. Hat dieses Matrixspiel einen Sattelpunkt?

    Matrixspiele mit optimal gemischter Strategie

    In den meisten Fällen hat das Matrixspiel keinen Sattelpunkt, das entsprechende Matrixspiel hat also keine reinen Strategielösungen.

    Aber es hat eine Lösung in optimal gemischten Strategien. Um sie zu finden, muss davon ausgegangen werden, dass das Spiel so oft wiederholt wird, dass man aufgrund der Erfahrung erraten kann, welche Strategie vorzuziehen ist. Daher ist die Entscheidung mit dem Konzept der Wahrscheinlichkeit und des Durchschnitts (Erwartung) verbunden. In der endgültigen Lösung gibt es sowohl ein Analogon des Sattelpunkts (dh die Gleichheit der unteren und oberen Preise des Spiels) als auch ein Analogon der ihnen entsprechenden Strategien.

    Damit also der erste Spieler den maximalen durchschnittlichen Gewinn erzielt und der zweite Spieler den durchschnittlichen Verlust minimal hält, sollten mit einer gewissen Wahrscheinlichkeit reine Strategien zum Einsatz kommen.

    Wenn der erste Spieler reine Strategien mit Wahrscheinlichkeiten verwendet , dann der Vektor wird die gemischte Strategie des ersten Spielers genannt. Mit anderen Worten, es handelt sich um eine „Mischung“ aus reinen Strategien. Die Summe dieser Wahrscheinlichkeiten ist gleich eins:

    .

    Wenn der zweite Spieler reine Strategien mit Wahrscheinlichkeiten verwendet , dann der Vektor wird die gemischte Strategie des zweiten Spielers genannt. Die Summe dieser Wahrscheinlichkeiten ist gleich eins:

    .

    Wenn der erste Spieler eine gemischte Strategie verwendet p, und der zweite Spieler - eine gemischte Strategie q, dann macht es Sinn erwarteter Wert der erste Spieler gewinnt (der zweite Spieler verliert). Um es zu finden, müssen Sie den gemischten Strategievektor des ersten Spielers (der eine einzeilige Matrix sein wird), die Auszahlungsmatrix und den gemischten Strategievektor des zweiten Spielers (der eine einspaltige Matrix sein wird) multiplizieren:

    .

    Beispiel 5 Gegeben sei ein Matrixspiel mit einer Auszahlungsmatrix

    .

    Bestimmen Sie die mathematische Erwartung für den Gewinn des ersten Spielers (den Verlust des zweiten Spielers), wenn die gemischte Strategie des ersten Spielers ist und die gemischte Strategie des zweiten Spielers ist.

    Lösung. Gemäß der Formel für die mathematische Erwartung des Gewinns des ersten Spielers (Verlust des zweiten Spielers) ist sie gleich dem Produkt aus dem gemischten Strategievektor des ersten Spielers, der Auszahlungsmatrix und dem gemischten Strategievektor des zweiten Spielers:

    Der erste Spieler wird eine solche gemischte Strategie genannt, die ihm die maximale durchschnittliche Auszahlung bringen würde, wenn das Spiel ausreichend oft wiederholt wird.

    Optimale gemischte Strategie Der zweite Spieler wird eine solche gemischte Strategie genannt, die ihm den minimalen durchschnittlichen Verlust verschaffen würde, wenn das Spiel ausreichend oft wiederholt wird.

    In Analogie zur Notation von Maximin und Minimax bei reinen Strategien werden optimale gemischte Strategien wie folgt bezeichnet (und sind mit der mathematischen Erwartung, also dem Durchschnitt, des Gewinns des ersten Spielers und des Verlusts des zweiten Spielers verknüpft):

    ,

    .

    In diesem Fall für die Funktion E Es gibt einen Sattelpunkt , was Gleichheit bedeutet.

    Um die optimalen gemischten Strategien und Sattelpunkte zu finden, d.h. Lösen Sie das Matrixspiel in gemischten Strategien , müssen Sie das Matrixspiel auf ein lineares Programmierproblem, also auf ein Optimierungsproblem, zurückführen und das entsprechende lineare Programmierproblem lösen.

    Reduktion eines Matrixspiels auf ein lineares Programmierproblem

    Um ein Matrixspiel in gemischten Strategien zu lösen, müssen Sie eine gerade Linie bilden Problem der linearen Programmierung und seine Doppelaufgabe. Beim dualen Problem wird die erweiterte Matrix, die die Koeffizienten von Variablen im Beschränkungssystem, konstante Terme und Koeffizienten von Variablen in der Zielfunktion speichert, transponiert. In diesem Fall ist das Minimum der Zielfunktion des ursprünglichen Problems dem Maximum des dualen Problems zugeordnet.

    Zielfunktion im Problem der direkten linearen Programmierung:

    .

    Das Nebenbedingungssystem im direkten Problem der linearen Programmierung:

    Zielfunktion im dualen Problem:

    .

    Das Nebenbedingungssystem im dualen Problem:

    Bezeichnen Sie den optimalen Plan des Problems der direkten linearen Programmierung

    ,

    und der optimale Plan des dualen Problems ist mit bezeichnet

    Lineare Formen für die entsprechenden optimalen Designs werden mit und bezeichnet.

    und Sie müssen sie als Summe der entsprechenden Koordinaten der optimalen Pläne finden.

    In Übereinstimmung mit den Definitionen des vorherigen Abschnitts und den Koordinaten optimaler Pläne gelten die folgenden gemischten Strategien des ersten und zweiten Spielers:

    .

    Mathematiker haben das bewiesen Spielpreis wird in Form von linearen Formen optimaler Pläne wie folgt ausgedrückt:

    ,

    das heißt, es ist der Kehrwert der Summen der Koordinaten der optimalen Pläne.

    Wir Praktiker können diese Formel nur anwenden, um Matrixspiele in gemischten Strategien zu lösen. Wie Formeln zum Finden optimaler gemischter Strategien jeweils der erste und zweite Spieler:

    wobei die zweiten Faktoren Vektoren sind. Optimale gemischte Strategien sind auch Vektoren, wie wir bereits im vorherigen Absatz definiert haben. Wenn wir also die Zahl (den Preis des Spiels) mit dem Vektor (mit den Koordinaten der optimalen Pläne) multiplizieren, erhalten wir auch einen Vektor.

    Beispiel 6 Gegeben sei ein Matrixspiel mit einer Auszahlungsmatrix

    .

    Finden Sie den Preis eines Spiels v und optimale gemischte Strategien und .

    Lösung. Wir stellen das diesem Matrixspiel entsprechende lineare Programmierproblem zusammen:

    Wir erhalten die Lösung des direkten Problems:

    .

    Wir finden die lineare Form optimaler Pläne als Summe der gefundenen Koordinaten.

    Vorlesung 11: Spieltheorie und Entscheidungsfindung

    Gegenstand und Aufgaben der Spieltheorie

    Die klassischen Probleme der Systemanalyse sind Spielprobleme der Entscheidungsfindung unter Risiko und Ungewissheit.

    Sowohl die Ziele der Operation, die Bedingungen für die Durchführung der Operation als auch die bewussten Handlungen von Gegnern oder anderen Personen, von denen der Erfolg der Operation abhängt, können ungewiss sein.

    Speziell mathematische Methoden entworfen, um Entscheidungen unter Risiko und Ungewissheit zu rechtfertigen. In einigen der einfachsten Fälle ermöglichen diese Methoden, tatsächlich die optimale Lösung zu finden und auszuwählen. In komplexeren Fällen bieten diese Methoden unterstützendes Material, mit dem Sie tiefer in eine komplexe Situation eintauchen und jede der Situationen bewerten können mögliche Lösungen aus verschiedenen Blickwinkeln betrachten und Entscheidungen auf der Grundlage möglicher Konsequenzen treffen. Eine der wichtigen Entscheidungsvoraussetzungen in diesem Fall ist die Risikominimierung.

    Bei der Lösung einer Reihe praktischer Aufgaben des Operations Research (im Bereich Ökologie, Gewährleistung der Lebenssicherheit usw.) müssen Situationen analysiert werden, in denen zwei (oder mehr) Kriegsparteien mit unterschiedlichen Zielen und deren Ergebnis aufeinanderprallen Die Aktivität jeder der Parteien hängt davon ab, welche Vorgehensweise der Feind wählen wird. Solche Situationen können als bezeichnet werden Konfliktsituationen.

    Spieltheorie ist mathematische Theorie Konfliktsituationen, mit deren Hilfe Empfehlungen zum rationalen Vorgehen der Konfliktbeteiligten entwickelt werden können. Um eine mathematische Analyse der Situation ohne Berücksichtigung sekundärer Faktoren zu ermöglichen, wird ein vereinfachtes, schematisiertes Modell der Situation erstellt, das als bezeichnet wird Spiel. das Spiel wird nach wohldefinierten Regeln gespielt, die als System von Bedingungen verstanden werden, die die möglichen Handlungsoptionen der Spieler regeln; die Menge an Informationen, die jede Partei über das Verhalten der anderen hat; das Ergebnis des Spiels, zu dem jede gegebene Reihe von Zügen führt.

    Das Ergebnis des Spiels (Gewinn oder Verlust) hat nicht immer einen quantitativen Ausdruck, aber es ist normalerweise möglich, es zumindest bedingt mit einem Zahlenwert auszudrücken.

    Ein Zug ist die Wahl einer der in den Spielregeln vorgesehenen Aktionen und deren Durchführung. Bewegungen werden in persönliche und zufällige unterteilt. Ein persönlicher Zug ist eine bewusste Wahl des Spielers für eine der möglichen Handlungsoptionen und deren Umsetzung. Ein zufälliger Zug ist eine Auswahl aus einer Reihe von Möglichkeiten, die nicht durch die Entscheidung des Spielers, sondern durch einen Mechanismus der zufälligen Auswahl (Werfen einer Münze, Auswählen einer Karte aus einem gemischten Stapel usw.) ausgeführt wird. Für jeden zufälligen Zug bestimmen die Spielregeln die Wahrscheinlichkeitsverteilung möglicher Ergebnisse. Das Spiel kann nur aus ihren persönlichen Zügen oder nur zufälligen Zügen oder einer Kombination aus beidem bestehen. Der nächste Grundbegriff der Spieltheorie ist der Strategiebegriff. Eine Strategie ist ein vom Spieler a priori getroffenes System von Entscheidungen (vom „Wenn-dann“-Typ), an das er sich während des Spiels hält, das als Algorithmus dargestellt und automatisch ausgeführt werden kann.

    Ziel der Spieltheorie ist es, Empfehlungen für das vernünftige Verhalten von Spielern in einer Konfliktsituation zu entwickeln, also die „optimale Strategie“ für jeden von ihnen zu bestimmen. Eine Strategie, die in einer Hinsicht optimal ist, muss nicht unbedingt in anderen optimal sein. In Anbetracht dieser Limitationen und damit nicht blind an den spielmethodischen Empfehlungen festhaltend, kann man den mathematischen Apparat der Spieltheorie noch sinnvoll nutzen, um eine zwar nicht gerade optimale, aber doch „akzeptable“ Strategie zu entwickeln.

    Spiele kann klassifiziert werden: nach der Anzahl der Spieler, der Anzahl der Strategien, der Art der Interaktion der Spieler, der Art der Auszahlung, der Anzahl der Züge, dem Informationsstand usw. .

    Abhängig von der Anzahl der Spieler zwischen Spielen mit zwei und n Spielern unterscheiden. Der erste von ihnen ist der am besten untersuchte. Spiele mit drei oder mehr Spielern werden wegen der auftretenden grundsätzlichen Schwierigkeiten und der technischen Lösungsmöglichkeiten weniger untersucht.

    Abhängig von der Anzahl möglicher Strategien werden Spiele unterteilt in " Finale" und " endlos».

    Ein Spiel heißt endlich, wenn jeder Spieler nur endlich viele Strategien hat, und unendlich, wenn mindestens einer der Spieler unendlich viele Strategien hat.

    Durch die Art der Interaktion Spiele sind in nicht kooperative unterteilt: Spieler haben kein Recht, Vereinbarungen zu treffen, Koalitionen zu bilden; Koalition (Genossenschaft) - kann Koalitionen beitreten.

    In kooperativen Spielen sind Koalitionen vorgegeben.

    Durch die Art der Gewinne Spiele werden unterteilt in: Nullsummenspiele (das Gesamtkapital aller Spieler ändert sich nicht, sondern wird unter den Spielern neu verteilt; die Summe der Auszahlungen aller Spieler ist null) und Nicht-Nullsummenspiele.

    Nach Art der Auszahlungsfunktionen Spiele sind unterteilt in: Matrix, Bimatrix, kontinuierlich, konvex usw.

    Matrix Das Spiel ist ein Endspiel von zwei Spielern mit Nullsumme, in dem die Auszahlung von Spieler 1 in Form einer Matrix angegeben wird (die Zeile der Matrix entspricht der Nummer der angewandten Strategie von Spieler 1, die Spalte entspricht die Nummer der angewendeten Strategie des Spielers am Schnittpunkt der Zeile und Spalte der Matrix, wird die Auszahlung von Spieler 1 gefunden, entsprechend den angewendeten Strategien ).

    Für Matrixspiele ist bewiesen, dass jedes von ihnen eine Lösung hat, und sie kann leicht gefunden werden, indem das Spiel auf ein lineares Programmierproblem reduziert wird.

    Bimatrix Das Spiel ist ein endliches Spiel mit zwei Spielern mit einer Summe ungleich Null, bei dem die Auszahlungen jedes Spielers durch Matrizen separat für den entsprechenden Spieler angegeben werden (in jeder Matrix entspricht die Zeile der Strategie von Spieler 1, die Spalte entspricht zur Strategie von Spieler 2, am Schnittpunkt der Zeile und Spalte in der ersten Matrix steht die Auszahlung von Spieler 1, in der zweiten Matrix steht die Auszahlung des Spielers)

    kontinuierlich Es wird ein Spiel betrachtet, bei dem die Auszahlungsfunktion jedes Spielers kontinuierlich ist. Es ist bewiesen, dass Spiele dieser Klasse Lösungen haben, aber praktisch akzeptable Methoden, um sie zu finden, wurden nicht entwickelt.

    Wenn die Auszahlungsfunktion konvex ist, wird ein solches Spiel aufgerufen konvex. Für sie wurden akzeptable Lösungsmethoden entwickelt, die darin bestehen, für einen Spieler eine rein optimale Strategie (eine bestimmte Zahl) und die Wahrscheinlichkeiten für die Anwendung der rein optimalen Strategien eines anderen Spielers zu finden. Diese Aufgabe ist relativ einfach zu lösen.

    Aufzeichnung eines Matrixspiels als Auszahlungsmatrix

    Betrachten Sie ein endliches Spiel, in dem der erste Spieler A m Strategien hat und der zweite Spieler B-n Strategien. Ein solches Spiel wird als m×n-Spiel bezeichnet. Bezeichne die Strategien A 1 , A 2 , ..., Am ; und B 1 , B 2 , ..., B n . Angenommen, jede Seite hat eine bestimmte Strategie gewählt: A i oder B j . Wenn das Spiel nur aus persönlichen Zügen besteht, dann bestimmt die Wahl der Strategien eindeutig das Ergebnis des Spiels – den Sieg einer der Parteien a ij . Wenn das Spiel zusätzlich zu persönlichen Zufallszügen enthält, dann ist die Auszahlung für ein Paar Strategien A i und B eine Zufallsvariable, die von den Ergebnissen aller Zufallszüge abhängt. In diesem Fall ist die natürliche Schätzung der erwarteten Auszahlung die erwartete Auszahlung, die auch mit a ij bezeichnet wird.

    Nehmen Sie an, dass wir die Werte von a ij für jedes Strategiepaar kennen. Diese Werte können in Form einer rechteckigen Tabelle (Matrix) geschrieben werden, deren Zeilen den Strategien A i und deren Spalten den Strategien B j entsprechen.

    Dann kann das Matrixspiel im Allgemeinen als folgende Auszahlungsmatrix geschrieben werden:

    B1 B2 ... B n
    Ein 1 eine 11 eine 12 ... ein 1n
    A2 eine 21 eine 22 ... ein 2n
    ... ... ... ... ...
    Bin ein m1 ein m2 ... amn

    Tisch - Generelle Form Auszahlungsmatrix des Matrixspiels

    wobei A i die Namen der Strategien von Spieler 1 sind, B j die Namen der Strategien von Spieler 2 sind, a ij die Auszahlungen von Spieler 1 sind, wenn er die i-te Strategie wählt, und Spieler 2 – j-te Strategie. Da dieses Spiel ein Nullsummenspiel ist, hat der Auszahlungswert für Spieler 2 das entgegengesetzte Vorzeichen des Auszahlungswerts für Spieler 1.

    Das Konzept des unteren und oberen Preises des Spiels. Lösung des Spiels in reinen Strategien

    Jeder der Spieler versucht, seine Auszahlung zu maximieren, wobei er das Verhalten des gegnerischen Spielers berücksichtigt. Daher ist es für Spieler 1 erforderlich, die Mindestwerte der Auszahlungen in jeder der Strategien zu bestimmen und dann das Maximum dieser Werte zu finden, dh den Wert zu bestimmen

    V n \u003d max ich min j a ij

    oder finden Sie die Mindestwerte für jede der Zeilen der Auszahlungsmatrix und bestimmen Sie dann das Maximum dieser Werte. Der Wert von V n wird aufgerufen maximieren Matrizen bzw geringerer Spielpreis. Die Strategie des Spielers, die dem Maximin V n entspricht, heißt Maximin-Strategie.

    Wenn wir uns an die Maximin-Strategie halten, ist uns natürlich für jedes Verhalten des Gegners eine Auszahlung von nicht weniger als V n garantiert. Daher ist der Wert von V n das garantierte Minimum, das wir selbst bereitstellen können, indem wir unserer vorsichtigsten Strategie folgen.

    Der Wert des Gewinns von Spieler 1 ist per Definition des Matrixspiels der Wert des Verlusts von Spieler 1. Daher muss für Spieler 2 der Wert bestimmt werden

    Vin = min j max ich ein ij

    Oder finden Sie die Maximalwerte für jede der Spalten der Auszahlungsmatrix und bestimmen Sie dann das Minimum dieser Werte. Der Wert Vin wird aufgerufen Minimax Matrizen, Top Spielpreis oder Minimax Auszahlung. Die der Auszahlung entsprechende Strategie des Gegners wird als seine Minimax-Strategie bezeichnet. Durch das Festhalten an seiner vorsichtigsten Minimax-Strategie ist dem Gegner garantiert, dass er in jedem Fall nicht mehr als V c verlieren wird.

    Stimmen die Werte von V н und V в nicht überein, so erweist sich bei langfristiger Einhaltung der Spielregeln (Koeffizienten a ij) die Strategiewahl der einzelnen Spieler als instabil. Es erlangt nur dann Stabilität, wenn V n \u003d V in \u003d V. In diesem Fall sagen sie, dass das Spiel hat Lösung in reinen Strategien, und die Strategien, in denen V erreicht wird, sind optimale reine Strategien. Der Wert V wird aufgerufen der Nettopreis des Spiels .

    Zum Beispiel in einer Matrix:

    B1 B2 B3 B4 Min. j
    Ein 1 17 16 15 14 14
    A2 11 18 12 13 11
    Ein 3 18 11 13 12 11
    Max i 18 18 15 14

    Tabelle – Auszahlungsmatrix, in der es eine Lösung in reinen Strategien gibt

    Es gibt eine Lösung in reinen Strategien. In diesem Fall ist die optimale reine Strategie für Spieler 1 die Strategie A 1 und für Spieler 2 die Strategie B 4 .

    In der Matrix gibt es keine Lösung in reinen Strategien, da der untere Spielpreis in Strategie A 1 erreicht wird und seinen Wert 12 hat, während der obere Spielpreis in Strategie B 4 erreicht wird und seinen Wert 13 hat.

    B1 B2 B3 B4 Min. j
    Ein 1 17 16 15 12 12
    A2 11 18 12 13 11
    Ein 3 18 11 13 12 11
    Max i 18 18 15 13

    Tabelle - Auszahlungsmatrix, in der es keine Lösung in reinen Strategien gibt

    Reduzieren der Reihenfolge der Auszahlungsmatrix

    Die Reihenfolge der Auszahlungsmatrix (die Anzahl der Zeilen und Spalten) kann reduziert werden, indem dominierte und doppelte Strategien eliminiert werden.

    Die Strategie K* wird aufgerufen dominiert Strategie K** wenn für jede Variante des Verhaltens des Gegenspielers die Relation

    Ein k*< A k** ,

    wobei A k* und A k** die Werte der Auszahlungen sind, wenn der Spieler die Strategien K* bzw. K** wählt.

    Wenn die Beziehung

    Strategie K* soll in Bezug auf Strategie K** dupliziert werden.

    Beispielsweise ist in einer Matrix mit dominierten und doppelten Strategien Strategie A 1 dominant bezüglich Strategie A 2 , Strategie B 6 ist dominiert bezüglich Strategien B 3 , B 4 und B 5 und Strategie B 5 ist doppelt bezüglich Strategie B 5 zu Strategie B vier .

    B1 B2 B3 B4 B5 B6
    Ein 1 1 2 3 4 4 7
    A2 7 6 5 4 4 8
    Ein 3 1 8 2 3 3 6
    A4 8 1 3 2 2 5

    Tabelle – Auszahlungsmatrix mit dominierten und doppelten Strategien

    Diese Strategien werden von den Spielern nicht gewählt, da sie offensichtlich verlieren, und die Entfernung dieser Strategien aus der Auszahlungsmatrix wird die Bestimmung der unteren und oberen Preise des durch diese Matrix beschriebenen Spiels nicht beeinflussen.

    Die Menge der nicht dominierten Strategien, die man nach Reduzierung der Dimension der Auszahlungsmatrix erhält, wird auch als Pareto-Menge bezeichnet.

    Spielbeispiele

    1. Das Spiel "Huhn"

    Das Spiel „Huhn“ besteht darin, dass die Spieler eine Interaktion eingehen, die dazu führt, dass jedem von ihnen ernsthafter Schaden zugefügt wird, bis einer der Spieler das Spiel verlässt. Ein Beispiel für die Verwendung dieses Spiels ist die Interaktion von Fahrzeugen, z. B. Situationen, in denen zwei Autos aufeinander zufahren und dasjenige, das sich zuerst zur Seite dreht, als „Schwächer“ oder „Huhn“ gilt. Der Sinn des Spiels besteht darin, Spannungen zu erzeugen, die zum Ausscheiden des Spielers führen würden. Diese Situation findet man häufig bei Teenagern oder aggressiven jungen Menschen, obwohl sie manchmal ein geringeres Risiko birgt. Eine andere Anwendung dieses Spiels ist eine Situation, in der zwei politische Parteien in Kontakt kommen, in dem sie nichts gewinnen können, und nur Stolz hält sie an der Konfrontation fest. Die Parteien machen nur langsam Zugeständnisse, bis sie den letzten Punkt erreicht haben. Der daraus resultierende psychische Stress kann einen der Spieler zu einer falschen Verhaltensstrategie verleiten: Wenn keiner der Spieler nachgibt, sind eine Kollision und eine fatale Auflösung vorprogrammiert.

    Die Auszahlungsmatrix für das Spiel sieht folgendermaßen aus:

    Ertrag Gib nicht nach
    Ertrag 0, 0 -1, +1
    Gib nicht nach +1, -1 -100, -100

    2. Das Spiel "Drachen und Taube"

    Das Drachen- und Taubenspiel ist ein biologisches Beispiel für ein Spiel. In dieser Version wählen zwei Spieler mit unbegrenzten Ressourcen eine von zwei Verhaltensstrategien. Die erste („Taube“) ist, dass der Spieler seine Stärke demonstriert, indem er den Gegner einschüchtert, und die zweite („Drachen“) ist, dass der Spieler den Gegner physisch angreift. Wenn beide Spieler die Drachenstrategie wählen, kämpfen sie, indem sie sich gegenseitig verletzen. Wählt einer der Spieler die „Drachen“-Strategie und der zweite „Taube“, dann besiegt der erste den zweiten. Wenn beide Spieler Tauben sind, schließen die Gegner einen Kompromiss und erhalten eine Auszahlung, die sich als geringer herausstellt als die Auszahlung des Drachens, der die Taube besiegt, wie aus der Auszahlungsmatrix dieses Spiels hervorgeht.

    Dabei ist V der Preis der Vereinbarung, C der Preis des Konflikts und V

    Es gibt drei Nash-Gleichgewichtspunkte im Drachen- und Taubenspiel:

    1. Der erste Spieler wählt den Drachen und der zweite Spieler die Taube.
    2. Der erste Spieler wählt eine Taube und der zweite einen Drachen.
    3. beide Spieler wählen eine gemischte Strategie, bei der „Drachen“ mit Wahrscheinlichkeit p und „Taube“ mit Wahrscheinlichkeit 1-p gewählt wird.

    3. Gefangenendilemma

    Das Gefangenendilemma ist eine der häufigsten Konfliktsituationen, die in der Spieltheorie betrachtet werden.

    Das klassische Gefangenendilemma geht so: Zwei Verdächtige, A und B, sind in verschiedenen Zellen. Der Ermittler, der sie nacheinander besucht, schlägt einen Deal mit folgendem Inhalt vor: Wenn einer von ihnen gegen den anderen aussagt und der zweite schweigt, wird der erste Gefangene freigelassen und der zweite zu 10 Jahren verurteilt . Wenn beide schweigen, werden sie 6 Monate absitzen. Wenn sich beide verraten, erhält jeder 2 Jahre. Jeder der Gefangenen muss eine Entscheidung treffen: einen Komplizen verraten oder schweigen, ohne zu wissen, welche Entscheidung der andere getroffen hat. Dilemma: Welche Entscheidung werden die Gefangenen treffen?

    Die Auszahlungsmatrix des Spiels:

    In diesem Fall basiert das Ergebnis auf der Entscheidung jedes einzelnen Gefangenen. Die Position der Spieler wird dadurch kompliziert, dass sie nicht wissen, welche Entscheidung der andere getroffen hat, und dass sie einander nicht vertrauen.

    Die beste Strategie der Spieler wird die Zusammenarbeit sein, bei der beide schweigen und die maximale Auszahlung erhalten (kleinere Laufzeit), jede andere Lösung wird weniger gewinnen.

    Lassen Sie uns das "Gefangenendilemma" analysieren und zur Klarheit zur Auszahlungsmatrix der kanonischen Form übergehen:

    Zusammenarbeit Verweigerung der Zusammenarbeit
    Zusammenarbeit 3, 3 0, 5
    Verweigerung der Zusammenarbeit 5, 0 1, 1

    Gemäß dieser Matrix betragen die Kosten der gegenseitigen Nichtkooperation (S) für jeden Spieler 1 Punkt, die Kosten der Kooperation (R) 3 Punkte und der Preis der Versuchung, den anderen zu verraten (T) 5 Punkte . Wir können die folgende Ungleichung schreiben: T > R > S. Wenn das Spiel mehrmals wiederholt wird, überwindet die Wahl der Kooperation die Versuchung, zu verraten und die maximale Auszahlung zu erhalten: 2 R > T + S.

    Nash-Gleichgewicht.

    Ein Nash-Gleichgewicht ist eine Situation, in der kein Spieler angesichts der Strategie eines anderen Spielers (eines anderen Unternehmens) einen Anreiz hat, seine Strategie zu ändern, sodass die Spieler eine Kompromisslösung erreichen können.

    Die Definition eines Nash-Gleichgewichts und seiner Existenz ist wie folgt definiert.

    Sei (S, f) ein Spiel, in dem S die Menge der Strategien und f die Menge der Auszahlungen ist. Wenn jeder der Spieler i ∈ (1, ..., n) die Strategie x i &isin S wählt, wobei x = (x 1 , ..., x n), dann erhält der Spieler i die Auszahlung f i (x). Die Auszahlung hängt von der von allen Spielern gewählten Strategie ab. Eine Strategie x* ∈ S ist ein Nash-Gleichgewicht, wenn keine Abweichung davon durch irgendeinen Spieler ihm Gewinn bringt, d. h. die folgende Ungleichung gilt für alle i:

    f ich (x*) ≥ f ich (x ich , x* -i)

    Zum Beispiel hat das Dilemma-Spiel des Gefangenen ein Nash-Gleichgewicht, eine Situation, in der sich beide Gefangene gegenseitig verraten.

    Der einfachste Weg, das Nash-Gleichgewicht zu bestimmen, ist die Verwendung der Auszahlungsmatrix, insbesondere in Fällen, in denen zwei Spieler am Spiel teilnehmen und mehr als zwei Strategien in ihrem Arsenal haben. Da in diesem Fall die formale Analyse ziemlich kompliziert sein wird, wird die mnemonische Regel angewendet, die wie folgt lautet: Die Zelle der Auszahlungsmatrix ist ein Nash-Gleichgewicht, wenn die erste Zahl darin das Maximum unter allen in den Spalten dargestellten Werten ist , und die zweite Zahl , die in einer Zelle steht - die maximale Zahl unter allen Zeilen.

    Wenden Sie beispielsweise diese Regel für eine 3x3-Matrix an:

    EIN B C
    EIN 0, 0 25, 40 5, 10
    B 40, 25 0, 0 5, 15
    C 10, 5 15, 5 10, 10

    Nash-Gleichgewichtspunkte: (B,A), (A,B) und (C,C). In der Tat ist für Zelle (B, A) 25 der Maximalwert in der zweiten Zeile, da 40 der Maximalwert in der ersten Spalte ist. Für Zelle (A, B) ist 25 der Höchstwert in der zweiten Spalte, 40 ist der Höchstwert in der zweiten Zeile. Dasselbe gilt für die Zelle (C,C).

    Betrachten Sie ein Beispiel für ein Verschmutzungsspiel ( Umfeld). Hier wird unser Fokus liegen Nebenwirkungen Produktion als Verschmutzung. Wenn Unternehmen niemanden fragen würden, was zu tun ist, würde jeder von ihnen lieber Umweltverschmutzung verursachen, als teure Reiniger zu installieren. Wenn ein Unternehmen beschließen würde, schädliche Emissionen zu reduzieren, würden die Kosten und folglich die Preise seiner Produkte steigen und die Nachfrage würde sinken. Gut möglich, dass diese Firma einfach in Konkurs geht. In der grausamen Welt der natürlichen Auslese lebende Unternehmen würden lieber in einem Nash-Gleichgewicht (Zelle D) bleiben, in dem kein Geld für Abwasserbehandlungsanlagen und -technologien ausgegeben werden muss. Kein Unternehmen kann seine Gewinne steigern, indem es die Umweltverschmutzung verringert.

    Firma 1
    Firma 2 Geringe Verschmutzung Hohe Verschmutzung
    Geringe Verschmutzung ABER
    100,100
    BEI
    -30,120
    Hohe Verschmutzung AUS
    120,-30
    D
    100,100

    Tabelle - Auszahlungsmatrix des Spiels bei der Umweltverschmutzung.

    Jedes unkontrollierte und gewinnmaximierende Stahlunternehmen, das in das wirtschaftliche Spiel einsteigt, wird Wasser- und Luftverschmutzung produzieren. Wenn ein Unternehmen versucht, seine Emissionen zu sanieren, wird es dadurch gezwungen, die Preise zu erhöhen und Verluste zu erleiden. Nicht kooperatives Verhalten wird unter Bedingungen mit hohen Ausreißern ein Nash-Gleichgewicht herstellen. Die Regierung kann Maßnahmen ergreifen, um das Gleichgewicht in Zelle A zu verschieben. In dieser Position ist die Verschmutzung vernachlässigbar, aber die Gewinne bleiben gleich.

    Verschmutzungsspiele sind einer der Fälle, in denen der Mechanismus der „unsichtbaren Hand“ nicht funktioniert. Dies ist eine Situation, in der das Nash-Gleichgewicht ineffizient ist. Manchmal werden diese außer Kontrolle geratenen Spiele bedrohlich und die Regierung kann eingreifen. Durch die Einführung eines Systems von Bußgeldern und Emissionsquoten kann die Regierung Unternehmen veranlassen, Ergebnis A zu wählen, was einer geringen Umweltverschmutzung entspricht. Die Firmen verdienen genau so viel wie vorher, bei großen Emissionen, und die Welt wird etwas sauberer.

    Ein Beispiel für das Lösen eines Matrixspiels in reinen Strategien

    Betrachten wir ein Beispiel für die Lösung eines Matrixspiels in reinen Strategien in einer realen Wirtschaft in einer Situation, in der zwei Unternehmen um den Produktmarkt der Region kämpfen.

    Eine Aufgabe.

    Zwei Unternehmen produzieren Produkte und liefern diese an den regionalen Markt. Sie sind die einzigen Lieferanten von Produkten in der Region und bestimmen daher vollständig den Markt für diese Produkte in der Region.

    Jedes der Unternehmen ist in der Lage, Produkte mit einer von drei verschiedenen Technologien herzustellen. Abhängig von der Umweltfreundlichkeit des technologischen Prozesses und der Qualität der mit jeder Technologie hergestellten Produkte können Unternehmen den Preis einer Produktionseinheit auf das Niveau von 10, 6 bzw. 2 Geldeinheiten festsetzen. Gleichzeitig haben Unternehmen unterschiedliche Kosten für die Produktion einer Produktionseinheit.

    Tabelle - Kosten pro produzierter Produktionseinheit in den Unternehmen der Region (Währungseinheiten).

    Als Ergebnis der Marktforschung des Produktmarktes der Region wurde die Produktnachfragefunktion bestimmt:

    Y = 6 - 0,5⋅X,

    wobei Y die Menge der Produkte ist, die die Bevölkerung der Region kaufen wird (in Tausend Einheiten), und X der Durchschnittspreis der Produkte von Unternehmen ist, c.u.

    Daten zur Nachfrage nach Produkten in Abhängigkeit von den Verkaufspreisen sind in der Tabelle angegeben:

    Verkaufspreis 1 Einheit. Produkte, m.u.

    Durchschnittlicher Verkaufspreis von 1 Einheit. Produkte, m.u.

    Nachfrage nach Produkten, tausend Einheiten

    Unternehmen 1 Unternehmen 2
    10 10 10 1
    10 6 8 2
    10 2 6 3
    6 10 8 2
    6 6 6 3
    6 2 4 4
    2 10 6 3
    2 6 4 4
    2 2 2 5

    Tabelle - Nachfrage nach Produkten in der Region, Tausend Einheiten.

    Die Werte der von der Bevölkerung gekauften Anteile der Produkte des Unternehmens 1 hängen vom Verhältnis der Preise für die Produkte des Unternehmens 1 und des Unternehmens ab.Als Ergebnis der Marktforschung wurde diese Abhängigkeit festgestellt und die Werte wurden berechnet:

    Tabelle - Der Anteil der von der Bevölkerung gekauften Produkte des Unternehmens 1 in Abhängigkeit vom Preisverhältnis der Produkte

    Je nach Problemstellung sind nur 2 Unternehmen auf dem regionalen Markt tätig. Daher kann der Anteil der von der Bevölkerung gekauften Produkte des zweiten Unternehmens in Abhängigkeit vom Preisverhältnis für Produkte als Einheit minus dem Anteil des ersten Unternehmens definiert werden.

    Die Strategien der Unternehmen bei diesem Problem sind ihre Entscheidungen bezüglich der Produktionstechnologien. Diese Entscheidungen bestimmen die Kosten und den Verkaufspreis einer Produktionseinheit. Die Aufgabe muss Folgendes definieren:

    1. Gibt es bei diesem Problem eine Gleichgewichtssituation in der Wahl der Produktionstechnologien beider Unternehmen?
    2. Gibt es Technologien, die Unternehmen aufgrund von Nachteilen offensichtlich nicht wählen werden?
    3. Wie viele Produkte werden in einer Gleichgewichtssituation verkauft? Welches Unternehmen wird der Gewinner sein?

    Die Lösung des Problems

    1. Lassen Sie uns definieren wirtschaftlicher Sinn Auszahlungskoeffizienten in der Auszahlungsmatrix des Problems. Jedes Unternehmen versucht, den Gewinn aus der Produktion von Produkten zu maximieren. Darüber hinaus kämpfen in diesem Fall Unternehmen um den Markt für Produkte in der Region. Gleichzeitig bedeutet der Gewinn eines Unternehmens den Verlust eines anderen. Ein solches Problem kann auf ein Nullsummen-Matrixspiel reduziert werden. In diesem Fall sind die Gewinnkoeffizienten die Differenz zwischen den Gewinnen von Unternehmen 1 und Unternehmen 2 aus der Produktion von Produkten. Ist diese Differenz positiv, gewinnt Unternehmen 1, ist sie negativ, gewinnt Unternehmen 2.
    2. Berechnen Sie die Koeffizienten der Auszahlungsmatrix. Dazu müssen die Werte des Gewinns von Unternehmen 1 und Unternehmen 2 aus der Produktion von Produkten ermittelt werden.

    Der Gewinn des Unternehmens bei diesem Problem hängt ab von:

    • aus dem Preis und den Produktionskosten;
    • von der Menge der von der Bevölkerung der Region gekauften Produkte;
    • aus dem Anteil der Produkte, die die Bevölkerung vom Unternehmen kauft.

    Daher müssen die Werte der Differenz der Unternehmensgewinne, die den Koeffizienten der Auszahlungsmatrix entsprechen, durch die Formel bestimmt werden:

    D = p⋅(S⋅R1 - S⋅C1) - (1 - p)⋅(S⋅R2 - S⋅C2),

    wobei D der Wert der Gewinndifferenz aus der Produktion von Produkten von Unternehmen 1 und Unternehmen ist

    p ist der Anteil der Produkte des Unternehmens 1, der von der Bevölkerung der Region gekauft wird;

    S ist die Anzahl der von der Bevölkerung der Region gekauften Produkte;

    R1 und R2 sind die Verkaufspreise einer Produktionseinheit der Unternehmen 1 und

    C1 und C2 sind die Gesamtkosten einer in den Unternehmen 1 und produzierten Produktionseinheit

    Lassen Sie uns einen der Koeffizienten der Auszahlungsmatrix berechnen.

    Lassen Sie beispielsweise Unternehmen 1 über die Herstellung von Produkten gemäß Technologie III und Unternehmen 2 gemäß Technologie II entscheiden. Dann der Verkaufspreis der Einheit. Produkte für Unternehmen 1 sind CU 2. zum Stückpreis. Produkte GE 1.5 Für Enterprise 2 der Verkaufspreis einer Einheit. Die Produktion wird CU 6 betragen. zu einem Preis von CU 4.

    Die Menge an Produkten, mit denen die Bevölkerung der Region erwerben wird durchschnittlicher Preis 4 cu, gleich 4 Tausend Einheiten. (Tabelle 1). Der Anteil der Produkte, die die Bevölkerung von Unternehmen 1 kaufen wird, beträgt 0,85 und von Unternehmen 2 0,15 (Tabelle 1.3). Berechnen Sie den Auszahlungsmatrixkoeffizienten a 32 mit der Formel:

    a 32 \u003d 0,85⋅ (4⋅2 - 4 × 1,5) - 0,15⋅ (4⋅6 - 4⋅4) \u003d 0,5 Tausend Einheiten.

    wobei i=3 die Technologienummer des ersten Unternehmens und j=2 die Technologienummer des zweiten Unternehmens ist.

    In ähnlicher Weise berechnen wir alle Koeffizienten der Auszahlungsmatrix. In der Auszahlungsmatrix stellen die Strategien A 1 - A 3 - Entscheidungen über Produktionstechnologien von Unternehmen 1 dar, Strategien B 1 - B 3 - Entscheidungen über Produktionstechnologien von Unternehmen 2, Auszahlungsquoten - die Gewinndifferenz zwischen Unternehmen 1 und Unternehmen

    B1 B2 B3 Min. j
    Ein 1 0,17 0,62 0,24 0,17
    A2 0,3 -1,5 -0,8 -1
    Ein 3 0,9 0,5 0,4 0,4
    Max i 3 0,62 0,4

    Tabelle - Auszahlungsmatrix im Spiel "Kampf zweier Unternehmen".

    In dieser Matrix gibt es keine dominierenden oder duplizierenden Strategien. Das bedeutet, dass es für beide Unternehmen keine offensichtlich unrentablen Produktionstechnologien gibt. Lassen Sie uns die minimalen Elemente der Zeilen der Matrix bestimmen. Für Unternehmen 1 hat jedes dieser Elemente den Wert der garantierten Mindestauszahlung bei der Wahl der geeigneten Strategie. Die Mindestelemente der zeilenweisen Matrix haben die folgenden Werte: 0,17, -1,5, 0,4.

    Lassen Sie uns die maximalen Elemente der Matrixspalten bestimmen. Für Unternehmen 2 hat jedes dieser Elemente auch den Wert der garantierten Mindestauszahlung bei der Wahl der geeigneten Strategie. Die maximalen Elemente der Matrix nach Spalten haben die folgenden Werte: 3, 0,62, 0,4.

    Der niedrigere Preis des Spiels in der Matrix beträgt 0,4. Der obere Preis des Spiels ist ebenfalls gleich 0,4. Somit sind der untere und der obere Preis des Spiels in der Matrix gleich. Das heißt, es gibt eine für beide Unternehmen optimale Produktionstechnologie unter den Bedingungen dieser Aufgabenstellung. Diese Technologie ist III, was den Strategien A 3 Unternehmen 1 und B 3 Unternehmen entspricht. Die Strategien A 3 und B 3 sind reine optimale Strategien in diesem Problem.

    Der Wert der Differenz zwischen den Gewinnen von Unternehmen 1 und Unternehmen 2 bei Wahl einer nettooptimalen Strategie ist positiv. Das bedeutet, dass Unternehmen 1 dieses Spiel gewinnen wird. Unternehmen 1 erhält 0,4 Tausend GE. Gleichzeitig werden 5.000 Einheiten auf dem Markt verkauft. Produkte (der Umsatz entspricht der Nachfrage nach Produkten, Tabelle 1) Beide Unternehmen setzen den Preis pro Produktionseinheit auf 2 WE fest. In diesem Fall betragen die vollen Kosten einer Produktionseinheit für das erste Unternehmen 1,5 WE und für das zweite 1 WE. Unternehmen 1 profitiert nur aufgrund des hohen Anteils der Produkte, die die Bevölkerung von ihm kaufen wird.

    Entscheidungskriterien

    Der Entscheider bestimmt je nach Zielvorgabe die profitabelste Strategie, die er im Prozess der Problemlösung umsetzt. Der Entscheidungsträger bestimmt das Ergebnis der Lösung des Problems durch einen der Entscheidungskriterien. Um zu einer eindeutigen und möglichst vorteilhaften Lösung zu kommen, ist es notwendig, eine Bewertungs-(Soll-)Funktion einzuführen. Gleichzeitig wird jeder Entscheiderstrategie (A i ) ein Ergebnis W i zugeordnet, das alle Folgen dieser Entscheidung charakterisiert. Aus der Reihe der Entscheidungsergebnisse wählt der Entscheider das W-Element aus, das die Motivation seines Verhaltens am besten widerspiegelt.

    Je nach Bedingungen Außenumgebung und dem Grad der Informiertheit des Entscheidungsträgers wird folgende Einteilung der Entscheidungsaufgaben vorgenommen:

    • in Gefahr;
    • unter Bedingungen der Ungewissheit;
    • in Konflikt- oder Oppositionsbedingungen (aktiver Gegner).

    Entscheidungsfindung unter Risiko.

    1. Kriterien des Erwartungswertes.

    Die Verwendung des Erwartungswertkriteriums beruht auf dem Wunsch, den erwarteten Gewinn zu maximieren (oder die erwarteten Kosten zu minimieren). Die Verwendung von Erwartungswerten impliziert die Möglichkeit, dasselbe Problem mehrmals zu lösen, bis hinreichend genaue Berechnungsformeln vorliegen. Mathematisch sieht das so aus: Sei X - Zufallswert mit mathematischem Erwartungswert MX und Varianz DX. Wenn x 1 , x 2 , ..., x n Werte einer Zufallsvariablen (r.v.) X sind, dann ist das arithmetische Mittel ihrer (Probenmittel-)Werte x^=(x 1 +x 2 +.. .+x n)/ n hat eine Varianz von DX/n. Also, wenn n→∞ DX/n→∞ und X→MX.

    Mit anderen Worten, bei ausreichend großem Stichprobenumfang geht die Differenz zwischen dem arithmetischen Mittel und dem mathematischen Erwartungswert gegen Null (sog. Grenzwertsatz der Wahrscheinlichkeitstheorie). Daher ist die Verwendung des Erwartungswertkriteriums nur dann gültig, wenn die gleiche Lösung ausreichend oft angewendet werden muss. Auch der Umkehrschluss gilt: Erwartungsorientierung führt bei selten zu treffenden Entscheidungen zu falschen Ergebnissen.

    Beispiel 1. Es muss eine Entscheidung darüber getroffen werden, wann eine vorbeugende Wartung des PCs durchgeführt werden muss, um Verluste aufgrund einer Fehlfunktion zu minimieren. Wenn Reparaturen zu oft durchgeführt werden, sind die Wartungskosten hoch und der Verlust durch versehentliche Ausfälle gering.

    Da im Voraus nicht vorhergesagt werden kann, wann eine Fehlfunktion auftritt, muss die Wahrscheinlichkeit ermittelt werden, dass der PC im Zeitraum t ausfällt. Dies ist das Element des Risikos.

    Rechnerisch sieht das so aus: Ein PC wird individuell repariert, wenn er wegen einer Panne stehen bleibt. Nach T Zeitintervallen wird eine vorbeugende Wartung aller n PCs durchgeführt. Muss definiert werden optimaler Wert m, wodurch die Gesamtkosten für die Reparatur defekter PCs und die Durchführung vorbeugender Wartung pro Zeitintervall minimiert werden.

    Sei p t die Ausfallwahrscheinlichkeit eines PCs zum Zeitpunkt t und n t eine Zufallsvariable gleich der Anzahl aller PCs, die zum selben Zeitpunkt ausgefallen sind. Lassen Sie weiter C 1 - die Kosten für die Reparatur eines defekten PCs und C 2 - die Kosten für die vorbeugende Wartung einer Maschine.

    Die Anwendung des Erwartungswertkriteriums ist in diesem Fall gerechtfertigt, wenn die PCs über einen längeren Zeitraum betrieben werden. In diesem Fall betragen die zu erwartenden Kosten für ein Intervall

    OZ = (C 1 ∑M(n t)+C 1 n)/T,

    wobei M(nt) die mathematische Erwartung der Anzahl ausgefallener PCs zum Zeitpunkt t ist. Da n t hat Binomialverteilung mit Parametern (n, p t), dann ist M(n t) = np t . Auf diese Weise

    OZ \u003d n (C 1 ∑ p t + C 2) / T.

    Notwendige Optimalitätsbedingungen T* haben die Form:

    Unze (T * -1) ≥ Unze (T *),

    OZ (T * +1) ≥ OZ (T *).

    Berechnen Sie daher ausgehend von einem kleinen Wert von T die OZ(

    T) bis sie zufrieden sind die notwendigen Voraussetzungen Optimalität.

    Es sei C 1 = 100; C2 = 10; n = 50. Die p t -Werte sind:

    T p t ∑р t Unzen (T)
    1 0.05 0 50(100⋅0+10)/1=500
    2 0.07 0.05 375
    3 0.10 0.12 366.7
    4 0.13 02 400
    5 0.18 0.35 450

    T * → 3, OZ (T *) → 366,7

    Daher muss eine vorbeugende Wartung über T * = 3 Zeitintervalle durchgeführt werden.

    Kriterium "Erwartungswert - Abweichung".

    Das Erwartungswertkriterium kann so modifiziert werden, dass es auf selten auftretende Situationen angewendet werden kann.

    Wenn x - s. in. mit der Varianz DX, dann hat das arithmetische Mittel x^ die Varianz DX/n, wobei n die Anzahl der Terme in x^ ist. Wenn also DX abnimmt, steigt die Wahrscheinlichkeit, dass x^ nahe bei MX liegt. Es empfiehlt sich daher, ein Kriterium einzuführen, bei dem die Maximierung des Gewinnerwartungswerts mit der Minimierung seiner Varianz kombiniert wird.

    Beispiel 2. Wenden wir das Kriterium "Erwartungswert - Varianz" auf Beispiel 1 an. Dazu müssen Sie die Varianz der Kosten für ein Zeitintervall finden, d.h. Streuung

    s T \u003d (C 1 ∑n t + C 2 n) / T

    Da n t , t = (1, T-1) ist r.v., dann ist s T auch r.v. Sv n t hat eine Binomialverteilung mit M(n t) = np t und D(n t) = np t (1–p t). Folglich,

    D(s T) = D((C 1 ∑n t +C 2 n)/T) = (C 1 /T) 2 D(∑n t) =

    = (C 1 /T) 2 ∑Dn t = (C 1 /T) 2 ∑np t (1-p t) = (C 1 /T) 2 (∑p t - ∑p t 2 ),

    wobei C 2 n = const.

    Aus Beispiel 1 folgt das

    M(sT) = M(s(T)).

    Daher ist das gewünschte Kriterium das Minimum des Ausdrucks

    M(s(T)) + zu D(s T).

    Kommentar. Die Konstante "k" kann als Niveau betrachtet werden Risikoaversion, Weil „k“ bestimmt den „Möglichkeitsgrad“ der Streuung D(s T) in Bezug auf mathematische Erwartung. Wenn ein Unternehmer beispielsweise besonders empfindlich auf große negative Abweichungen des Gewinns von M(s(T)) nach unten reagiert, kann er „k“ viel größer als 1 wählen. Dies gibt der Varianz mehr Gewicht und führt zu einer Lösung, die verringert die Wahrscheinlichkeit großer Gewinnverluste.

    Für k=1 bekommen wir das Problem

    M(s(T))+D(s(T)) = n ( (C 1 /T+C 1 2 /T 2)∑p t - C 1 2 /T 2 ∑p t 2 + C 2 /T )

    Mit den Daten aus Beispiel 1 können Sie die folgende Tabelle erstellen

    T Punkt p t 2 ∑pt ∑pt 2 M(s(T))+D(s(T))
    1 0,05 0,0025 0 0 500.00
    2 0,07 0,0049 0,05 0,0025 6312,50
    3 0,10 0,0100 0,12 0,0074 6622,22
    4 0,13 0,0169 0,2 0,0174 6731,25
    5 0,18 0,0324 0,35 0,0343 6764,00

    Die Tabelle zeigt, dass in jedem Intervall T * =1 eine vorbeugende Wartung durchgeführt werden muss.

    3. Grenzkriterium

    Das Grenzkriterium liefert keine optimale Lösung, die beispielsweise den Gewinn maximiert oder die Kosten minimiert. Vielmehr entspricht es der Definition akzeptabel Vorgehensweise.

    Beispiel 3. Angenommen, die Nachfragemenge x pro Zeiteinheit (Nachfrageintensität) für ein Produkt ist durch eine stetige Verteilungsfunktion f(x) gegeben. Sind die Lagerbestände im Anfangsmoment gering, kann es in Zukunft zu Warenknappheit kommen. Andernfalls können die Bestände an unverkaufter Ware am Ende des Berichtszeitraums sehr groß sein. In beiden Fällen sind Verluste möglich.

    Da Es ist sehr schwierig, die Verluste aus einem Mangel zu bestimmen, der Entscheidungsträger kann die erforderliche Höhe der Bestände so festlegen, dass der Wert erwartet Defizit A 1 Einheiten nicht überschritten, und der Wert erwartetÜberschuss nicht mehr als A 2 Einheiten. Mit anderen Worten, sei I der gewünschte Lagerbestand. Dann

    erwartetes Defizit = ∫(x-I)f(x)dx ≤ A 1 ,

    erwartete Überschüsse = ∫(I-x)f(x)dx ≤ A 2 .

    Bei einer willkürlichen Wahl von A 1 und A 2 können sich diese Bedingungen als widersprüchlich herausstellen. In diesem Fall muss eine der Beschränkungen gelockert werden, um die Zulässigkeit sicherzustellen.

    Lassen Sie zum Beispiel

    f(x) = 20/x 2 , 10≤x≤20,

    f(x) = 0, x≤10 und x≥20.

    ∫(x-I)f(x)dx = ∫(x-I)(20/x 2)dx = 20(ln(20/I) + I/20 – 1)

    ∫(I-x)f(x)dx = ∫(I-x)(20/x 2)dx = 20(ln(10/I) + I/10 – 1)

    Die Anwendung des Grenzpegelkriteriums führt zu den Ungleichungen

    ln(I) - I/20 ≥ ln(20) - A 1 /20 - 1 = 1,996 - A 1 /20

    ln(I) - I/10 ≥ ln(10) - A 2 /20 - 1 = 1,302 - A 2 /20

    Die Grenzwerte A 1 und A 2 müssen so gewählt werden, dass für mindestens einen Wert von I beide Ungleichungen gelten.

    Wenn zum Beispiel A 1 = 2 und A 2 = 4, werden die Ungleichungen

    ln(I) - I/20 ≥ 1,896

    ln(I) - I/10 ≥ 1,102

    Der Wert von I muss zwischen 10 und 20 liegen, weil es ist innerhalb dieser Grenzen, die Änderungen erfordern. Die Tabelle zeigt, dass beide Bedingungen für I erfüllt sind, ab dem Intervall (13.17)

    ich 10 11 12 13 14 15 16 17 18 19 20
    ln(I) - I/20 1,8 1,84 1,88 1,91 1,94 1,96 1,97 1,98 1,99 1,99 1,99
    ln(I) - I/10 1,3 19 18 16 14 11 1,17 1,13 1,09 1,04 0,99

    Jeder dieser Werte erfüllt die Bedingungen des Problems.

    Entscheidungsfindung unter Unsicherheit

    Wir gehen davon aus, dass der Entscheidungsträger nicht konfrontiert wird angemessen Feind.

    Die für eine Entscheidung unter Unsicherheit erforderlichen Daten werden üblicherweise in Form einer Matrix angegeben, deren Zeilen möglichen Aktionen und die Spalten möglichen Zuständen des Systems entsprechen.

    Nehmen wir zum Beispiel an, dass es erforderlich ist, ein Produkt aus einem Material herzustellen, dessen Haltbarkeit nicht zu akzeptablen Kosten bestimmt werden kann. Die Lasten werden als bekannt vorausgesetzt. Es muss entschieden werden, welche Abmessungen das Produkt aus diesem Material haben soll.

    Lösungsmöglichkeiten sind:

    E 1 - die Wahl der Abmessungen aus Gründen der maximalen Haltbarkeit;

    E m - die Wahl der Abmessungen aus Gründen der Mindesthaltbarkeit;

    E i sind Zwischenlösungen.

    Die zu berücksichtigenden Bedingungen sind:

    F 1 - Bedingungen, die maximale Haltbarkeit gewährleisten;

    F n - Bedingungen, die eine Mindesthaltbarkeit bieten;

    F i - Zwischenbedingungen.

    Unter dem Ergebnis der Entscheidung e ij = e(E i ; F j) können wir hier die Schätzung verstehen, die der Option E i und den Bedingungen F j entspricht und den Gewinn, den Nutzen oder die Zuverlässigkeit charakterisiert. Normalerweise nennen wir ein solches Ergebnis Nützlichkeit der Entscheidung.

    Dann ist die Lösungsfamilie (Matrix) ||e ij || sieht aus wie:

    F1 F2 ... F n
    E1 e 11 e 12 ... e 1n
    E 2 e 21 e 22 ... e 2n
    ... ... ... ... ...
    E m e m1 e m2 ... e mn

    Um zu einer eindeutigen und möglichst vorteilhaften Lösung zu kommen, ist es notwendig, eine Bewertungs-(Soll-)Funktion einzuführen. In diesem Fall ist die Entscheidungsmatrix ||e ij || auf eine Spalte reduziert. Jeder Option E i wird daher ein Ergebnis e ir zugeordnet, das im Allgemeinen alle Folgen dieser Entscheidung charakterisiert. Ein solches Ergebnis wird ferner durch das gleiche Symbol e ir bezeichnet.

    Klassische Entscheidungskriterien

    1. Minimax-Kriterium.

    Die Regel zur Lösungswahl nach dem Minimax-Kriterium (MM-Kriterium) kann wie folgt interpretiert werden:

    Die Entscheidungsmatrix wird mit einer weiteren Spalte der kleinsten Ergebnisse e ir jeder Zeile aufgefüllt. Es müssen diejenigen Optionen ausgewählt werden, in deren Zeilen der größte Wert e ir dieser Spalte steht.

    So ausgewählt. Optionen eliminieren das Risiko vollständig. Das bedeutet, dass der Entscheidungsträger nicht mit einem schlechteren Ergebnis als dem konfrontiert werden kann, das er anstrebt. Diese Eigenschaft macht es möglich, das MM-Kriterium als eines der grundlegenden zu betrachten.

    Die Anwendung des MM-Kriteriums ist gerechtfertigt, wenn die Entscheidungssituation wie folgt ist:

    1. Über die Möglichkeit des Auftretens externer Zustände F j ist nichts bekannt;
    2. Man muss mit dem Auftreten verschiedener äußerer Zustände F j rechnen;
    3. Die Lösung wird nur einmal implementiert;
    4. Jegliches Risiko muss ausgeschlossen werden.

    2. Bayes-Laplace-Kriterium.

    q i bezeichne die Wahrscheinlichkeit des Auftretens des externen Zustands F j .

    Die entsprechende Auswahlregel kann wie folgt interpretiert werden:

    Die Entscheidungsmatrix wird um eine weitere Spalte ergänzt, die die mathematische Erwartung der Werte jeder Zeile enthält. Es werden diejenigen Optionen ausgewählt, in deren Zeilen der größte Wert e ir dieser Spalte steht.

    Es wird davon ausgegangen, dass die Situation, in der die Entscheidung getroffen wird, durch folgende Umstände gekennzeichnet ist:

    1. Die Wahrscheinlichkeiten für das Auftreten des Zustands F j sind bekannt und nicht zeitabhängig.
    2. Die Lösung wird (theoretisch) unendlich oft realisiert.
    3. Bei einer kleinen Anzahl von Implementierungen der Lösung ist ein gewisses Risiko zulässig.

    Wenn genug in großen Zahlen Implementierungen stabilisiert sich der Durchschnittswert allmählich. Daher ist bei vollständiger (unendlicher) Implementierung jedes Risiko praktisch ausgeschlossen.

    Dass. Das Bayes-Laplace-Kriterium (B-L-Kriterium) ist optimistischer als das Minimax-Kriterium, impliziert jedoch ein größeres Bewusstsein und eine ziemlich lange Umsetzung.

    3. Kriterium von Savage.

    a ij:= max i (e ij) - e ij

    e ir:= max i (a ij) = max j (max i (e ij) - e ij)

    Der Wert von a ij kann als maximaler Zusatzgewinn interpretiert werden, der erreicht wird, wenn im Zustand F j statt der Variante E i eine andere, für diesen äußeren Zustand optimale Variante gewählt wird. Der Wert von a ij kann auch als Verluste (Strafen) interpretiert werden, die im Zustand F j entstehen, wenn die für ihn optimale Variante durch die Variante E i ersetzt wird. Im letzteren Fall ist e ir der maximal mögliche (über alle äußeren Zustände F j , j = (1,n)) Verlust bei Wahl der Variante E i .

    Die dem Savage-Kriterium entsprechende Auswahlregel wird nun wie folgt interpretiert:

    1. Jedes Element der Entscheidungsmatrix ||e ij || vom größten Ergebnis max(e ij) der entsprechenden Spalte subtrahiert.
    2. Differenzen a ij bilden eine Matrix von Residuen ||e ij ||. Diese Matrix wird mit der größten Differenzspalte e ir aktualisiert. Wählen Sie die Optionen in den Zeilen aus, deren kleinster Wert für diese Spalte ist.

    Die Anforderungen an die Entscheidungssituation decken sich mit der Anforderung an das MM-Kriterium.

    4. Beispiel und Schlussfolgerungen.

    Aus den Anforderungen an die betrachteten Kriterien wird deutlich, dass sie aufgrund ihrer starren Ausgangslage nur für Idealisierte anwendbar sind praktische Lösungen. Für den Fall, dass eine zu starke Idealisierung möglich ist, können wiederum verschiedene Kriterien gleichzeitig angewendet werden. Danach wählt der Entscheidungsträger unter mehreren Optionen die endgültige Entscheidung nach der Willensmethode aus. Dieser Ansatz erlaubt erstens ein besseres Eindringen in alle inneren Zusammenhänge des Entscheidungsproblems und schwächt zweitens den Einfluss des subjektiven Faktors ab.

    Beispiel. Während des Betriebs des Computers ist es notwendig, die Verarbeitung von Informationen regelmäßig auszusetzen und den Computer auf das Vorhandensein von Viren zu überprüfen. Die Aussetzung der Verarbeitung von Informationen führt zu bestimmten wirtschaftlichen Kosten. Wenn der Virus nicht rechtzeitig erkannt wird, können einige der Informationen verloren gehen, was zu noch größeren Verlusten führen wird.

    Lösungsmöglichkeiten sind:

    E 1 - vollständige Überprüfung;

    E 2 - Mindestprüfung;

    E 3 - Überprüfungsverweigerung.

    Der Computer kann sich in folgenden Zuständen befinden:

    F 1 - das Virus fehlt;

    F 2 - es gibt einen Virus, aber er hatte keine Zeit, die Informationen zu beschädigen;

    F 3 - Es gibt Dateien, die wiederhergestellt werden müssen.

    Die Ergebnisse, einschließlich der Kosten für die Suche nach dem Virus und seiner Beseitigung sowie die Kosten für die Wiederherstellung von Informationen, sehen wie folgt aus:

    F1 F2 F3 MM-Kriterium Kriterium B-L
    e ir = min j (e ij) max ich (e ir) eir = ∑eij max ich (e ir)
    E1 -20,0 -20 -25,0 -25,0 -25,0 -22,33
    E 2 -14,0 -23,0 -31,0 -31,0 -22,67
    E 3 0 -24.0 -40.0 -40.0 -21.33 -21.33

    Nach dem MM-Kriterium sollte eine Vollprüfung durchgeführt werden. Das Bayes-Laplace-Kriterium, das davon ausgeht, dass alle Zustände der Maschine gleich wahrscheinlich sind.

    F1 F2 F3 Savages Kriterium
    e ir = min j (a ij) min j (eir)
    E1 +20,0 0 0 +20,0
    E 2 +14,0 +1,0 +6,0 +14,0 +14,0
    E 3 0 +2,0 +15,0 +15,0

    Das Beispiel ist so gewählt, dass jedes Kriterium eine neue Lösung bietet. Die Ungewissheit des Zustands, in dem die Überprüfung den Computer vorfindet, verwandelt sich in eine Unklarheit darüber, welchem ​​Kriterium zu folgen ist.

    Da sind verschiedene Kriterien damit verbunden verschiedene Bedingungen in dem die Entscheidung getroffen wird, ist der beste Weg für eine vergleichende Bewertung der Empfehlungen bestimmter Kriterien, zusätzliche Informationen über die Situation selbst einzuholen. Insbesondere wenn sich die zu treffende Entscheidung auf Hunderte von Maschinen mit gleichen Parametern bezieht, empfiehlt sich die Anwendung des Bayes-Laplace-Kriteriums. Wenn die Anzahl der Maschinen nicht groß ist, ist es besser, die Minimax- oder Savage-Kriterien zu verwenden.

    Abgeleitete Kriterien.

    1. Hurwitz-Kriterium.

    Um eine möglichst ausgewogene Position einzunehmen, schlug Hurwitz eine Bewertungsfunktion vor, die irgendwo zwischen dem Standpunkt des extremen Optimismus und des extremen Pessimismus liegt:

    max ich (e ir) = ( C⋅min j (e ij) + (1-C)⋅max j (e ij) ),

    wobei C der Gewichtsfaktor ist.

    Die Auswahlregel nach dem Hurwitz-Kriterium wird wie folgt gebildet:

    Entscheidungsmatrix ||e ij || mit einer Spalte aufgefüllt, die den gewichteten Durchschnitt der kleinsten und größten Ergebnisse für jede Zeile enthält. Es werden nur die Optionen ausgewählt, in deren Zeilen sich die größten Elemente e e ir dieser Spalte befinden.

    Bei C=1 wird das Hurwitz-Kriterium zu einem MM-Kriterium. Bei C = 0 wird es zum „Zocker“-Kriterium

    max ich (e ir) = max ich (max j (e ij)),

    diese. Wir nehmen den Standpunkt eines Spielers ein, der darauf setzt, dass die beste Chance „herausfällt“.

    In technischen Anwendungen ist es schwierig, den Gewichtsfaktor C zu wählen, weil Es ist schwierig, ein quantitatives Merkmal für die Anteile an Optimismus und Pessimismus zu finden, die bei der Entscheidungsfindung vorhanden sind. Daher meistens C: \u003d 1/2.

    Das Hurwitz-Kriterium wird angewendet, wenn:

    1. über die Wahrscheinlichkeiten des Auftretens des Zustands F j ist nichts bekannt;
    2. mit dem Auftreten des Zustands F j ist zu rechnen;
    3. nur wenige Lösungen werden realisiert;
    4. Ein gewisses Risiko ist erlaubt.

    2. Das Hodge-Lehmann-Kriterium.

    Dieses Kriterium stützt sich gleichzeitig auf das MM-Kriterium und das Bayes-Laplace-Kriterium. Mit dem Parameter n wird der Vertrauensgrad in die verwendeten Wahrscheinlichkeitsverteilungen ausgedrückt. Bei hoher Konfidenz dominiert das Bayes-Laplace-Kriterium, ansonsten das MM-Kriterium, d.h. wir suchen

    max i (e ir) = max i (v⋅∑e ij ⋅q i + (1-v) min j (e ir)), 0 ≤ n ≤ 1.

    Die dem Hodge-Lehman-Kriterium entsprechende Auswahlregel wird wie folgt gebildet:

    Entscheidungsmatrix ||e ij || wird durch eine Spalte ergänzt, die sich aus gewichteten Durchschnitten (mit Gewichtung v≡const), mathematischen Erwartungen und dem kleinsten Ergebnis jeder Zeile (*) zusammensetzt. Es werden diejenigen Lösungen ausgewählt, in deren Zeilen der größte Wert dieser Spalte steht.

    Bei v = 1 wird das Hodge-Lehman-Kriterium zum Bayes-Laplace-Kriterium und bei v = 0 zum Minimax.

    Die Wahl von v ist subjektiv, da der Zuverlässigkeitsgrad jeder Verteilungsfunktion eine dunkle Angelegenheit ist.

    Um das Hodge-Lehman-Kriterium anzuwenden, ist es wünschenswert, dass die Situation, in der die Entscheidung getroffen wird, die folgenden Eigenschaften erfüllt:

    1. die Eintrittswahrscheinlichkeiten des Zustands F j sind unbekannt, aber einige Annahmen über die Wahrscheinlichkeitsverteilung sind möglich;
    2. die akzeptierte Lösung lässt theoretisch unendlich viele Implementierungen zu;
    3. Bei kleinen Implementierungszahlen ist ein gewisses Risiko zulässig.

    3. Germeiers Kriterium.

    Dieses Kriterium konzentriert sich auf die Höhe der Verluste, d.h. zu negativen Werten aller e ij . Dabei

    max ich (e ir) = max ich (min j (e ij)q j) .

    Da bei wirtschaftlichen Aufgaben handelt es sich hauptsächlich um Preise und Kosten, die Bedingung e e ij<0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij -a при подходящем образом подобранном a>0. In diesem Fall hängt die optimale Lösung von a ab.

    Die Auswahlregel nach dem Germeier-Kriterium ist wie folgt formuliert:

    Entscheidungsmatrix ||e ij || wird durch eine weitere Spalte ergänzt, die in jeder Zeile das kleinste Produkt aus dem darin verfügbaren Ergebnis und der Wahrscheinlichkeit des entsprechenden Zustands F j enthält. In den Zeilen werden diejenigen Optionen ausgewählt, in denen der größte Wert e e ij dieser Spalte gefunden wird.

    Das Germeier-Kriterium verallgemeinert gewissermaßen das MM-Kriterium: Bei Gleichverteilung q j = 1/n, j=(1,n) werden sie identisch.

    Die Bedingungen für seine Anwendbarkeit sind:

    1. mit dem Auftreten bestimmter Zustände, einzeln oder in Kombination, muss gerechnet werden;
    2. ein gewisses Risiko ist erlaubt;
    3. Die Lösung kann einmal oder mehrmals implementiert werden.

    Wenn die Verteilungsfunktion nicht sehr zuverlässig bekannt ist und die Realisierungszahlen klein sind, erhält man nach dem Germeier-Kriterium im Allgemeinen ein unangemessen großes Risiko.

    4. Kombinierter Bayes-Laplace- und Minimax-Test.

    Der Wunsch, Kriterien zu erhalten, die sich besser an die bestehende Situation anpassen als alle bisher betrachteten, führte zur Konstruktion der sogenannten zusammengesetzten Kriterien. Betrachten Sie als Beispiel ein Kriterium, das durch Kombinieren des Bayes-Laplace-Kriteriums und des Minimax-Kriteriums (BL(MM)-Kriterium) erhalten wird.

    Die Auswahlregel für dieses Kriterium ist wie folgt formuliert:

    Entscheidungsmatrix ||e ij || mit drei weiteren Spalten hinzugefügt. In die erste werden die mathematischen Erwartungen jeder Zeile geschrieben, in die zweite - die Differenz zwischen dem Referenzwert

    e ich 0 j 0 = max ich (max j (e ij))

    und den kleinsten Wert

    die entsprechende Zeile. Die dritte Spalte enthält die Differenzen zwischen dem größten Wert

    jede Zeile und den größten Wert max j (e i 0 j) der Zeile, die den Wert e i 0 j 0 enthält. Es werden diejenigen Optionen ausgewählt, deren Zeilen (vorbehaltlich der folgenden Verhältnisse zwischen den Elementen der zweiten und dritten Spalte) die höchste mathematische Erwartung geben. Nämlich den entsprechenden Wert

    e ich 0 j 0 - max j (e ij)

    aus der zweiten Spalte muss gleich oder gleich einem vorbestimmten Risikoniveau E add sein. Der Wert in der dritten Spalte muss größer sein als der Wert in der zweiten Spalte.

    Die Anwendung dieses Kriteriums ist auf die folgenden Merkmale der Situation zurückzuführen, in der die Entscheidung getroffen wird:

    1. die Eintrittswahrscheinlichkeiten der Zustände F j sind unbekannt, aber es gibt einige a priori Informationen zugunsten einer bestimmten Verteilung;
    2. es ist notwendig, mit dem Auftreten verschiedener Zustände zu rechnen, sowohl einzeln als auch in Kombination;
    3. begrenztes Risiko erlaubt;
    4. die getroffene Entscheidung wird einmal oder wiederholt umgesetzt.

    Das BL(MM)-Kriterium eignet sich gut zum Konstruieren praktischer Lösungen, vor allem im Bereich der Technik, und kann als recht zuverlässig angesehen werden. Jedoch berücksichtigen die gegebenen Risikogrenzen E add und dementsprechend die Risikoschätzungen E i weder die Anzahl der Anwendungen der Lösung noch andere ähnliche Informationen. Der Einfluss des subjektiven Faktors ist zwar abgeschwächt, aber nicht vollständig ausgeschlossen.

    max j (e ij) – max j (e i 0 j) ≥ E i

    unabdingbar in den Fällen, in denen die Lösung nur einmal oder wenige Male implementiert wird. Unter diesen Bedingungen reicht es nicht aus, sich nur auf das Risiko ungünstiger äußerer Bedingungen und Durchschnittswerte zu konzentrieren. Aus diesem Grund können Sie jedoch in erfolgreichen externen Zuständen einige Verluste erleiden. Bei einer großen Anzahl von Implementierungen ist diese Bedingung nicht mehr so ​​wichtig. Es erlaubt sogar vernünftige Alternativen. Es gibt jedoch keine eindeutigen quantitativen Hinweise, in welchen Fällen auf diese Bedingung verzichtet werden sollte.

    5. Das Kriterium der Werke.

    max ich (e ir):= max ich (∏e ij)

    Die Auswahlregel lautet in diesem Fall wie folgt:

    Entscheidungsmatrix ||e ij || wird mit einer neuen Spalte aufgefüllt, die die Produkte aller Ergebnisse jeder Zeile enthält. Es werden diejenigen Optionen ausgewählt, in deren Zeilen sich befinden höchste Werte diese Spalte.

    Die Anwendung dieses Kriteriums ist auf folgende Umstände zurückzuführen:

    1. die Wahrscheinlichkeiten des Auftretens des Zustands F j sind unbekannt;
    2. wobei das Auftreten jedes der Zustände F j gesondert betrachtet werden muss;
    3. das Kriterium gilt auch für eine kleine Anzahl von Implementierungen der Lösung;
    4. Ein gewisses Risiko ist erlaubt.

    Das Produktkriterium wird hauptsächlich für Fälle angepasst, in denen alle e ij positiv sind. Wenn die Positivitätsbedingung verletzt wird, dann sollte eine Verschiebung e ij + a mit irgendeiner Konstante a > |min ij (e ij)| durchgeführt werden. Das Ergebnis hängt natürlich von a ab. In der Praxis meistens

    a:= |min ij (e ij)|+1.

    Kann keine Konstante als sinnvoll erkannt werden, ist das Produktkriterium nicht anwendbar.

    Beispiel.

    Betrachten Sie dasselbe Beispiel wie zuvor (siehe oben).

    Die Konstruktion der optimalen Lösung für die Entscheidungsmatrix über Prüfungen nach dem Hurwitz-Kriterium hat die Form (bei С=0, in 10 3):

    ||e ij || С⋅min j (e ij) (1-С)⋅max j (e ij) e ir max ich (e ir)
    -20,0 -22,0 -25,0 -12,5 -10.0 -22,5
    -14,0 -23.0 -31.0 -15,5 -7.0 -22,5
    0 -24.0 -40.0 -20.0 0 -20.0 -20.0

    In diesem Beispiel hat die Lösung bezüglich des Gewichtsfaktors C einen Wendepunkt: Bis C = 0,57 wird E 3 optimal gewählt, bei großen Werten E 1 .

    Anwendung des Hodge-Lehman-Tests (q=0,33, v=0, bei 103):

    ∑e ij ⋅q j minj(eij) v⋅∑e ij ⋅q j (1-v)⋅∑e ij ⋅q j e ir max ich (e ir)
    -22,33 -25,0 -11,17 -12,5 -23,67 -23,67
    -22,67 -31,0 -11,34 -15,5 -26,84
    -21,33 -40,0 -10,67 -20,0 -30,76

    Der Hodge-Lehman-Test empfiehlt – ebenso wie der MM-Test – Variante E 1 (vollständiger Check). Der Wechsel der empfohlenen Variante erfolgt erst bei v=0,94. Daher muss die Gleichverteilung von Zuständen der betrachteten Maschine mit sehr hoher Wahrscheinlichkeit erkannt werden, damit sie durch eine größere mathematische Erwartung gewählt werden kann. Die Anzahl der Implementierungen der Lösung bleibt immer beliebig.

    Das Germeier-Kriterium bei q j = 0,33 ergibt folgendes Ergebnis (in 10 3):

    ||e ij || ||e ij q j || e ir = min j (e ij q j) max ich (e ir)
    -20,0 -22,0 -25,0 -6,67 -7,33 -8,33 -8,33 -8,33
    -14,0 -23,0 -31,.0 -4,67 -7,67 -10,33 -10,33
    0 -24,0 -40,0 0 -8,0 -13,33 -13,33

    Option E 1 wird als optimal gewählt. Der Variantenvergleich anhand des Wertes von e ir zeigt, dass die Arbeitsweise des Germeier-Tests noch flexibler ist als die des MM-Tests.

    In der folgenden Tabelle ist die Lösung nach dem BL(MM)-Kriterium mit q 1 =q 2 =q 3 =1/2 (Daten in 10 3 ) gewählt.

    ||e ij || ∑e ij q j e ich 0 j 0 - min j (e ij) max j (e ij) max j (e ij) - max j (e ich 0 j)
    -20,0 -22,0 -25,0 -23,33 0 -20,0 0
    -14,0 -23,0 -31,0 -22,67 +6,0 -14,0 +6,0
    0 -24,0 -40,0 -21,33 +15,0 0 +20,0

    Option E 3 (Prüfungsverweigerung) wird von diesem Kriterium nur dann akzeptiert, wenn sich das Risiko E möglich = 15⋅10 3 nähert. Ansonsten ist E 1 optimal. Bei vielen technischen und wirtschaftlichen Aufgabenstellungen ist das tolerierbare Risiko viel geringer, meist nur ein kleiner Prozentsatz der Gesamtkosten. In solchen Fällen ist es besonders wertvoll, wenn sich der ungenaue Wert der Wahrscheinlichkeitsverteilung nicht sehr stark auswirkt. Stellt sich gleichzeitig heraus, dass es unabhängig von der getroffenen Entscheidung unmöglich ist, das tolerierbare Risiko E zusätzlich im Voraus zu ermitteln, kann die Berechnung des erwarteten Risikos E möglich weiterhelfen. Dann wird es möglich zu prüfen, ob ein solches Risiko gerechtfertigt ist. Eine solche Recherche ist in der Regel einfacher gegeben.

    Die Ergebnisse der Anwendung des Produktkriteriums für a = 41⋅10 3 und a = 200⋅10 3 sind:

    a ||eij + a|| e ir = ∏ j e ij max ich ir
    41 +21 +19 +16 6384 6384
    +27 +18 +10 4860
    +41 +17 +1 697
    200 +180 +178 +175 5607
    +186 +177 +169 5563
    +200 +176 +160 5632 5632

    Die Bedingung e ij > 0 ist für diese Matrix nicht zulässig. Daher wird zu den Elementen der Matrix (gemäß äußerer Willkür) zuerst a = 41⋅10 3 und dann a = 200⋅10 3 hinzugefügt.

    Für а = 41⋅10 3 ist die Variante μ 1 optimal und für а = 200⋅10 3 — die Variante μ 3 , so dass die Abhängigkeit der optimalen Variante von а offensichtlich ist.



    Error: Inhalt ist geschützt!!