Teoria jocurilor matematice. Exemple de înregistrare și rezolvare a jocurilor din viață

Teoria jocului - un set de metode matematice de rezolvare a situaţiilor conflictuale (coliziuni de interese). În teoria jocurilor, un joc este modelul matematic al unei situații conflictuale. Un subiect de interes deosebit în teoria jocurilor este studiul strategiilor de luare a deciziilor ale participanților la joc în condiții de incertitudine. Incertitudinea se datorează faptului că două sau mai multe părți urmăresc scopuri opuse, iar rezultatele oricărei acțiuni a fiecăreia dintre părți depind de mișcările partenerului. În același timp, fiecare dintre părți se străduiește să ia decizii optime care să realizeze obiectivele stabilite în cea mai mare măsură.

Teoria jocurilor este aplicată cel mai consistent în economie, unde apar situații conflictuale, de exemplu, în relațiile dintre un furnizor și un consumator, un cumpărător și un vânzător, o bancă și un client. Aplicarea teoriei jocurilor poate fi găsită și în politică, sociologie, biologie și artă militară.

Din istoria teoriei jocurilor

Istoria teoriei jocurilor ca disciplină independentă începe în 1944, când John von Neumann și Oscar Morgenstern au publicat cartea „Theory of Games and Economic Behavior” („Theory of Games and Economic Behavior”). Deși s-au mai întâlnit exemple de teorie a jocurilor: tratatul din Talmudul babilonian despre împărțirea bunurilor unui soț decedat între soțiile sale, jocurile de cărți în secolul al XVIII-lea, dezvoltarea teoriei șahului la începutul secolului al XX-lea, dovada a teoremei minimax a aceluiași John von Neumann în anul 1928, fără de care nu ar exista teoria jocurilor.

În anii 1950, Melvin Drescher și Meryl Flood din Rand Corporation Primul care a aplicat experimental dilema prizonierului, John Nash, în lucrarea sa despre starea de echilibru în jocurile cu două persoane, a dezvoltat conceptul de echilibru Nash.

Reinhard Salten a publicat în 1965 cartea „Oligopoly processing in game theory on demand” („Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit”), cu care aplicarea teoriei jocurilor în economie a primit o nouă forță motrice. Un pas înainte în evoluția teoriei jocurilor este asociat cu lucrarea lui John Maynard Smith „Evolutionary Stable Strategy” („Evolutionary Stable Strategy”, 1974). Dilema prizonierului a fost popularizată în cartea lui Robert Axelrod, Evoluția cooperării, publicată în 1984. În 1994, John Nash, John Harsanyi și Reinhard Salten au primit Premiul Nobel pentru Teoria Jocurilor.

Teoria jocurilor în viață și în afaceri

Să ne oprim mai detaliat asupra esenței unei situații conflictuale (conflict de interese) în sensul în care aceasta este înțeleasă în teoria jocurilor pentru modelarea ulterioară a diferitelor situații din viață și afaceri. Lăsați individul să fie într-o poziție care duce la unul dintre mai multe rezultate posibile, iar individul are unele preferințe personale în legătură cu aceste rezultate. Dar, deși poate controla într-o oarecare măsură factorii variabili care determină rezultatul, el nu deține control complet asupra acestora. Uneori, controlul este în mâinile câtorva indivizi care, ca el, au o oarecare preferință pentru posibilele rezultate, dar în caz general interesele acestor indivizi nu sunt de acord. În alte cazuri, rezultatul final poate depinde atât de accidente (uneori numite dezastre naturale în științe juridice), cât și de alți indivizi. Teoria jocurilor sistematizează observațiile unor astfel de situații și formulează principii generale pentru a ghida acțiuni rezonabile în astfel de situații.

În unele privințe, denumirea de „teoria jocurilor” este regretabilă, deoarece sugerează că teoria jocurilor se ocupă doar de valoare socială ciocniri care apar în jocurile de salon, dar totuși această teorie are un sens mult mai larg.

Următoarea situație economică poate da o idee despre aplicarea teoriei jocurilor. Să presupunem că există mai mulți antreprenori, fiecare dintre aceștia cautând să maximizeze profiturile, având în același timp o putere limitată asupra variabilelor care determină acest profit. Antreprenorul nu are control asupra variabilelor care sunt controlate de un alt antreprenor, dar care pot afecta foarte mult veniturile primului. Interpretarea acestei situații ca un joc poate da naștere la următoarea obiecție. Modelul de joc presupune că fiecare antreprenor face o alegere din zona opțiunilor posibile, iar profiturile sunt determinate de aceste alegeri unice. Este evident că acest lucru este aproape imposibil în realitate, deoarece în acest caz nu ar fi necesare aparate administrative complexe în industrie. Doar că există o serie de decizii și modificări ale acestor decizii care depind de alegerile făcute de alți participanți. sistem economic(jucători). Dar, în principiu, se poate imagina că orice administrator anticipează toate eventualele neprevăzute și descrie în detaliu acțiunea care trebuie întreprinsă în fiecare caz, în loc să rezolve fiecare sarcină pe măsură ce apare.

Un conflict militar, prin definiție, este o ciocnire de interese în care niciuna dintre părți nu are control deplin asupra variabilelor care determină rezultatul, care este decis printr-o serie de bătălii. Puteți considera pur și simplu rezultatul ca o victorie sau o pierdere și să le atribuiți valori numerice 1 și 0.

Una dintre cele mai simple situații conflictuale care pot fi notate și rezolvate în teoria jocurilor este un duel, care este un conflict între doi jucători 1 și 2, având respectiv pȘi q lovituri. Pentru fiecare jucător, există o funcție care indică probabilitatea ca jucătorul să lovească i la momentul t va da o lovitură care se va dovedi fatală.

Ca urmare, teoria jocurilor ajunge la următoarea formulare a unei anumite clase de conflicte de interese: există n jucători, iar fiecare jucător trebuie să aleagă o posibilitate dintr-un anumit set de 100, iar atunci când face o alegere, jucătorul nu are nicio informație despre alegerile altor jucători. Zona de alegeri posibile a jucătorului poate conține elemente precum „mută asul de pică”, „produce tancuri în loc de mașini” sau în sens general, o strategie care definește toate acțiunile care trebuie întreprinse în toate circumstanțele posibile. Fiecare jucător se confruntă cu sarcina: ce alegere ar trebui să facă pentru ca influența sa privată asupra rezultatului să-i aducă cel mai mare câștig posibil?

Model matematic în teoria jocurilor și formalizarea problemelor

După cum am observat deja, jocul este un model matematic al unei situații conflictuale și necesită următoarele componente:

  1. părțile interesate;
  2. acțiuni posibile de fiecare parte;
  3. interesele părților.

Părțile interesate de joc se numesc jucători. , fiecare dintre ei poate întreprinde cel puțin două acțiuni (dacă jucătorul are o singură acțiune, atunci nu participă efectiv la joc, deoarece se știe dinainte ce va întreprinde). Rezultatul jocului se numește victorie. .

O situație conflictuală reală nu este întotdeauna, dar jocul (în conceptul de teoria jocurilor) - întotdeauna - continuă anumite reguli , care definesc exact:

  1. opțiuni pentru jucători;
  2. cantitatea de informații pe care fiecare jucător o are despre comportamentul partenerului;
  3. recompensa la care duce fiecare set de acțiuni.

Exemple de jocuri oficializate sunt fotbalul, jocul de cărți, șahul.

Dar în economie, un model de comportament al jucătorului apare, de exemplu, atunci când mai multe firme caută să ocupe un loc mai avantajos pe piață, mai mulți indivizi încearcă să împartă unele lucruri bune (resurse, finanțe) între ei, astfel încât toată lumea să obțină cât mai mult posibil. . Jucătorii aflați în situații conflictuale din economie care pot fi modelați ca un joc sunt firmele, băncile, persoanele fizice și alți agenți economici. La rândul său, în condiții de război, modelul de joc este folosit, de exemplu, în alegerea mai multor cea mai bună armă(din ceea ce este disponibil sau potențial posibil) pentru a învinge inamicul sau a proteja împotriva atacurilor.

Jocul este caracterizat de incertitudinea rezultatului . Cauzele incertitudinii pot fi împărțite în următoarele grupuri:

  1. combinatorie (ca la șah);
  2. influența factorilor aleatori (ca în jocul „capete sau cozi”, zaruri, jocuri de cărți);
  3. strategic (jucătorul nu știe ce acțiune va întreprinde adversarul).

Strategia jucătorului este un set de reguli care îi determină acțiunile la fiecare mișcare, în funcție de situație.

Scopul teoriei jocurilor este de a determina strategia optimă pentru fiecare jucător. A determina o astfel de strategie înseamnă a rezolva jocul. Optimitatea strategiei se realizează atunci când unul dintre jucători trebuie să obțină profitul maxim, în timp ce al doilea aderă la strategia sa. Iar al doilea jucător ar trebui să aibă o pierdere minimă dacă primul se ține de strategia lui.

Clasificarea jocurilor

  1. Clasificare după numărul de jucători (joc de două sau mai multe persoane). Jocurile pentru două persoane sunt esențiale pentru toată teoria jocurilor. Conceptul de bază al teoriei jocurilor pentru jocurile pentru două persoane este o generalizare a ideii esențiale de echilibru, care apare în mod natural în jocurile pentru două persoane. Cât despre jocuri n persoane, atunci o parte a teoriei jocurilor este dedicată jocurilor în care cooperarea între jucători este interzisă. Într-o altă parte a teoriei jocurilor n persoane se presupune că jucătorii pot coopera în beneficiul reciproc (a se vedea mai târziu în acest paragraf despre jocurile non-cooperative și cooperative).
  2. Clasificarea după numărul de jucători și strategiile acestora (numarul de strategii este de cel putin doua, poate fi infinit).
  3. Clasificarea după cantitatea de informații privind mișcările trecute: jocuri cu informații complete și informații incomplete. Să fie jucătorul 1 - cumpărătorul și jucătorul 2 - vânzătorul. Dacă jucătorul 1 nu are informații complete despre acțiunile jucătorului 2, atunci jucătorul 1 poate să nu facă distincția între două alternative între care trebuie să aleagă. De exemplu, alegerea între două tipuri de un anumit produs și neștiind că, după unele caracteristici, produsul A mai rău decât bunurile B, este posibil ca jucătorul 1 să nu vadă diferența dintre alternative.
  4. Clasificare după principiile împărțirii câștigurilor : cooperativă, coaliție pe de o parte și necooperativ, necooperativ pe de altă parte. ÎN joc non-cooperativ , sau altfel - joc non-cooperativ , jucătorii aleg strategii simultan fără să știe ce strategie va alege al doilea jucător. Comunicarea între jucători nu este posibilă. ÎN joc cooperativ , sau altfel - joc de coaliție , jucătorii pot forma coaliții și pot lua măsuri colective pentru a-și crește câștigurile.
  5. Joc finit cu sumă zero pentru două persoane sau jocul antagonist este joc de strategie cu informații complete care implică părți cu interese opuse. Jocurile antagoniste sunt jocuri de matrice .

Un exemplu clasic din teoria jocurilor este dilema prizonierului.

Cei doi suspecți sunt luați în arest și izolați unul de celălalt. Procurorul este convins că aceștia au săvârșit o infracțiune gravă, dar nu are suficiente probe pentru a-i pune sub acuzare la proces. El le spune fiecăruia dintre prizonieri că are două alternative: să mărturisească infracțiunea pe care poliția crede că a comis-o sau să nu mărturisească. Dacă amândoi nu mărturisesc, atunci procurorul districtual îi va acuza de o infracțiune minoră, cum ar fi furtul mic sau deținerea ilegală a unei arme, și amândoi vor primi o sentință mică. Dacă amândoi mărturisesc, vor fi supuși urmăririi penale, dar nu va necesita cea mai severă pedeapsă. Dacă unul mărturisește și celălalt nu, atunci cel mărturisit va avea o pedeapsă comutată pentru extrădarea unui complice, în timp ce cel încăpățânat va primi „la maxim”.

Dacă această sarcină strategică este formulată în termeni de concluzie, atunci se rezumă la următoarele:

Astfel, dacă ambii prizonieri nu se spovedesc, vor primi câte 1 an fiecare. Dacă ambii mărturisesc, atunci fiecare va primi 8 ani. Iar dacă unul mărturisește, celălalt nu, atunci cel care mărturisește va scăpa cu trei luni de închisoare, iar cel care nu se spovedește va primi 10 ani. Matricea de mai sus reflectă corect dilema prizonierului: toată lumea se confruntă cu întrebarea de a mărturisi sau a nu mărturisi. Jocul pe care procurorul îl oferă prizonierilor este joc non-cooperativ sau altfel - joc non-coaliție . Dacă ambii prizonieri ar fi putut coopera (de ex. jocul ar fi cooperant sau altfel joc de coaliție ), atunci amândoi nu s-au spovedit și au primit câte un an de închisoare fiecare.

Exemple de utilizare a mijloacelor matematice ale teoriei jocurilor

Ne întoarcem acum la luarea în considerare a soluțiilor la exemple de clase comune de jocuri pentru care există metode de investigare și soluție în teoria jocurilor.

Un exemplu de formalizare a unui joc non-cooperativ (non-cooperant) de două persoane

În paragraful anterior, am considerat deja un exemplu de joc necooperativ (necooperant) (dilema prizonierului). Să ne consolidăm abilitățile. Un complot clasic inspirat de Aventurile lui Sherlock Holmes a lui Arthur Conan Doyle este de asemenea potrivit pentru asta. Se poate, desigur, obiecta: exemplul nu este din viață, ci din literatură, dar Conan Doyle nu s-a impus ca scriitor de science-fiction! Clasic și pentru că sarcina a fost finalizată de Oscar Morgenstern, așa cum am stabilit deja - unul dintre fondatorii teoriei jocurilor.

Exemplul 1 Va fi oferit un fragment prescurtat din una dintre Aventurile lui Sherlock Holmes. Conform conceptelor binecunoscute ale teoriei jocurilor, creați un model al unei situații de conflict și scrieți în mod formal jocul.

Sherlock Holmes intenționează să plece de la Londra la Dover cu scopul suplimentar de a ajunge pe continent (european) pentru a scăpa de profesorul Moriarty, care îl urmărește. Urcându-se în tren, l-a văzut pe profesorul Moriarty pe peronul gării. Sherlock Holmes recunoaște că Moriarty poate alege un tren special și îl poate depăși. Sherlock Holmes are două alternative: să continue spre Dover sau să coboare la stația Canterbury, care este singura stație intermediară de pe traseul său. Presupunem că adversarul său este suficient de inteligent pentru a determina opțiunile lui Holmes, așa că are aceleași două alternative. Ambii adversari trebuie să aleagă o stație în care să coboare din tren, neștiind ce decizie va lua fiecare dintre ei. Dacă, în urma deciziei, ambii ajung la aceeași stație, atunci putem presupune cu siguranță că Sherlock Holmes va fi ucis de profesorul Moriarty. Dacă Sherlock Holmes ajunge în siguranță la Dover, el va fi salvat.

Soluţie. Eroii lui Conan Doyle pot fi considerați participanți la joc, adică jucători. La dispoziția fiecărui jucător i (i=1,2) două strategii pure:

  • coborâți la Dover (strategie si1 ( i=1,2) );
  • coborâți la o stație de drum (strategie si2 ( i=1,2) )

În funcție de care dintre cele două strategii alege fiecare dintre cei doi jucători, o combinație specială de strategii va fi creată ca pereche. s = (s1 , s 2 ) .

Fiecare combinație poate fi asociată cu un eveniment - rezultatul unei încercări de a-l ucide pe Sherlock Holmes de către profesorul Moriarty. Facem o matrice a acestui joc cu posibile evenimente.

Sub fiecare dintre evenimente este indicat un indice, ceea ce înseamnă dobândirea profesorului Moriarty, și se calculează în funcție de mântuirea lui Holmes. Ambii eroi aleg o strategie în același timp, neștiind ce va alege adversarul. Astfel, jocul este necooperant, pentru că, în primul rând, jucătorii sunt în trenuri diferite, iar în al doilea rând, au interese opuse.

Un exemplu de formalizare și soluție a unui joc cooperativ (coalițional). n persoane

În acest moment, partea practică, adică cursul rezolvării unei probleme exemplu, va fi precedată de o parte teoretică, în care ne vom familiariza cu conceptele de teoria jocurilor pentru rezolvarea jocurilor cooperative (necooperative). Pentru această sarcină, teoria jocurilor sugerează:

  • funcția caracteristică (pentru a spune simplu, reflectă valoarea beneficiilor unirii jucătorilor într-o coaliție);
  • conceptul de aditivitate (proprietatea cantităților, constând în faptul că valoarea cantității corespunzătoare întregului obiect este egală cu suma valorilor cantităților corespunzătoare părților sale, într-o anumită clasă de împărțire a obiectului în părți) și supraaditivitatea (valoarea cantității corespunzătoare întregului obiect este mai mare decât suma valorilor cantităților, corespunzătoare părților sale) a funcției caracteristice.

Supraadditivitatea funcției caracteristice indică faptul că coalițiile sunt benefice pentru jucători, deoarece în acest caz câștigul coaliției crește odată cu numărul de jucători.

Pentru a oficializa jocul, trebuie să introducem notația formală pentru conceptele de mai sus.

Pentru Joc n notează setul tuturor jucătorilor săi ca N= (1,2,...,n) Orice submulțime nevidă a mulțimii N notat ca T(inclusiv pe sine Nși toate submulțimile formate dintr-un element). Există o activitate pe site Seturi și operații pe platouri, care se deschide într-o fereastră nouă când faceți clic pe link.

Funcția caracteristică se notează ca v iar domeniul său de definire constă din posibile submulţimi ale mulţimii N. v(T) - valoarea funcției caracteristice pentru un anumit subset, de exemplu, venitul primit de o coaliție, inclusiv, eventual, formată dintr-un jucător. Acest lucru este important deoarece teoria jocurilor necesită verificarea prezenței superaditității pentru valorile funcției caracteristice tuturor coalițiilor care nu se suprapun.

Pentru două coaliții nevide de subseturi T1 Și T2 aditivitatea funcției caracteristice a unui joc cooperativ (coalițional) se scrie după cum urmează:

Și superaditivitatea este așa:

Exemplul 2 Trei elevi ai unei școli de muzică câștigă bani în plus în cluburi diferite, își primesc veniturile de la vizitatorii clubului. Determinați dacă este profitabil pentru ei să își unească forțele (dacă da, în ce condiții), folosind conceptele de teoria jocurilor pentru a rezolva jocurile cooperative n persoane, cu următoarele date inițiale.

În medie, veniturile lor pe seară au fost:

  • violonistul are 600 de unitati;
  • chitaristul are 700 de unități;
  • cantareata are 900 de unitati.

În încercarea de a crește veniturile, studenții au creat diverse grupuri timp de câteva luni. Rezultatele au arătat că, prin echipă, ei și-ar putea crește veniturile de seară, după cum urmează:

  • violonist + chitarist a câștigat 1500 de unități;
  • violonist + cântăreț a câștigat 1800 de unități;
  • chitarist + cântăreț a câștigat 1900 de unități;
  • violonist + chitarist + cântăreț a câștigat 3000 de unități.

Soluţie. În acest exemplu, numărul de participanți la joc n= 3 , prin urmare, domeniul funcției caracteristice a jocului este format din 2³ = 8 subseturi posibile ale setului tuturor jucătorilor. Să enumerăm toate coalițiile posibile T:

  • coaliții de un element, fiecare dintre ele constând dintr-un jucător - un muzician: T{1} , T{2} , T{3} ;
  • coaliții de două elemente: T{1,2} , T{1,3} , T{2,3} ;
  • coaliție de trei elemente: T{1,2,3} .

Atribuim un număr de serie fiecărui jucător:

  • violonist - primul jucător;
  • chitarist - al 2-lea jucător;
  • cantareata este al 3-lea jucator.

În funcție de datele problemei, determinăm funcția caracteristică a jocului v:

v(T(1)) = 600; v(T(2)) = 700; v(T(3)) = 900; aceste valori ale funcției caracteristice sunt determinate pe baza câștigurilor primului, al doilea și, respectiv, al treilea jucători, atunci când aceștia nu sunt uniți în coaliții;

v(T(1,2)) = 1500; v(T(1,3)) = 1800; v(T(2,3)) = 1900; aceste valori ale funcției caracteristice sunt determinate de veniturile fiecărei perechi de jucători uniți în coaliții;

v(T(1,2,3)) = 3000; această valoare a funcţiei caracteristice este determinată de venitul mediu în cazul în care jucătorii au fost uniţi în triplete.

Astfel, am enumerat toate coalițiile posibile de jucători, sunt opt ​​dintre ele, așa cum ar trebui să fie, deoarece domeniul de definire a funcției caracteristice a jocului este format din exact opt ​​subseturi posibile ale setului tuturor jucătorilor. Ceea ce cere teoria jocurilor, deoarece trebuie să verificăm prezența superadditivității pentru valorile funcției caracteristice tuturor coalițiilor care nu se suprapun.

Cum sunt îndeplinite condițiile de supraaditivitate în acest exemplu? Să definim modul în care jucătorii formează coaliții care nu se suprapun T1 Și T2 . Dacă unii dintre jucători sunt într-o coaliție T1 , atunci toți ceilalți jucători sunt în coaliție T2 iar prin definiție această coaliție se formează ca diferență între setul total de jucători și setul T1 . Atunci dacă T1 - o coaliție de un jucător, apoi într-o coaliție T2 vor fi al doilea și al treilea jucător, dacă fac parte din coaliție T1 vor fi primul și al treilea jucător, apoi coaliția T2 va consta doar din al doilea jucător și așa mai departe.

Teoria jocului ca ramură a cercetării operaționale este o teorie modele matematice luarea deciziilor optime în condiţii de incertitudine sau conflict a mai multor părţi cu interese diferite. Teoria jocurilor explorează strategiile optime în situații de natură de joc. Acestea includ situații legate de alegerea celor mai avantajoase soluții de producție pentru un sistem de experimente științifice și economice, organizarea controlului statistic și relațiile economice dintre întreprinderile din industrie și alte industrii. Prin formalizarea matematică a situațiilor conflictuale, acestea pot fi reprezentate ca un joc de doi, trei etc. jucători, fiecare dintre care urmărește scopul de a maximiza propriul beneficiu, câștigul său în detrimentul celuilalt.

Secțiunea „Teoria jocurilor” este reprezentată de trei calculatoare online:

  1. Strategii optime pentru jucători. În astfel de probleme, este dată o matrice a plăților. Este necesar să se găsească strategii pure sau mixte ale jucătorilor și, pretul jocului. Pentru a rezolva, trebuie să specificați dimensiunea matricei și metoda de soluție. Serviciul implementează următoarele metode pentru a rezolva un joc cu doi jucători:
    1. Minimax. Dacă trebuie să găsiți strategia pură a jucătorilor sau să răspundeți la întrebarea despre punctul de șa al jocului, alegeți această metodă de soluție.
    2. Metoda simplex. Folosit pentru a rezolva jocuri de strategie mixte prin metode programare liniară.
    3. Metoda grafică. Folosit pentru a rezolva jocuri de strategie mixte. Dacă există un punct de șa, soluția se oprește. Exemplu: Având în vedere o matrice de profit, găsiți strategiile optime de jucător mixt și prețul jocului folosind metoda grafica soluții de joc.
    4. Metoda iterativă Brown-Robinson. Metoda iterativă este utilizată atunci când metoda grafică nu este aplicabilă și când metoda algebrică și metode matriceale. Această metodă oferă o aproximare a valorii jocului, iar valoarea adevărată poate fi obținută cu orice grad de acuratețe dorit. Această metodă nu este suficientă pentru a găsi strategii optime, dar vă permite să urmăriți dinamica unui joc pe rând și să determinați costul jocului pentru fiecare dintre jucători la fiecare pas.
    De exemplu, sarcina poate suna ca „indicați strategiile optime ale jucătorilor pentru joc date de matricea plăților”.
    Toate metodele aplică o verificare pentru rândurile și coloanele dominante.
  2. Joc Bimatrix. De obicei, într-un astfel de joc, sunt stabilite două matrice de aceeași dimensiune a plăților primului și celui de-al doilea jucător. Rândurile acestor matrici corespund strategiilor primului jucător, iar coloanele matricelor corespund strategiilor celui de-al doilea jucător. În acest caz, prima matrice reprezintă plățile primului jucător, iar a doua matrice arată câștigurile celui de-al doilea.
  3. Jocuri cu natura. Se utilizează atunci când este necesar să se aleagă o decizie de management după criteriile Maximax, Bayes, Laplace, Wald, Savage, Hurwitz.
    Pentru criteriul Bayes, va fi necesară și introducerea probabilităților de apariție a evenimentelor. Dacă nu sunt setate, lăsați valorile implicite (vor exista evenimente echivalente).
    Pentru criteriul Hurwitz, specificați nivelul de optimism λ . Dacă acest parametru nu este specificat în condiții, pot fi utilizate valorile 0, 0,5 și 1.

În multe probleme este necesară găsirea unei soluții cu ajutorul unui computer. Unul dintre instrumente este serviciile și funcțiile de mai sus

  • Strategie mixtă de jucător. Găsiți strategia mixtă a jucătorilor.
  • Modelarea circuitelor de joc în teoria jocurilor. Întreprinderea are posibilitatea de a planifica în mod independent volumul producției de produse sezoniere P 1, P 2, P 3.
  • Rezolvarea unui joc matricial folosind o metodă grafică

    Rezolvarea unui joc cu matrice folosind metode de programare liniară

    1. Jocul Matrix. Folosind metoda simplex. Găsim câștigul garantat determinat de prețul mai mic al jocului a = max(a i) = 2, ceea ce indică strategia maximă pură A 1 .
    2. Un exemplu de rezolvare a unui joc matriceal prin programare liniară. Rezolvați jocul matriceal folosind programarea liniară.

    Oferiți o reprezentare grafică, normalizați și găsiți soluția exactă a unui joc pozițional cu următoarea funcție de plată:
    Jucătorul A face prima mutare: el alege un număr x dintr-un set de două numere.
    Jucătorul B face a 2-a mutare: neștiind despre alegerea jucătorului A la prima mutare, el alege numărul y din setul de două numere.
    Jucătorul A face a 3-a mutare: el alege un număr z dintr-un set de două numere, cunoscând valorile lui y alese de jucătorul B la a 2-a mișcare, dar fără a-și aminti propria alegere de x la prima mutare.

    Jocuri cu natura

    1. jocuri statistice
      O întreprindere agricolă poate vinde unele produse:
      A1) imediat după curățare;
      A2) în lunile de iarnă;
      A3) în lunile de primăvară.
      Profitul depinde de prețul de vânzare într-o anumită perioadă de timp, costurile de stocare și eventualele pierderi. Valoarea profitului calculată pentru diferite state-raporturi de venituri și costuri (S1, S2 și S3), pe toată perioada de implementare, este prezentată sub forma unei matrice (milioane de ruble)
    2. Compania produce rochii și costume, a căror vânzare depinde de starea vremii. Costul companiei în perioada aprilie-mai pe unitatea de producție va fi...
    3. Rezolvarea problemei privind stocurile de materii prime. Pentru o anumită perioadă de timp la întreprindere, consumul de materii prime, în funcție de calitatea acesteia, este de 1, 2, 3 și 4.
    4. Pesimism extrem, optimism extrem și strategii optimism-pesimism

    Jocuri Bimatrix

    Arborele decizional în teoria jocurilor (exemplu de rezolvare a problemelor).

    vezi și o colecție de soluții despre teoria jocurilor (soluția jocurilor matriceale), probleme tipice pe EMM (programare liniară, teoria jocurilor).

    Există trei companii de televiziune care operează în oraș: ABC, CBSȘi NBC. Aceste companii își pot începe programul de știri de seară la 6:30 sau 7:00. 60% dintre telespectatori preferă să urmărească știrile de seară la 6.30, iar 40% - la 7.00. Cel mai popular program de știri de seară al companiei ABC, stirea pregatita de companie este cea mai putin populara NBC. Ponderea telespectatorilor programelor de știri de seară este prezentată în tabel (NBC, СBS, АВС)

    ABC: 6.30

    NSoare

    SWS

    ABC: 7.00

    NBCU

    SWS

    Găsiți cele mai bune strategii pentru companii în funcție de momentul programelor de știri

    Sugestie de soluție: jocul are o strategie dominată

    Se numește un joc cu sumă zero pentru două persoane, în care fiecare dintre ele are un set finit de strategii. Regulile jocului cu matrice sunt determinate de matricea de plăți, ale cărei elemente sunt plățile primului jucător, care sunt și pierderile celui de-al doilea jucător.

    Jocul Matrix este un joc antagonic. Primul jucător primește câștigul maxim garantat (care nu depinde de comportamentul celui de-al doilea jucător) egal cu prețul jocului, în mod similar, al doilea jucător realizează pierderea minimă garantată.

    Sub strategie este înțeles ca un set de reguli (principii) care determină alegerea unei variante de acțiuni pentru fiecare mișcare personală a unui jucător, în funcție de situația actuală.

    Acum despre totul în ordine și în detaliu.

    Matricea de plăți, strategii pure, prețul jocului

    ÎN joc de matrice regulile sale sunt determinate matricea plăților .

    Luați în considerare un joc în care sunt doi participanți: primul jucător și al doilea jucător. Lăsați primul jucător să aibă m strategii pure și la dispoziția celui de-al doilea jucător - n strategii pure. Deoarece se ia în considerare un joc, este firesc să existe câștiguri și înfrângeri în acest joc.

    ÎN matricea de plată elementele sunt numere care exprimă câștigurile și pierderile jucătorilor. Câștigurile și pierderile pot fi exprimate în puncte, bani sau alte unități.

    Să creăm o matrice a plăților:

    Dacă primul jucător alege i-a strategie pură și al doilea jucător j-a strategie pură, atunci câștigul primului jucător este Aij unități, iar pierderea celui de-al doilea jucător este de asemenea Aij unitati.

    Deoarece Aij + (- A ij) = 0, atunci jocul descris este un joc cu matrice cu sumă zero.

    Cel mai simplu exemplu de joc cu matrice este aruncarea unei monede. Regulile jocului sunt următoarele. Primul și al doilea jucător aruncă o monedă și rezultatul este cap sau coadă. Dacă se aruncă cap și cap sau cozi sau cozi în același timp, atunci primul jucător va câștiga o unitate, iar în alte cazuri va pierde o unitate (al doilea jucător va câștiga o unitate). Aceleași două strategii sunt la dispoziția celui de-al doilea jucător. Matricea de profit corespunzătoare ar fi:

    Sarcina teoriei jocurilor este de a determina alegerea strategiei primului jucător, care să-i garanteze câștigul mediu maxim, precum și alegerea strategiei celui de-al doilea jucător, care să-i garanteze pierderea medie maximă.

    Cum se alege o strategie într-un joc matrice?

    Să ne uităm din nou la matricea plăților:

    În primul rând, determinăm plata primului jucător dacă folosește i strategia pură. Dacă primul jucător folosește i-a strategie pură, atunci este logic să presupunem că al doilea jucător va folosi o astfel de strategie pură, datorită căreia câștigul primului jucător ar fi minim. La rândul său, primul jucător va folosi o strategie atât de pură, care i-ar oferi profitul maxim. Pe baza acestor condiții, câștigul primului jucător, pe care îl notăm ca fiind v1 , se numește maximin victorie sau pret mai mic al jocului .

    La pentru aceste valori, primul jucător ar trebui să procedeze după cum urmează. Din fiecare rând, scrieți valoarea elementului minim și alegeți maximul dintre ele. Astfel, câștigul primului jucător va fi maximul minim. De aici și numele - maximin win. Numărul de linie al acestui element va fi numărul strategiei pure alese de primul jucător.

    Acum să determinăm pierderea celui de-al doilea jucător dacă folosește j-a strategie. În acest caz, primul jucător folosește propria strategie pură, în care pierderea celui de-al doilea jucător ar fi maximă. Al doilea jucător trebuie să aleagă o astfel de strategie pură în care pierderea lui ar fi minimă. Pierderea celui de-al doilea jucător, pe care îl notăm ca v2 , se numește pierdere minimax sau pret de top joc .

    La rezolvarea problemelor privind prețul jocului și determinarea strategiei pentru a determina aceste valori pentru al doilea jucător, procedați după cum urmează. Din fiecare coloană, scrieți valoarea elementului maxim și alegeți minimul dintre ele. Astfel, pierderea celui de-al doilea jucător va fi minimul maxim. De aici și numele - câștig minimax. Numărul coloanei acestui element va fi numărul strategiei pure alese de al doilea jucător. Dacă al doilea jucător folosește „minimax”, atunci indiferent de alegerea strategiei de către primul jucător, acesta va pierde cel mult v2 unitati.

    Exemplul 1

    .

    Cel mai mare dintre cele mai mici elemente ale rândurilor este 2, acesta este prețul mai mic al jocului, primul rând îi corespunde, prin urmare, strategia maximă a primului jucător este primul. Cel mai mic dintre cele mai mari elemente ale coloanelor este 5, acesta este prețul superior al jocului, a doua coloană îi corespunde, prin urmare, strategia minimax a celui de-al doilea jucător este a doua.

    Acum că am învățat cum să găsim prețul mai mic și superior al jocului, strategiile maximin și minimax, este timpul să învățăm cum să desemnăm formal aceste concepte.

    Deci, plata garantată a primului jucător este:

    Primul jucător trebuie să aleagă o strategie pură care să-i ofere maximul minim de câștiguri. Acest câștig (maximin) este notat după cum urmează:

    .

    Primul jucător folosește strategia sa pură, astfel încât pierderea celui de-al doilea jucător să fie maximă. Această pierdere este definită după cum urmează:

    Al doilea jucător trebuie să-și aleagă strategia pură, astfel încât pierderea sa să fie minimă. Această pierdere (minimax) se notează după cum urmează:

    .

    Un alt exemplu din aceeași serie.

    Exemplul 2 Dat un joc de matrice cu o matrice de plăți

    .

    Determinați strategia maximin a primului jucător, strategia minimax a celui de-al doilea jucător, prețul mai mic și superior al jocului.

    Soluţie. În partea dreaptă a matricei de plăți, scriem cele mai mici elemente din rândurile sale și marcăm maximul dintre ele, iar din partea de jos a matricei - cele mai mari elemente din coloane și selectăm minimul dintre ele:

    Cel mai mare dintre cele mai mici elemente ale rândurilor este 3, acesta este prețul mai mic al jocului, al doilea rând îi corespunde, prin urmare, strategia maximă a primului jucător este a doua. Cel mai mic dintre cele mai mari elemente ale coloanelor este 5, acesta este prețul superior al jocului, prima coloană îi corespunde, prin urmare, strategia minimax a celui de-al doilea jucător este prima.

    Punct de șa în jocurile cu matrice

    Dacă prețul superior și inferior al jocului sunt același, atunci jocul matrice este considerat a avea un punct de șa. Este adevărat și invers: dacă un joc cu matrice are un punct de șa, atunci prețurile superioare și mai mici ale jocului cu matrice sunt aceleași. Elementul corespunzător este atât cel mai mic din rând, cât și cel mai mare din coloană și este egal cu prețul jocului.

    Astfel, dacă , atunci este strategia pură optimă a primului jucător și este strategia pură optimă a celui de-al doilea jucător. Adică, prețurile egale mai mici și mai mari ale jocului sunt obținute pe aceeași pereche de strategii.

    În acest caz jocul matricial are o soluție în strategii pure .

    Exemplul 3 Dat un joc de matrice cu o matrice de plăți

    .

    Soluţie. În partea dreaptă a matricei de plăți, scriem cele mai mici elemente din rândurile sale și marcăm maximul dintre ele, iar din partea de jos a matricei - cele mai mari elemente din coloane și selectăm minimul dintre ele:

    Prețul mai mic al jocului este același cu prețul superior al jocului. Astfel, prețul jocului este 5. Adică . Prețul jocului este egal cu valoarea punctului de șa. Strategia maximin a primului jucător este a doua strategie pură, iar strategia minimax a celui de-al doilea jucător este a treia strategie pură. Acest joc de matrice are o soluție în strategii pure.

    Rezolvați singur problema jocului matrice, apoi vedeți soluția

    Exemplul 4 Dat un joc de matrice cu o matrice de plăți

    .

    Găsiți prețul mai mic și mai mare al jocului. Acest joc de matrice are un punct de șa?

    Jocuri Matrix cu strategie mixtă optimă

    În cele mai multe cazuri, jocul de matrice nu are un punct de șa, astfel încât jocul de matrice corespunzător nu are soluții pure de strategie.

    Dar are o soluție în strategii mixte optime. Pentru a le găsi, trebuie să presupunem că jocul se repetă de destule ori încât, pe baza experienței, se poate ghici care strategie este de preferat. Prin urmare, decizia este asociată cu conceptul de probabilitate și medie (așteptare). În soluția finală, există atât un analog al punctului de șa (adică egalitatea prețurilor inferioare și superioare ale jocului), cât și un analog al strategiilor corespunzătoare acestora.

    Deci, pentru ca primul jucător să obțină câștigul mediu maxim și al doilea jucător să aibă pierderea medie minimă, strategiile pure ar trebui folosite cu o anumită probabilitate.

    Dacă primul jucător folosește strategii pure cu probabilități , apoi vectorul se numește strategia mixtă a primului jucător. Cu alte cuvinte, este un „amestec” de strategii pure. Suma acestor probabilități este egală cu unu:

    .

    Dacă al doilea jucător folosește strategii pure cu probabilități , apoi vectorul se numește strategia mixtă a celui de-al doilea jucător. Suma acestor probabilități este egală cu unu:

    .

    Dacă primul jucător folosește o strategie mixtă p, iar al doilea jucător - o strategie mixtă q, atunci are sens valorea estimata primul jucător câștigă (al doilea jucător pierde). Pentru a-l găsi, trebuie să înmulți vectorul de strategie mixtă al primului jucător (care va fi o matrice cu un rând), matricea de profit și vectorul de strategie mixtă al celui de-al doilea jucător (care va fi o matrice cu o singură coloană):

    .

    Exemplul 5 Dat un joc de matrice cu o matrice de plăți

    .

    Determinați așteptările matematice ale câștigului primului jucător (pierderea celui de-al doilea jucător), dacă strategia mixtă a primului jucător este , iar strategia mixtă a celui de-al doilea jucător este .

    Soluţie. Conform formulei pentru așteptarea matematică a câștigului primului jucător (pierderea celui de-al doilea jucător), este egal cu produsul dintre vectorul de strategie mixtă al primului jucător, matricea de câștig și vectorul de strategie mixtă al celui de-al doilea jucător:

    Primul jucător este numit o astfel de strategie mixtă care i-ar oferi câștigul mediu maxim dacă jocul este repetat de un număr suficient de ori.

    Strategie mixtă optimă Al doilea jucător este numit o astfel de strategie mixtă care i-ar oferi pierderea medie minimă dacă jocul este repetat de un număr suficient de ori.

    Prin analogie cu notația maximin și minimax în cazul strategiilor pure, strategiile mixte optime sunt notate după cum urmează (și sunt legate de așteptarea matematică, adică media, a câștigului primului jucător și a pierderii celui de-al doilea jucător):

    ,

    .

    În acest caz, pentru funcție E există un punct de șa , ceea ce înseamnă egalitate.

    Pentru a găsi strategiile mixte optime și punctul de șa, i.e. rezolvați jocul matriceal în strategii mixte , trebuie să reduceți jocul de matrice la o problemă de programare liniară, adică la o problemă de optimizare și să rezolvați problema de programare liniară corespunzătoare.

    Reducerea unui joc de matrice la o problemă de programare liniară

    Pentru a rezolva un joc de matrice în strategii mixte, trebuie să compui o linie dreaptă problema de programare liniaraȘi dubla sa sarcină. În problema duală, se transpune matricea augmentată, care stochează coeficienții variabilelor în sistemul de constrângeri, termenii constanți și coeficienții variabilelor în funcția obiectiv. În acest caz, minimul funcției scop a problemei inițiale este asociat cu maximul în problema duală.

    Funcția obiectiv în problema de programare liniară directă:

    .

    Sistemul de constrângeri în problema directă a programării liniare:

    Funcția de obiectiv în problema duală:

    .

    Sistemul de constrângeri în problema duală:

    Indicați planul optim al problemei de programare liniară directă

    ,

    iar planul optim al problemei duale se notează prin

    Formele liniare pentru desenele optime corespunzătoare vor fi notate cu și ,

    și trebuie să le găsiți ca suma coordonatelor corespunzătoare ale planurilor optime.

    În conformitate cu definițiile din secțiunea anterioară și coordonatele planurilor optime, sunt valabile următoarele strategii mixte ale primului și celui de-al doilea jucător:

    .

    Matematicienii au dovedit asta pretul jocului se exprimă în forme liniare ale planurilor optime după cum urmează:

    ,

    adică este reciproca sumelor coordonatelor planurilor optime.

    Noi, practicanții, putem folosi această formulă doar pentru a rezolva jocuri matrice în strategii mixte. Ca formule pentru găsirea unor strategii mixte optime respectiv primul și al doilea jucător:

    în care factorii secundi sunt vectori. Strategiile mixte optime sunt, de asemenea, vectori, așa cum am definit deja în paragraful anterior. Prin urmare, înmulțind numărul (prețul jocului) cu vectorul (cu coordonatele planurilor optime), obținem și un vector.

    Exemplul 6 Dat un joc de matrice cu o matrice de plăți

    .

    Găsiți prețul unui joc V si strategii mixte optime si .

    Soluţie. Compunem problema de programare liniară corespunzătoare acestui joc matriceal:

    Obținem soluția problemei directe:

    .

    Găsim forma liniară a planurilor optime ca sumă a coordonatelor găsite.

    Cursul 11: Teoria jocurilor și luarea deciziilor

    Subiectul și sarcinile teoriei jocurilor

    Problemele clasice ale analizei de sistem sunt probleme de joc de luare a deciziilor sub risc și incertitudine.

    Atât scopurile operației, condițiile pentru efectuarea operației, cât și acțiunile conștiente ale adversarilor sau ale altor persoane de care depinde succesul operației, pot fi incerte.

    Special metode matematice concepute pentru a justifica deciziile în condiții de risc și incertitudine. În unele, cele mai simple cazuri, aceste metode fac posibilă găsirea și alegerea efectivă a soluției optime. În cazuri mai complexe, aceste metode oferă material suport care vă permite să aprofundați o situație complexă și să evaluați fiecare dintre solutii posibile din diferite puncte de vedere și ia decizii în funcție de posibilele consecințe ale acesteia. Una dintre condițiile importante pentru luarea deciziilor în acest caz este minimizarea riscului.

    Atunci când se rezolvă o serie de probleme practice ale cercetării operaționale (în domeniul ecologiei, al asigurării siguranței vieții etc.), trebuie analizate situațiile în care două (sau mai multe) părți în conflict se ciocnesc, urmărind scopuri diferite și rezultatul oricărei activitatea fiecăreia dintre părți depinde de modul de acțiune pe care îl va alege inamicul. Astfel de situații pot fi numite situatii conflictuale.

    Teoria jocurilor este teorie matematică situații conflictuale, cu ajutorul cărora se pot elabora recomandări privind cursul rațional de acțiune al participanților la conflict. Pentru a face posibilă analiza matematică a situației fără a lua în considerare factori secundari, se construiește un model simplificat, schematizat al situației, care se numește joc. jocul se joacă după reguli bine definite, care sunt înțelese ca un sistem de condiții care reglementează posibilele opțiuni pentru acțiunile jucătorilor; cantitatea de informații pe care fiecare parte o are despre comportamentul celeilalte; rezultatul jocului la care duce fiecare set dat de mișcări.

    Rezultatul jocului (câștig sau înfrângere) nu are întotdeauna deloc o expresie cantitativă, dar de obicei este posibil, cel puțin condiționat, să-l exprimăm cu o valoare numerică.

    O mutare este alegerea uneia dintre acțiunile prevăzute de regulile jocului și implementarea acesteia. Mișcările sunt împărțite în personale și aleatorii. O mișcare personală este o alegere conștientă de către jucător a uneia dintre opțiunile posibile de acțiune și implementarea acesteia. O mișcare aleatorie este o alegere dintr-un număr de posibilități, efectuată nu prin decizia jucătorului, ci printr-un mecanism de alegere aleatorie (aruncarea unei monede, alegerea unei cărți dintr-un pachet amestecat etc.). Pentru fiecare mișcare aleatorie, regulile jocului determină distribuția probabilității rezultatelor posibile. Jocul poate consta doar din mișcările lor personale, sau numai din mișcări aleatorii sau o combinație a ambelor. Următorul concept de bază al teoriei jocurilor este conceptul de strategie. O strategie este un sistem de decizii a priori adoptat de jucător (de tipul „dacă-atunci”), la care acesta aderă în timpul jocului, care poate fi reprezentat ca un algoritm și executat automat.

    Scopul teoriei jocurilor este de a elabora recomandări pentru comportamentul rezonabil al jucătorilor într-o situație de conflict, adică de a determina „strategia optimă” pentru fiecare dintre ei. O strategie care este optimă într-o măsură poate să nu fie neapărat optimă în altele. Fiind conștienți de aceste limitări și deci neaderând orbește la recomandările obținute prin metodele de joc, se poate folosi totuși în mod rezonabil aparatul matematic al teoriei jocurilor pentru a dezvolta, dacă nu tocmai optimă, atunci măcar o strategie „acceptabilă”.

    Jocuri pot fi clasificate: după numărul de jucători, numărul de strategii, natura interacțiunii jucătorilor, natura câștigului, numărul de mișcări, starea informațiilor etc. .

    În funcție de numărul de jucători distinge între jocurile a doi și n jucători. Prima dintre ele este cea mai studiată. Jocurile de trei sau mai mulți jucători sunt mai puțin studiate din cauza dificultăților fundamentale care apar și a posibilităților tehnice de obținere a unei soluții.

    În funcție de numărul de strategii posibile, jocurile sunt împărțite în " final" Și " fără sfârşit».

    Se spune că un joc este finit dacă fiecare jucător are doar un număr finit de strategii și infinit dacă cel puțin unul dintre jucători are un număr infinit de strategii.

    După natura interacțiunii jocurile sunt împărțite în non-cooperative: jucătorii nu au dreptul să încheie acorduri, să formeze coaliții; coaliție (cooperativă) - se poate alătura coalițiilor.

    În jocurile cooperative, coalițiile sunt predeterminate.

    După natura câștigurilor jocurile sunt împărțite în: jocuri cu sumă zero (capitalul total al tuturor jucătorilor nu se modifică, dar este redistribuit între jucători; suma câștigurilor tuturor jucătorilor este zero) și jocuri cu sumă diferită de zero.

    După tipul de funcții de plată jocurile se împart în: matrice, bimatrice, continue, convexe etc.

    matrice jocul este un joc final de doi jucători cu sumă zero, în care câștigul jucătorului 1 este dat sub forma unei matrice (rândul matricei corespunde numărului strategiei aplicate jucătorului 1, coloana corespunde cu numărul strategiei aplicate a jucătorului la intersecția rândului și coloanei matricei, se găsește câștigul jucătorului 1 corespunzător strategiilor aplicate).

    Pentru jocurile cu matrice, se dovedește că oricare dintre ele are o soluție și poate fi găsită cu ușurință prin reducerea jocului la o problemă de programare liniară.

    Bimatrix jocul este un joc finit de doi jucători cu o sumă diferită de zero, în care plățile fiecărui jucător sunt date prin matrice separat pentru jucătorul corespunzător (în fiecare matrice, rândul corespunde strategiei jucătorului 1, coloana corespunde la strategia jucătorului 2, la intersecția rândului și coloanei din prima matrice este câștigul jucătorului 1, în a doua matrice este câștigul jucătorului)

    continuu Se consideră un joc în care funcția de câștig a fiecărui jucător este continuă. Este dovedit că jocurile din această clasă au soluții, dar nu au fost dezvoltate metode practic acceptabile pentru găsirea lor.

    Dacă funcția de plată este convexă, atunci se numește un astfel de joc convex. Pentru ei s-au dezvoltat metode acceptabile de rezolvare, care constau în găsirea unei strategii pure optime (un anumit număr) pentru un jucător și a probabilităților de aplicare a strategiilor pure optime ale altui jucător. Această sarcină este relativ ușor de rezolvat.

    Înregistrarea unui joc Matrix ca matrice de plăți

    Să considerăm un joc finit în care primul jucător A are m strategii și al doilea jucător B-n strategii. Un astfel de joc se numește joc m×n. Se notează strategiile A 1 , A 2 , ..., A m ; şi B1, B2, ..., Bn. Să presupunem că fiecare parte a ales o anumită strategie: A i sau B j . Dacă jocul constă numai din mișcări personale, atunci alegerea strategiilor determină în mod unic rezultatul jocului — câștigul uneia dintre părți a ij . Dacă jocul conține, pe lângă mișcări aleatorii personale, atunci câștigul pentru o pereche de strategii A i și B este o variabilă aleatoare care depinde de rezultatele tuturor mișcărilor aleatoare. În acest caz, estimarea naturală a profitului așteptat este câștigul așteptat, care este de asemenea notat cu a ij .

    Să presupunem că cunoaștem valorile unui ij pentru fiecare pereche de strategii. Aceste valori pot fi scrise sub forma unui tabel dreptunghiular (matrice), ale cărui rânduri corespund strategiilor A i , iar coloanele corespund strategiilor B j .

    Apoi, în general, jocul cu matrice poate fi scris ca următoarea matrice a plăților:

    B1 B2 ... B n
    A 1 un 11 un 12 ... un 1n
    A2 un 21 un 22 ... un 2n
    ... ... ... ... ...
    A m un m1 un m2 ... amn

    Masa - Forma generală matricea de plăți a jocului de matrice

    unde A i sunt numele strategiilor jucătorului 1, B j sunt numele strategiilor jucătorului 2, a ij sunt câștigurile jucătorului 1 atunci când alege strategia i-a, iar jucătorul 2 — j-a strategie. Deoarece acest joc este un joc cu sumă zero, valoarea câștigului pentru jucătorul 2 este opusul valorii câștigului pentru jucătorul 1.

    Conceptul de preț mai mic și superior al jocului. Rezolvarea jocului în strategii pure

    Fiecare dintre jucători caută să-și maximizeze profitul, ținând cont de comportamentul jucătorului advers. Prin urmare, pentru jucătorul 1, este necesar să se determine valorile minime ale plăților în fiecare dintre strategii și apoi să se găsească maximul acestor valori, adică să se determine valoarea

    V n \u003d max i min j a ij

    sau găsiți valorile minime pentru fiecare dintre rândurile matricei de profit și apoi determinați maximul acestor valori. Se numește valoarea lui V n maximin matrice sau pret mai mic al jocului. Strategia jucătorului care corespunde maximinului V n se numește strategie maximin.

    Evident, dacă aderăm la strategia maximin, atunci pentru orice comportament al adversarului ni se garantează un profit nu mai mic de V n. Prin urmare, valoarea lui V n este minimul garantat pe care ni-l putem oferi, aderând la cea mai prudentă strategie a noastră.

    Valoarea câștigului jucătorului 1 este, prin definiția jocului matrice, valoarea pierderii jucătorului.De aceea, pentru jucătorul 2, este necesar să se determine valoarea

    V in = min j max i a ij

    Sau găsiți valorile maxime pentru fiecare dintre coloanele matricei de plăți și apoi determinați minimul acestor valori. Se numește valoarea V in minimax matrici, pret de top joc sau remunerația minimax. Strategia adversarului corespunzătoare câștigului se numește strategia lui minimax. Aderând la cea mai prudentă strategie minimax, adversarul este garantat că, în orice caz, nu va pierde mai mult de V c.

    Dacă valorile lui V н și V в nu se potrivesc, menținând în același timp regulile jocului (coeficienții a ij) pe termen lung, alegerea strategiilor de către fiecare dintre jucători se dovedește a fi instabilă. Dobândește stabilitate numai atunci când V n \u003d V în \u003d V. În acest caz, ei spun că jocul are soluție în strategii pure, iar strategiile în care se realizează V sunt strategii pure optime. Se numește valoarea V prețul net al jocului .

    De exemplu, într-o matrice:

    B1 B2 B3 B4 Min j
    A 1 17 16 15 14 14
    A2 11 18 12 13 11
    A 3 18 11 13 12 11
    Max i 18 18 15 14

    Tabel — Matricea de plăți în care există o soluție în strategiile pure

    există o soluție în strategii pure. În acest caz, pentru jucătorul 1, strategia pură optimă va fi strategia A 1 , iar pentru jucătorul 2, strategia B 4 .

    În matrice, nu există o soluție în strategiile pure, deoarece prețul de joc inferior este atins în strategia A 1 și valoarea acestuia este de 12, în timp ce prețul de joc superior este atins în strategia B 4 și valoarea acestuia este de 13.

    B1 B2 B3 B4 Min j
    A 1 17 16 15 12 12
    A2 11 18 12 13 11
    A 3 18 11 13 12 11
    Max i 18 18 15 13

    Tabel - Matrice de plăți în care nu există soluție în strategiile pure

    Reducerea ordinii matricei de plăți

    Ordinea matricei de plăți (numărul de rânduri și coloane) poate fi redusă prin eliminarea strategiilor dominate și duplicate.

    Se numește strategia K* dominat strategia K** dacă, pentru orice variantă a comportamentului jucătorului advers, relaţia

    A k*< A k** ,

    unde A k* și A k** sunt valorile câștigurilor atunci când jucătorul alege strategiile K* și, respectiv, K**.

    Dacă relaţia

    se spune că strategia K* este duplicată în raport cu strategia K**.

    De exemplu, într-o matrice cu strategii dominate și duplicate, strategia A 1 este dominantă în raport cu strategia A 2 , strategia B 6 este dominată în raport cu strategiile B 3 , B 4 și B 5 , iar strategia B 5 este duplicată în ceea ce privește la strategia B 4 .

    B1 B2 B3 B4 B5 B6
    A 1 1 2 3 4 4 7
    A2 7 6 5 4 4 8
    A 3 1 8 2 3 3 6
    A4 8 1 3 2 2 5

    Tabel - Matrice de plăți cu strategii dominate și duplicate

    Aceste strategii nu vor fi alese de jucători, deoarece în mod evident pierd, iar eliminarea acestor strategii din matricea plăților nu va afecta determinarea prețurilor mai mici și mai mari ale jocului descrise de această matrice.

    Setul de strategii nedominate obținute după reducerea dimensiunii matricei de profit se mai numește și mulțimea Pareto.

    Exemple de jocuri

    1. Jocul „Pui”

    Jocul „Pui” constă în intrarea jucătorilor într-o interacțiune care duce la cauzarea unui rău grav fiecăruia dintre ei până când unul dintre jucători părăsește jocul. Un exemplu de utilizare a acestui joc este interacțiunea vehicul cu motor, de exemplu, situațiile în care două mașini se îndreaptă una spre cealaltă, iar cea care se întoarce mai întâi în lateral este considerată un „slăbit” sau „pui”. Sensul jocului este de a crea tensiune care ar duce la eliminarea jucătorului. Această situație se întâlnește adesea în rândul adolescenților sau tinerilor agresivi, deși uneori prezintă un risc mai mic. O altă aplicație a acestui joc este o situație în care doi partide politice intră în contact în care nu pot câștiga nimic, iar doar mândria îi face să păstreze confruntarea. Părțile întârzie să facă concesii până ajung la punctul final. Stresul psihologic care rezultă poate conduce unul dintre jucători la o strategie de comportament greșită: dacă niciunul dintre jucători nu cedează, atunci o coliziune și un deznodământ fatal sunt inevitabile.

    Matricea de plăți pentru joc arată astfel:

    Randament Nu ceda
    Randament 0, 0 -1, +1
    Nu ceda +1, -1 -100, -100

    2. Jocul „zmeu și porumbel”

    Jocul de zmeu și porumbel este un exemplu biologic de joc. În această versiune, doi jucători cu resurse nelimitate aleg una dintre cele două strategii comportamentale. Primul („porumbel”) este că jucătorul își demonstrează puterea intimidând adversarul, iar al doilea („zmeul”) este că jucătorul atacă fizic adversarul. Dacă ambii jucători aleg strategia de zmeu, se luptă rănindu-se unul pe celălalt. Dacă unul dintre jucători alege strategia „Zmeu”, iar al doilea „Porumbel”, atunci primul îl învinge pe al doilea. Dacă ambii jucători sunt porumbei, atunci adversarii ajung la un compromis, primind o răsplată care se dovedește a fi mai mică decât câștigul zmeului care învinge porumbelul, după cum reiese din matricea de plăți a acestui joc.

    Aici V este prețul acordului, C este prețul conflictului și V

    Există trei puncte de echilibru Nash în jocul zmeului și porumbelului:

    1. Primul jucător alege zmeul, iar al doilea jucător alege porumbelul.
    2. Primul jucător alege un porumbel, iar al doilea un zmeu.
    3. ambii jucători aleg o strategie mixtă în care „zmeul” este ales cu probabilitatea p, iar „porumbelul” cu probabilitatea 1-p.

    3. Dilema prizonierului

    Dilema prizonierului este una dintre cele mai frecvente situații conflictuale luate în considerare în teoria jocurilor.

    Dilema deținutului clasic este așa: doi suspecți, A și B, sunt în celule diferite. Anchetatorul, vizitându-i unul câte unul, oferă următoarea înțelegere: dacă unul dintre ei depune mărturie împotriva celuilalt, iar al doilea tace, atunci primul prizonier va fi eliberat, iar al doilea va fi condamnat la 10 ani. Dacă amândoi rămân tăcuți, vor servi 6 luni. Dacă amândoi se trădează unul pe celălalt, atunci fiecare va primi 2 ani. Fiecare dintre prizonieri trebuie să ia o decizie: să trădeze un complice sau să tacă, neștiind ce decizie a luat celălalt. Dilema: ce decizie vor lua prizonierii?

    Matricea de câștiguri a jocului:

    În acest caz, rezultatul se bazează pe decizia fiecăruia dintre prizonieri. Poziția jucătorilor este complicată de faptul că nu știu ce decizie a luat celălalt și că nu au încredere unul în celălalt.

    Cea mai bună strategie a jucătorilor va fi cooperarea, în care ambii tac și primesc profitul maxim (termen mai mic), fiecare soluție va fi mai puțin câștigătoare.

    Să analizăm „dilema prizonierului”, trecând pentru claritate la matricea de plăți a formei canonice:

    Cooperare Refuzul de a coopera
    Cooperare 3, 3 0, 5
    Refuzul de a coopera 5, 0 1, 1

    Conform acestei matrice, costul necooperării reciproce (S) este de 1 punct pentru fiecare dintre jucători, costul cooperării (R) este de 3 puncte, iar prețul tentației de a-l trăda pe celălalt (T) este de 5 puncte. . Putem scrie următoarea inegalitate: T > R > S. Când jocul se repetă de mai multe ori, alegerea cooperării învinge tentația de a trăda și de a obține câștigul maxim: 2 R > T + S.

    Echilibru Nash.

    Un echilibru Nash este o situație în care niciun jucător nu are un stimulent să-și schimbe strategia având în vedere strategia altui jucător (altă firmă), permițând jucătorilor să ajungă la o soluție de compromis.

    Definiția unui echilibru Nash și existența acestuia este definită după cum urmează.

    Fie (S, f) un joc în care S este setul de strategii și f este setul de plăți. Când fiecare dintre jucătorii i ∈ (1, ..., n) alege strategia x i &isin S, unde x = (x 1 , ..., x n), atunci jucătorul i primește recompensa f i (x). Recompensa depinde de strategia aleasă de toți jucătorii. O strategie x* ∈ S este un echilibru Nash dacă nicio abatere de la acesta de către niciun jucător nu îi aduce profit, adică următoarea inegalitate este valabilă pentru tot i:

    f i (x*) ≥ f i (x i , x* -i)

    De exemplu, jocul dilemei prizonierului are un echilibru Nash, o situație în care ambii prizonieri se trădează reciproc.

    Cel mai simplu mod de a determina echilibrul Nash este folosirea matricei de profit, mai ales în cazurile în care doi jucători participă la joc, având mai mult de două strategii în arsenalul lor. Deoarece în acest caz analiza formală va fi destul de complicată, se aplică regula mnemonică, care este următoarea: celula matricei de plăți este un echilibru Nash dacă primul număr din acesta este maximul dintre toate valorile prezentat în coloane, iar al doilea număr , în picioare într-o celulă - numărul maxim dintre toate liniile.

    De exemplu, aplicați această regulă pentru o matrice 3x3:

    A B C
    A 0, 0 25, 40 5, 10
    B 40, 25 0, 0 5, 15
    C 10, 5 15, 5 10, 10

    Puncte de echilibru Nash: (B,A), (A,B) și (C,C). Într-adevăr, pentru celula (B,A), deoarece 40 este valoarea maximă din prima coloană, 25 este valoarea maximă din al doilea rând. Pentru celula (A,B), 25 este valoarea maximă din a doua coloană, 40 este valoarea maximă din al doilea rând. Același lucru este valabil și pentru celula (C,C).

    Luați în considerare un exemplu de joc al poluării ( mediu inconjurator). Aici, concentrarea noastră va fi efecte secundare producția ca poluare. Dacă firmele nu ar întreba pe nimeni ce să facă, oricare dintre ele ar prefera să creeze poluare decât să instaleze produse de curățare scumpe. Dacă orice firmă ar decide să reducă emisiile nocive, atunci costurile și, în consecință, prețurile produselor sale, ar crește, iar cererea ar scădea. Este foarte posibil ca această companie să dea pur și simplu faliment. Trăind în lumea crudă a selecției naturale, firmele ar prefera să rămână într-un echilibru Nash (celula D) în care nu este nevoie să cheltuiască bani pe stații și tehnologii de tratare a apelor uzate. Nicio firmă nu poate crește profiturile prin reducerea poluării.

    Firma 1
    Firma 2 Poluare scăzută Nivel ridicat de poluare
    Poluare scăzută A
    100,100
    ÎN
    -30,120
    Nivel ridicat de poluare CU
    120,-30
    D
    100,100

    Tabel - Matricea de câștiguri a jocului în poluarea mediului.

    Intrând în jocul economic, fiecare firmă siderurgică necontrolată și care maximizează profitul va produce poluare a apei și a aerului. Dacă vreo firmă încearcă să-și curețe emisiile, va fi astfel forțată să crească prețurile și să suporte pierderi. Comportamentul necooperant va stabili un echilibru Nash în condiții aberante ridicate. Guvernul poate lua măsuri pentru a muta echilibrul în celula A. În această poziție, poluarea va fi neglijabilă, dar profiturile vor rămâne aceleași.

    Jocurile de poluare sunt unul dintre cazurile în care mecanismul „mânii invizibile” nu funcționează. Aceasta este o situație în care echilibrul Nash este ineficient. Uneori, aceste jocuri scăpate de sub control devin amenințătoare și guvernul poate interveni. Prin stabilirea unui sistem de amenzi și cote de emisii, guvernul poate determina firmele să aleagă rezultatul A, corespunzător unei poluări scăzute. Firmele câștigă exact la fel ca înainte, cu emisii mari, iar lumea devine oarecum mai curată.

    Un exemplu de rezolvare a unui joc de matrice în strategii pure

    Să luăm în considerare un exemplu de rezolvare a unui joc de matrice în strategii pure, într-o economie reală, într-o situație în care două întreprinderi se luptă pentru piața de produse din regiune.

    Sarcină.

    Două întreprinderi produc produse și le furnizează pieței regionale. Ei sunt singurii furnizori de produse în regiune, prin urmare determină complet piața acestor produse în regiune.

    Fiecare dintre întreprinderi are capacitatea de a produce produse folosind una dintre cele trei tehnologii diferite. În funcție de respectarea mediului înconjurător a procesului tehnologic și de calitatea produselor realizate prin fiecare tehnologie, întreprinderile pot stabili prețul pe unitatea de producție la nivelul a 10, 6 și, respectiv, 2 unități monetare. În același timp, întreprinderile au costuri diferite pentru producerea unei unități de producție.

    Tabel - Costuri pe unitatea de producție produsă la întreprinderile din regiune (unități monetare).

    Ca urmare a cercetării de marketing a pieței de produse din regiune, a fost determinată funcția cererii de produse:

    Y = 6 - 0,5⋅X,

    unde Y este cantitatea de produse pe care populația regiunii le va achiziționa (mii de unități), iar X este prețul mediu al produselor întreprinderilor, c.u.

    Datele privind cererea de produse în funcție de prețurile de vânzare sunt date în tabel:

    Pret de vanzare 1 unitate. produse, m.u.

    Preț mediu de vânzare de 1 unitate. produse, m.u.

    Cererea de produse, mii de unități

    Întreprinderea 1 Întreprinderea 2
    10 10 10 1
    10 6 8 2
    10 2 6 3
    6 10 8 2
    6 6 6 3
    6 2 4 4
    2 10 6 3
    2 6 4 4
    2 2 2 5

    Tabel - Cererea de produse în regiune, mii de unități.

    Valorile acțiunilor produselor întreprinderii 1 achiziționate de către populație depind de raportul dintre prețurile produselor întreprinderii 1 și întreprinderii. În urma cercetărilor de marketing s-a stabilit această dependență, iar valorile au fost calculat:

    Tabel - Ponderea produselor întreprinderii 1 achiziționate de populație, în funcție de raportul prețurilor la produse

    În funcție de starea problemei, pe piața regională operează doar 2 întreprinderi. Prin urmare, ponderea produselor din a doua întreprindere achiziționată de populație, în funcție de raportul prețurilor la produse, poate fi definită ca o unitate minus ponderea primei întreprinderi.

    Strategiile întreprinderilor în această problemă sunt deciziile lor privind tehnologiile de producție. Aceste decizii determină costul și prețul de vânzare al unei unități de producție. Sarcina trebuie să definească:

    1. Există o situație de echilibru în această problemă în alegerea tehnologiilor de producție de către ambele întreprinderi?
    2. Există tehnologii pe care, în mod evident, întreprinderile nu le vor alege din cauza dezavantajului?
    3. Câte produse vor fi vândute într-o situație de echilibru? Care companie va fi câștigătoare?

    Rezolvarea problemei

    1. Să definim sens economic coeficienții de profit în matricea de profit a problemei. Fiecare întreprindere urmărește să maximizeze profiturile din producția de produse. Dar, în plus, în acest caz, întreprinderile luptă pentru piața produselor din regiune. În același timp, câștigul unei întreprinderi înseamnă pierderea alteia. O astfel de problemă poate fi redusă la un joc cu matrice cu sumă zero. În acest caz, coeficienții de câștig vor fi diferența dintre profiturile întreprinderii 1 și ale întreprinderii 2 din producția de produse. Dacă această diferență este pozitivă, întreprinderea 1 câștigă, iar dacă este negativă, întreprinderea 2 câștigă.
    2. Calculați coeficienții matricei de profit. Pentru a face acest lucru, este necesar să se determine valorile profitului întreprinderii 1 și întreprinderii 2 din producția de produse.

    Profitul întreprinderii în această problemă depinde de:

    • din prețul și costul de producție;
    • asupra cantității de produse achiziționate de populația regiunii;
    • din ponderea produselor achiziţionate de populaţie de la întreprindere.

    Astfel, valorile diferenței dintre profiturile întreprinderilor, corespunzătoare coeficienților matricei de profit, trebuie determinate prin formula:

    D = p⋅(S⋅R1 - S⋅C1) - (1 - p)⋅(S⋅R2 - S⋅C2),

    unde D este valoarea diferenței de profit din producția de produse a întreprinderii 1 și a întreprinderii

    p este ponderea produselor întreprinderii 1 achiziționate de populația regiunii;

    S este numărul de produse achiziționate de populația regiunii;

    R1 și R2 sunt prețurile de vânzare ale unei unități de producție de către întreprinderi 1 și

    C1 și C2 sunt costul total al unei unități de producție produsă la întreprinderile 1 și

    Să calculăm unul dintre coeficienții matricei de profit.

    Să fie, de exemplu, întreprinderea 1 să decidă asupra producției de produse în conformitate cu tehnologia III, iar întreprinderea 2 - în conformitate cu tehnologia II. Apoi prețul de vânzare al unității. produsele pentru întreprinderea 1 vor fi CU 2. la cost unitar. produse CU 1.5 Pentru Enterprise 2, prețul de vânzare al unei unități. producția va fi CU 6. la un cost de 4 UM.

    Cantitatea de produse cu care populația regiunii o va achiziționa prețul mediu 4 cu, este egal cu 4 mii de unități. (Tabelul 1). Ponderea produselor pe care populația le va achiziționa de la întreprinderea 1 va fi de 0,85, iar de la întreprinderea 2 - 0,15 (Tabelul 1.3). Calculați coeficientul matricei de profit a 32 folosind formula:

    a 32 \u003d 0,85⋅ (4⋅2 - 4 × 1,5) - 0,15⋅ (4⋅6 - 4⋅4) \u003d 0,5 mii de unități.

    unde i=3 este numărul de tehnologie al primei întreprinderi, iar j=2 este numărul de tehnologie al celei de-a doua întreprinderi.

    În mod similar, calculăm toți coeficienții matricei de profit. În matricea de profit, strategiile A 1 - A 3 - reprezintă decizii privind tehnologiile de producție pe întreprinderea 1, strategiile B 1 - B 3 - deciziile privind tehnologiile de producție pe întreprinderea 2, ratele de profit - diferența de profit între întreprinderea 1 și întreprindere.

    B1 B2 B3 Min j
    A 1 0,17 0,62 0,24 0,17
    A2 0,3 -1,5 -0,8 -1
    A 3 0,9 0,5 0,4 0,4
    Max i 3 0,62 0,4

    Tabel - Matricea de plăți în jocul „Lupta a două întreprinderi”.

    Nu există strategii de dominare sau duplicare în această matrice. Aceasta înseamnă că pentru ambele întreprinderi nu există tehnologii de producție în mod evident neprofitabile. Să determinăm elementele minime ale rândurilor matricei. Pentru întreprinderea 1, fiecare dintre aceste elemente are valoarea profitului minim garantat la alegerea strategiei adecvate. Elementele minime ale matricei pe rânduri au următoarele valori: 0,17, -1,5, 0,4.

    Să determinăm elementele maxime ale coloanelor matricei. Pentru întreprinderea 2, fiecare dintre aceste elemente are și valoarea profitului minim garantat la alegerea strategiei adecvate. Elementele maxime ale matricei pe coloane au următoarele valori: 3, 0,62, 0,4.

    Prețul mai mic al jocului din matrice este 0,4. Prețul superior al jocului este, de asemenea, egal cu 0,4. Astfel, prețul inferior și superior al jocului din matrice sunt aceleași. Aceasta înseamnă că există o tehnologie de producție care este optimă pentru ambele întreprinderi în condițiile acestei sarcini. Această tehnologie este III, care corespunde strategiilor A 3 întreprinderea 1 și B 3 întreprinderile Strategiile A 3 și B 3 sunt strategii pure optime în această problemă.

    Valoarea diferenței dintre profiturile întreprinderii 1 și întreprinderii 2 la alegerea unei strategii optime nete este pozitivă. Aceasta înseamnă că întreprinderea 1 va câștiga acest joc. Întreprinderea 1 va câștiga 0,4 mii UM. Totodată, pe piață vor fi vândute 5 mii de unități. produse (vânzările sunt egale cu cererea de produse, tabelul 1). Ambele întreprinderi vor stabili prețul pe unitatea de producție la 2 UM. În acest caz, pentru prima întreprindere, costul total al unei unități de producție va fi de 1,5 UM, iar pentru a doua - 1 UM. Întreprinderea 1 va beneficia doar de ponderea mare a produselor pe care populația le va achiziționa de la ea.

    Criterii de decizie

    Factorul de decizie determină cea mai profitabilă strategie în funcție de stabilirea țintei, pe care o implementează în procesul de rezolvare a problemei. Factorul de decizie determină rezultatul rezolvării problemei de către unul dintre criterii de decizie. Pentru a ajunge la o soluție lipsită de ambiguitate și, dacă este posibil, cea mai avantajoasă, este necesar să se introducă o funcție de evaluare (țintă). În același timp, fiecărei strategii de decizie (A i) i se atribuie un rezultat W i , care caracterizează toate consecințele acestei decizii. Din gama de rezultate de luare a deciziilor, decidentul selectează elementul W care reflectă cel mai bine motivația comportamentului său.

    In functie de conditii Mediul extern si gradul de informativ al decidentului se face urmatoarea clasificare a sarcinilor decizionale:

    • la risc;
    • în condiții de incertitudine;
    • în condiţii de conflict sau opoziţie (adversar activ).

    Luarea deciziilor sub risc.

    1. Criterii de valoare aşteptată.

    Utilizarea criteriului valorii așteptate se datorează dorinței de a maximiza profitul așteptat (sau de a minimiza costurile așteptate). Utilizarea valorilor așteptate implică posibilitatea de a rezolva aceeași problemă de mai multe ori până la obținerea unor formule de calcul suficient de precise. Matematic, arată astfel: fie X - valoare aleatorie cu așteptări matematice MX și varianță DX. Dacă x 1 , x 2 , ..., x n sunt valori ale unei variabile aleatoare (r.v.) X, atunci media aritmetică a valorilor lor (media eșantionului) x^=(x 1 +x 2 +.. .+x n)/ n are o varianță de DX/n. Astfel, când n→∞ DX/n→∞ și X→MX.

    Cu alte cuvinte, cu o dimensiune a eșantionului suficient de mare, diferența dintre media aritmetică și așteptarea matematică tinde spre zero (așa-numita teoremă limită a teoriei probabilităților). Prin urmare, utilizarea criteriului valorii așteptate este valabilă numai în cazul în care aceeași soluție trebuie aplicată de un număr suficient de mare de ori. Este adevărat și invers: orientarea spre așteptări va duce la rezultate incorecte pentru deciziile care trebuie luate de un număr mic de ori.

    Exemplul 1. Este necesar să se ia o decizie cu privire la momentul în care este necesar să se efectueze întreținerea preventivă a PC-ului pentru a minimiza pierderile datorate unei defecțiuni. Dacă reparațiile sunt făcute prea des, costurile de întreținere vor fi mari, cu pierderi mici din cauza defecțiunilor accidentale.

    Deoarece este imposibil de anticipat când va apărea o defecțiune, este necesar să se găsească probabilitatea ca PC-ul să se defecteze în perioada de timp t. Acesta este elementul de risc.

    Matematic, arată așa: un computer este reparat individual dacă se oprește din cauza unei defecțiuni. După T intervale de timp, se efectuează întreținerea preventivă a tuturor n PC-uri. Este necesar să se determine valoarea optimă a lui m, care minimizează costul total al reparației computerelor defecte și al efectuării reparațiilor preventive pe un interval de timp.

    Fie p t probabilitatea de eșec a unui PC la momentul t și n t o variabilă aleatorie egală cu numărul tuturor PC-urilor care au eșuat în același moment. Mai departe C 1 - costul reparației unui computer defect și C 2 - costul întreținerii preventive a unei mașini.

    Aplicarea criteriului valorii așteptate în acest caz este justificată dacă PC-urile sunt operate o perioadă lungă de timp. În acest caz, costurile așteptate pentru un interval vor fi

    OZ = (C 1 ∑M(n t)+C 1 n)/T,

    unde M(n t) este așteptarea matematică a numărului de calculatoare eșuate la momentul t. Din moment ce n t are distribuție binomială cu parametrii (n, p t), atunci M(n t) = np t . Prin urmare

    OZ \u003d n (C 1 ∑p t + C 2) / T.

    Condițiile de optimitate necesare T * au forma:

    OZ (T * -1) ≥ OZ (T *),

    OZ (T * +1) ≥ OZ (T *).

    Prin urmare, pornind de la o valoare mică a lui T, se calculează OZ(

    T) până când sunt mulțumiți conditiile necesare optimitatea.

    Fie C 1 = 100; C2 = 10; n = 50. Valorile p t sunt:

    T p t ∑р t OZ(T)
    1 0.05 0 50(100⋅0+10)/1=500
    2 0.07 0.05 375
    3 0.10 0.12 366.7
    4 0.13 02 400
    5 0.18 0.35 450

    T * → 3, OZ(T *) → 366,7

    Prin urmare, întreținerea preventivă trebuie făcută prin T * =3 intervale de timp.

    Criteriul „valoare așteptată – varianță”.

    Criteriul valorii așteptate poate fi modificat astfel încât să poată fi aplicat situațiilor care apar rar.

    Dacă x - s. V. cu varianța DX, atunci media aritmetică x^ are varianță DX/n, unde n este numărul de termeni din x^. Prin urmare, dacă DX scade și probabilitatea ca x^ să fie aproape de MX crește. Prin urmare, este recomandabil să se introducă un criteriu în care maximizarea valorii așteptate a profitului să fie combinată cu minimizarea variației acestuia.

    Exemplul 2. Să aplicăm criteriul „valoare așteptată - varianță” de exemplu 1. Pentru a face acest lucru, trebuie să găsiți varianța costurilor pentru un interval de timp, adică. dispersie

    s T \u003d (C 1 ∑n t + C 2 n) / T

    Deoarece n t , t = (1, T-1) este r.v., atunci s T este de asemenea r.v. S.v. n t are o distribuție binomială cu M(n t) = np t și D(n t) = np t (1–p t). Prin urmare,

    D(s T) = D((C 1 ∑n t +C 2 n)/T) = (C 1 /T) 2 D(∑n t) =

    = (C 1 /T) 2 ∑Dn t = (C 1 /T) 2 ∑np t (1-p t) = (C 1 /T) 2 (∑p t - ∑p t 2 ),

    unde C 2 n = const.

    Din exemplul 1 rezultă că

    M(s T) = M(s(T)).

    Prin urmare, criteriul dorit va fi minimul expresiei

    M(s(T)) + la D(s T).

    cometariu. Constanta „k” poate fi considerată ca un nivel aversiunii față de risc, deoarece „k” determină „gradul de posibilitate” al dispersiei D(s T) în raport cu așteptări matematice. De exemplu, dacă un antreprenor este deosebit de sensibil la abateri negative mari ale profiturilor în jos de la M(s(T)), atunci el poate alege „k” mult mai mare decât 1. Aceasta dă mai multă pondere varianței și duce la o soluție care reduce probabilitatea unor pierderi mari de profit.

    Pentru k=1 avem problema

    M(s(T))+D(s(T)) = n ( (C 1 /T+C 1 2 /T 2)∑p t - C 1 2 /T 2 ∑p t 2 + C 2 /T )

    Folosind datele din exemplul 1, puteți crea următorul tabel

    T pct p t 2 ∑p t ∑p t 2 M(s(T))+D(s(T))
    1 0,05 0,0025 0 0 500.00
    2 0,07 0,0049 0,05 0,0025 6312,50
    3 0,10 0,0100 0,12 0,0074 6622,22
    4 0,13 0,0169 0,2 0,0174 6731,25
    5 0,18 0,0324 0,35 0,0343 6764,00

    Tabelul arată că întreținerea preventivă trebuie făcută în fiecare interval T * =1.

    3. Criteriul limitativ

    Criteriul de limitare nu oferă o soluție optimă care maximizează, de exemplu, profitul sau minimizează costurile. Mai degrabă, se potrivește definiției acceptabil mod de acțiune.

    Exemplul 3. Să presupunem că cantitatea de cerere x pe unitatea de timp (intensitatea cererii) pentru un anumit produs este dată de o funcție de distribuție continuă f(x). Dacă stocurile sunt mici la momentul inițial, poate exista o lipsă de bunuri în viitor. În caz contrar, până la sfârșitul perioadei analizate, stocurile de bunuri nevândute pot fi foarte mari. În ambele cazuri, sunt posibile pierderi.

    Deoarece este foarte dificil să se determine pierderile din lipsă, decidentul poate stabili nivelul necesar al stocurilor în așa fel încât valoarea așteptat deficitul nu a depășit unitățile A 1, iar valoarea așteptat surplusul nu a depăşit A 2 unităţi. Cu alte cuvinte, să fiu nivelul de inventar dorit. Apoi

    deficit așteptat = ∫(x-I)f(x)dx ≤ A 1 ,

    surplusuri așteptate = ∫(I-x)f(x)dx ≤ A 2 .

    Cu o alegere arbitrară a A 1 și A 2, aceste condiții se pot dovedi a fi contradictorii. În acest caz, una dintre constrângeri trebuie relaxată pentru a asigura admisibilitatea.

    Să, de exemplu,

    f(x) = 20/x 2 , 10≤x≤20,

    f(x) = 0, x≤10 și x≥20.

    ∫(x-I)f(x)dx = ∫(x-I)(20/x 2)dx = 20(ln(20/I) + I/20 – 1)

    ∫(I-x)f(x)dx = ∫(I-x)(20/x 2)dx = 20(ln(10/I) + I/10 – 1)

    Aplicarea criteriului nivelului limitativ duce la inegalităţi

    ln(I) - I/20 ≥ ln(20) - A 1 /20 - 1 = 1,996 - A 1 /20

    ln(I) - I/10 ≥ ln(10) - A 2 /20 - 1 = 1,302 - A 2 /20

    Valorile limită A 1 și A 2 trebuie alese astfel încât ambele inegalități să fie valabile pentru cel puțin o valoare a lui I.

    De exemplu, dacă A 1 = 2 și A 2 = 4, inegalitățile devin

    ln(I) - I/20 ≥ 1,896

    ln(I) - I/10 ≥ 1,102

    Valoarea lui I trebuie să fie între 10 și 20, pentru că în aceste limite cererea se schimbă. Tabelul arată că ambele condiții sunt îndeplinite pentru I, din intervalul (13.17)

    eu 10 11 12 13 14 15 16 17 18 19 20
    ln(I) - I/20 1,8 1,84 1,88 1,91 1,94 1,96 1,97 1,98 1,99 1,99 1,99
    ln(I) - I/10 1,3 19 18 16 14 11 1,17 1,13 1,09 1,04 0,99

    Oricare dintre aceste valori satisface condițiile problemei.

    Luarea deciziilor în condiții de incertitudine

    Vom presupune că decidentul nu este confruntat rezonabil dusman.

    Datele necesare pentru a lua o decizie în condiții de incertitudine sunt de obicei date sub forma unei matrice, ale cărei rânduri corespund unor posibile acțiuni, iar coloanele unor posibile stări ale sistemului.

    De exemplu, este necesar să se fabrice un produs dintr-un material, a cărui durabilitate nu poate fi determinată la costuri acceptabile. Se presupune că încărcările sunt cunoscute. Este necesar să se decidă ce dimensiuni ar trebui să aibă produsul din acest material.

    Opțiunile de soluție sunt:

    E 1 - alegerea dimensiunilor din motive de durabilitate maximă;

    E m - alegerea dimensiunilor din motive de durabilitate minimă;

    E i sunt soluții intermediare.

    Condițiile care trebuie luate în considerare sunt:

    F 1 - conditii care asigura durabilitate maxima;

    F n - conditii care asigura durabilitate minima;

    F i - condiţii intermediare.

    Sub rezultatul deciziei e ij = e(E i ; F j) aici putem înțelege estimarea corespunzătoare opțiunii E i și condițiile F j și care caracterizează profitul, utilitatea sau fiabilitatea. De obicei, vom numi un astfel de rezultat utilitatea deciziei.

    Apoi familia (matricea) soluțiilor ||e ij || se pare ca:

    F1 F2 ... F n
    E 1 e 11 e 12 ... e 1n
    E 2 e 21 e 22 ... e 2n
    ... ... ... ... ...
    E m e m1 e m2 ... e mn

    Pentru a ajunge la o soluție lipsită de ambiguitate și, dacă este posibil, cea mai avantajoasă, este necesar să se introducă o funcție de evaluare (țintă). În acest caz, matricea de decizie ||e ij || redus la o coloană. Fiecărei opțiuni E i i se atribuie, așadar, unele rezultate e ir , care caracterizează, în general, toate consecințele acestei decizii. Un astfel de rezultat va fi notat în continuare prin același simbol e ir .

    Criterii clasice de decizie

    1. Criteriul Minimax.

    Regula pentru alegerea unei soluții în conformitate cu criteriul minimax (criteriul MM) poate fi interpretată după cum urmează:

    matricea de decizie este completată cu încă o coloană cu cele mai mici rezultate din fiecare rând. Este necesar să alegeți acele opțiuni în rândurile cărora sunt cea mai mare valoare e ir a acestei coloane.

    Selectat astfel. opțiunile elimină complet riscul. Aceasta înseamnă că decidentul nu se poate confrunta cu un rezultat mai rău decât cel pe care îl vizează. Această proprietate face posibilă considerarea criteriului MM ca unul dintre cele fundamentale.

    Utilizarea criteriului MM este justificată dacă situația în care se ia decizia este următoarea:

    1. Nu se știe nimic despre posibilitatea apariției stărilor externe F j;
    2. Trebuie să se țină seama de apariția diferitelor stări externe F j ;
    3. Soluția este implementată o singură dată;
    4. Orice risc trebuie exclus.

    2. Criteriul Bayes-Laplace.

    Fie q i probabilitatea de apariție a stării externe F j .

    Regula de selecție corespunzătoare poate fi interpretată după cum urmează:

    matricea de decizie este completată cu încă o coloană care conține așteptarea matematică a valorilor fiecărui rând. Sunt selectate acele opțiuni, în rândurile cărora se află cea mai mare valoare e ir a acestei coloane.

    Se presupune că situația în care se ia decizia este caracterizată de următoarele circumstanțe:

    1. Probabilitățile de apariție a stării F j sunt cunoscute și nu depind de timp.
    2. Soluția se realizează (teoretic) de nenumărate ori.
    3. Pentru un număr mic de implementări ale soluției, este permis un anumit risc.

    Când suficient în număr mare implementări, valoarea medie se stabilizează treptat. Prin urmare, cu implementarea completă (infinită), orice risc este practic exclus.

    Acea. Criteriul Bayes-Laplace (criteriul B-L) este mai optimist decât criteriul minimax, cu toate acestea, implică o mai mare conștientizare și o implementare destul de lungă.

    3. Criteriul lui Savage.

    a ij:= max i (e ij) - e ij

    e ir:= max i (a ij) = max j (max i (e ij) - e ij)

    Valoarea lui a ij poate fi interpretată ca câștig suplimentar maxim, care se realizează dacă, în starea F j, în locul variantei E i, se alege o altă variantă, optimă pentru această stare externă. Valoarea lui a ij poate fi interpretată și ca pierderi (penalități) apărute în starea F j la înlocuirea variantei optime pentru acesta cu varianta E i . În acest din urmă caz, e ir este pierderile maxime posibile (peste toate stările externe F j , j = (1,n)) în cazul alegerii variantei E i .

    Regula de selecție corespunzătoare criteriului lui Savage este acum interpretată după cum urmează:

    1. Fiecare element al matricei de decizie ||e ij || se scade din cel mai mare rezultat max(e ij) al coloanei corespunzătoare.
    2. Diferențele a ij formează o matrice de reziduuri ||e ij ||. Această matrice este actualizată cu cea mai mare coloană de diferență. Alegeți acele opțiuni în rândurile cărora este cea mai mică valoare pentru această coloană.

    Cerințele pentru situația în care se ia decizia coincid cu cerințele pentru criteriul MM.

    4. Exemplu și concluzii.

    Din cerințele pentru criteriile luate în considerare, devine clar că, datorită pozițiilor lor de pornire rigide, acestea sunt aplicabile numai pentru idealizate. solutii practice. În cazul în care este posibilă o idealizare prea puternică, pot fi aplicate pe rând diferite criterii simultan. După aceea, dintre mai multe opțiuni, decidentul alege decizia finală prin metoda volitivă. Această abordare permite, în primul rând, să pătrundă mai bine în toate conexiunile interne ale problemei decizionale și, în al doilea rând, slăbește influența factorului subiectiv.

    Exemplu. În timpul funcționării computerului, este necesar să suspendați periodic procesarea informațiilor și să verificați computerul pentru prezența virușilor în acesta. Suspendarea prelucrării informațiilor duce la anumite costuri economice. Dacă virusul nu este detectat la timp, o parte din informații se pot pierde, ceea ce va duce la pierderi și mai mari.

    Opțiunile de soluție sunt:

    E 1 - verificare completă;

    E 2 - verificare minimă;

    E 3 - refuzul verificării.

    Computerul poate fi în următoarele stări:

    F 1 - virusul este absent;

    F 2 - există un virus, dar nu a avut timp să deterioreze informația;

    F 3 - există fișiere care trebuie restaurate.

    Rezultatele, inclusiv costurile de căutare a virusului și eliminarea acestuia, precum și costurile asociate cu restaurarea informațiilor, arată astfel:

    F1 F2 F3 MM-criteriul criteriul B-L
    e ir = min j (e ij) max i (e ir) e ir = ∑e ij max i (e ir)
    E 1 -20,0 -20 -25,0 -25,0 -25,0 -22,33
    E 2 -14,0 -23,0 -31,0 -31,0 -22,67
    E 3 0 -24.0 -40.0 -40.0 -21.33 -21.33

    Conform criteriului MM, trebuie efectuată o verificare completă. Criteriul Bayes-Laplace, presupunând că toate stările mașinii sunt la fel de probabile.

    F1 F2 F3 criteriul lui Savage
    e ir = min j (a ij) min j (e ir)
    E 1 +20,0 0 0 +20,0
    E 2 +14,0 +1,0 +6,0 +14,0 +14,0
    E 3 0 +2,0 +15,0 +15,0

    Exemplul este ales special pentru ca fiecare criteriu să ofere o soluție nouă. Incertitudinea stării în care cecul găsește computerul se transformă într-o ambiguitate în ceea ce privește criteriul de urmat.

    Deoarece diferite criterii sunt asociate cu diverse conditiiîn care se ia decizia, cea mai bună modalitate de evaluare comparativă a recomandărilor anumitor criterii este obținerea de informații suplimentare despre situația în sine. În special, dacă decizia luată se referă la sute de mașini cu aceiași parametri, atunci se recomandă aplicarea criteriului Bayes-Laplace. Dacă numărul de mașini nu este mare, este mai bine să utilizați criteriile minimax sau Savage.

    Criterii derivate.

    1. Criteriul Hurwitz.

    Încercând să ia cea mai echilibrată poziție, Hurwitz a sugerat o funcție de evaluare care se află undeva între punctul de vedere al optimismului extrem și al pesimismului extrem:

    max i (e ir) = ( C⋅min j (e ij) + (1-C)⋅max j (e ij) ),

    unde C este factorul de greutate.

    Regula de selecție conform criteriului Hurwitz se formează după cum urmează:

    matrice de decizie ||e ij || completată cu o coloană care conține media ponderată a celor mai mici și mai mari rezultate pentru fiecare rând. Sunt selectate doar acele opțiuni, în rândurile cărora se află cele mai mari elemente din această coloană.

    La C=1, criteriul Hurwitz se transformă într-un criteriu MM. La C = 0, se transformă în criteriul „jucătorului de noroc”.

    max i (e ir) = max i (max j (e ij)),

    acestea. luăm punctul de vedere al unui jucător care pariază că cea mai bună șansă va „cădea”.

    În aplicațiile tehnice, este dificil să alegeți factorul de greutate C, deoarece este greu de găsit o caracteristică cantitativă pentru acele ponderi de optimism și pesimism care sunt prezente la luarea unei decizii. Prin urmare, cel mai adesea C: \u003d 1/2.

    Criteriul Hurwitz se aplică atunci când:

    1. nu se știe nimic despre probabilitățile de apariție a stării F j;
    2. cu apariția stării F j trebuie luate în considerare;
    3. se realizează doar un număr mic de soluții;
    4. este permis un anumit risc.

    2. Criteriul Hodge–Lehmann.

    Acest criteriu se bazează simultan pe criteriul MM și pe criteriul Bayes-Laplace. Folosind parametrul n, se exprimă gradul de încredere în distribuțiile de probabilitate utilizate. Dacă încrederea este mare, atunci domină criteriul Bayes-Laplace, în caz contrar, criteriul MM, i.e. căutăm

    max i (e ir) = max i (v⋅∑e ij ⋅q i + (1-v) min j (e ir)), 0 ≤ n ≤ 1.

    Regula de selecție corespunzătoare criteriului Hodge-Lehman se formează după cum urmează:

    matrice de decizie ||e ij || este completată de o coloană compusă din medii ponderate (cu pondere v≡const) așteptări matematice și cel mai mic rezultat al fiecărui rând (*). Acele soluții sunt selectate în rândurile cărora este cea mai mare valoare a acestei coloane.

    La v = 1, criteriul Hodge-Lehman se transformă în criteriul Bayes-Laplace, iar la v = 0 devine minimax.

    Alegerea lui v este subiectivă deoarece gradul de fiabilitate al oricărei funcții de distribuție este o materie întunecată.

    Pentru a aplica criteriul Hodge-Lehman, este de dorit ca situația în care este luată decizia să satisfacă următoarele proprietăți:

    1. probabilitățile de apariție a stării F j sunt necunoscute, dar sunt posibile unele ipoteze despre distribuția probabilității;
    2. solutia acceptata admite teoretic infinit de implementari;
    3. pentru un număr mic de implementări, este permis un anumit risc.

    3. Criteriul lui Germeier.

    Acest criteriu este axat pe valoarea pierderilor, de ex. la valori negative ale tuturor e ij . în care

    max i (e ir) = max i (min j (e ij)q j) .

    Deoarece în sarcinile economice se ocupă în principal de prețuri și costuri, condiția e e ij<0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij -a при подходящем образом подобранном a>0. În acest caz, soluția optimă depinde de a.

    Regula de selecție după criteriul Germeier se formulează astfel:

    matrice de decizie ||e ij || se completează cu încă o coloană care conține în fiecare rând cel mai mic produs al rezultatului disponibil în acesta și probabilitatea stării corespunzătoare F j . Acele opțiuni sunt selectate în rândurile cărora se găsește cea mai mare valoare e e ij a acestei coloane.

    Într-un fel, criteriul Germeier generalizează criteriul MM: în cazul unei distribuții uniforme q j = 1/n, j=(1,n), acestea devin identice.

    Condițiile de aplicare a acestuia sunt:

    1. odată cu apariția anumitor stări, separat sau în combinație, este necesar să se socotească;
    2. este permis un anumit risc;
    3. soluția poate fi implementată o dată sau de mai multe ori.

    Dacă funcția de distribuție nu este cunoscută foarte sigur, iar numerele de realizare sunt mici, atunci, urmând criteriul Germeier, se obține, în general, un risc nerezonabil de mare.

    4. Test combinat Bayes-Laplace și minimax.

    Dorința de a obține criterii care s-ar adapta mai bine situației existente decât toate cele avute în vedere până acum a condus la construirea așa-numitelor criterii compozite. Ca exemplu, luați în considerare un criteriu obținut prin combinarea criteriilor Bayes-Laplace și minimax (criteriul BL(MM)).

    Regula de selecție pentru acest criteriu este formulată după cum urmează:

    matrice de decizie ||e ij || adăugat cu încă trei coloane. În primul dintre ele sunt scrise așteptările matematice ale fiecărui rând, în al doilea - diferența dintre valoarea de referință

    e i 0 j 0 = max i (max j (e ij))

    și cea mai mică valoare

    linia corespunzătoare. A treia coloană conține diferențele dintre cea mai mare valoare

    fiecare rând și cea mai mare valoare max j (e i 0 j) a rândului care conține valoarea e i 0 j 0 . Sunt selectate acele opțiuni, ale căror rânduri (sub rezerva următoarelor rapoarte între elementele coloanei a doua și a treia) oferă cea mai mare așteptare matematică. Și anume, valoarea corespunzătoare

    e i 0 j 0 - max j (e ij)

    din a doua coloană trebuie să fie egal sau egal cu un nivel de risc prestabilit E add. Valoarea din a treia coloană trebuie să fie mai mare decât valoarea din a doua coloană.

    Aplicarea acestui criteriu se datorează următoarelor trăsături ale situației în care se ia decizia:

    1. probabilitățile de apariție a stărilor F j sunt necunoscute, dar există unele informații a priori în favoarea unei distribuții particulare;
    2. este necesar să se ia în considerare apariția diferitelor stări, atât individual, cât și în combinație;
    3. risc limitat permis;
    4. decizia luată este pusă în aplicare o dată sau în mod repetat.

    Criteriul BL(MM) este potrivit pentru construirea de soluții practice, în primul rând în domeniul tehnologiei, și poate fi considerat destul de fiabil. Cu toate acestea, limitele de risc date E adaugă și, în consecință, estimările de risc E i nu iau în considerare nici numărul de aplicare a soluției, nici alte informații similare. Influența factorului subiectiv, deși slăbit, nu este complet exclusă.

    max j (e ij)-max j (e i 0 j)≥E i

    esențial în acele cazuri în care soluția este implementată o singură dată sau de un număr mic de ori. În aceste condiții, nu este suficient să se concentreze asupra riscului asociat doar condițiilor externe nefavorabile și valorilor medii. Din această cauză, totuși, puteți suferi unele pierderi în stări exterioare de succes. Cu un număr mare de implementări, această condiție încetează să mai fie atât de importantă. Permite chiar și alternative rezonabile. Cu toate acestea, nu există indicații cantitative clare în care cazuri ar trebui omisă această condiție.

    5. Criteriul lucrărilor.

    max i (e ir):= max i (∏e ij)

    Regula de selecție în acest caz este formulată după cum urmează:

    Matricea deciziei ||e ij || este completată cu o nouă coloană care conține produsele tuturor rezultatelor fiecărui rând. Sunt selectate acele opțiuni, în rândurile cărora sunt cele mai mari valori această coloană.

    Aplicarea acestui criteriu se datorează următoarelor circumstanțe:

    1. probabilitățile de apariție a stării F j sunt necunoscute;
    2. cu apariția fiecăreia dintre stările F j separat trebuie luate în considerare;
    3. criteriul este aplicabil și pentru un număr mic de implementări ale soluției;
    4. este permis un anumit risc.

    Criteriul produsului este adaptat în primul rând pentru cazurile în care toate e ij sunt pozitive. Dacă condiția de pozitivitate este încălcată, atunci ar trebui efectuată o schimbare e ij +a cu o constantă a>|min ij (e ij)|. Rezultatul va depinde în mod natural de a. În practică, cel mai adesea

    a:= |min ij (e ij)|+1.

    Dacă nicio constantă nu poate fi recunoscută ca semnificativă, atunci criteriul produselor nu este aplicabil.

    Exemplu.

    Luați în considerare același exemplu ca înainte (vezi mai sus).

    Construcția soluției optime pentru matricea deciziilor despre verificări după criteriul Hurwitz are forma (la С=0, în 10 3):

    ||e ij || С⋅min j (e ij) (1-С)⋅max j (e ij) e ir max i (e ir)
    -20,0 -22,0 -25,0 -12,5 -10.0 -22,5
    -14,0 -23.0 -31.0 -15,5 -7.0 -22,5
    0 -24.0 -40.0 -20.0 0 -20.0 -20.0

    În acest exemplu, soluția are un punct de cotitură în raport cu factorul de greutate C: până la C = 0,57, E 3 este selectat ca fiind optim, iar la valori mari, E 1 .

    Aplicarea testului Hodge-Lehman (q=0,33, v=0, la 103):

    ∑e ij ⋅q j minj(eij) v⋅∑e ij ⋅q j (1-v)⋅∑e ij ⋅q j e ir max i (e ir)
    -22,33 -25,0 -11,17 -12,5 -23,67 -23,67
    -22,67 -31,0 -11,34 -15,5 -26,84
    -21,33 -40,0 -10,67 -20,0 -30,76

    Testul Hodge-Lehman recomandă opțiunea E 1 (verificare completă) - la fel ca și testul MM. Modificarea variantei recomandate are loc doar la v=0,94. Prin urmare, distribuția uniformă a stărilor mașinii luate în considerare trebuie recunoscută cu o probabilitate foarte mare, astfel încât să poată fi aleasă de o așteptare matematică mai mare. Numărul de implementări ale soluției rămâne întotdeauna arbitrar.

    Criteriul Germeier la q j = 0,33 dă următorul rezultat (în 10 3):

    ||e ij || ||e ij q j || e ir = min j (e ij q j) max i (e ir)
    -20,0 -22,0 -25,0 -6,67 -7,33 -8,33 -8,33 -8,33
    -14,0 -23,0 -31,.0 -4,67 -7,67 -10,33 -10,33
    0 -24,0 -40,0 0 -8,0 -13,33 -13,33

    Opțiunea E 1 este aleasă ca cea optimă. Compararea variantelor folosind valoarea lui e ir arată că modul în care funcționează testul Germeier este chiar mai flexibil decât cel al testului MM.

    În tabelul de mai jos, soluția este selectată în conformitate cu criteriul BL(MM) cu q 1 =q 2 =q 3 = 1/2 (date în 10 3).

    ||e ij || ∑e ij q j e i 0 j 0 - min j (e ij) max j (e ij) max j (e ij) - max j (e i 0 j)
    -20,0 -22,0 -25,0 -23,33 0 -20,0 0
    -14,0 -23,0 -31,0 -22,67 +6,0 -14,0 +6,0
    0 -24,0 -40,0 -21,33 +15,0 0 +20,0

    Opțiunea E 3 (refuzul verificării) este acceptată de acest criteriu numai atunci când riscul se apropie de E posibil = 15⋅10 3 . În caz contrar, E 1 este optim. În multe sarcini tehnice și economice, riscul tolerabil este mult mai mic, de obicei doar un mic procent din costurile totale. În astfel de cazuri, este deosebit de valoros dacă valoarea inexactă a distribuției de probabilitate nu afectează foarte mult. Dacă, în același timp, se dovedește imposibil să se stabilească în prealabil riscul tolerabil E suplimentar, indiferent de decizia luată, atunci calculul riscului așteptat E posibil poate ajuta. Atunci devine posibil să se analizeze dacă un astfel de risc este justificat. O astfel de cercetare este de obicei oferită mai ușor.

    Rezultatele aplicării criteriului de produs pentru a = 41⋅10 3 și a = 200⋅10 3 sunt:

    A ||eij + a|| e ir = ∏ j e ij max i e ir
    41 +21 +19 +16 6384 6384
    +27 +18 +10 4860
    +41 +17 +1 697
    200 +180 +178 +175 5607
    +186 +177 +169 5563
    +200 +176 +160 5632 5632

    Condiția e ij > 0 nu este fezabilă pentru această matrice. Prin urmare, elementelor matricei se adaugă (în funcție de arbitrariul extern) mai întâi a = 41⋅10 3 , iar apoi a = 200⋅10 3 .

    Pentru а = 41⋅10 3 varianta Е 1 este optimă, iar pentru а = 200⋅10 3 — varianta Е 3 , astfel încât dependența variantei optime de a este evidentă.



    eroare: Conținutul este protejat!!