TEORIA GIER - semestr zimowy 2011 Przykładowe rozwiązania

4. Gracz I, mąż, wychodzi pod wieczór z domu mówiąc, że idzie jeszcze popracować. W rzeczywistości dopiero zdecyduje, czy naprawdę pójdzie do pracy, czy spotka się z inną kobietą. Gracz II, żona, domyśla się tego i musi zdecydować, czy wysłać w ślad za mężem detektywa. Jeśli tego nie zrobi, nie dowie się niczego nowego i jej użyteczność wyniesie 0. Jeśli detektyw wyśledzi męża na spotkaniu z inną, użyteczność męża wyniesie −10, a żony 8. Jeśli mąż spotka się z inną, a żona nie dowie się o tym, użyteczność męża wyniesie 5. Użyteczność męża z pójścia do pracy wynosi p, przy czym 0 < p < 5. Za wynajęcie detektywa trzeba zapłacić c jednostek użyteczności. Detektyw jest lojalny wobec zleceniodawcy i na tyle sprawny, że mąż go nie ”zgubi”. (a) Podać postać ekstensywną i normalną dwóch wersji tej gry: pierwszej z niepełną informacją i drugiej z pełną (w której mąż jest w stanie stwierdzić, czy detektyw go śledzi). (b) Przyjmując p = c = 2 wyznaczyć równowagi obu gier i podać wypłaty obu graczy w tych równowagach. (c) Jak droga musiałaby być praca detektywa, by gra z niepełną informacją miała równowagę w czystych strategiach?

5. Dwie firmy A i B konkurujące na pewnym rynku podejmują jednocześnie i niezależnie od siebie decyzję, czy rozpocząć kampanię negatywnej reklamy skierowanej przeciw konkurentowi. Obecnie każda z firm osiąga ze sprzedaży na tym rynku 10 i tak też pozostanie, jeżeli nikt nie zdecyduje się na rozpoczęcie kampanii. Prowadzenie kampanii kosztuje 15. Jeśli obie firmy prowadzą kampanię, podział rynku i dochody ze sprzedaży nie zmieniają się. Jeśli kampanię prowadzi tylko jedna firma, to jej konkurent zostaje wyeliminowany z rynku, a dochód ze sprzedaży produktu firmy, która pozostaje na rynku, wzrasta o 20 w przypadku firmy A i o r > 20 w przypadku firmy B . (a) Podać postać normalną i ekstensywną tej gry i wyznaczyć wszystkie jej równowagi Nasha. (b) Oznaczmy przez p(r) prawdopodobieństwo wyeliminowania z rynku firmy A w równowadze w strategiach mieszanych. Czy p jest rosnącą, czy malejącą funkcją zmiennej r? (c) Podać postać normalną i ekstensywną wersji tej gry z pełną informacją, w której firma A podejmuje decyzję jako pierwsza, a B decyduje znając już wybór konkurenta. (d) Czy w grze z pełną informacją korzystniej dla gracza jest decydować jako pierwszy, czy jako drugi? Uzasadnić odpowiedź.

Rozwiązanie – 4 (a) W obu wersjach gry żona ma dwie strategie: wynająć detektywa (D) lub nie (ND). Mąż w wersji z niepełną informacją też ma 2 strategie: pójść do pracy (Pr) lub do innej (In), a w wersji z pełną informacją 4: Pr, In i dwie strategie ”warunkowe”: (D → Pr, ND → In) oraz (D → In, ND → Pr). Pr In −c ; p 8 − c ; 10 Postać normalna przy niepełnej informacji: Ż D ND 0;p 0;5

przy pełnej :

Ż D ND

Pr −c; p 0;p

In D → Pr, ND → In 8 − c ; −10 −c ; 5 0;5 0;5

D → In, ND → Pr 8 − c ; −10 0;p

Postać ekstensywna: Ż jako pierwsza wybiera między D a ND, następnie M wybiera między Pr a In. W wersji z niepełną informacją oba jego wierzchołki decyzyjne są w jednym zbiorze informacyjnym. Oczywiście, jak w każdym takim zadaniu, trzeba porządnie narysować drzewo, podać wypłaty, etykiety wierzchołków i łuków i zaznaczyć ew. zbiory informacyjne. (b) Z postaci normalnej gry z niepełną informacją widać od razu, że jeżeli c < 8, to żadna para czystych strategii nie jest równowagą (co od razu jest odpowiedzią na (c)). Jeśli c ­ 8, to ND jest dominującą strategią żony i jest w równowadze z najlepszą odpowiedzią męża na ND, czyli strategią In. Równowaga w strategiach mieszanych przy c < 8: Ż wynajmuje detektywa z prawdopodobieństwem xD , M idzie do innej z prawdopodobieństwem yIn gdzie yIn jest tą wielkością, przy której Ż jest indyferentna między wyborem D a ND – rozwiązaniem równania 8yIn − c = 0 ; yIn = 8c , yP r = 1 − 8c ; xD jest tą wielkością, przy której M jest indyferentny między wyborem Pr a In – rozwiązaniem równania −10xD + 5(1 − xD ) = p ; xD = 5−p , xN D = p+10 ; 15 15 1 4 dla p = 2 mamy xD = 5 , xN D = 5 . Wypłaty w tej równowadze: Ż 0 , M p (można darować sobie ich obliczanie, bo wiadomo, że muszą być równe (jednakowym) wypłatom każdej ze strategii czystych przeciw tym mieszanym strategiom równowagi). W grze z pełną informacją indukcja wstecz wyznacza jedyną równowagę doskonałą: (ND , (D → In, ND → Pr)) – strategia męża w tej równowadze słabo dominuje każdą inną. Przy c < 8 nie ma innych równowag z tego samego powodu co w grze z niepełną informacją.

Rozwiązanie – 5 (a) Postać normalna:

A RN Nie

RN Nie –5 ; –5 15 ; 0 0 ; r − 5 10 ; 10

(RN – reklama negatywna).

Równowagi : (1) A prowadzi kampanię, B nie prowadzi z wypłatami A 15 , B 0 (2) A nie prowadzi kampanii , B prowadzi z wypłatami A 0 , B r − 5 (3) w strategiach mieszanych: A : prowadzi kampanię z prawdopodobieństwem a, B prowadzi kampanię z prawdopodobieństwem b gdzie a jest tą wielkością, przy której B jest indyferentny między prowadzeniem kampanii a nie – rozwiązaniem równania −5a + (r − 5)(1 − a) = 0a + 10(1 − a) ; r−15 a = r−10 ; b jest tą wielkością, przy której A jest indyferentny między prowadzeniem kampanii a nie – rozwiązaniem równania −5b + 15(1 − b) = 0b + 10(1 − b) ; b = 12 ; 50 wypłaty w tej równowadze: A 5 , B r−10 (najłatwiej je wyliczyć biorąc wypłaty strategii czystych przeciw mieszanej str. równowagi) Postać ekstensywna – kolejno A i B wybierają akcje RN bądź Nie, drugi wybierający gracz ma niepełną informację – oba jego wierzchołki decyzyjne są w jednym zbiorze informacyjnym. (b) p(r) jest prawdopodobieństwem,   że B poprowadzi kampanię informacyjną, a A 1 r−15 5 nie, a zatem p(r) = 2 · 1 − r−10 = 2(r−10) – maleje przy rosnącym r. (c) Gracz B ma teraz 4 strategie, a postać ekstensywna różni się od tej z (a) tym, że usunięto 2elementowy zbiór informacyjny. RN Nie To samo co A Inaczej niż A –5 ; –5 15 ; 0 -5 ; -5 15 ; 0 Postać normalna: A RN Nie 0 ; r − 5 10 ; 10 10 ; 10 0 ; r−5 (Strategia ”to samo co A” gracza B jest zdominowana, a ”inaczej niż A” słabo dominująca. W jedynej równowadze doskonałej A gra RN, a B gra ”inaczej niż A”). (d) W jedynej równowadze doskonałej gry z pełną informacją gracz wybierający jako pierwszy ma wyższą wypłatę niż wybierający jako drugi.

16. Gracz 1, napastnik, strzela karnego graczowi 2, bramkarzowi, i ma do wyboru 2 strategie: strzelać w lewy róg (bramki, widziany od strony boiska) lub w prawy. Bramkarz ma do wyboru 3 strategie: rzucić się w lewy róg (jak wyżej), rzucić się w prawy róg lub zaczekać na to, gdzie strzeli gracz 1. Napastnik na pewno trafi tam gdzie chce i wobec tego na pewno strzeli bramkę, gdy bramkarz rzuci się w przeciwny róg. Jeśli bramkarz od razu rzuci się w ten róg, w który strzela napastnik, obroni karnego z prawdopodobieństwem 0,4 przy strzale w lewy róg, a z prawdopodobieństwem 0,3 przy strzale w prawy róg. Jeżeli zaczeka, obroni strzał w każdy z rogów z prawdopodobieństwem o 0,1 mniejszym, niż gdyby od razu rzucił się w dany róg. (a) Podać macierz otrzymanej w tej sytuacji gry o sumie zerowej, w którą wypłatą gracza 1 jest prawdopodobieństwo strzelenia bramki. (b) Wyznaczyć wartość tej gry i strategie optymalne obu graczy. (c) Czy i ewentualnie jak zmieni się odpowiedź na pytanie (b), gdy gracz 1 ma dodatkowo trzecią strategię strzelania w środek bramki? (Bramkarz na pewno obroni taki strzał, gdy zaczeka, a na pewno nie obroni, gdy rzuci się w któryś z rogów). Uzasadnić odpowiedź. Roziwązanie (a) Przy ponumerowaniu strategii: gracza 1 : 1. L (strzela w lewy), 2. P (strzela w prawy) gracza 2 : 1. L (rzuca się w lewy), 2. P (rzuca się w prawy) 3. Cz (czeka) " # 0, 6 1 0, 7 macierzą wypłat gracza 1 jest . 1 0, 7 0, 8 (b) Gra oczywiście nie ma równowagi w strategiach czystych, a ponieważ jeden z graczy ma więcej niż 2 strategie, najprostszy algorytm szukania równowag dla gier 2 × 2 nie zadziała. Znajdziemy strategię optymalną gracza 1 – wiemy z teorii, że w grach o sumie zerowej (bądź stałej) jest to strategia równowagi. a więc maksymalizująca (w takich grach) wypłatę gracza 1 przeciw najlepszej odpowiedzi gracza 2. Gracz 1 rozwiązuje więc (przy oznaczeniu x = xL , 1 − x = xP ) problem max min(u1 ((x, 1 − x), L), u1 ((x, 1 − x), P), u1 ((x, 1 − x), Cz)) =

x∈[0,1]

max min(1 − 0, 4x , 0, 7 + 0, 3x , 0, 8 − 0, 1x)

.

x∈[0,1]

Można wyliczyć (a prościej: narysować) te obszary x, w których minimum w nawiasie jest realizowane przez pierwszą, drugą lub trzecią funkcję – czyli strategie bramkarza. Rozwiązaniem jest x = 0, 25 ; wówczas "

u1 (x, P) = u1 (x, Cz) = [0, 25 0, 75] · "

u1 (x, L) = [0, 25 0, 75] ·

1 0, 7

#

0, 6 1

#

"

= [0, 25 0, 75] ·

0, 7 0, 8

#

= 0, 775 ,

= 0, 9 .

Optymalną strategią napastnika (x) jest więc strzał w lewy róg z prawdopodobieństwem 0,25, a w prawy z prawd. 0,75. Wartość gry wynosi 0,775.

Ponieważ najlepszymi odpowiedziami bramkarza na x są P i Cz, a L nie jest, strategia optymalna bramkarza jest tą strategią mieszaną używającą wyłącznie P i Cz , przy której napastnik jest indyferentny między strzałem w lewy a prawy róg bramki. Rozwiązaniem jest y L = 0 , y P = 0, 25 , y Cz = 0, 75. (Lub równoważnie: najbezpieczniejsza strategia bramkarza, przy czym wystarczy szukać wśród tych z yL = 0)., (c) Przeciw ”starej” strategii optymalnej bramkarza, y , ta dodatkowa strategia daje napastnikowi oczekiwaną wypłatę 0,25, a więc nie obniża poziomu bezpieczeństwa bramkarza. Strategia optymalna bramkarza pozostaje bez zmian, a wobec tego strategia optymalna napastnika (jego najlepsza odpowiedź na y) i wartość gry też się nie zmienią.

12. W trzyosobowej grze ”konformiści” gracze równocześnie podnoszą rękę. Jeśli wszyscy podniosą lewą lub wszyscy prawą, każdy otrzymuje wypłatę 0. Jeśli jeden z graczy podniesie inną rękę niż dwaj pozostali – np. jako jedyny podniesie lewą – to płaci po 1 zł obu pozostałym graczom. (a) Podać poziomy bezpieczeństwa wszystkich strategii czystych i mieszanych gracza 1. Jaka strategia jest najbezpieczniejsza? Czy układ, w którym wszyscy gracze używają swoich najbezpieczniejszych strategii, jest równowagą Nasha? (b) Znaleźć równowagę Nasha, w której gracze nie grają swoich najbezpieczniejszych strategii. Roziwązanie (a) Każdy z graczy ma dwie strategie czyste, L i P. Poziom bezpieczeństwa strategii to jej wypłata w najgorszym możliwym przypadku – czyli wtedy, gdy obaj pozostali gracze zagrają drugą strategię czystą, czyli −2. Formalnie, poziom bezpieczeństwa dowolnej strategii x = (xL , xP ) gracza np. 1 (czystej lub mieszanej) to β(x) = min(u1 (x, L, L), u1 (x, L, P ), u1 (x, P, L), u1 (x, P, P )) czyli min(u1 (x, L, L), u1 (x, P, P )), bo u1 (x, L, P ), u1 (x, P, L) = 1 – gdy dwaj gracze grają różne strategie czyste, trzeci zawsze wygrywa. Zaś u1 (x, L, L) = 0xL − 2xP

,

u1 (x, P, P ) = −2xL + 0xP ,

a więc najbezpieczniejsza jest strategia maksymalizująca min(−2xL , −2xP ) – xL = xP = 0, 5. (b) Wszyscy grają tę samą strategię czystą.

12. Trzy siostry dzielą między siebie trzy odziedziczone obiekty: mieszkanie, jacht i cenny obraz. Uzgodniono następującą procedurę podziału: najmłodsza siostra oznajmia, z którego obiektu rezygnuje, najstarsza zgodnie z tym przydziela jej jeden z dwóch innych obiektów, a na koniec spośród dwóch, których nie dostała najmłodsza, jeden wybiera dla siebie średnia siostra. Ostatni z obiektów zostaje dla najstarszej siostry. Każda z sióstr kieruje się tylko swą preferencją co do przypadającego jej dobra, nie interesując się tym, której przypadły inne obiekty. (a) Podać postać ekstensywną gry, w której wszystkie siostry najbardziej chciałyby dostać mieszkanie, ale najstarsza woli dostać jacht niż obraz, a obie pozostałe odwrotnie. (Można przyjąć dla każdego gracza wypłatę 2 za najbardziej preferowany obiekt, 1 za średni i 0 za najmniej preferowany). Znaleźć w tej grze dwie równowagi doskonałe, w których najmłodsza siostra rezygnuje z różnych obiektów. Która z tych dwóch jej strategii wydaje się Pani / Panu rozsądniejsza i dlaczego? (b) Pokazać, że gdy każda z sióstr najwyżej ceni sobie inny obiekt, to w równowadze doskonałej każda dostanie najbardziej preferowany. Opisać dokładnie strategie wszystkich trzech w tej równowadze.

Roziwązanie (a) Opis drzewa: Zaczyna najmnłodsza siostra (Mł), wybiera jedną z 3 akcji: RM (rezygnuje z mieszkania), RJ i RO. Następnie najstarsza (St) wybiera jedną z 2 możliwych akcji: po RM są to J → Mł (przydziela młodszej jacht) i O → Mł , po RJ M → Mł i O → Mł, a po RO są to J → Mł i M → Mł. Następnie średnia (Śr) wybiera dla siebie jeden z 2 dostępnych obiektów – np. po akcjach RM i O → Mł wybiera pomiędzy J a M. Na końcu tej ścieżki Mł dostaje obraz, Śr mieszkanie, a St jacht. Gra jest z pełną informacją. Oczywiście trzeba narysować całe drzewo, poetykietować wszystkie łuki i wypisać wypłaty (lub lepiej podział obiektów) w każdym wierzchołku końcowym. Trzeba także zaznaczyć akcje wybierane w trakcie indukcji wstecz. Analiza przy preferencjach z p. (a) : Śr zawsze wybierze mieszkanie jeśli jest dostępne, a jeśli nie – tj. jeśli St zagrała M → Mł – to obraz. Wiedząc to, St nigdy nie zagra J → Mł, bo wtedy po optymalnej reakcji Śr sama zostanie z obrazem. Jeśli natomiast Mł sama zrezygnuje z jachtu, RJ, to St będzie indyferentna między przydzieleniem jej mieszkania bądź obrazu, bo w obu przypadkach zostanie jej jacht. Mł spodziewa się zatem M jeśli zagra RO, O jeśli zagra RM, a jeśli zagra RJ, to M lub O w zależności od tego, co wtedy zdecyduje St. Jeśli spodziewa się, że St po RJ wynierze M → Mł , może zagrać RJ; jeśli spodziewa się O → Mł , powinna zagrać RO. Są więc 3 równowagi doskonałe w czystych strategiach: (1) Mł : RO , Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J → Mł a po RJ – O → Mł ; (2) Mł : RO , Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J → Mł a po RJ – M → Mł ;

(3) Mł : RJ , Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J → Mł a po RJ – M → Mł i w każdej z nich wynik (podział obiektów) jest taki sam. Wszystko to widać na drzewie gry w procesie indukcji wstecz. Dla Mł bezpieczniej jest zrezygnować z obrazu, bo wtedy w jedynej równowadze doskonałej podgry następującej po jej decyzji dostaje mieszkanie. Po RJ ryzykuje że spośród równowag doskonałych podgry może zostać rozegrana ta, w której dostanie obraz. (b) Załóżmy że najmłodsza siostra preferuje obraz, średnia mieszkanie, a najstarsza jacht. Wtedy: jeżeli Mł nie zagra RO, St zagra O → Mł bo wtedy gwarantuje sobie J (Śr wybierze mieszkanie). Zatem w każdej równowadze doskonałej St zagra O → Mł jeśli tylko może; jeżeli Mł zagra RO – HGW, ale w takim wypadku Mł nie dostanie obrazu który dostałaby rezygnując z czegokolwiek innego, Czyli RO nie jest najlepszą odpowiedzią Mł na jakiekolwiek strategie równowagi dosk. – a zatem nie trzeba dokładnie badać strategii równowagi w podgrze po RO. W każdej równowadze doskonałej Mł gra RM lub RJ, a St przydziela jej obraz i sama dostaje jacht.

13. Dwaj gracze targują się o podział sumy 19,99 zł. Pierwszą propozycję podziału składa gracz I. Jeśli gracz II ją odrzuci, to z sumy 19,99 ubywa 6 zł i gracz II składa propozycję podziału mniejszej sumy; jeśli ta z kolei zostanie odrzucona przez gracza I, to gra się kończy i obaj gracze dostają po 5,50 zł, a resztę zabiera arbiter. Przyjęcie którejkolwiek propozycji także kończy grę i wtedy następuje uzgodniony podział. Zakładamy, że legalne są tylko takie propozycje podziału, w których oferent otrzymuje całkowitą liczbę złotówek (czyli np. pierwsza propozycja gracza I musi być postaci: n zł 99 gr dla ciebie, 19 − n zł dla mnie). Gracze nie dyskontują wypłat. Narysować fragment drzewa tej gry z co najmniej jedną gałęzią każdej możliwej długości. Znaleźć jej równowagę doskonałą i podać pełny opis tworzących ją strategii oraz otrzymany podział.

Roziwązanie Opis drzewa: Zaczyna gracz I, wybiera jedną z 20 propozycji: (0 , 19,99) , ... , (19, 0,99). Każdą z nich II może zaakceptować albo odrzucić. Gdy zaakceptuje (k , 19 − k zł 99 gr), gra kończy się z tymi wypłatami, Gdy odrzuci, składa jedną z 14 kontrpropozycji: (0,99 , 13) , ... , (13,99 , 0). Jeśli I ją przyjmie, gra kończy się z tymi wypłatami; jeśli odrzuci, gra kończy się z wypłatami (5,50 , 5,50). Informacja jest pełna – nie ma nietrywialnych zbiorów informacyjnych. Oczywiście reprezentatywny fragment drzewa trzeba narysować, najlepiej istotny dla znajdowania równowagi. Trzeba też zaznaczyć akcje wybierane w trakcie indukcji wstecz. Analiza: Pierwszy etap indukcji wstecz: Jeśli gracz I odrzuci kontrprppozycję gracza II, otrzyma 5,50, a zatem odrzuci (0,99 , 13) , ... , (4,99 , 9) , a przyjmie (5,99 , 8) , ... , (13,99 , 0). Wiedząc to, II spodziewa się, że po odrzuceniu pierwszej propozycji gracza I otrzyma 8 – najwyższą z wypłat po optymalnej reakcji I. Wobec tego pójdzie na tę możliwość – tj. odrzuci propozycję I i sam zaproponuje (5,99 , 8) – jeśli I zaoferuje mu mniej niż 8. Tzn. odrzuci (19 , 0,99) , ... , (12 , 7,99) , a przyjmie (11, 8,99) , (0 , 19,99). Wiedząc to, I spodziewa się, że po odrzuceniu swej pierwszej propozycji otrzyma 5,99. Złoży więc najlepszą dla siebie ofertę spośród tych, które będą przyjęte i zarazam dadzą mu co najmniej 6. Jest nią oczywiście (11 , 8,99) . Równowaga doskonała: Gracz I proponuje (11 , 8,99), zgadza się na propozycje II dające mu co najmniej 5,99 i odrzuca pozostałe. Gracz II przyjmuje propozycje I wtedy i tylko wtedy, gdy proponuje mu się co najmniej 8,99, a po ew. odrzuceniu proponuje podział (5,99 , 8). Wypłaty w tej rówonowadze: : 11 zł dla I , 8,99 zł dla II. Przykład równowagi niedoskonałej: Każdy z graczy składa tylko propozycje (1,99 dla ciebie, reszta dla mnie), a przyjmuje tylko takie, w których oferuje mu się co najmniej 9,99 zł.