TEORÍA DE JUEGOS ¿Cómo Có jjugar?? ¿Estrategias puras o mixtas? Parte I

J g de Juegos d suma cero Bart y Lisa aplican p maximin:

L1 = 0 L2 = 1 L3 = 2 B1 = 0 B2 = 1 B3 = 2

−5 2 3

2 3 3

−5 −5 2

B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2 i ⎝ j ⎠ L * = min max (π ij ) = min (3,3, 2 ) = 2 j

(

i

)

J g de Juegos d suma cero Bart y Lisa aplican p maximin:

Solución estrategias puras: B*=B3, L*=L3, Л=2 Punto de Silla :

(

max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij ) j i ⎝ j i ⎠

)

J g de Juegos d suma constante t t y Punto de silla: condición necesaria y suficiente

para encontrar equilibrio en estrategias puras

⎧⎪π io , j ≥ π io , jo ∀j = 1K m ∃io , jo / ⎨ ⎪⎩π i , jo ≤ π io , jo ∀i = 1K n

Punto de silla

¿Y si no hay un punto de silla? Lisa

Papel

Tijeras

Piedra

Papel

0,0

-1,1 1,1

1,-1 1, 1

Tijeras

1,-1 1, 1

0,0

-1,1 1,1

Piedra

-1,1 1,1

1,-1 1, 1

0,0

Bart

Definiciones y y y

Estrategia mixta: jugada con una probabilidad p E t t i pura: Estrategia jugada con una probabilidad p=1 Distribución de probabilidad subjetiva: un jugador cree que el otro elegirá la estrategia k con probabilidad лk,

¿Y si no hay un punto de silla? Estrategia mixta: y Distribución de p probabilidad asociada con el conjunto j de estrategias puras de un jugador. P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1; i

pi es la probabilidad de jugar la estrategia Ai

Estrategias mixtas y Juego bipersonal y B jjuega g Bi con p probabilidad pi ((P)) y L juega Lj con probabilidad qj (Q)

Def. Valor esperado del juego:

(

)

E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j j

i

i

j

p, q son probabilidades subjetivas

Piedra, papel Piedra, papel,, tijeras tijeras:: deja que adivine… adivine… Pb(rock)=1

"Good ol' rock. Nuthin' beats that!"

TEORÍA DE JUEGOS ¿Cómo Có jjugar?? Parte II

Ejemplo: cara / cruz Fila y Columna escriben cara o cruz en un papel y Si escriben ib llo mismo, i Columna C l lle paga 1 a Fila Fil y Si escriben algo diferente, Fila le paga 1 a Columna y

Ejemplo: cara / cruz Estrategia mixta: y Fila juega cara con probabilidad 2/3 y Columna juega cruz cru ¿Cuál es el valor esperado d ddell juego dde Fila?

Columna Cara

Cruz

Cara

1,-1

-1,1

Cruz

-1,1

1,-1

Fil Fila

Teorema Minimax (I) y En un juego bipersonal de suma constante, el valor

p del juego j g tiene siempre, p , al menos un esperado punto de silla:

(

)

max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*) Q P ⎝ Q P ⎠

Todo juego bipersonal de suma constante tiene solución

Equilibrio en estrategias mixtas Teorema: y En un juego bipersonal de suma constante, El valor esperado del juego tiene siempre, al menos un punto de silla:

(

)

max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*) Q P ⎝ Q P ⎠ Todo juego bipersonal de suma constante tiene solución

Juegos y Cooperativos: y Coalición y Negociación de las reglas del juego y Coordinación y Amenazas y promesas confiables y No cooperativos: y N personas actúan independientemente y No hay coaliciones posibles y Acciones racionales

Solución ó juegos no cooperativos y Minimax y Todo juego bipersonal de suma cero tiene una estrategia mixta

óptima p para p cada jugador j g y Espera lo mejor, prepárate para lo peor y Equilibrio de Nash y Solución a una clase más amplia de juegos no cooperativos y Muestra que puede haber más de una solución y La extiende a un número finito de jugadores

¿Cómo jugar? jugar? ¿Cuál es la solución del juego? juego? y Minimax y Equilibrio de Nash y Equilibrio en estrategias dominantes y Eliminación de estrategias dominadas y Inducción hacia atrás

¿Qué é es un equilibrio? Columna Cara

Cruz

Cara

2,1

0,0

Cruz

0,0

1,2

Fila

Juego bipersonal, bipersonal, no cooperativo Definiciones: F: conjunto de estrategias mixtas de Fila pf = probabilidad de jugar la estrategia f Є F C: conjunto de estrategias mixtas de Columna pc = probabilidad de jugar la estrategia c Є C Objetivo: Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye un equilibrio

S l ió Solución

pf

pc

y Función F ió pagos Fil Fila: uf(f,c) (f )

y Лc , Лf,f son las probabilidades subjetivas

que f y c tienen sobre las decisiones del otro y pf,pc: estrategias t t i mixtas i t y pfЛc: probabilidad –desde desde el punto de vista de f- de que se juegue la estrategia (f,c)

S l ió Solución y Fila escoge la distribución de probabilidad (pf)

que maximiza el valor esperado de sus pagos:

E[pagosf] = ∑f∑cpfЛcuf(f,c) (f c) y Columna busca maximizar: E[pagosc] = ∑f∑cpcЛfuc(f,c)

Equilibrio de Nash Equilibrio de Nash: El equilibrio de Nash consiste en las conjeturas sobre la probabilidad de ocurrencia de las estrategias (Лc ,Л Лf, ) y la probabilidad de que dichas estrategias sean elegidas (pf, pc), tal que: 1 1. L conjeturas Las j t son correctas: t pf = Лf, pc = Лc; y 2. Cada jugador escoge (pf) y (pc) de forma que maximiza su utilidad esperada, dadas sus conjeturas.

E ilib i d Equilibrio de N Nash h Estrategias puras Un equilibrio de Nash en estrategias puras es un par (f*, (f , cc*)) tal que

uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y uc(f*, (f* c*) *) ≥ uc(f*,c) (f* ) para cada d estrategia t t i c dde C C.

¿Cuál es el equilibrio de Nash en estrategias puras? Columna Cara

Cruz

Cara

20,80

70,30

Cruz

90,10

30,70

Fila

Teorema Existencia (Nash) y Suponga que un juego tiene un número finito de estrategias

para cada jugador. Entonces existe al menos un equilibrio de Nash as en e estrategias est ateg as mixtas tas

¿Cuál es la estrategia mixta de equilibrio? Columna Cara

Cruz

Cara

20,80

70,30

Cruz

90,10

30,70

Fila

Equilibrio en estrategias mixtas Columna c

s

c

20,80

70,30

s

90,10

30,70

Fila

Estrategias E i Fila: Cara, pc; Sello, ps Columna: Cara, Лc; Sello Лs

E[ pagos fila ] = ∑∑ prπ c u (r , c) r

c

E[ pagos fila fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30) E[ pagoscol ] = ∑∑ prπ c u (r , c) r

c

E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)

Planteamiento del problema fila : max pc (π c * 20 + π s * 70) + ps (π c * 90 + π s * 30) s.t pc + p s = 1 pc , p s ≥ 0 columna : max π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70) s.t

πc +πs =1 π c ,π s ≥ 0

Planteamiento del problema (II) fila : fil max [ pc (π c * 20 + π s * 70)

columna : max [π c ( pc * 80 + ps *10)

+ ps (π c * 90 + π s * 30)]

+ π s ( pc * 30 + ps * 70)]

s.t p s = 1 − pc

π s = 1− π c

[ pc (π c * 20 + π s * 70)} + (1 − pc )(π c * 90 + π s * 30)] ∂u ∂π ≤ 0, =0 ∂pc ∂pc − 70π c + 40π s ≤ 0

s.t max [π c ( pc * 80 + ps *10) + (1 − π c )( pc * 30 + ps * 70)] ∂u ∂p ≤ 0, =0 ∂π c ∂π c 50 pc − 60 ps ≤ 0

Función de reacción (Mejor respuesta) Лs Mejor respuesta de fila a cualquier l i estrategia t t i d de columna -70Л c+40Л s=0

fila : − 70π c + 40π s = 0

πc,π s ≥ 0 πc + πs = 1

7/11

4/11

Лc Л c+ Л s=1

Equilibrio en estrategias mixtas ps Mejor respuesta de columna l a cualquier l i estrategia de fila

50p c-60p s=0

columna : 50 pc − 60 ps = 0

5/11

pc + p s = 1 pc , p s ≥ 0

6/11

pc p c+ p s=1

Equilibrio de Nash Columna

Л c=4/11

cara

cruz

cara

20,80

70,30

cruz

90,10

30,70

p c=6/11

Fila

Batalla de los sexos: sexos: ¿Cuántos equilibrios de Nash hay? Ananías misa

fútbol

misa

4,1

0,0

fútbol

00 0,0

14 1,4

Tola

El dilema del prisionero II y Wally y Dilbert son compañeros de trabajo y Cada uno debe evaluar el desempeño del otro y La calificación determinará un aumento de sueldo y El aumento será mayor si el propio desempeño es superior al del otro

Dilbert

Wally

El dilema del prisionero II Dilbert Wally

“Rat out” (denigrar)

Alabar

“Rat out” (denigrar)

0,0

5,-1

Alabar

-1,5

1,1

Solución ó por dominación ó y Definiciones: y Estrategia dominante y Estrategia débilmente dominante y Estrategia dominada

y Eliminación iterada de estrategias dominadas

Dominación ó y ss’i domina estrictamente a si si y solo sí:

ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i z

s*i domina débilmente a si si y solo sí: u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ) ∀ s− i ∈ S −i y u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i

Dominación ó estricta y s’i es una estrategia estrictamente dominante

ppara el jjugador g i si:

ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i

s’i es superior a todas las otras estrategias de i

E t t gi estrictamente Estrategia ti t t dominante d i t Dilbert W ll Wally

“Rat out” (denigrar)

Alabar

“Rat Rat out” out (denigrar)

0,0

5,-1

Alabar

-1,5

1,1

Solución: {Rat-out, Rat-out}

Equilibrio y estrategias dominantes y Dilema del prisionero II: y Rat-Out estrictamente dominante para Wally y Dilbert y {Rat-out, Rat-out} es el equilibrio y El equilibrio q en estrategias g dominantes es el equilibrio q de Nash

El dilema del prisionero II

Dominación ó débil é y s’i es una estrategia débilmente dominante para el jugador i si

s’i domina débilmente a todas las otras estrategias de i

z

s*i domina débilmente a si si y solo sí: u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ∀ s − i ∈ S − i y u i ( s *i , s −i ) > u i ( si , s −i )∃ s − i ∈ S −i

Ejemplo: estrategia débilmente dominante 2 1

Arriba

Izquierda

Derecha

7,3

5,3

Solución: {Arriba, Izquierda} Abajo

7,0

3,-1

Estrategias dominantes y Las estrategias dominantes definen la solución del juego y Racionalidad: y Los jugadores prefieren las estrategias dominantes, dominantes si existen

M h jjuegos no ti Muchos tienen estrategias t t i dominantes

Dominación ó Et t i d Estrategia dominada: i d s**i es dominada d i d por s’i si: i

ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ), ) ∀si ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ) ∃sˆ−i Estrategia no dominada s*i es no dominada si no existe s’i tal que:

ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i

Solución ó por dominación ó y Estrategias no dominadas preferibles a las dominadas y Un jugador racional no juega estrategias dominadas y Un U jugador j d racional i l no espera que los l otros t jjuegen

estrategias dominadas

Elimine estrategias indeseables

Ejemplo: eliminación iterativa de Ejemplo: estrategias dominadas Columna

Izquierda

Derecha

Arriba

11 1,1

01 0,1

Medio

0,2

1,0

Abajo

0,-1

0,0

Fila

Problemas de la eliminación iterativa de estrategias dominadas y Capas de racionalidad y Una estrategia se vuelve dominada en la ronda de eliminación

# #15? y El orden de eliminación importa y Estrategias débilmente dominantes

y Múltiples resultados y Estrategias débilmente dominantes

y No existencia de estrategias dominadas

Ejemplo: eliminación iterativa de estrategias dominadas Columna

Izquierda

Centro

Derecha

Arriba

4,5

1,6

5,6

Medio

3,5

2,5

5,4

Abajo j

2,5 ,

2,0 ,

7,0 ,

Fil Fila

Ejemplo: eliminación iterativa de Ejemplo: estrategias dominadas Columna

Izquierda

Centro

Mala

Arriba

1,-1

-1,1

0,-2

Medio

-1,1

1,-1

0,-2

Mala

-2,0 ,

-2,0 ,

-2,-2 ,

Fil Fila

¿Cuál es la estrategia dominante? dominante? Columna C Cara

S ll Sello

Cara

1,-1

-1,1

Sello

-1,1

1,-1

Fila

¿Porqué podemos determinar las estrategias dominadas usando únicamente los pagos?

Competencia a la Bertrand y Dos firmas en un mercado pueden cargar precios alto, alto

medio, bajo y Si cargan el mismo precio precio, comparten el mercado equitativamente y Quien cargue el menor precio, precio gana todo el mercado

Competencia a la Bertrand Firma 2

Alto

Medio

Bajo

Alto o

6,6

0,10 0, 0

0,8

Medio

10,0

5,5

0,8

Bajo

8,0

8,0

4,4

Firma 1