Notas sobre el teorema minimax

Notas sobre el teorema minimax Antonio Martin´on Abril de 2012 1 Teoremas minimax Sean X e Y dos conjuntos no vac´ıos y consideremos una funci´on f...
0 downloads 0 Views 51KB Size
Notas sobre el teorema minimax Antonio Martin´on Abril de 2012

1

Teoremas minimax

Sean X e Y dos conjuntos no vac´ıos y consideremos una funci´on f : X × Y −→ R . Se verifica sup inf f (x, y) ≤ inf sup f (x, y) ;

x∈X y∈Y

y∈Y x∈X

(1)

efectivamente, dado x ∈ X resulta claro que inf f (x, y) ≤ inf sup f (x, y) ,

y∈Y

y∈Y x∈X

de donde se obtiene inmediatamente la desigualdad (1). En general no vale la igualdad en (1), como queda claro si se toma X = Y = {0, 1} y f (x, y) = 0 si x ̸= y, f (x, y) = 1 si x = y, pues se obtiene sup inf f (x, y) = 0 < 1 = inf sup f (x, y) .

x∈X y∈Y

y∈Y x∈X

Los llamados teoremas minimax contemplan condiciones suficientes para que se verifique la igualdad en (1); es decir, para que se cumpla la igualdad minimax: sup inf f (x, y) = inf sup f (x, y) .

x∈X y∈Y

y∈Y x∈X

(2)

Se enuncia a continuaci´on la versi´on de Maurice Sion (1958). Teorema 1 Sean E y F espacios vectoriales topol´ ogicos de Hausdorff; X ⊂ E e Y ⊂ F conjuntos convexos, compactos y no vac´ıos; f : X × Y −→ R una funci´ on sup-semicontinua y casi-c´ oncava sobre X e inf-semicontinua y casi-convexa sobre Y . Entonces se verifica la igualdad minimax (2). Las nociones sobre continuidad y convexidad que figuran en el enunciado se introducen al final de estas notas.

1

2

Aplicaci´ on a la teor´ıa de juegos

Consideremos un juego de suma cero en el que intervienen dos jugadores, que denotaremos por A y B. El jugador A tiene el conjunto {a1 , ..., am } de estrategias puras o acciones y, an´alogamente, el jugador B posee las del conjunto {b1 , ..., bn }. Para cada par de acciones (ai , bj ) hay una utilidad (ganancia o p´erdida) A(ai , bj ) para el jugador A y otra B(ai , bj ) para el jugador B. Que se trata de un juego de suma cero significa que las ganancias de A son las p´erdidas de B, y rec´ıprocamente; es decir, se verifica (1 ≤ i ≤ m; 1 ≤ j ≤ n) .

A(ai , bj ) + B(ai , bj ) = 0

Ahora suponemos que el jugador A ejecutar´a la estrategia ai con probabilidad xi y que B realizar´a bj con probabilidad yj . Cada distribiuci´on de probabilidad x = (x1 , ..., xm ) es una estrategia mixta o estrategia aleatoria para A y, an´alogamente, cada distribuci´on y = (y1 , ..., yn ) lo es para B. Se verifica xi ≥ 0 (1 ≤ i ≤ m) ,

yj ≥ 0 (1 ≤ j ≤ n)

,

m ∑

xi =

i=1

n ∑

yj = 1 .

j=1

Para cada par de estrategias mixtas (x, y) se tiene la funci´ on de pagos de A: f (x, y) =

m ∑ n ∑

A(ai , bj )xi yj ,

i=1 j=1

que es bilineal en xi , yj . An´alogamente, la funci´ on de pagos de B viene dada por g(x, y) =

m ∑ n ∑

B(ai , bj )xi yj .

i=1 j=1

Se verifica f (x, y) + g(x, y) = 0 (para todo x, y) . Tenemos, por tanto la siguiente situaci´on: • X e Y son los simplex X=

{

x = (x1 , ..., xm ) : xi ≥ 0 (1 ≤ i ≤ m) ,  

Y =



m ∑

}

xi = 1

i=1

y = (y1 , ..., yn ) : yj ≥ 0 (1 ≤ j ≤ n) ,

n ∑ j=1

yj = 1

,

  

,

as´ı que X e Y son convexos, compactos y no vac´ıos. • La funci´on de pagos f : X × Y −→ R es continua, as´ı que es continua sobre X y sobre Y . Adem´as es bilineal, luego es lineal sobre X y sobre Y , por tanto es c´oncava sobre X y convexa sobre Y . • Se aplica el teorema de Sion y se obtiene la igualdad minimax (2), pero ahora es seguro que se alcanzan los supremos e ´ınfimos, y se escribe, por tanto, con m´aximos y m´ınimos: max min f (x, y) = min max f (x, y) . x∈X y∈Y

y∈Y x∈X

2

(3)

La igualdad minimax en este contexto significa que las estrategias que hacen que A maximice sus ganancias m´ınimas son las mismas que hacen que B minimice sus p´erdidas m´aximas. Observemos que de la igualdad minimax (3) resulta (

)

max min g(x, y) = max − max(−g(x, y)) = − min max f (x, y) = y∈Y x∈X

y∈Y

x∈X

y∈Y x∈X

(

)

= − max min f (x, y) = min − min(−g(x, y)) = min max g(x, y) , x∈X y∈Y

x∈X

y∈Y

x∈X y∈Y

que puede interpretarse diciendo que las estrategias que hacen que A maximice sus ganancias m´ınimas y B minimice sus p´erdidas m´aximas son las mismas que hacen que A minimice sus p´erdidas m´aximas y B maximice sus ganancias m´ınimas.

3

Puntos silla

Consideremos conjuntos no vac´ıos X e Y y una funci´on f : X × Y −→ R . Se dice que (x′ , y ′ ) ∈ X × Y es un punto silla de f si sup f (x′ , y) = f (x′ , y ′ ) = inf f (x, y ′ ) ; x∈X

y∈Y

observemos que es equivalente a sup f (x′ , y) = inf f (x, y ′ ) x∈X

y∈Y

y que realmente puede escribirse max f (x′ , y) = f (x′ , y ′ ) = min f (x, y ′ ) . y∈Y

x∈X

En otras palabras, (x′ , y ′ ) ∈ X × Y es un punto silla de f si se cumple f (x′ , y) ≤ f (x′ , y ′ ) ≤ f (x, y ′ )

(x ∈ X, y ∈ Y ) .

Algunos ejemplos y propiedades: • Ejemplo. Dada la funci´on f : R × R −→ R, definida por f (x, y) = −2x2 + y 2 − y + 2, se tiene que el punto (0, 1/2) es un punto silla de f . • Proposici´ on. Si f tiene un punto silla entonces se verifica la igualdad minimax (2), realmente la igualdad (3). Demostraci´ on. Sea (x′ , y ′ ) punto silla de f . Entonces inf sup f (x, y) ≤ sup f (x, y ′ ) ≤ f (x′ , y ′ ) ≤

y∈Y x∈X

x∈X

inf f (x′ , y) ≤ sup inf f (x, y) ≤ inf sup f (x, y) .

y∈Y

x∈X y∈Y

3

y∈Y x∈X

• Ejemplo. Puede ocurrir que (2) sea cierta y no haya punto silla, como en el siguiente ejemplo: f : {1}×]0, 1[−→ R, dada por f (x, y) = y, no tiene punto silla, aunque s´ı verifica la igualdad minimax (2). • Proposici´ on. Si se verifica la igualdad minimax (3), entonces hay punto silla. Demostraci´ on. Suponemos α := max min f (x, y) = min max f (x, y) . x∈X y∈Y

Sea

x′

y∈Y x∈X

∈ X tal que α = min f (x′ , y) . y∈Y

Existe y ′ ∈ Y que verifica α = min f (x′ , y) = f (x′ , y ′ ) ≤ f (x′ , y) (y ∈ Y ) . y∈Y

(4)

Sea y ′′ ∈ Y tal que α = max f (x, y ′′ ) ≥ f (x, y ′′ ) x∈X

(x ∈ X) .

(5)

Luego f (x′ , y ′′ ) ≤ α ≤ f (x′ , y ′′ ), es decir α = f (x′ , y ′′ ). El punto (x′ , y ′′ ) es un punto silla ya que, por (4) y (5), se tiene f (x, y ′′ ) ≤ f (x′ , y ′′ ) = α ≤ f (x′ , y)

(x ∈ X, y ∈ Y ) .

En un juego de suma cero con dos jugadores se dice que el par de estrategias mixtas (x′ , y ′ ) es un punto de equilibrio si es un punto silla para la funci´on de pagos: f (x, y ′ ) ≤ f (x′ , y ′ ) ≤ f (x′ , y) (x ∈ X, y ∈ Y ) . Si se producen cambios en el punto de equilibrio alguno de los jugadores pierde.

4

Continuidad

Sea T un espacio topol´ogico y consideremos la funci´on f : T −→ R . Usaremos la siguiente notaci´on: {f ≤ λ} := {t ∈ T : f (t) ≤ λ} ; an´alogos significados para {f < λ}, {f = λ}... Asociados a f se definen los conjuntos epi f := {(t, α) : t ∈ T, α ∈ R, f (t) ≤ α} (epigrafo de f ) . hipo f := {(t, α) : t ∈ T, α ∈ R, f (t) ≥ α} (hipografo de f ) . Se dice que f es sup-semicontinua si se verifica cualquiera de las siguientes condiciones equivalentes entre s´ı: 4

• Para todo λ ∈ R, el conjunto {f < λ} es subconjunto abierto de T • Para todo λ ∈ R, el conjunto {f ≥ λ} es subconjunto cerrado de T • hipo f es subconjunto cerrado de X × R • Si (ti )i∈I es una red en T que converge a t, entonces lim sup f (ti ) := inf sup f (tj ) ≤ f (t) . i

i

j≥i

An´alogamente, se dice que f es inf-semicontinua si se verifican las siguientes condiciones equivalen-tes: • Para todo λ ∈ R, el conjunto {f > λ} es subconjunto abierto de T • Para todo λ ∈ R, el conjunto {f ≤ λ} es subconjunto cerrado de T • epi f es subconjunto cerrado de X × R • Si (ti )i∈I es una red en T que converge a t, entonces lim inf f (ti ) := sup inf f (tj ) ≥ f (t) . i

i

j≥i

Se verifica: • f es sup-semicontinua ⇐⇒ −f es inf-semicontinua. • f es continua ⇐⇒ f es inf-semicontinua y sup-semicontinua.

5

Convexidad

Sean V un espacio vectorial real, C ⊂ V y la funci´on f : C −→ R . Diremos que f es casi-convexa si se cumplen las siguientes condiciones equivalentes entre s´ı: • Para todo λ ∈ R, el conjunto {f < λ} es subconjunto convexo de V • Para todo λ ∈ R, el conjunto {f ≤ λ} es subconjunto convexo de V • Para todo x, y ∈ C y todo λ ∈ [0, 1], se tiene f (λx + (1 − λ)y) ≤ max{f (x), f (y)} Diremos que f es casi-c´ oncava si se verifican las condiciones equivalentes: • Para todo λ ∈ R, el conjunto {f > λ} es subconjunto convexo de V • Para todo λ ∈ R, el conjunto {f ≥ λ} es subconjunto convexo de V • Para todo x, y ∈ C y todo λ ∈ [0, 1], se tiene f (λx + (1 − λ)y) ≥ min{f (x), f (y)} 5

Se verifica: • f es casi-convexa ⇐⇒ −f es casi-c´oncava . • f es lineal =⇒ f es convexa =⇒ f es casi-convexa . • f es lineal =⇒ f es c´oncava =⇒ f es casi-c´oncava .

6