Notas sobre el teorema minimax

Notas sobre el teorema minimax Antonio Martin´on Abril de 2012 1 Teoremas minimax Sean X e Y dos conjuntos no vac´ıos y consideremos una funci´on f...

Author: José Luis Herrera Ortiz de Zárate

0 downloads 0 Views 51KB Size

Report

Download PDF

Recommend Documents

CUATRO NOTAS SOBRE EL

Notas sobre el Cuzco

NOTAS SOBRE EL REALISMO JURIDICO

NOTAS SOBRE EL LIBERALISMO CLASICO*

NOTAS SOBRE EL IMAGINARIO EPICO

NOTAS SOBRE EL TROPICO AMERICANO: EL CARIBE

Resumen del contenidos 5.(*3.2) sobre el Teorema del coseno y el Teorema del seno

Notas sobre EL LIBRO DEL APOCALIPSIS

NOTAS SOBRE LOS SUFIJOS AUMENTATIVOS EN EL

NOTAS SOBRE EL DERECHO DE VISITA

NOTAS SOBRE EL PODER CONSTITUYENTE IRREGULAR

NOTAS SOBRE EL MATERIAL DE NUESTRA FABRICACION:

NOTAS. Sobre el Anti-Imperialismo de Rodo

Notas sobre el Poder de Castigar

NOTAS SOBRE EL LINAJE COLOMBIANO YEPES

Notas sobre el teatro independiente espariol

NOTAS PERSONALES SOBRE EL ORIGEN DEL HOMBRE

Notas sobre el concepto de cultura popular:

Notas sobre el clima de Magallanes (Chile)

EL TEOREMA DE FERMAT

NOTAS SOBRE AUDIOMETQIA

NOTAS SOBRE PROPORCION

NOTAS SOBRE REPTILES IBERICOS:

NOTAS SOBRE CIUDADANIA SEXUAL

Notas sobre el teorema minimax Antonio Martin´on Abril de 2012

1

Teoremas minimax

Sean X e Y dos conjuntos no vac´ıos y consideremos una funci´on f : X × Y −→ R . Se verifica sup inf f (x, y) ≤ inf sup f (x, y) ;

x∈X y∈Y

y∈Y x∈X

(1)

efectivamente, dado x ∈ X resulta claro que inf f (x, y) ≤ inf sup f (x, y) ,

y∈Y

y∈Y x∈X

de donde se obtiene inmediatamente la desigualdad (1). En general no vale la igualdad en (1), como queda claro si se toma X = Y = {0, 1} y f (x, y) = 0 si x ̸= y, f (x, y) = 1 si x = y, pues se obtiene sup inf f (x, y) = 0 < 1 = inf sup f (x, y) .

x∈X y∈Y

y∈Y x∈X

Los llamados teoremas minimax contemplan condiciones suficientes para que se verifique la igualdad en (1); es decir, para que se cumpla la igualdad minimax: sup inf f (x, y) = inf sup f (x, y) .

x∈X y∈Y

y∈Y x∈X

(2)

Se enuncia a continuaci´on la versi´on de Maurice Sion (1958). Teorema 1 Sean E y F espacios vectoriales topol´ ogicos de Hausdorﬀ; X ⊂ E e Y ⊂ F conjuntos convexos, compactos y no vac´ıos; f : X × Y −→ R una funci´ on sup-semicontinua y casi-c´ oncava sobre X e inf-semicontinua y casi-convexa sobre Y . Entonces se veriﬁca la igualdad minimax (2). Las nociones sobre continuidad y convexidad que figuran en el enunciado se introducen al final de estas notas.

1

2

Aplicaci´ on a la teor´ıa de juegos

Consideremos un juego de suma cero en el que intervienen dos jugadores, que denotaremos por A y B. El jugador A tiene el conjunto {a1 , ..., am } de estrategias puras o acciones y, an´alogamente, el jugador B posee las del conjunto {b1 , ..., bn }. Para cada par de acciones (ai , bj ) hay una utilidad (ganancia o p´erdida) A(ai , bj ) para el jugador A y otra B(ai , bj ) para el jugador B. Que se trata de un juego de suma cero significa que las ganancias de A son las p´erdidas de B, y rec´ıprocamente; es decir, se verifica (1 ≤ i ≤ m; 1 ≤ j ≤ n) .

A(ai , bj ) + B(ai , bj ) = 0

Ahora suponemos que el jugador A ejecutar´a la estrategia ai con probabilidad xi y que B realizar´a bj con probabilidad yj . Cada distribiuci´on de probabilidad x = (x1 , ..., xm ) es una estrategia mixta o estrategia aleatoria para A y, an´alogamente, cada distribuci´on y = (y1 , ..., yn ) lo es para B. Se verifica xi ≥ 0 (1 ≤ i ≤ m) ,

yj ≥ 0 (1 ≤ j ≤ n)

,

m ∑

xi =

i=1

n ∑

yj = 1 .

j=1

Para cada par de estrategias mixtas (x, y) se tiene la funci´ on de pagos de A: f (x, y) =

m ∑ n ∑

A(ai , bj )xi yj ,

i=1 j=1

que es bilineal en xi , yj . An´alogamente, la funci´ on de pagos de B viene dada por g(x, y) =

m ∑ n ∑

B(ai , bj )xi yj .

i=1 j=1

Se verifica f (x, y) + g(x, y) = 0 (para todo x, y) . Tenemos, por tanto la siguiente situaci´on: • X e Y son los simplex X=

{

x = (x1 , ..., xm ) : xi ≥ 0 (1 ≤ i ≤ m) ,  

Y =



m ∑

}

xi = 1

i=1

y = (y1 , ..., yn ) : yj ≥ 0 (1 ≤ j ≤ n) ,

n ∑ j=1

yj = 1

,

  

,

as´ı que X e Y son convexos, compactos y no vac´ıos. • La funci´on de pagos f : X × Y −→ R es continua, as´ı que es continua sobre X y sobre Y . Adem´as es bilineal, luego es lineal sobre X y sobre Y , por tanto es c´oncava sobre X y convexa sobre Y . • Se aplica el teorema de Sion y se obtiene la igualdad minimax (2), pero ahora es seguro que se alcanzan los supremos e ´ınfimos, y se escribe, por tanto, con m´aximos y m´ınimos: max min f (x, y) = min max f (x, y) . x∈X y∈Y

y∈Y x∈X

2

(3)

La igualdad minimax en este contexto significa que las estrategias que hacen que A maximice sus ganancias m´ınimas son las mismas que hacen que B minimice sus p´erdidas m´aximas. Observemos que de la igualdad minimax (3) resulta (

)

max min g(x, y) = max − max(−g(x, y)) = − min max f (x, y) = y∈Y x∈X

y∈Y

x∈X

y∈Y x∈X

(

)

= − max min f (x, y) = min − min(−g(x, y)) = min max g(x, y) , x∈X y∈Y

x∈X

y∈Y

x∈X y∈Y

que puede interpretarse diciendo que las estrategias que hacen que A maximice sus ganancias m´ınimas y B minimice sus p´erdidas m´aximas son las mismas que hacen que A minimice sus p´erdidas m´aximas y B maximice sus ganancias m´ınimas.

3

Puntos silla

Consideremos conjuntos no vac´ıos X e Y y una funci´on f : X × Y −→ R . Se dice que (x′ , y ′ ) ∈ X × Y es un punto silla de f si sup f (x′ , y) = f (x′ , y ′ ) = inf f (x, y ′ ) ; x∈X

y∈Y

observemos que es equivalente a sup f (x′ , y) = inf f (x, y ′ ) x∈X

y∈Y

y que realmente puede escribirse max f (x′ , y) = f (x′ , y ′ ) = min f (x, y ′ ) . y∈Y

x∈X

En otras palabras, (x′ , y ′ ) ∈ X × Y es un punto silla de f si se cumple f (x′ , y) ≤ f (x′ , y ′ ) ≤ f (x, y ′ )

(x ∈ X, y ∈ Y ) .

Algunos ejemplos y propiedades: • Ejemplo. Dada la funci´on f : R × R −→ R, definida por f (x, y) = −2x2 + y 2 − y + 2, se tiene que el punto (0, 1/2) es un punto silla de f . • Proposici´ on. Si f tiene un punto silla entonces se verifica la igualdad minimax (2), realmente la igualdad (3). Demostraci´ on. Sea (x′ , y ′ ) punto silla de f . Entonces inf sup f (x, y) ≤ sup f (x, y ′ ) ≤ f (x′ , y ′ ) ≤

y∈Y x∈X

x∈X

inf f (x′ , y) ≤ sup inf f (x, y) ≤ inf sup f (x, y) .

y∈Y

x∈X y∈Y

3

y∈Y x∈X

• Ejemplo. Puede ocurrir que (2) sea cierta y no haya punto silla, como en el siguiente ejemplo: f : {1}×]0, 1[−→ R, dada por f (x, y) = y, no tiene punto silla, aunque s´ı verifica la igualdad minimax (2). • Proposici´ on. Si se verifica la igualdad minimax (3), entonces hay punto silla. Demostraci´ on. Suponemos α := max min f (x, y) = min max f (x, y) . x∈X y∈Y

Sea

x′

y∈Y x∈X

∈ X tal que α = min f (x′ , y) . y∈Y

Existe y ′ ∈ Y que verifica α = min f (x′ , y) = f (x′ , y ′ ) ≤ f (x′ , y) (y ∈ Y ) . y∈Y

(4)

Sea y ′′ ∈ Y tal que α = max f (x, y ′′ ) ≥ f (x, y ′′ ) x∈X

(x ∈ X) .

(5)

Luego f (x′ , y ′′ ) ≤ α ≤ f (x′ , y ′′ ), es decir α = f (x′ , y ′′ ). El punto (x′ , y ′′ ) es un punto silla ya que, por (4) y (5), se tiene f (x, y ′′ ) ≤ f (x′ , y ′′ ) = α ≤ f (x′ , y)

(x ∈ X, y ∈ Y ) .

En un juego de suma cero con dos jugadores se dice que el par de estrategias mixtas (x′ , y ′ ) es un punto de equilibrio si es un punto silla para la funci´on de pagos: f (x, y ′ ) ≤ f (x′ , y ′ ) ≤ f (x′ , y) (x ∈ X, y ∈ Y ) . Si se producen cambios en el punto de equilibrio alguno de los jugadores pierde.

4

Continuidad

Sea T un espacio topol´ogico y consideremos la funci´on f : T −→ R . Usaremos la siguiente notaci´on: {f ≤ λ} := {t ∈ T : f (t) ≤ λ} ; an´alogos significados para {f < λ}, {f = λ}... Asociados a f se definen los conjuntos epi f := {(t, α) : t ∈ T, α ∈ R, f (t) ≤ α} (epigrafo de f ) . hipo f := {(t, α) : t ∈ T, α ∈ R, f (t) ≥ α} (hipografo de f ) . Se dice que f es sup-semicontinua si se verifica cualquiera de las siguientes condiciones equivalentes entre s´ı: 4

• Para todo λ ∈ R, el conjunto {f < λ} es subconjunto abierto de T • Para todo λ ∈ R, el conjunto {f ≥ λ} es subconjunto cerrado de T • hipo f es subconjunto cerrado de X × R • Si (ti )i∈I es una red en T que converge a t, entonces lim sup f (ti ) := inf sup f (tj ) ≤ f (t) . i

i

j≥i

An´alogamente, se dice que f es inf-semicontinua si se verifican las siguientes condiciones equivalen-tes: • Para todo λ ∈ R, el conjunto {f > λ} es subconjunto abierto de T • Para todo λ ∈ R, el conjunto {f ≤ λ} es subconjunto cerrado de T • epi f es subconjunto cerrado de X × R • Si (ti )i∈I es una red en T que converge a t, entonces lim inf f (ti ) := sup inf f (tj ) ≥ f (t) . i

i

j≥i

Se verifica: • f es sup-semicontinua ⇐⇒ −f es inf-semicontinua. • f es continua ⇐⇒ f es inf-semicontinua y sup-semicontinua.

5

Convexidad

Sean V un espacio vectorial real, C ⊂ V y la funci´on f : C −→ R . Diremos que f es casi-convexa si se cumplen las siguientes condiciones equivalentes entre s´ı: • Para todo λ ∈ R, el conjunto {f < λ} es subconjunto convexo de V • Para todo λ ∈ R, el conjunto {f ≤ λ} es subconjunto convexo de V • Para todo x, y ∈ C y todo λ ∈ [0, 1], se tiene f (λx + (1 − λ)y) ≤ max{f (x), f (y)} Diremos que f es casi-c´ oncava si se verifican las condiciones equivalentes: • Para todo λ ∈ R, el conjunto {f > λ} es subconjunto convexo de V • Para todo λ ∈ R, el conjunto {f ≥ λ} es subconjunto convexo de V • Para todo x, y ∈ C y todo λ ∈ [0, 1], se tiene f (λx + (1 − λ)y) ≥ min{f (x), f (y)} 5

Se verifica: • f es casi-convexa ⇐⇒ −f es casi-c´oncava . • f es lineal =⇒ f es convexa =⇒ f es casi-convexa . • f es lineal =⇒ f es c´oncava =⇒ f es casi-c´oncava .

6