Teoría de Juegos: Estrategia Mixta

centro de control

Estrategia Pura vs Estrategia Mixta

El Dilema del Prisionero es un ejemplo de una Estrategia Pura, donde un curso de acción específico puede ser tomado por un jugador:



Daniel


Quedarse Callado Culpar a Christian
Christian Quedarse Callado -1, -1 -10, 0

Culpar a Daniel 0, -10 -6, -6

En este caso, el resultado es que se culpan mutuamente (-6, -6).

Pero hay juegos donde una mezcla de acciones es lo mejor, y eso se llama una Estrategia Mixta.

Estrategia Mixta

Una Estrategia Mixta permite que un jugador sea impredecible y puede aumentar su éxito.

pelota de fútbol

Ejemplo: ¡Gol!

Es una tanda de penaltis y te toca patear por tu equipo. ¿Hacia dónde deberías patear?

Si siempre pateas a la derecha, el portero siempre puede ir a la derecha y atajarte.

¿Entonces es mejor 50-50? ¿Quizás lanzar una moneda cada vez?

Pero un jugador a menudo es mejor de un lado. Digamos que normalmente marcas el 40% de las veces cuando pateas a la izquierda, y el 70% cuando pateas a la derecha:



Portero


Atajar Izq. Atajar Der.
Pateador Patear Izq. 0, 0 +0.4, –0.4

Patear Der. +0.7, –0.7 0, 0

(Explicación: si ambos van a la izquierda, no hay gol. Lo mismo si ambos van a la derecha. Pero, por ejemplo, para "Patear Derecha, Atajar Izquierda" marcas 0.7 de las veces.)

Ahora divirtámonos e intentemos engañar al portero.

  • Si siempre pateamos a la izquierda, siempre atajarán a la izquierda: resultado 0
  • Si siempre pateamos a la derecha, siempre atajarán a la derecha: resultado 0
  • ¿Qué tal si pateamos 50% al azar? Entonces lo mejor para ellos sería siempre atajar a la derecha porque ese es nuestro mejor lado: el resultado es que la mitad del tiempo obtenemos 0.4, así que 0.2
  • Entonces, si pensamos que siempre atajarán a la derecha, podríamos agregar algunos extras a la izquierda ya que no estarán ahí. ¿Qué tal 60% a la izquierda: resultado 0.6 x 0.4 = 0.24
  • Quizás podríamos ir con 70% a la izquierda: el resultado es 0.7 x 0.4 = 0.28, pero ellos se darán cuenta y comenzarán a atajar siempre a la izquierda, así que en su lugar obtendríamos 0.3 x 0.7 = 0.21

OK, en lugar de adivinar, calculemos exactamente. Esto lo ilustra (mira los puntos anteriores y verifica si tiene sentido):

teoría de juegos

Donde k representa cuán a menudo pateamos a la izquierda (nuestro mal lado):

Para encontrar dónde la línea 0.4k se encuentra con la línea 0.7(1–k) las igualamos:

0.4k = 0.7(1–k) 

0.4k = 0.7 – 0.7k 

1.1k = 0.7

k = 0.7/1.1 = 0.636...

El resultado es 0.636 x 0.4 = 0.254 (o 0.364 x 0.7 = 0.255)

Así que la mejor estrategia de este pateador es patear a la izquierda al azar el 64% del tiempo.

¿Genial, eh?

De hecho, un estudio (enlace en inglés https://www.jstor.org/stable/3083302) encontró que los jugadores profesionales sí aleatorizan, y que:

  • los pateadores patean hacia su mejor lado solo 45% del tiempo (55% hacia su mal lado)
  • los porteros van a ese lado 57% del tiempo.

¿Qué hay del portero? Toma su punto de vista y ve qué se te ocurre.