EYE IN THE SKY. LA VERDAD CIENTÍFICA SOBRE LOS JUEGOS DE AZAR.


 

 

 

 

 

 

 LA GUÍA CIENTÍFICA DEL JUGADOR PROFESIONAL.

[Métodos Científicos contra el Azar.]
[Análisis Estadístico de Juegos de Azar.]

[Teoría de los Juegos y Estrategia.]
[Cálculo del Riesgo Económico.]
[Cálculo de Probabilidades.]
[Funcionamiento de Tragamonedas.]

 

EL PRINCIPIO MINIMAX Y EL PRINCIPIO MAXIMIN EN JUEGOS ESTRATÉGICOS.

Antecedentes en la Formulación del Principio Minimax y del Principio Maximin:

Principio Maximin y Minimax: Ernst Zermelo, John von Neumann, Oskar Morgenstern, John Nash.

El Principio Minimax y el Principio Maximin son los métodos básicos que permiten encontrar la solución más óptima en los juegos estratégicos, especialmente en aquellos en que se tiene Información Perfecta y no interviene el azar en el resultado final. Estos principios básicamente son el motor matemático de toda «estrategia racional».

El matemático James Waldegrave en 1713 fue el primero que comenzó a teorizar sobre el funcionamiento de esos dos principios, en una carta que escribió en la que analizó matemáticamente una solución óptima para un juego de cartas entre dos participantes conocido como le Her. Luego, el matemático y economista francés Antoine-Augustin Cournot (1801−1877), en el intento de extender la aplicación de la teoría de la probabilidad a la economía política, publicó su obra titulada Recherches sur les principes mathématiques de la théorie des richesses (1838), en la cual incluyó un análisis matemático sobre la manera como operan las estrategias de maximización de la riqueza usadas por dos hipotéticas compañías que ejercen un duopolio en un mercado.

En 1912 el matemático alemán Ernst Zermelo (1871−1953), en el Quinto Congreso Internacional de Matemáticas (Cambridge), formuló la hipótesis de que los juegos secuenciales y combinatorios, como el ajedrez, las damas o el go, están determinados desde la posición inicial al ofrecer una solución óptima que conduce hacia un resultado final específico, siempre que ambos oponentes apliquen sus mejores estrategias. Zermelo indicó que está hipótesis sobre la Determinancia de los juegos estratégicos sólo puede ser cierta si ambos jugadores en cada turno realizan su movimiento más óptimo, y eso implica que el jugador que tiene el primer turno siempre debe elegir aquella movida que para él representa el máximo valor que conduce hacia la victoria (elige el «Valor Maximin»), mientras que el jugador que tiene el segundo turno siempre se encuentra condicionado porque debe responderle a su oponente eligiendo aquella movida que minimice los máximos valores disponibles que en el siguiente turno tendrá su oponente hacia la victoria (elige el «Valor Minimax»).

Cuando se logra probar la existencia de la Determinancia en un juego estratégico, entonces es lógico que el Valor Maximin de la mejor movida elegida por el primer jugador será igual al Valor Minimax de la mejor movida elegida en respuesta por el segundo jugador, tesis que constituye el fundamento del denominado Teorema de Zermelo, que posteriormente fue bautizado como el Teorema Minimax.

En 1928 el Teorema Minimax fue expresado formalmente por John von Neumann (1903−1957) en un artículo titulado Zur theorie der gesellschaftsspiele math, y dice lo siguiente: «En un juego de suma cero entre dos jugadores, donde cada jugador conoce el número finito de estrategias de su oponente, es posible aplicar una estrategia racional que permite a ambos jugadores minimizar la pérdida máxima esperada. Para esto cada jugador sólo debe escoger aquella estrategia que tiene la recompensa más alta entre los pagos más bajos ofrecidos por todas sus estrategias. Esto garantiza que la pérdida a sufrir no será mayor al valor de esa recompensa que resulta ser la más baja de las máximas esperadas».

En otras palabras, el Principio Minimax consiste en que un jugador A escoge sólo aquella estrategia que en caso de ser derrotada sólo le dará al oponente B una recompensa cuyo valor siempre es el mínimo que podría obtener frente a otras pérdidas aún mayores que podría sufrir el jugador A si hubiera usado otra estrategia distinta a su alcance.

Más tarde John von Neumann y Oskar Morgenstern (1902−1976), en su obra conjunta titulada Theory of games and economic behavior (1944), profundizaron mucho más en el funcionamiento del Principio Minimax en los juegos Bipersonales de Suma Cero, y también analizaron la forma de aplicación del Principio Maximin en juegos de Suma No Cero (aquellos en los que la ganancia de un jugador no es exactamente igual a la pérdida que sufre su oponente), y en especial teorizaron sobre la posibilidad de que se presente un equilibrio entre las estrategias racionales usadas por los participantes que compiten por unas recompensas en ciertas situaciones conflictivas que ocurren a diario en los mercados.

Desde los años 50's proliferaron las investigaciones sobre la aplicación del Principio Maximin y del Principio Minimax en todo tipo de situaciones conflictivas y estratégicas que ocurren en las acciones militares, en las transacciones de las bolsas de valores, en la competencia por los mercados, en el campo de la diplomacia internacional, en la manera como los abogados presentan sus argumentos en los juicios ante las cortes de justicia, en el diseño de las campañas electorales de los candidatos a cargos de elección popular, en la teoría de la evolución biológica de las especies, etc. Sobresalen los trabajos publicados por John Forbes Nash (Premio Nóbel de Economía en 1994), en los que analizó la aplicación de estos principios estratégicos y las situaciones de equilibrio que se presentan en los juegos cooperativos, en los juegos de múltiples jugadores y en la Teoría de las Decisiones de Mercado.

Funcionamiento del Principio Minimax y del Principio Maximin en un Árbol de Nodos:

El Principio Maximin y el Principio Minimax se pueden aplicar principalmente en los juegos estratégicos de tipo Combinatorio (la movida de cada jugador condiciona el abanico de las siguientes movidas a realizar), Secuenciales (los que se juegan por turnos entre oponentes), de Información Perfecta, de Suma Cero (un jugador sólo puede ganar un punto si el oponente pierde el mismo valor) y en los que no interviene el azar, como ocurre en el ajedrez, las damas (English Draughts o Checkers o Damas Internacionales), el NIm, el go, el ajedrez chino (Xiangqi), el ajedrez japonés (Shogi), el Juego del Molino (Nine Men’s Morris), el Tres en Línea (Tic‑Tac‑Toe), el Reversi, el Conecta Cuatro, el konane, el chaturanga, el hex, etc.

Para aplicar el Principio Maximin y el Principio Minimax en juegos estratégicos como los antes mencionados cuando son representados de forma extensiva mediante un árbol de decisiones o nodos, se tienen en cuenta las siguientes reglas: a−) Se construye el respectivo árbol de decisiones, incluyendo toda posible ramificación y nodo, desde el Nodo Raíz hasta llegar a todos los Nodos Terminales; b−) Se deben valorar los nodos terminales mediante una Función de Utilidad, la cual le asigna un valor positivo a los nodos que representan el camino hacia una victoria o recompensa para el jugador que aplica el Principio Maximin y le asigna un valor negativo a los nodos que representan el camino hacia una victoria o recompensa para el jugador que aplica el Principio Minimax. Si un nodo terminal representa un empate o un estado del juego en que ya no es posible realizar un movimiento legal, entonces el valor asignado es cero; c−) Los valores positivos (Valor Maximin) o los valores negativos (Valor Minimax) asignados a los nodos terminales se propagan desde éstos por cada ramificación hacia los nodos de los niveles superiores hasta llegar al nodo raíz, para lo cual se sobreentiende que el jugador que tiene el primer turno siempre aplica el Principio Maximin (MAX) y por tanto un nodo de MAX siempre toma el valor del nodo sucesor o nodo terminal con el mayor valor, mientras que en contraste el jugador que tiene el segundo turno siempre aplica el Principio Minimax (MIN) y por tanto un nodo de MIN siempre toma el valor del nodo sucesor o nodo terminal con el menor valor; y, d) Para trazar la solución más óptima del juego entre las ramificaciones del árbol una vez le han sido asignados a todos los nodos los respectivos valores positivos o negativos, se sobreentiende que cada jugador siempre elige en su turno el movimiento que conduce al estado sucesor del actual con mejor valoración según le corresponda aplicar el Principio Maximin o el Principio Minimax.

Un ejemplo clarifica la aplicación de lo anterior. Supongamos un juego de Nim con una pila inicial conformada por 6 fichas. Cada jugador en su turno sólo puede retirar 1, 2 ó 3 fichas de la pila según su libre decisión, de tal forma que gana el juego el jugador que logre obligar a su oponente a retirar la última ficha que quede de la pila. El primer jugador A aplica la estrategia Maximin (MAX), por tanto en su turno siempre elige la movida de mayor valor, mientras que el jugador B aplica la estrategia Minimax (MIN) y por tanto en su turno siempre elige la movida de menor valor. El siguiente es el árbol de decisiones de este juego:

Principio Maximin y Minimax en el árbol de nodos del Nim.

En la anterior gráfica los números dentro de los círculos rojos son nodos que indican la cantidad de fichas que quedan en la pila después de que cada jugador en su turno retiró 1, 2 ó 3 fichas según las ramificaciones que representan las posibles movidas que derivan de cada estado del juego. Los nodos terminales sombreados de color verde son estados del juego que equivalen a una victoria de A, mientras que los nodos terminales sombreados de color lila son estados del juego que equivalen a una victoria de B. Los nodos terminales que equivalen a una victoria de A tienen al lado de la ramificación un 1 que es el valor que les corresponde al aplicar la Función de Utilidad teniendo en cuenta el Principio Maximin, mientras que los nodos terminales que equivalen a una victoria de B tienen al lado de la ramificación un −1 que es el valor que les corresponde al aplicar la Función de Utilidad teniendo en cuenta el Principio Minimax. La propagación de estos valores hacia los nodos de los niveles superiores se realiza considerando que si A en su turno tiene varias ramificaciones que equivalen a posibles movidas que puede realizar, entonces bajo el Principio Maximin siempre elegirá la que conduce al nodo de mayor valor posible (1) y descartará las ramificaciones que conducen a nodos de menor valor (−1), mientras que si B en su turno tiene varias ramificaciones que equivalen a posibles movidas que puede realizar, entonces bajo el Principio Minimax siempre elegirá la que conduce al nodo de menor valor posible (−1) y descartará las ramificaciones que conducen a nodos de mayor valor (1).

Teorema de Zermelo y Principio Minimax en un árbol de nodos.

Por supuesto, los jugadores A (MAX) y B (MIN) sólo pueden escoger entre un valor positivo y un valor negativo cuando en su respectivo turno disponen de alternativas que permiten hacer esa elección. Cuando en el turno de un jugador sólo existe una única ramificación que representa una movida, necesariamente el jugador debe realizar esa movida independientemente de su valor positivo o negativo, ya que se trata de una jugada forzada. Del mismo modo, cuando el juego está «Determinado», entonces llega un momento en que se hace realidad el Teorema de Zermelo, es decir, el Valor Maximin de la mejor movida elegida por A es igual al Valor Minimax de la mejor movida elegida en respuesta por B. En efecto, en la anterior gráfica se observa que este juego de Nim está determinado a favor del jugador A desde el primer movimiento que él realiza, ya que en su primer turno le corresponde el valor de −1 a la opción de retirar 3 fichas para reducir la pila a 3, también tiene el valor de −1 la opción de retirar 2 fichas para reducir la pila a 4, y tiene el valor de 1 retirar una sola ficha para reducir la pila a 5, por tanto, al aplicar el Principio Maximin, su mejor jugada es la última que tiene un valor de 1 que es mayor al de las otras dos opciones. Dentro de esa ramificación cuando le corresponde el turno a B, éste encuentra que tiene tres alternativas de movimientos, pero todas tienen un valor de 1, y al no poder descartarlas por una alternativa de menor valor (MIN), entonces no importa cuál movimiento elija, porque en este caso el Valor Minimax de su mejor jugada es igual al Valor Maximin de la jugada previa de A, es decir 1 = 1, y esto equivale a que el juego está Determinado a favor de la victoria de A, la cual necesariamente ocurre como lo muestran las ramificaciones de color azul en las que se ve que A siempre tiene la opción de elegir la jugada ganadora no importa qué decisión adopte B. Si A en su primer turno erróneamente eligiera cualquiera de las otras dos jugadas valoradas con −1, entonces B en su turno siempre podrá responderle escogiendo una jugada con Valor Minimax de −1 y así obtendrá la victoria en esas ramificaciones, pero esos triunfos no serían ocasionados por la Determinancia del juego sino por el error cometido en la estrategia de A.

Funcionamiento del Principio Minimax en una Matriz de Pagos de un Juego de Suma Cero:

Para aplicar el Principio Minimax en un juego de Suma Cero que transcurre de forma Simultánea y que es representado mediante una Matriz de Pagos, se siguen estos pasos: a−) En primer lugar, el jugador debe identificar todas las estrategias posibles que puede aplicar frente a una situación específica de un juego estratégico; b−) Luego el jugador debe evaluar cuáles son los valores de todas las recompensas que ofrecen cada una de sus estrategias frente a las posibles estrategias que en respuesta puede adoptar su oponente; c−) Después el jugador debe identificar cuáles son las recompensas de menor valor para cada una de las estrategia que puede aplicar; y, d−) Finalmente, el jugador elige aplicar sólo aquella estrategia que tiene la recompensa de valor más alto entre las recompensas mínimas identificadas para cada una de sus estrategias. En otras palabras, en este caso el Principio Minimax equivale a elegir siempre la estrategia que permite minimizar la máxima pérdida posible.

Un ejemplo sencillo clarifica la aplicación del Principio Minimax en una Matriz de Pagos. Supongamos que existe un juego de Suma Cero que además es Simultáneo entre A y B, en el cual ellos disponen de diferentes estrategias cuyas recompensas aparecen en la siguiente matriz de pagos:

MATRIZ DE PAGOS

 

ESTRATEGIAS DE B:

 

No. 1

No. 2

No. 3

 

ESTRATEGIAS

 DE A:

No. 1

+2   2

+7   7

–5   +5

No. 2

–6   +6

+2   2

–7   +7

No. 3

+1   1

–3   +3

+4   4

Esta matriz muestra que se trata de un juego de Suma Cero, es decir, en este tipo de juego la situación matemática que siempre se presenta entre los dos jugadores es Ganar−Perder porque el valor de la recompensa que gana un jugador es igual al valor de la pérdida que sufre su oponente: por ejemplo, si A decide aplicar la estrategia No. 2 y B le responde con la estrategia No. 3, entonces B gana +7 puntos equivalentes a los –7 puntos que pierde A. Como se trata de un juego de tipo Simultáneo, entonces cada jugador no conoce cuál estrategia finalmente elegirá su oponente al momento de jugar, aunque sí conoce cuáles son todas esas posibles estrategias y los resultados que producen. Para aplicar el Principio Minimax cada jugador debe identificar cuál es el valor de la recompensa más mínima que obtendría en cada una de sus estrategias disponibles, como se muestra en esta matriz:

MATRIZ DE PAGOS  (RECOMPENSAS MÍNIMAS)

 
 

ESTRATEGIAS DE B:

 

No. 1

No. 2

No. 3

MÍNIMOS DE A:

 

ESTRATEGIAS

 DE A:

No. 1

+2   –2

+7   7

–5   +5

–5

No. 2

–6   +6

+2   2

–7   +7

–7

No. 3

+1   1

–3   +3

+4   4

–3

 

MÍNIMOS DE B:

–2

7

4

 

Los mínimos valores de las recompensas de las estrategias de A son 5, 7, y 3, por tanto, al aplicar el Principio Minimax, A debe elegir el mayor de esos valores mínimos, es decir, 3, y por consiguiente la estrategia No. 3 que produce ese valor es la que debe aplicar con el propósito de no sufrir una pérdida mayor a ese valor. Por su parte, los mínimos valores de las recompensas de B son 2, 7, y 4, por tanto, al aplicar el Principio Minimax, B debe elegir el mayor de esos valores mínimos, es decir, –2, y en consecuencia la estrategia No. 1 que produce ese valor es la que debe aplicar con el fin de no sufrir una pérdida mayor a ese valor. De este modo el comportamiento estratégico de ambos jugadores se rige por la racionalidad matemática, ya que cuando cada jugador elige la estrategia que produce el valor más alto de entre las mínimas recompensas que podría obtener en caso de perder, simultáneamente está ocasionando que su oponente no pueda obtener una ganancia mayor a ese valor no importa cuál estrategia aplique: por ejemplo, el jugador A al elegir la estrategia No. 3 no le permite al jugador B aspirar a obtener una ganancia mayor a +3, y por su parte B al escoger la estrategia No. 1 no le permite a A aspirar a obtener una ganancia mayor a +2.

Por supuesto, el panorama cambia si el anterior juego es con repetición, digamos si se juega 10 ó 20 veces seguidas entre los mismos oponentes. En efecto, si bajo estas nuevas condiciones en los primeros juegos A se aferra a la estrategia No. 3 y B a la estrategia No. 1, entonces el encuentro de ambas estrategias que fueron seleccionadas según el Principio Minimax ocasiona que A gane +1 punto y que B pierda –1 punto. Quizá B, al darse cuenta de que A de forma predecible aplica la estrategia No. 3, opte por aplicar en respuesta la estrategia No. 2 que ocasiona que A pierda –3 puntos y que B gane +3 puntos. Pero a su vez, si B de forma repetitiva aplica la estrategia No. 2, entonces A puede reaccionar respondiendo con la estrategia No. 1 que le permitirá ganar +7 puntos mientras que B perderá –7 puntos.

Dentro de la Teoría de los Juegos se considera que un juego estratégico de Suma Cero tiene una «Solución Estable» cuando ninguno de los jugadores está tentado a cambiar la mejor estrategia que fue elegida mediante el Principio Minimax, incluso si el juego transcurre con repetición, porque cambiar esa mejor estrategia siempre implica una pérdida mayor para el jugador que cambia. Es evidente que el juego antes analizado en la matriz de pagos no tiene una Solución Estable, porque si ese juego es con repetición, entonces los jugadores en procura de lograr la situación Ganar−Perder pueden optar por aplicar una estrategia que ofrece mejores recompensas que la identificada mediante el Principio Minimax.

Igualmente, cuando en un juego las estrategias de ambos jugadores seleccionadas mediante el Principio Minimax coinciden en un mismo resultado, se dice que el juego tiene un «Punto de Silla», aspecto que fue probado inicialmente por John von Neumann en los juegos bipersonales, y luego fue probado en los juegos cooperativos y en los juegos de múltiples jugadores mediante las investigaciones realizadas por John F. Nash.

FUENTES DE CONSULTA:

BEWERSDORFF, Jörg.  Luck, Logic, and White Lies. The mathematics of games. A K Peters Ltd., Wellesley (Massachusetts), 2005.

DUTTA, PrajitStrategies and games: Theory and practice. MIT Press, 2000.

OSBORNE, Martin J. An introduction to Game Theory. Oxford University Press, New York, 2004. 

WIKIPEDIA. Consulta de los términos: Decision Theory; Game Theory; Maximin; Minimax; Normal Form Game; Payoff Matrix; Repeated Game; Strategy Game.

IR AL ÍNDICE

 

 

Copyright © 2005-2014, NELSON GARCÍA L. y EYE-IN-THE-SKY GROUP. Todos los derechos reservados.