DESARROLLO CONCEPTUAL

El juego de los dos dedos cuando esta estrictamente determinado
Formulación de juegos de dos personas con suma cero
Para ilustrar las características básicas de un modelo de teoría de juegos, considérese los juegos llamados pares e impares. Éste consiste nada más en que los dos  jugadores muestran al mismo tiempo uno o dos dedos. Si el número de dedos coincide, el jugador que apuesta a pares (por ejemplo, el jugador 1) gana la apuesta al jugador que va por impares (jugador II). Si el número no coincide, el jugador 1 pierde y le paga al jugador II. Entonces, cada jugador tiene dos estrategias: mostrar uno o dos dedos.




JUGADOR 1
JUGADOR 2


Ec1
Ec2
Mínimo
Er1
6
-11
-11
Er2
3
2
2
Máximo
6
2


 Este juego se encuentra estrictamente determinado por que tiene punto de silla, donde este es el valor esperado del juego es decir en la intersección de en la intersección de la  mí Er2;Ec2 se encuentra:
 El punto de silla = valor del juego = 2

En general, el juego de dos personas se caracteriza por

1. Las estrategias del jugador I.
2. Las estrategias del jugador II.
3. La matriz de pagos.



Características

·         Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente y la matriz de pagos.

·         Una jugada real en el juego consiste en que los dos jugadores elijan al mismo tiempo una estrategia sin saber cuál es la elección de su oponente.

·         Una estrategia puede constituir una acción sencilla, como mostrar un número par o impar en dedos en el juego de pares e impares.

·         Por otro lado, en juegos más complicados que llevan en sí una serie de movimientos, una estrategia es una regla predeterminada que especifica por completo cómo se intenta responder a cada circunstancia posible en cada etapa del juego.


·         Por lo general, la matriz de pagos muestra la ganancia (positiva o negativa) que resultaría con cada combinación de estrategias para el jugador 1. Se da de esta manera, ya que la matriz del jugador II es el negativo de ésta, debido a la naturaleza de la suma cero del juego.

·         Los elementos de la matriz pueden tener cualquier tipo de unidades, como dólares, siempre que representen con exactitud la utilidad del jugador 1 en el resultado correspondiente.

·         Por otro lado, el resultado que corresponde a un elemento 2 en una matriz de pagos debe "valer el doble" para el jugador 1 que el resultado correspondiente a un elemento 1. Así, dada la elección, debe serle indiferente un 50% de posibilidades de recibir el primer resultado (en lugar de nada) y recibir en definitiva el último resultado.

·         Un objetivo primordial de la teoría de juegos es establecer criterios racionales para seleccionar una estrategia, los cuales implican dos suposiciones importantes:

o   Ambos jugadores son racionales.
o   Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin compasión para el oponente).


El juego de los dos dedos cuando no esta estrictamente determinado

I
II
Mínimo
I
-2
3
-2
II
3
-4
-4
Máximo
3
3

P1, (1-P1)
Como se puede notar no hay ninguna coincidencia en los números es decir no hay punto de silla entonces procedemos ha hallar  las probabilidades con el que jugadores debe jugar.

Estrategias del jugador renglón

Multiplicación de matrices


P1, (1-P1) = -2P1+3(1-P1); 3P1-4(1-P1)


VEJ= (-2P1+3-3P1); (3P1-4+4P1)


VEJ= -5P1+3; 7P1-4

Ecuación 1 = -5P1+3
Ecuación 2 = 7P1-4

·         Se le da valores arbitrariamente a P1 en la ecuación 1

Si P1=0 entonces; -5(0)+3=3
Si P1=1 entonces; -5(1)+3=-2

·         Se le da valores arbitrariamente a P1 en la ecuación 2

Si P1=0 entonces; 7(0) -4 = -4
Si P1=1 entonces; 7(1) -4 =  3


Es decir;

-5P1+3 = 7P1-4
-5P1-7P1=-4-3
-12P1=-7
P1=-7/-12
P1= 0.5833

P2=1-P1
P2=1-0.58
P2=0.42

Las probabilidades con la que debe jugar el jugador renglón, es del 58% con la estrategia I y del 42% con la estrategia II.


Estrategias del jugador columna

P1, (1-P1) = -2P1+3(1-P1); 3P1-4(1-P1)


VEJ= (-2P1+3-3P1); (3P1-4+4P1)


VEJ= -5P1+3; 7P1-4

Ecuación 1 = -5P1+3
Ecuación 2 = 7P1-4

·         Se le da valores arbitrariamente a P1 en la ecuación 1

Si P1=0 entonces; -5(0)+3=3
Si P1=1 entonces; -5(1)+3=-2

·         Se le da valores arbitrariamente a P1 en la ecuación 2

Si P1=0 entonces; 7(0) -4 = -4
Si P1=1 entonces; 7(1) -4 =  3


Es decir;

-5P1+3 = 7P1-4
-5P1-7P1=-4-3
-12P1=-7
P1=-7/-12
P1= 0.5833

P2=1-P1
P2=1-0.58
P2=0.42

Las probabilidades con la que debe jugar el jugador columna son las misma que de jugador renglón en la utilización de estrategias, es decir  del 58% con la estrategia I y del 42% con la estrategia II.

FUENTE: adaptado por los estudiantes de octavo semestre de ingeniería industrial universidad libre seccional Barranquilla; de la  Última actualización: septiembre 2007 Derechos de autor  de la pagina de © Stefan Waner


Dinámica para encontrar el valor del juego cuando no está estrictamente determinado
Cuando un juego no tiene punto de silla, la teoría de juegos aconseja a cada jugador asignar una distribución de probabilidad sobre su conjunto de estrategias. Vamos a expresar esto de la siguiente forma:

Xi = probabilidad de que el jugador A use la estrategia i ( i = 1,2,…,m)
yi = probabilidad de que el jugador B use la estrategia j ( j = 1,2,…,n) donde  n y m son los números de estrategias disponibles.
Vamos a empezar con el juego (2 x n) en el que el jugador A tiene dos estrategias, siendo la recompensa para este mismo jugador.


Suponemos que el jugador A mezcla las estrategias A1 y A2 con sus probabilidades respectivas x1 y 1 – x1, siendo 0 ≤ x1 ≤ 1. A su vez el jugador B mezcla sus estrategias con sus respectivas probabilidades.
En este caso, la recompensa esperada por A correspondiente a la j-ésima estrategia pura de B se calcula de la siguiente manera:

(a1j – a2j) x1 – a2j, j = 1,2,…,n

El jugador A trata así de determinar el valor de x1 que maximice las recompensas mínimas esperadas:
Max min {(a1j – a2j)x1 – a2j}

Tenemos un juego de 2 x 4 en el que la recompensa es para el jugador A.


B1
B2
B3
B4
Mínimo
A1
-1
2
2
3
-1
A2
6
4
3
2
2
Máximo
6
4
3
3

No hay punto de silla es decir el juego no está estrictamente determinado, no hay solución de estrategia pura, por lo que debemos mezclar estrategias. Las recompensas esperadas por A correspondientes a las estrategias puras de B, son:
RELACION DE ECUACIONES
|Estrategia pura de B           |Recompensa esperada por A                                      |
|1                                                              |-2x1 + 4                                                       |
|2                                                              |-x1 + 3                                                        |
|3                                                              |-x1 + 2                                                        |
|4                                                              |-7x1 + 6                                                       |
Se iguala las ecuaciones número 2 y 4 y nos resulta lo siguiente

-x1+3=-7x1+6
-x1+7x1=6-3
6x1=3
X1=3/6
X1=0.5
La solución óptima del jugador A mezcla A1 y A2 con las probabilidades 0.5 y 0.5, respectivamente. El valor V correspondiente del juego se determina sustituyendo x1 = 0.5 en cualquiera de las funciones de las líneas B3 y B4, con lo que se obtiene:
V = 0.5 + 2 = 2.5
V = -7(0.5) + 6= 2.5




Fuente: Tomado Última actualización: septiembre 2007 
Derechos de autor © Stefan Waner


Dinámica para el encontrar el valor del juego cuando esta estrictamente determinado


Para determinar si un juego está estrictamente determinado debemos saber si tiene punto de silla y esto se sabe Cuando hayamos los  mínimos en los reglones y los máximos en la columna  loa cuales arrojara unos valores que al ser comparados mostrara una igualdad de unos de esos valores tanto en columna como en renglón donde estos se intercepta será nuestro punto de silla  y demostrara que el juego está estrictamente determinado siendo este el valor del juego.
Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja las máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.
Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinados:
  1. Todos los puntos de silla en un juego tienen los mismos valores de pago.
  2. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.
El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial.

Ejemplo dilema del prisionero
Se arresta a dos sospechosos por robo, y si se les condena, cada uno recibiría una sentencia de 10 años. Sin embargo, si ninguno confiesa, la evidencia bastaría para una sentencia de 1 año por posesión de bienes robados. Se interroga a cada sospechoso por separado y no se permite comunicación entre ellos. El fiscal promete impunidad al que confiese, pero la totalidad de la sentencia de 10 años al que no confiese. Si confiesan ambos, cada uno obtiene una sentencia reducida de 5 años. La matriz de rendimiento para este caso sería:
La mejor estrategia para cada sospechoso es confesar, sin importar lo que haga el otro.


FUENTE: Tomado Última actualización: septiembre 2007  Derechos de autor © Stefan Waner



Reducción de una matriz

Una acción domina a otra si todos sus pagos son por lo menos tan provechosos al jugador que los pagos correspondientes de la otra. En términos de la matriz de pagos, podemos decirlo como sigue:
  1. Renglón r en la matriz de pagos domina a renglón s si cada pago en renglón r ≥ el pago correspondiente en renglón s.
  2. Columna r en la matriz de pagos domina a columna s si cada pago en columna r ≤ el pago correspondiente en columna s.
Observe que si dos renglones o columnas son iguales, cada uno domina al otro. Un renglón o columna domina estrictamente a un otro si el uno domina al otro y son desiguales.
Siguiendo el primero principios de la teoría de juegos, la acción que corresponde a un renglón o columna estrictamente dominado nunca será jugado, y ambos jugadores son conscientes de esto por el segundo principio. Entonces cada jugador quien sigue los principios de la teoría de juegos eliminará repetidamente renglones y columnas dominadas como podría ser el caso. (En el caso que son iguales dos renglones o columnas, no hay razón para elegir uno sobre el otro, entonces cualquiera de los dos puede ser eliminado.) Este proceso se llama reducción por predominio.


Ejemplo
Considere otra vez el siguiente juego.


Acción Columna



A
B
C

Acción
Renglón
1
0
-1
1
2
0
0
2
3
-1
-2
3
Pues las entradas de Renglón 2 son ≥ las entradas correspondientes en Renglón 1, entonces Renglón 2 domina a Renglón 1.
Pues las entradas de Columna B son ≤ las entradas correspondientes en Columna A, Columna B domina a Columna A.
Reducir el juego más arriba por predominio
Pues Renglón 2 domina a Renglón 1, eliminamos Renglón 1 para obtener


A
B
C
2
0
0
2
3
-1
-2
3
Pues Columna B ahora domina a ambas Columnas A y C, eliminamos las dos Columnas A y C para obtener


B
2
0
3
-2
Pues el primero renglón domina ahora al último renglón, eliminamos el último renglón, y estamos reducidos a la siguiente matriz 1×1


B
2
(
0
)
En este caso, hemos solucionado el juego por reducción por predominio: El jugador renglón debe siempre jugar 2 y el jugador de columna debe siempre jugar B. Pues el pago correspondiente es 0, decimos que el juego es justo (ninguno jugador tiene ventaja sobre el otro).
Observe que tuvimos suerte aquí: No todos los juegos pueden ser reducido a un juego 1×1 por predominio.

FUENTE: Tomado Última actualización: septiembre 2007  Derechos de autor © Stefan Waner

Solución por Programación lineal
Pasos del método de la programación lineal para determinar la estrategia aleatorizada Óptima.
1.    Determine la matriz de recompensa R.
2.    Si R tiene elementos no positivos, forme Rʼ  sumando una constante a cada elemento de R. Si E y Eʼ constituyen los valores esperados del juego asociados con las matrices de recompensa R y Rʼ, respectivamente, entonces Eʼ = E + (La Constante añadida).
3.    Si el jugador renglón adopta una estrategia aleatorizada, donde las probabilidades de selecciones de los renglones 1 a n son P1 a Pnʼ respectivamente, entonces:
Pr = [ PP2 …. Pn ] donde P1 + P2 +…. + Pn = 1
Si el jugador columna adopta una estrategia pura, los valores esperados de dichas estrategias puras se incluyen en la matriz.
E (Pura)= Pr * Rʼ
Calcule E (Pura)
4.    Resuelva P1 + P2 +…. + Pn = 1 para Pn = 1 y sustituya el resultado en E (Pura).
5.    El valor esperado Eʼ  del juego es menor o igual que cada uno de los elementos de la matriz del paso 4. Cada una de esas desigualdades resultantes constituye una restricción en el problema de programación lineal. Liste estas restricciones.
6.    Cada una de las probabilidades P1, P2, P3 , … debe ser menor o igual que 1. Liste estas restricciones.
7.    Establezca el objetivo, que consiste en obtener el valor máximo de Z= Eʼ.
8.    Resuelva el problema de programación lineal y determine los valores de PP2 …. Pn,  y Eʼ.
9.    Describa la estrategia aleatorizada óptima del jugador renglón proporcionando la probabilidad con la que el jugador debería elegir cada renglón.
10. Reste la constante del paso 2 de Eʼ para obtener E, el valor esperado del juego.





EJEMPLO: JUEGO DE DOS JUGADORES DE SUMA NULA

FUENTE: tomado del libro de winston en su pagina 545
Solución por Solver

Lo ejercicios de teoría de juego que no están estrictamente determinada se le puede dar solución por medio de la herramienta informática solver que es uno de los complementos de la hoja de cálculo Excel.
 Pasos para la resolución de problemas en solver:
1. se plantea la matriz de juego en la hoja de cálculo de Excel
 
2. Se halla los mínimos de los renglones y los máximos en las columna a través de las formulas de Excel MIN y MAX llevando el cursor al reglón de debajo del reglón mínimo colocando el signo igual del teclado seguramente escribiendo la función o formula MIN  y seleccionando las celadas de la Er1 y terminando con un enter y luego desplazando la copia de esta función hasta donde sea necesario. Igualmente para hallar los máximos de la columna se llevara el cursor al lado de la columna que dice máximo e insertamos la función MAX MIN  y seleccionando las celadas de la Ec1 y terminando con un enter y luego desplazando la copia de esta función hasta donde sea necesario.


3.  Tomamos dos columnas hacia la izquierda donde una de ellas va ser nombradas con el número de probabilidades iguales a las de las estrategias y la siguiente a ella rellenada con ceros, al llegar al rellenar todas las columna de ceros correspondiente al número de probabilidades en la casilla siguiente de la columna se establece la sumatoria de todas estas probabilidades a través de la función autosuma ubicada  en la ventana de inicio del lado derecho.


4. luego establecemos debajo de la matriz de pago un pequeña matriz renglón donde ubicaremos las suma y  producto de la matriz de pago con las probabilidades atravez de la función de Excel SUMAPRODUCTO llevamos el cursor se lleva al renglón de abajo se digita el símbolo igual y digitamos la función segundo de la selección de la matriz de probabilidades se fijan con la tecla F4 separados por un punto y coma y se selecciona la matriz de pago y se da enter, y luego desplazamos esta casilla seleccionada para que me arroje la suma produce de las demás estrategias. Luego tomamos una casilla cualquiera llamadas valor esperado del juego.

5. ya planteada la estructura del ejercicio  se procede a la utilización del solver donde se procederá al llenado de los siguientes comandos en el valor esperado del juego en la casilla inmediata seguida va ser nuestra celda objetivo, luego como vamos a hallar las probabilidades de mi jugador renglón se selecciona el máximo, después la celdas a cambiar será las de las probabilidades y la celda objetivo, además este ejercicio va estar sujeto a las siguientes restricciones: a) la sumatoria de mis probabilidades va ser igual a uno (1). b) las probabilidades deben ser mayores o iguales a ceros. c) la suma producto de mis estrategias con las probabilidades deben ser mayores a la de mi celda objetivo.
Luego de haber gestionado todos estos comandos nos vamos al botón opciones y se adopta no negativos, se le da cerrar, luego resolver y por ultimo  seleccionamos utilizar solución de solver  y aceptar. Y todo esto nos arroja  los resultados de las probabilidades con  las que debe jugar  mi jugador renglón.




6. para encontrar las probabilidades con la que debe jugar mi jugador renglón procedemos a cambiar en solver lo siguiente en el valor de función objetivo seleccionamos mínimo y en las restricciones  se cambia  que  los sumaproductos serán menores que la celda objetivo o valor esperado en el juego.


FUENTE: elaborado por los estudiantes de octavo semestre de ingeniería industrial universidad libre seccional Barranquilla 

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best CD Rates