función de utilidad de un jugador de poker implementada según un

Anuncio
FUNCIÓN DE UTILIDAD DE UN JUGADOR DE POKER
IMPLEMENTADA SEGÚN UN MODELO DE DATOS
EXTRAÍDO DE WEKA.
Jonathan Caballero Álvarez
Javier Baltasar Palma
Ingeniería de Telecomunicación
5º Curso
100060641
Ingeniería de Telecomunicación
5º Curso
100060646
1.- INTRODUCCIÓN
Trabajo para la asignatura de Inteligencia en Redes
de Comunicaciones.
LA IDEA
Durante este desarrollo teórico vamos a explicar
cómo un jugador de póker al estilo Texas Hold’em
implementado por una inteligencia artificial podría averiguar
cuándo un jugador humano va de farol, en función de las
cinco cartas que hay boca arriba en la mesa, y de la cantidad
apostada, introduciendo esos valores en un modelo de datos
construido en las jugadas anteriores.
LAS HERRAMIENTAS
♦ Función de utilidad
♦ Minería de datos
♦ Weka
♦ Poker Texas Hold’em
El póker es uno de los juegos de azar en los que
más valor tiene la estrategia seguida por el jugador.
Los
sistemas
de
inteligencia
artificial
implementados para este juego hacen un análisis simple de la
situación, y aplican un modelo estadístico en el que calculan,
con el limitado rango de cartas que pueden visualizar (siete
cartas, cinco en la mesa y dos en su mano), si su jugada tiene
más o menos probabilidades de derrotar a las de los demás,
apostando más o menos cantidad en función de ello.
Nuestra idea ha querido ir más allá, introduciendo
un nuevo elemento en la ecuación que estos sistemas utilizan:
la capacidad de mentir del ser humano.
A día de hoy existen sistemas para identificar
cuándo una persona miente o dice la verdad, pero todos ellos
están basados en análisis clínicos, como la temperatura
corporal o la sudoración, datos que en este caso no están a
nuestra disposición. Sin embargo, podemos crear un modelo
de conducta para cada jugador individual, basándonos
únicamente en la forma de actuar en las rondas previas.
Aludimos aquí a la teoría de John Nash, conocida
como la teoría de juegos, en la que se define para cada
jugador una función de utilidad, que representa el grado de
aversión o propensión al riesgo de cada uno.
Aplicado al caso que nos concierne, asimilaremos
esta función a una gráfica o modelo de datos, que nos
devolverá las posibilidades que hay de que un jugador haya
apostado en función de una jugada superior a la que
realmente tiene, es decir, va de farol.
2.- POKER MODELO TEXAS HOLD’EM
2.1.-Objetivo
Figura 1: Representación de escalera de color (jugada
más alta en póker).
Al igual que en otras versiones de póker, el objetivo
de Texas hold 'em es llevarse el bote o pozo, donde bote es el
dinero apostado por todos los jugadores en una mano. El bote
se gana bien al mostrar las cartas, formando las mejores 5
cartas de las 7 disponibles, o apostando para que los otros
jugadores "tiren" las cartas o "no vayan", abandonando su
apuesta por el bote.
Al coger las cinco mejores cartas de las siete
disponibles (dos cartas iniciales privadas y cinco cartas
comunitarias) , cada uno puede hacer la combinación que
más beneficiosa le resulte. Es decir, puede coger sus dos
cartas iniciales más tres cartas comunitarias de la mesa,
puede coger una de sus cartas iniciales más cuatro cartas
comunitarias, o puede no coger ninguna de sus cartas
iniciales y jugar con las cinco cartas comunitarias. A esto
último se le llama "jugar con la mesa".
2.3.- Evolución de una ronda
2.3.1.-Pre-Flop
2.2.-Apuestas
Hold'em se suele jugar usando las apuestas ciega
pequeña ("small blind") y ciega grande ("big blind"). Estas
apuestas se demominan "ciegas" ya que el jugador apuesta
sin haber visto ninguna de las cartas de la mesa.
La ciega pequeña la pone el jugador a la izquierda del
repartidor, y equivale a la mitad de la ciega grande.
La ciega grande la aporta el jugador a la izquierda del
anterior y equivale a la apuesta mínima. En los torneos, la
cantidad de las ciegas va aumentando conforme el torneo
avanza.
Un botón se utiliza para representar al jugador
situado en la posición del repartidor (Dealer). El botón de
repartidor gira en la dirección de las agujas del reloj después
de cada mano, con lo que se van turnando el repartidor y las
"ciegas".
2.3.- Clasificación de las jugadas
Se debe conseguir la mejor mano de las siguientes:
Jugada
Descripción
Cinco cartas
Escalera seguidas del
mismo palo
real
del 10 al As.
Ejemplo
Nº
Comb.
4
Cinco cartas
Escalera consecutivas
mismo
de color del
palo.
36
Cuatro cartas
Póquer iguales en su
valor.
624
Figura 2: Dos ases, a priori la mejor jugada
El juego comienza repartiendo 2 cartas boca abajo a
cada jugador. Son las únicas cartas que cada jugador recibirá
individualmente, y sólo serán descubiertas si se muestran las
cartas al final de la mano, o si la apuesta queda entre 2
jugadores y se apuesta un all-in.
La mano comienza con una ronda de apuestas antes
del flop, comenzando por el jugador a la izquierda de la ciega
grande y se continúa en la dirección de las agujas del reloj.
Después de esta ronda de apuestas, si aún continúan
al menos dos jugadores en la mano, se comienzan a poner
sobre la mesa las cinco cartas comunitarias descubiertas. De
esta forma Texas hold'em es un juego de póker "descubierto",
lo cual es prácticamente imprescindible para el trabajo que
vamos a desarrollar. Las cartas vendrán siendo colocadas en
tres fases:
2.3.2.-Post-Flop
Antes de cada una de las tres fases se quema una
carta, que se deja apartada y boca abajo.
2.3.3.-1ª Fase, (Flop): Tres cartas descubiertas
Full
Tres cartas
iguales, más
otras
dos
iguales.
3.744
El repartidor reparte el flop, tres cartas descubiertas
simultáneamente .El "flop" va seguido de otra ronda de
apuestas. Esta y las demás rondas de apuestas comienzan por
el jugador a la izquierda del croupier o quien posea el Dealer
y continúan en el sentido de las agujas del reloj.
Color
Cinco cartas
del
mismo
palo sin ser
consecutivas.
5.148
2.3.4.-2ª Fase, (Turn): Una carta descubierta
Cinco cartas
consecutivas
Escalera
de
palos
diferentes.
10.200
Tres cartas
iguales en su
valor.
54.912
Dobles Dos pares de
parejas cartas.
123.552
Dos
cartas
Pareja iguales y tres
diferentes.
1.098.240
Carta Gana quien
más alta tiene la carta
o jardín más alta.
1.302.540
Trío
Después de la ronda de apuestas en el "flop", una
nueva carta descubierta (turn) se pone sobre la mesa, seguido
de otra ronda de apuestas.
2.3.5.-3ª Fase, (River): Una carta descubierta
Después del "Turn", otra carta descubierta (river) se
coloca sobre la mesa (formando las cinco cartas comunes), y
es seguido de otra ronda de apuestas.
2.3.6.-Show Down
Finalmente, la muestra de cartas si fuera necesario
para dirimir al ganador entre los jugadores que todavía estén
en la mano.
2.3.7.-El Ganador
Tabla 1: Todas las jugadas posibles en póque y la
probabilidad de que ocurran.
Si un jugador apuesta y todos los demás se retiran,
el jugador se lleva todo el dinero del bote, y no tendrá que
mostrar sus cartas. Si dos o más jugadores continúan después
de la última ronda de apuestas, se muestran las cartas. En la
muestra, cada jugador utiliza las cinco mejores cartas
posibles de entre las siete que forman sus dos cartas y las
cinco cartas comunes de la mesa.
Si dos jugadores o más comparten la mejor mano,
entonces el bote se divide por igual entre los jugadores. De
todas formas es común que los jugadores tengan manos muy
similares, pero no idénticas. A menudo se utiliza la carta
kicker para desempatar, siendo ésta, en un empate de jugadas
de menos de cinco cartas la quinta carta, o la carta más alta
de una jugada de cinco.
3.- EL FACTOR HUMANO
Tal y como se ha explicado anteriormente, el póker
es un juego con una fuerte componente de estrategia.
En el caso que nos concierne, el objetivo es ganar la
mayor cantidad de fichas o dinero posible, lo que se consigue
siguiendo un sistema de apuestas.
En los párrafos anteriores vimos que en cada ronda
de juego hay cuatro momentos en los que se lleva a cabo las
apuestas: El pre-flop, el flop, el turn y el river.
Después de ponerse las ciegas y de que se han
repartido las dos cartas a cada jugador, la acción comienza
con el jugador inmediatamente a la izquierda de la ciega
grande que tiene la opción de pagar la ciega, subir (poner una
apuesta adicional), o retirarse (tirar su mano).
La acción continua alrededor de la mesa, y cada
jugador tiene la opción de pagar, subir o retirarse. Una vez
que la acción regresa a las ciegas, éstas tienen un par de
opciones. Si alguien ha subido, las ciegas pueden retirarse,
pagar o re-subir. Si nadie ha subido, cualquiera de los dos
jugadores en las ciegas puede subir. La ciega pequeña debe,
como mínimo, igualar la ciega grande si desea jugar la mano.
La ciega grande puede simplemente pasar si nadie ha subido.
Hay otra ronda de apuestas después del flop,
después del turn y después del river. Las apuestas comienzan
con el primer jugador restante a la izquierda del dealer. Si la
ciega pequeña no se ha retirado, ésta comienza la acción en
todas las rondas de apuestas siguientes al flop. Dado que no
hay apuestas forzadas en las siguientes rondas el pasar está
permitido.
El cómo una computadora llevaría a cabo las
decisiones de subir, pasar o retirarse de una apuesta es algo
muy simple. Dado que tiene una enorme capacidad de
cálculo, muy superior a la del cerebro humano, analizaría el
conjunto de jugadas posibles en función de las cartas
comunitarias, y vería si su jugada personal está entre el 50%
de las mejores posibles, caso en el que igualaría la apuesta.
Para subir, realizaría la misma operación, pero en este caso
esperaría a tener una jugada mejor, por ejemplo entre el 20%
de las mejores, de forma que tuviera muchas probabilidades
de ganar.
El caso de un ser humano es bien distinto. Esto es
debido a dos factores fundamentales:
- Es incapaz de realizar los cálculos necesarios en
tiempo real, dado que necesita altos conocimientos de
estadística y mucha más capacidad de procesamiento.
- Sus decisiones dependen también de la presión a
la que se ve sometido, así como del estudio del
comportamiento de sus compañeros de juego.
Es por ello que sus apuestas pueden diferir del
resultado óptimo obtenido por una computadora.
Ante la subida de una apuesta del jugador anterior,
una persona debe distinguir si lo ha hecho porque cree llevar
una buena jugada, o porque tiene muy pocas probabilidades
de ganar y pretende intimidar a los demás jugadores para que
se retiren y quedarse él con el bote, es decir, porque va de
farol.
Se da el mismo caso cuando un jugador decide
entre pasar o subir la apuesta.
El verdadero problema nace a partir de este punto,
y es que no se puede construir un sistema que modele al “ser
humano medio”, sino que cada persona tiene más o menos
probabilidades de efectuar una jugada de farol. Esto es así
porque este tipo de jugadas implican un gran riesgo, dado que
con una mano que muy probablemente pierda la partida, se
intenta ganar todo el bote.
Es aquí donde entra en juego la función de utilidad,
que determina para un jugador el grado de aversión o
propensión al riesgo que presenta.
4.- LA TEORÍA DE JUEGOS
Todo jugador de póker participa en este juego por
la motivación de conseguir unas ganancias en el mismo. Por
este motivo y por el hecho de ser un juego (se puede
denominar lotería atendiendo a términos de teoría de juegos)
se puede modelar de acuerdo a una serie de términos que
describiremos a continuación:
Valor esperado: Media ponderada de todos los
resultados posibles, donde los pesos son las
probabilidades.
1
El atractivo del juego no depende únicamente del valor
esperado sino de la utilidad de cada una de las opciones. Es
decir, no solo se tiene en cuenta la posibilidad de ganar una
cierta cantidad de dinero, sino la probabilidad de perder esa
misma cantidad o una cantidad mayor.
Por este motivo un individuo no elige la opción de
lotería con el máximo valor esperado, sino con la máxima
utilidad esperada. La utilidad esperada de un juego es el valor
esperado de la utilidad de cada uno de los resultados posibles:
2
Teniendo en cuenta estos dos factores descritos
anteriormente podemos pasar a hacer la definición de juego
justo:
Juego justo: Juego cuyo valor esperado es 0. El valor
esperado de nuestra riqueza si aceptamos el juego es igual
que el valor seguro si lo rechazamos.
Así con estos datos, podemos clasificar a todo jugador
de una lotería en 3 grupos diferenciados atendiendo al riesgo
que toman de participar en la misma:
1
Ecuación del valor esperado en nomenclatura de teoría de juegos.
Ecuanción de la función de utilidad esperada en nomenclatura de
teoría de juegos.
2
1.
Persona adversa al riesgo
Estas personas rechazarán juegos justos (VE=0) y
algunos juegos con VE positivo.
Podemos describir el comportamiento de este tipo de
personas con la siguiente gráfica:
La conclusión que se puede obtener para este tipo de
personas de la gráfica es que, cuanta más riqueza tiene un
consumidor más utilidad experimentará por un incremento de
la misma.
3.
Persona neutral al riesgo
Indiferente entre aceptar o rechazar un juego (VE = 0).
Podemos describir el comportamiento de este tipo de
personas con la siguiente gráfica:
Figura 3: Gráfica de la función de utilidad de una
persona adversa al riesgo.
La conclusión que se puede obtener para este tipo de
personas de la gráfica es que, cuanta más riqueza tiene un
consumidor menor utilidad experimentará por un incremento
de la misma.
2.
Persona amante del riesgo
Aceptarán juegos justos (VE = 0) y algunos juegos con
VE negativo.
Podemos describir el comportamiento de este tipo de
personas con la siguiente gráfica:
Figura 5: Gráfica de la función de utilidad de una
persona neutral al riesgo.
En este caso el consumidor experimenta un incremento
de la utilidad proporcional al de la riqueza.
Si aplicamos estas herramientas al juego que nos ocupa,
el póker, tendremos 3 grupos de personas con diferentes
formas de actuación dependiendo del riesgo que suponga una
jugada para la consecución de una ganancia para sí misma.
Esto quiere decir, que podemos modelar la tendencia a
farolear de cada uno de los individuos que participan de esta
lotería si conseguimos detectar en ellos el modelo de riesgo
que están dispuestos a correr acorde con las ganancias o
pérdidas que les suponga. Para ello atenderemos sus
respuestas a una de las 3 gráficas descritas anteriormente.
A partir de ahora nuestro problema se centrará en
asignar a cada jugador uno de los tres perfiles descritos. Para
ello compararemos sus actuaciones anteriores en la partida
con las gráficas anteriores mediante un análisis de mínimos
cuadrados.
Recopilar los datos de las anteriores partidas y su
posterior análisis serán los trabajos que desarrollemos
mediante minería de datos.
5.- MINERÍA DE DATOS
Figura 4: Gráfica de la función de utilidad de una
persona amante del riesgo.
La minería de datos consiste en la extracción no
trivial de información que reside de manera implícita en los
datos. Dicha información era previamente desconocida y
podrá resultar útil para algún proceso. En otras palabras, la
minería de datos prepara, sondea y explora los datos para
sacar la información oculta en ellos.
Las bases de la minería de datos se encuentran en la
inteligencia artificial y en el análisis estadístico. Mediante los
modelos extraídos utilizando técnicas de minería de datos se
aborda la solución a problemas de predicción, clasificación y
segmentación.
Dinero invertido por el jugador en la mano que se
está jugando.
Cantidad de fichas en el bote central.
Probabilidad de que la jugada del jugador esté entre
el 25% de las mejores jugadas para ganar la mano.
Acciones realizadas por el resto de jugadores en
función de sus anteriores respuestas al juego.
Un proceso típico de minería de datos consta de los
siguientes pasos generales:
♣ Selección del conjunto de datos, tanto en lo que
se refiere a las variables dependientes, como a las variables
objetivo, como posiblemente al muestreo de los registros
disponibles.
♣ Análisis de las propiedades de los datos, en
especial los histogramas, diagramas de dispersión, presencia
de valores atípicos y ausencia de datos (valores nulos).
♣ Transformación del conjunto de datos de entrada,
se realizará de diversas formas en función del análisis previo,
con el objetivo de prepararlo para aplicar la técnica de
minería de datos que mejor se adapte a los datos y al
problema.
♣ Seleccionar y aplicar la técnica de minería de
datos, se construye el modelo predictivo, de clasificación o
segmentación.
♣ Extracción de conocimiento, mediante una
técnica de minería de datos, se obtiene un modelo de
conocimiento, que representa patrones de comportamiento
observados en los valores de las variables del problema o
relaciones de asociación entre dichas variables. También
pueden usarse varias técnicas a la vez para generar distintos
modelos, aunque generalmente cada técnica obliga a un pre
procesado diferente de los datos.
♣ Interpretación y evaluación de datos, una vez
obtenido el modelo, se debe proceder a su validación
comprobando que las conclusiones que arroja son válidas y
suficientemente satisfactorias. En el caso de haber obtenido
varios modelos mediante el uso de distintas técnicas, se
deben comparar los modelos en busca de aquel que se ajuste
mejor al problema. Si ninguno de los modelos alcanza los
resultados esperados, debe alterarse alguno de los pasos
anteriores para generar nuevos modelos.
♣ Si el modelo final no superara esta evaluación el
proceso se podría repetir desde el principio o, si el experto lo
considera oportuno, a partir de cualquiera de los pasos
anteriores. Esta retroalimentación se podrá repetir cuantas
veces se considere necesario hasta obtener un modelo válido.
♣ Una vez validado el modelo, si resulta ser
aceptable, ya está listo para su explotación. Los modelos
obtenidos por técnicas de minería de datos se aplican
incorporándolos en los sistemas de análisis de información de
las organizaciones, e incluso, en los sistemas transaccionales.
Tradicionalmente, las técnicas de minería de datos
se aplicaban sobre información contenida en almacenes de
datos. De hecho, muchas grandes empresas e instituciones
han creado y alimentan bases de datos especialmente
diseñadas para proyectos de minería de datos en las que
centralizan información potencialmente útil de todas sus
áreas de negocio. No obstante, actualmente está cobrando una
importancia cada vez mayor la minería de datos
desestructurados como información contenida en ficheros de
texto, en Internet, etc.
En el caso que tratamos, los datos
necesitaremos obtener de cada jugada y jugador serán:
En base a esto podemos realizar un modelo en weka de forma
que podemos llevar un registro de todas las jugadas
realizadas en una partida de poker, para un posetior análisis
de las mismas. Esto nos servirá para una partida posterior con
los mismo jugadores sentados a la mesa, poder prever sus
acciones en función de las cartas existentes en la mesa y
teniendo en cuenta las mismas actuar en consecuencia.
6.- MODELO PARA TEXAS HOLD’EM
Utilizando todas las herramientas expuestas en las secciones
anteriores establecemos el modelo final para que una
máquina pueda competir con individuos humanos en el juego
del póquer, explicando el modelo a seguir para elegir las
acciones adecuadas en cada mano de juego dependiendo de
los acompañantes de la mesa y las acciones que realizan
durante el juego.
6.1.-Establecer situación propia
En primer lugar la máquina debe establecer cual es su
situación, acorde al número de fichas que tiene, al iniciarse
cada mano, para conocer el riesgo que puede tomar a la hora
de enfrentarse a las jugadas del resto de jugadores humanos.
Para ello realiza una sencilla media aritmética de acuerdo al
número de fichas que hay en juego en el momento de
iniciarse la mano.
3
Si a este nº medio de fichas lo llamamos umbral de
participación (thp) tendremos las siguientes situaciones:
fichas < 0.5 * thp  Nivel muy bajo de fichas.
0.5*thp < fichas < 0.75*thp  Nivel bajo de fichas.
0.75*thp < fichas < 1.25*thp  Nivel medio de fichas.
1.25*thp < fichas < 1.75*thp  Nivel alto de fichas.
fichas > 2*thp  Nivel muy alto de fichas.
Una vez conocida su situación es necesario identificar la
situación del resto de competidores en la mesa de juego, para
ello se realizará una operación del mismo calibre para
conocer el nivel de riqueza de los mismos.
6.2.- Comparar con los modelos ideales
Suponiendo que ya se hayan realizado varias manos, la
máquina conocerá la disposición de cada uno de los
jugadores frente al riesgo, situando a cada uno de ellos en una
de las situaciones descritas en la sección 4 de este
documento:
Adverso al riesgo  Función
Indiferente al riesgo  Función
Amante del riesgo  Función
que
Número de fichas que posee al inicio de la jugada.
3
Ecuación que utiliza la máquina para conocer su situación en la
mano actual.
Dibujaremos las tres funciones en un mismo gráfico para ver
las correspondencias entre ellas:
y=x
y = x2
y = √x
asemejaríamos a una de los tres perfiles anteriormente
comentados.
En un análisis cuantitativo, habría que realizar un estudio de
mínimos cuadrados en el que se compararían los puntos de la
envolvente con los de las gráficas ideales. Es aquí donde
entrará en juego el uso de la herramienta Weka, pues con
unos cuantos valores la máquina podrá completar el modelo
para todos los puntos del eje X, al principio de forma muy
aproximada, y conforme vaya obteniendo más datos, con más
precisión.
El motivo de tomar la envolvente superior es debido a que es
la que delimita la relación máxima ganancias/dificultad que
ese jugador en concreto está dispuesto a asumir.
Donde a medida que nos desplazamos a la derecha de la
gráfica significa que el contrincante tiene mayores ganancias
y a medida que nos desplazamos a la izquierda que tiene
menos ganancias. De esta forma situará en la gráfica la
posición de cada jugador para conocer el nivel de riesgo que
esta dispuesto a asumir en la mano actual en consonancia con
las fichas que tiene.
La máquina deberá hacer una aproximación cuantitativa de lo
que nosotros a continuación vamos a hacer de forma
cualitativa.
Dado un conjunto de datos sobre las actuaciones de un
jugador en las manos anteriores, representaremos en una
gráfica un punto por cada mano de la que tengamos datos, de
forma que en el eje de abscisas quede la cantidad de fichas o
dinero que están en ese momento en posesión del jugador, y
en el eje de ordenadas un valor representativo que identificará
las ganancias obtenidas en esa mano en función de la
cantidad y de la dificultad que supuso obtenerlas, es decir, la
función de utilidad de cada ganancia.
Este valor lo obtendremos a partir de la siguiente fórmula:
4
Donde
-
Apuesta es la cantidad que tuvo que apostar finalmente
para optar al bote comunitario.
Bote es la cantidad que ganó finalmente
Jugada es un valor numérico que identifica la calidad
de las cartas que tenía en su poder.
(Ver anexo 1: El valor de las jugadas)
Las características requeridas quedan entonces plasmadas en
esta fórmula, ya que la cantidad ganada afecta de forma
proporcional, y la dificultad se ve reflejada en los otros dos
factores, siendo la apuesta proporcional, dado que a más
cantidad apostada más riesgosa se torna la situación, pues
mayor cantidad puede llegar a perder; y la jugada
inversamente proporcional, ya que la dificultad para ganar
será más elevada cuanto peor sean las cartas propias.
En nuestro análisis cualitativo, tomaríamos la envolvente
superior del conjunto de puntos representado, y la
6.3.- Dos ejemplos prácticos
Para probar el modelo y comprobar la veracidad del modelo
estudiado realizamos un ejemplo participando en una partida
de póquer modelo Texas Hold’em jugando 8 manos.
Para ello uno de los jugadores tomará el rol de jugador
adverso al riesgo a la hora de realizar las apuestas y el otro
jugador tomará el rol de jugador amante del riesgo.
Para ello representaremos en una tabla el resultado de las
jugadas, apuestas y ganancias de cada uno de los jugadores
para las manos resultantes.
fichas
iniciales
valor de la
jugada
fichas
apostadas
bote
Figura 6: Gráfica comparativa de las funciones de
utilidad de los 3 grupos de riesgo
(apostado
/jugada)
*bote
150
130
145
175
152
137
110
124
2
2
25
1
2
2
2
2
20
22
20
15
13
25
8
8
24
66
34
19
20
65
12
16
240
726
27,2
285
130
812,5
48
64
Tabla 2: Resultado de caso práctico de 8 manos para
individuo amante del riesgo.
Aquí representamos el valor de las jugadas de acuerdo a la
fórmula de la sección anterior.
900
800
700
600
500
400
300
200
100
0
0
4
Función para conocer el riesgo que está dispuesto a asumir un
jugador.
50
100
150
200
Figura 7: Gráfica de las jugadas realizadas en el
ejemplo práctico para un individuo amante del riesgo.
fichas
iniciales
valor de la
jugada
fichas
apostadas
bote
Observamos la forma que tendría la gráfica ideal de una
persona amante del riesgo, la cual habría que normalizar de
acuerdo a las fichas iniciales de que dispone cada jugador:
(apostado
/jugada)*bote
150
150
123
140
147
143
188
174
10
10
2
1
2
10
2
1
22
20
15
35
Retirado
25
2
8
44
27
17
42
4
45
4
12
96,8
54
127,5
1470
---------112,5
4
96
Tabla 3: Caso practico de 8 manos para individuo
adverso al riesgo.
De nuevo adjuntamos la gráfica ideal sin normalizar de
acuerdo a un jugador de este tipo, atendiendo a la gráfica,
vemos que a pesar de también ser creciente como la anterior
el crecimiento de la misma es pequeño. En el caso que nos
acontece el jugador adverso al riesgo estudiado apenas realiza
apuestas con riesgo a la hora de jugar sus manos, pudiendo
observarse que apenas le afecta la cantidad de fichas que
posee en su montón, siendo incluso las apuestas menores a
medida que su número de fichas aumenta.
25
20
15
10
5
0
0
100
200
300
400
500
Figura 9: Gráfica ideal para un individuo adverso al
riesgo.
4500
4000
3500
3000
2500
7.- PREVISIÓN DE JUGADAS
2000
Con todo el análisis concluido, es hora de obtener los
resultados, que podremos explotar de dos formas distintas.
1500
1000
7.1.- Identificar los faroles
500
0
0
10
20
30
40
50
60
70
Figura 7: Gráfica ideal para un individuo amante del
riesgo.siguen una disposición
Se puede observar que las jugadas
creciente, con una tendencia de crecimiento alta de acuerdo a
que, a medida que van aumentando las ganancias el valor
esperado a la hora de realizar un riesgo es mucho mayor.
Como se puede observar este jugador se encuentra en la parte
inicial de la gráfica donde el aumento del riesgo de acuerdo a
las ganancias obtenidas (pendiente de la gráfica) no es muy
alto.
Jugador adverso al riesgo
Tal como hemos visto en las dos gráficas de ejemplo
anteriores, se encuentra de vez en cuando unos puntos que se
alejan claramente de la tendencia normal de la gráfica. Son
los puntos correspondientes a un farol lanzado por el jugador.
La explicación es muy simple si entendemos el significado de
la fórmula con la que lo calculamos, y es que estos valores
tan altos sólo pueden obtenerse cuando la apuesta lanzada es
considerablemente alta, y además la jugada tiene un valor
pequeño (para que divida por un número pequeño), es decir,
la definición de “farol”.
900
800
Aquí representamos el valor de las jugadas de acuerdo a la
fórmula de la sección anterior.
700
600
500
400
1600
300
1400
200
1200
100
1000
0
0
800
50
100
150
200
600
Figura 10: Distinción de las jugadas que resultan faroles
para el individuo amante del riesgo
400
200
0
0
50
100
150
200
Figura 8: Gráfica de las jugadas realizadas en el
ejemplo práctico para un individuo adverso al riesgo.
evitando así retirarse de una partida por una jugada
superior a la propia que no puede tener lugar.
1600
1400
ANEXO 1:
EL VALOR DE LAS JUGADAS
1200
1000
800
Veremos en este anexo cómo en función del número de
combinaciones que existe para cada jugada podemos obtener
un valor que representa su calidad y sus posibilidades de
ganar.
600
400
200
0
0
50
100
150
200
Figura 11: Distinción de las jugadas que resultan faroles
para un individuo adverso al riesgo.
Con estos puntos podemos hacer un cálculo estadístico que
nos diga las probabilidades que tiene cada jugador de ir de
farol, y valorarlo a la hora de aceptar o no una apuesta.
7.2.- Valorar la jugada del contrario
En caso de no ser un farol, podemos estimar la calidad de la
jugada del contrario aplicando las gráficas de los perfiles de
jugador.
De este modo, y dado que conocemos tres de los cuatro
factores, que son la apuesta que el contrario realiza, el bote al
que aspira y la cantidad que posee, podemos obtener muy
fácilmente el cuarto, que es el valor de la jugada.
Si bien este valor nunca será algo exacto dada la
imposibilidad de prever con total seguridad las acciones de
un ser humano, puede usarse para estimar de forma
aproximada las probabilidades de ganar del jugador
oponente.
8.- CONCLUSIONES
Llegados a este punto, estamos en condiciones de concebir un
jugador artificial de póker, que aprenda tras cada ronda la
forma de jugar de sus oponentes.
Este trabajo tan sólo desarrolla una mejora en la inteligencia
artificial de este jugador, pues primero es necesario
desarrollarla con una estrategia sólida y audaz, de forma que
ya por sí misma sea capaz de defenderse durante las primeras
rondas, donde aun no tiene información de sus contrarios.
Esto significa que al principio tomará decisiones basadas en
sus propias cartas, el caudal en su posesión y las
probabilidades de ganar con ello, pero según vaya avanzando
la partida comenzará a entender la forma de jugar de los que
le acompañan en la mesa, asignándole a cada uno una
personalidad de jugador.
Dando como valor base 1 a la peor jugada, esto es, carta alta,
iremos multiplicando por el factor adecuado conforme
vayamos aumentando la calidad de la misma. Dicho factor
surgirá de dividir el número de combinaciones posible de la
jugada inferior con el de a la que estamos asignando el valor
en cada momento. De este modo obtenemos los factores:
Jugada
Nº combinaciones
Factor
Escalera real
Escalera de color
Póquer
Full
Color
Escalera
Trío
Dobles parejas
Pareja
Carta más alta
4
36
624
3.744
5.148
10.200
54.912
123.552
1.098.240
1.302.540
9
17.33
6
1.375
1.98
5.383
2.25
8.88
1.186
-
Tabla 4: Factores de cálculo de los valores
De donde calculamos los valores de cada combinación,
redondeando posteriormente a un número más manejable:
Jugada
Valor exacto
Valor redondeado
Escalera real
Escalera de color
Póquer
Full
Color
Escalera
Trío
Dobles parejas
Pareja
Carta más alta
325559.43
36173.27
2086.92
347.82
252.96
127.67
23.715
10.54
1.186
1
325000
36000
2000
350
250
125
25
10
2
1
Tabla 5: Valores de cada jugada
9.- BIBLIOGRAFIA
[1] Wikipedia, la encyclopedia libre, sección Texas
Holdem.
Dado el caso de querer realizar un análisis mucho más
exhaustivo, podríamos realizar las siguientes mejoras:
[2] Pagina web pokerstars.com para la elaboración de
las estadísticas.
-
[3 Pagina web www.poquer.com.es/probabilidades.html
Como referencia probabilistica
-
-
Tener en cuenta a la hora de dar valor a las jugadas no
sólo sus probabilidades de aparición, sino también el
valor de su carta más alta.
Considerar un rango más amplio de perfiles de jugador,
incluyendo funciones de utilidad de tipo polinómico por
ejemplo.
Descartar a la hora de tomar las decisiones las jugadas
que las cartas comunitarias no permitan que se den,
Descargar