FUNCIÓN DE UTILIDAD DE UN JUGADOR DE POKER IMPLEMENTADA SEGÚN UN MODELO DE DATOS EXTRAÍDO DE WEKA. Jonathan Caballero Álvarez Javier Baltasar Palma Ingeniería de Telecomunicación 5º Curso 100060641 Ingeniería de Telecomunicación 5º Curso 100060646 1.- INTRODUCCIÓN Trabajo para la asignatura de Inteligencia en Redes de Comunicaciones. LA IDEA Durante este desarrollo teórico vamos a explicar cómo un jugador de póker al estilo Texas Hold’em implementado por una inteligencia artificial podría averiguar cuándo un jugador humano va de farol, en función de las cinco cartas que hay boca arriba en la mesa, y de la cantidad apostada, introduciendo esos valores en un modelo de datos construido en las jugadas anteriores. LAS HERRAMIENTAS ♦ Función de utilidad ♦ Minería de datos ♦ Weka ♦ Poker Texas Hold’em El póker es uno de los juegos de azar en los que más valor tiene la estrategia seguida por el jugador. Los sistemas de inteligencia artificial implementados para este juego hacen un análisis simple de la situación, y aplican un modelo estadístico en el que calculan, con el limitado rango de cartas que pueden visualizar (siete cartas, cinco en la mesa y dos en su mano), si su jugada tiene más o menos probabilidades de derrotar a las de los demás, apostando más o menos cantidad en función de ello. Nuestra idea ha querido ir más allá, introduciendo un nuevo elemento en la ecuación que estos sistemas utilizan: la capacidad de mentir del ser humano. A día de hoy existen sistemas para identificar cuándo una persona miente o dice la verdad, pero todos ellos están basados en análisis clínicos, como la temperatura corporal o la sudoración, datos que en este caso no están a nuestra disposición. Sin embargo, podemos crear un modelo de conducta para cada jugador individual, basándonos únicamente en la forma de actuar en las rondas previas. Aludimos aquí a la teoría de John Nash, conocida como la teoría de juegos, en la que se define para cada jugador una función de utilidad, que representa el grado de aversión o propensión al riesgo de cada uno. Aplicado al caso que nos concierne, asimilaremos esta función a una gráfica o modelo de datos, que nos devolverá las posibilidades que hay de que un jugador haya apostado en función de una jugada superior a la que realmente tiene, es decir, va de farol. 2.- POKER MODELO TEXAS HOLD’EM 2.1.-Objetivo Figura 1: Representación de escalera de color (jugada más alta en póker). Al igual que en otras versiones de póker, el objetivo de Texas hold 'em es llevarse el bote o pozo, donde bote es el dinero apostado por todos los jugadores en una mano. El bote se gana bien al mostrar las cartas, formando las mejores 5 cartas de las 7 disponibles, o apostando para que los otros jugadores "tiren" las cartas o "no vayan", abandonando su apuesta por el bote. Al coger las cinco mejores cartas de las siete disponibles (dos cartas iniciales privadas y cinco cartas comunitarias) , cada uno puede hacer la combinación que más beneficiosa le resulte. Es decir, puede coger sus dos cartas iniciales más tres cartas comunitarias de la mesa, puede coger una de sus cartas iniciales más cuatro cartas comunitarias, o puede no coger ninguna de sus cartas iniciales y jugar con las cinco cartas comunitarias. A esto último se le llama "jugar con la mesa". 2.3.- Evolución de una ronda 2.3.1.-Pre-Flop 2.2.-Apuestas Hold'em se suele jugar usando las apuestas ciega pequeña ("small blind") y ciega grande ("big blind"). Estas apuestas se demominan "ciegas" ya que el jugador apuesta sin haber visto ninguna de las cartas de la mesa. La ciega pequeña la pone el jugador a la izquierda del repartidor, y equivale a la mitad de la ciega grande. La ciega grande la aporta el jugador a la izquierda del anterior y equivale a la apuesta mínima. En los torneos, la cantidad de las ciegas va aumentando conforme el torneo avanza. Un botón se utiliza para representar al jugador situado en la posición del repartidor (Dealer). El botón de repartidor gira en la dirección de las agujas del reloj después de cada mano, con lo que se van turnando el repartidor y las "ciegas". 2.3.- Clasificación de las jugadas Se debe conseguir la mejor mano de las siguientes: Jugada Descripción Cinco cartas Escalera seguidas del mismo palo real del 10 al As. Ejemplo Nº Comb. 4 Cinco cartas Escalera consecutivas mismo de color del palo. 36 Cuatro cartas Póquer iguales en su valor. 624 Figura 2: Dos ases, a priori la mejor jugada El juego comienza repartiendo 2 cartas boca abajo a cada jugador. Son las únicas cartas que cada jugador recibirá individualmente, y sólo serán descubiertas si se muestran las cartas al final de la mano, o si la apuesta queda entre 2 jugadores y se apuesta un all-in. La mano comienza con una ronda de apuestas antes del flop, comenzando por el jugador a la izquierda de la ciega grande y se continúa en la dirección de las agujas del reloj. Después de esta ronda de apuestas, si aún continúan al menos dos jugadores en la mano, se comienzan a poner sobre la mesa las cinco cartas comunitarias descubiertas. De esta forma Texas hold'em es un juego de póker "descubierto", lo cual es prácticamente imprescindible para el trabajo que vamos a desarrollar. Las cartas vendrán siendo colocadas en tres fases: 2.3.2.-Post-Flop Antes de cada una de las tres fases se quema una carta, que se deja apartada y boca abajo. 2.3.3.-1ª Fase, (Flop): Tres cartas descubiertas Full Tres cartas iguales, más otras dos iguales. 3.744 El repartidor reparte el flop, tres cartas descubiertas simultáneamente .El "flop" va seguido de otra ronda de apuestas. Esta y las demás rondas de apuestas comienzan por el jugador a la izquierda del croupier o quien posea el Dealer y continúan en el sentido de las agujas del reloj. Color Cinco cartas del mismo palo sin ser consecutivas. 5.148 2.3.4.-2ª Fase, (Turn): Una carta descubierta Cinco cartas consecutivas Escalera de palos diferentes. 10.200 Tres cartas iguales en su valor. 54.912 Dobles Dos pares de parejas cartas. 123.552 Dos cartas Pareja iguales y tres diferentes. 1.098.240 Carta Gana quien más alta tiene la carta o jardín más alta. 1.302.540 Trío Después de la ronda de apuestas en el "flop", una nueva carta descubierta (turn) se pone sobre la mesa, seguido de otra ronda de apuestas. 2.3.5.-3ª Fase, (River): Una carta descubierta Después del "Turn", otra carta descubierta (river) se coloca sobre la mesa (formando las cinco cartas comunes), y es seguido de otra ronda de apuestas. 2.3.6.-Show Down Finalmente, la muestra de cartas si fuera necesario para dirimir al ganador entre los jugadores que todavía estén en la mano. 2.3.7.-El Ganador Tabla 1: Todas las jugadas posibles en póque y la probabilidad de que ocurran. Si un jugador apuesta y todos los demás se retiran, el jugador se lleva todo el dinero del bote, y no tendrá que mostrar sus cartas. Si dos o más jugadores continúan después de la última ronda de apuestas, se muestran las cartas. En la muestra, cada jugador utiliza las cinco mejores cartas posibles de entre las siete que forman sus dos cartas y las cinco cartas comunes de la mesa. Si dos jugadores o más comparten la mejor mano, entonces el bote se divide por igual entre los jugadores. De todas formas es común que los jugadores tengan manos muy similares, pero no idénticas. A menudo se utiliza la carta kicker para desempatar, siendo ésta, en un empate de jugadas de menos de cinco cartas la quinta carta, o la carta más alta de una jugada de cinco. 3.- EL FACTOR HUMANO Tal y como se ha explicado anteriormente, el póker es un juego con una fuerte componente de estrategia. En el caso que nos concierne, el objetivo es ganar la mayor cantidad de fichas o dinero posible, lo que se consigue siguiendo un sistema de apuestas. En los párrafos anteriores vimos que en cada ronda de juego hay cuatro momentos en los que se lleva a cabo las apuestas: El pre-flop, el flop, el turn y el river. Después de ponerse las ciegas y de que se han repartido las dos cartas a cada jugador, la acción comienza con el jugador inmediatamente a la izquierda de la ciega grande que tiene la opción de pagar la ciega, subir (poner una apuesta adicional), o retirarse (tirar su mano). La acción continua alrededor de la mesa, y cada jugador tiene la opción de pagar, subir o retirarse. Una vez que la acción regresa a las ciegas, éstas tienen un par de opciones. Si alguien ha subido, las ciegas pueden retirarse, pagar o re-subir. Si nadie ha subido, cualquiera de los dos jugadores en las ciegas puede subir. La ciega pequeña debe, como mínimo, igualar la ciega grande si desea jugar la mano. La ciega grande puede simplemente pasar si nadie ha subido. Hay otra ronda de apuestas después del flop, después del turn y después del river. Las apuestas comienzan con el primer jugador restante a la izquierda del dealer. Si la ciega pequeña no se ha retirado, ésta comienza la acción en todas las rondas de apuestas siguientes al flop. Dado que no hay apuestas forzadas en las siguientes rondas el pasar está permitido. El cómo una computadora llevaría a cabo las decisiones de subir, pasar o retirarse de una apuesta es algo muy simple. Dado que tiene una enorme capacidad de cálculo, muy superior a la del cerebro humano, analizaría el conjunto de jugadas posibles en función de las cartas comunitarias, y vería si su jugada personal está entre el 50% de las mejores posibles, caso en el que igualaría la apuesta. Para subir, realizaría la misma operación, pero en este caso esperaría a tener una jugada mejor, por ejemplo entre el 20% de las mejores, de forma que tuviera muchas probabilidades de ganar. El caso de un ser humano es bien distinto. Esto es debido a dos factores fundamentales: - Es incapaz de realizar los cálculos necesarios en tiempo real, dado que necesita altos conocimientos de estadística y mucha más capacidad de procesamiento. - Sus decisiones dependen también de la presión a la que se ve sometido, así como del estudio del comportamiento de sus compañeros de juego. Es por ello que sus apuestas pueden diferir del resultado óptimo obtenido por una computadora. Ante la subida de una apuesta del jugador anterior, una persona debe distinguir si lo ha hecho porque cree llevar una buena jugada, o porque tiene muy pocas probabilidades de ganar y pretende intimidar a los demás jugadores para que se retiren y quedarse él con el bote, es decir, porque va de farol. Se da el mismo caso cuando un jugador decide entre pasar o subir la apuesta. El verdadero problema nace a partir de este punto, y es que no se puede construir un sistema que modele al “ser humano medio”, sino que cada persona tiene más o menos probabilidades de efectuar una jugada de farol. Esto es así porque este tipo de jugadas implican un gran riesgo, dado que con una mano que muy probablemente pierda la partida, se intenta ganar todo el bote. Es aquí donde entra en juego la función de utilidad, que determina para un jugador el grado de aversión o propensión al riesgo que presenta. 4.- LA TEORÍA DE JUEGOS Todo jugador de póker participa en este juego por la motivación de conseguir unas ganancias en el mismo. Por este motivo y por el hecho de ser un juego (se puede denominar lotería atendiendo a términos de teoría de juegos) se puede modelar de acuerdo a una serie de términos que describiremos a continuación: Valor esperado: Media ponderada de todos los resultados posibles, donde los pesos son las probabilidades. 1 El atractivo del juego no depende únicamente del valor esperado sino de la utilidad de cada una de las opciones. Es decir, no solo se tiene en cuenta la posibilidad de ganar una cierta cantidad de dinero, sino la probabilidad de perder esa misma cantidad o una cantidad mayor. Por este motivo un individuo no elige la opción de lotería con el máximo valor esperado, sino con la máxima utilidad esperada. La utilidad esperada de un juego es el valor esperado de la utilidad de cada uno de los resultados posibles: 2 Teniendo en cuenta estos dos factores descritos anteriormente podemos pasar a hacer la definición de juego justo: Juego justo: Juego cuyo valor esperado es 0. El valor esperado de nuestra riqueza si aceptamos el juego es igual que el valor seguro si lo rechazamos. Así con estos datos, podemos clasificar a todo jugador de una lotería en 3 grupos diferenciados atendiendo al riesgo que toman de participar en la misma: 1 Ecuación del valor esperado en nomenclatura de teoría de juegos. Ecuanción de la función de utilidad esperada en nomenclatura de teoría de juegos. 2 1. Persona adversa al riesgo Estas personas rechazarán juegos justos (VE=0) y algunos juegos con VE positivo. Podemos describir el comportamiento de este tipo de personas con la siguiente gráfica: La conclusión que se puede obtener para este tipo de personas de la gráfica es que, cuanta más riqueza tiene un consumidor más utilidad experimentará por un incremento de la misma. 3. Persona neutral al riesgo Indiferente entre aceptar o rechazar un juego (VE = 0). Podemos describir el comportamiento de este tipo de personas con la siguiente gráfica: Figura 3: Gráfica de la función de utilidad de una persona adversa al riesgo. La conclusión que se puede obtener para este tipo de personas de la gráfica es que, cuanta más riqueza tiene un consumidor menor utilidad experimentará por un incremento de la misma. 2. Persona amante del riesgo Aceptarán juegos justos (VE = 0) y algunos juegos con VE negativo. Podemos describir el comportamiento de este tipo de personas con la siguiente gráfica: Figura 5: Gráfica de la función de utilidad de una persona neutral al riesgo. En este caso el consumidor experimenta un incremento de la utilidad proporcional al de la riqueza. Si aplicamos estas herramientas al juego que nos ocupa, el póker, tendremos 3 grupos de personas con diferentes formas de actuación dependiendo del riesgo que suponga una jugada para la consecución de una ganancia para sí misma. Esto quiere decir, que podemos modelar la tendencia a farolear de cada uno de los individuos que participan de esta lotería si conseguimos detectar en ellos el modelo de riesgo que están dispuestos a correr acorde con las ganancias o pérdidas que les suponga. Para ello atenderemos sus respuestas a una de las 3 gráficas descritas anteriormente. A partir de ahora nuestro problema se centrará en asignar a cada jugador uno de los tres perfiles descritos. Para ello compararemos sus actuaciones anteriores en la partida con las gráficas anteriores mediante un análisis de mínimos cuadrados. Recopilar los datos de las anteriores partidas y su posterior análisis serán los trabajos que desarrollemos mediante minería de datos. 5.- MINERÍA DE DATOS Figura 4: Gráfica de la función de utilidad de una persona amante del riesgo. La minería de datos consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación. Dinero invertido por el jugador en la mano que se está jugando. Cantidad de fichas en el bote central. Probabilidad de que la jugada del jugador esté entre el 25% de las mejores jugadas para ganar la mano. Acciones realizadas por el resto de jugadores en función de sus anteriores respuestas al juego. Un proceso típico de minería de datos consta de los siguientes pasos generales: ♣ Selección del conjunto de datos, tanto en lo que se refiere a las variables dependientes, como a las variables objetivo, como posiblemente al muestreo de los registros disponibles. ♣ Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos). ♣ Transformación del conjunto de datos de entrada, se realizará de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema. ♣ Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo, de clasificación o segmentación. ♣ Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un pre procesado diferente de los datos. ♣ Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos. ♣ Si el modelo final no superara esta evaluación el proceso se podría repetir desde el principio o, si el experto lo considera oportuno, a partir de cualquiera de los pasos anteriores. Esta retroalimentación se podrá repetir cuantas veces se considere necesario hasta obtener un modelo válido. ♣ Una vez validado el modelo, si resulta ser aceptable, ya está listo para su explotación. Los modelos obtenidos por técnicas de minería de datos se aplican incorporándolos en los sistemas de análisis de información de las organizaciones, e incluso, en los sistemas transaccionales. Tradicionalmente, las técnicas de minería de datos se aplicaban sobre información contenida en almacenes de datos. De hecho, muchas grandes empresas e instituciones han creado y alimentan bases de datos especialmente diseñadas para proyectos de minería de datos en las que centralizan información potencialmente útil de todas sus áreas de negocio. No obstante, actualmente está cobrando una importancia cada vez mayor la minería de datos desestructurados como información contenida en ficheros de texto, en Internet, etc. En el caso que tratamos, los datos necesitaremos obtener de cada jugada y jugador serán: En base a esto podemos realizar un modelo en weka de forma que podemos llevar un registro de todas las jugadas realizadas en una partida de poker, para un posetior análisis de las mismas. Esto nos servirá para una partida posterior con los mismo jugadores sentados a la mesa, poder prever sus acciones en función de las cartas existentes en la mesa y teniendo en cuenta las mismas actuar en consecuencia. 6.- MODELO PARA TEXAS HOLD’EM Utilizando todas las herramientas expuestas en las secciones anteriores establecemos el modelo final para que una máquina pueda competir con individuos humanos en el juego del póquer, explicando el modelo a seguir para elegir las acciones adecuadas en cada mano de juego dependiendo de los acompañantes de la mesa y las acciones que realizan durante el juego. 6.1.-Establecer situación propia En primer lugar la máquina debe establecer cual es su situación, acorde al número de fichas que tiene, al iniciarse cada mano, para conocer el riesgo que puede tomar a la hora de enfrentarse a las jugadas del resto de jugadores humanos. Para ello realiza una sencilla media aritmética de acuerdo al número de fichas que hay en juego en el momento de iniciarse la mano. 3 Si a este nº medio de fichas lo llamamos umbral de participación (thp) tendremos las siguientes situaciones: fichas < 0.5 * thp Nivel muy bajo de fichas. 0.5*thp < fichas < 0.75*thp Nivel bajo de fichas. 0.75*thp < fichas < 1.25*thp Nivel medio de fichas. 1.25*thp < fichas < 1.75*thp Nivel alto de fichas. fichas > 2*thp Nivel muy alto de fichas. Una vez conocida su situación es necesario identificar la situación del resto de competidores en la mesa de juego, para ello se realizará una operación del mismo calibre para conocer el nivel de riqueza de los mismos. 6.2.- Comparar con los modelos ideales Suponiendo que ya se hayan realizado varias manos, la máquina conocerá la disposición de cada uno de los jugadores frente al riesgo, situando a cada uno de ellos en una de las situaciones descritas en la sección 4 de este documento: Adverso al riesgo Función Indiferente al riesgo Función Amante del riesgo Función que Número de fichas que posee al inicio de la jugada. 3 Ecuación que utiliza la máquina para conocer su situación en la mano actual. Dibujaremos las tres funciones en un mismo gráfico para ver las correspondencias entre ellas: y=x y = x2 y = √x asemejaríamos a una de los tres perfiles anteriormente comentados. En un análisis cuantitativo, habría que realizar un estudio de mínimos cuadrados en el que se compararían los puntos de la envolvente con los de las gráficas ideales. Es aquí donde entrará en juego el uso de la herramienta Weka, pues con unos cuantos valores la máquina podrá completar el modelo para todos los puntos del eje X, al principio de forma muy aproximada, y conforme vaya obteniendo más datos, con más precisión. El motivo de tomar la envolvente superior es debido a que es la que delimita la relación máxima ganancias/dificultad que ese jugador en concreto está dispuesto a asumir. Donde a medida que nos desplazamos a la derecha de la gráfica significa que el contrincante tiene mayores ganancias y a medida que nos desplazamos a la izquierda que tiene menos ganancias. De esta forma situará en la gráfica la posición de cada jugador para conocer el nivel de riesgo que esta dispuesto a asumir en la mano actual en consonancia con las fichas que tiene. La máquina deberá hacer una aproximación cuantitativa de lo que nosotros a continuación vamos a hacer de forma cualitativa. Dado un conjunto de datos sobre las actuaciones de un jugador en las manos anteriores, representaremos en una gráfica un punto por cada mano de la que tengamos datos, de forma que en el eje de abscisas quede la cantidad de fichas o dinero que están en ese momento en posesión del jugador, y en el eje de ordenadas un valor representativo que identificará las ganancias obtenidas en esa mano en función de la cantidad y de la dificultad que supuso obtenerlas, es decir, la función de utilidad de cada ganancia. Este valor lo obtendremos a partir de la siguiente fórmula: 4 Donde - Apuesta es la cantidad que tuvo que apostar finalmente para optar al bote comunitario. Bote es la cantidad que ganó finalmente Jugada es un valor numérico que identifica la calidad de las cartas que tenía en su poder. (Ver anexo 1: El valor de las jugadas) Las características requeridas quedan entonces plasmadas en esta fórmula, ya que la cantidad ganada afecta de forma proporcional, y la dificultad se ve reflejada en los otros dos factores, siendo la apuesta proporcional, dado que a más cantidad apostada más riesgosa se torna la situación, pues mayor cantidad puede llegar a perder; y la jugada inversamente proporcional, ya que la dificultad para ganar será más elevada cuanto peor sean las cartas propias. En nuestro análisis cualitativo, tomaríamos la envolvente superior del conjunto de puntos representado, y la 6.3.- Dos ejemplos prácticos Para probar el modelo y comprobar la veracidad del modelo estudiado realizamos un ejemplo participando en una partida de póquer modelo Texas Hold’em jugando 8 manos. Para ello uno de los jugadores tomará el rol de jugador adverso al riesgo a la hora de realizar las apuestas y el otro jugador tomará el rol de jugador amante del riesgo. Para ello representaremos en una tabla el resultado de las jugadas, apuestas y ganancias de cada uno de los jugadores para las manos resultantes. fichas iniciales valor de la jugada fichas apostadas bote Figura 6: Gráfica comparativa de las funciones de utilidad de los 3 grupos de riesgo (apostado /jugada) *bote 150 130 145 175 152 137 110 124 2 2 25 1 2 2 2 2 20 22 20 15 13 25 8 8 24 66 34 19 20 65 12 16 240 726 27,2 285 130 812,5 48 64 Tabla 2: Resultado de caso práctico de 8 manos para individuo amante del riesgo. Aquí representamos el valor de las jugadas de acuerdo a la fórmula de la sección anterior. 900 800 700 600 500 400 300 200 100 0 0 4 Función para conocer el riesgo que está dispuesto a asumir un jugador. 50 100 150 200 Figura 7: Gráfica de las jugadas realizadas en el ejemplo práctico para un individuo amante del riesgo. fichas iniciales valor de la jugada fichas apostadas bote Observamos la forma que tendría la gráfica ideal de una persona amante del riesgo, la cual habría que normalizar de acuerdo a las fichas iniciales de que dispone cada jugador: (apostado /jugada)*bote 150 150 123 140 147 143 188 174 10 10 2 1 2 10 2 1 22 20 15 35 Retirado 25 2 8 44 27 17 42 4 45 4 12 96,8 54 127,5 1470 ---------112,5 4 96 Tabla 3: Caso practico de 8 manos para individuo adverso al riesgo. De nuevo adjuntamos la gráfica ideal sin normalizar de acuerdo a un jugador de este tipo, atendiendo a la gráfica, vemos que a pesar de también ser creciente como la anterior el crecimiento de la misma es pequeño. En el caso que nos acontece el jugador adverso al riesgo estudiado apenas realiza apuestas con riesgo a la hora de jugar sus manos, pudiendo observarse que apenas le afecta la cantidad de fichas que posee en su montón, siendo incluso las apuestas menores a medida que su número de fichas aumenta. 25 20 15 10 5 0 0 100 200 300 400 500 Figura 9: Gráfica ideal para un individuo adverso al riesgo. 4500 4000 3500 3000 2500 7.- PREVISIÓN DE JUGADAS 2000 Con todo el análisis concluido, es hora de obtener los resultados, que podremos explotar de dos formas distintas. 1500 1000 7.1.- Identificar los faroles 500 0 0 10 20 30 40 50 60 70 Figura 7: Gráfica ideal para un individuo amante del riesgo.siguen una disposición Se puede observar que las jugadas creciente, con una tendencia de crecimiento alta de acuerdo a que, a medida que van aumentando las ganancias el valor esperado a la hora de realizar un riesgo es mucho mayor. Como se puede observar este jugador se encuentra en la parte inicial de la gráfica donde el aumento del riesgo de acuerdo a las ganancias obtenidas (pendiente de la gráfica) no es muy alto. Jugador adverso al riesgo Tal como hemos visto en las dos gráficas de ejemplo anteriores, se encuentra de vez en cuando unos puntos que se alejan claramente de la tendencia normal de la gráfica. Son los puntos correspondientes a un farol lanzado por el jugador. La explicación es muy simple si entendemos el significado de la fórmula con la que lo calculamos, y es que estos valores tan altos sólo pueden obtenerse cuando la apuesta lanzada es considerablemente alta, y además la jugada tiene un valor pequeño (para que divida por un número pequeño), es decir, la definición de “farol”. 900 800 Aquí representamos el valor de las jugadas de acuerdo a la fórmula de la sección anterior. 700 600 500 400 1600 300 1400 200 1200 100 1000 0 0 800 50 100 150 200 600 Figura 10: Distinción de las jugadas que resultan faroles para el individuo amante del riesgo 400 200 0 0 50 100 150 200 Figura 8: Gráfica de las jugadas realizadas en el ejemplo práctico para un individuo adverso al riesgo. evitando así retirarse de una partida por una jugada superior a la propia que no puede tener lugar. 1600 1400 ANEXO 1: EL VALOR DE LAS JUGADAS 1200 1000 800 Veremos en este anexo cómo en función del número de combinaciones que existe para cada jugada podemos obtener un valor que representa su calidad y sus posibilidades de ganar. 600 400 200 0 0 50 100 150 200 Figura 11: Distinción de las jugadas que resultan faroles para un individuo adverso al riesgo. Con estos puntos podemos hacer un cálculo estadístico que nos diga las probabilidades que tiene cada jugador de ir de farol, y valorarlo a la hora de aceptar o no una apuesta. 7.2.- Valorar la jugada del contrario En caso de no ser un farol, podemos estimar la calidad de la jugada del contrario aplicando las gráficas de los perfiles de jugador. De este modo, y dado que conocemos tres de los cuatro factores, que son la apuesta que el contrario realiza, el bote al que aspira y la cantidad que posee, podemos obtener muy fácilmente el cuarto, que es el valor de la jugada. Si bien este valor nunca será algo exacto dada la imposibilidad de prever con total seguridad las acciones de un ser humano, puede usarse para estimar de forma aproximada las probabilidades de ganar del jugador oponente. 8.- CONCLUSIONES Llegados a este punto, estamos en condiciones de concebir un jugador artificial de póker, que aprenda tras cada ronda la forma de jugar de sus oponentes. Este trabajo tan sólo desarrolla una mejora en la inteligencia artificial de este jugador, pues primero es necesario desarrollarla con una estrategia sólida y audaz, de forma que ya por sí misma sea capaz de defenderse durante las primeras rondas, donde aun no tiene información de sus contrarios. Esto significa que al principio tomará decisiones basadas en sus propias cartas, el caudal en su posesión y las probabilidades de ganar con ello, pero según vaya avanzando la partida comenzará a entender la forma de jugar de los que le acompañan en la mesa, asignándole a cada uno una personalidad de jugador. Dando como valor base 1 a la peor jugada, esto es, carta alta, iremos multiplicando por el factor adecuado conforme vayamos aumentando la calidad de la misma. Dicho factor surgirá de dividir el número de combinaciones posible de la jugada inferior con el de a la que estamos asignando el valor en cada momento. De este modo obtenemos los factores: Jugada Nº combinaciones Factor Escalera real Escalera de color Póquer Full Color Escalera Trío Dobles parejas Pareja Carta más alta 4 36 624 3.744 5.148 10.200 54.912 123.552 1.098.240 1.302.540 9 17.33 6 1.375 1.98 5.383 2.25 8.88 1.186 - Tabla 4: Factores de cálculo de los valores De donde calculamos los valores de cada combinación, redondeando posteriormente a un número más manejable: Jugada Valor exacto Valor redondeado Escalera real Escalera de color Póquer Full Color Escalera Trío Dobles parejas Pareja Carta más alta 325559.43 36173.27 2086.92 347.82 252.96 127.67 23.715 10.54 1.186 1 325000 36000 2000 350 250 125 25 10 2 1 Tabla 5: Valores de cada jugada 9.- BIBLIOGRAFIA [1] Wikipedia, la encyclopedia libre, sección Texas Holdem. Dado el caso de querer realizar un análisis mucho más exhaustivo, podríamos realizar las siguientes mejoras: [2] Pagina web pokerstars.com para la elaboración de las estadísticas. - [3 Pagina web www.poquer.com.es/probabilidades.html Como referencia probabilistica - - Tener en cuenta a la hora de dar valor a las jugadas no sólo sus probabilidades de aparición, sino también el valor de su carta más alta. Considerar un rango más amplio de perfiles de jugador, incluyendo funciones de utilidad de tipo polinómico por ejemplo. Descartar a la hora de tomar las decisiones las jugadas que las cartas comunitarias no permitan que se den,