Universidad de Valladolid Análisis de los campeones del League of Legends Análisis de Datos (3º Grado en Estadística) Celia Santiago González 11-1-2016 Celia Santiago González Grado en Estadística Análisis de Datos Tabla de contenido Introducción .................................................................................................................................. 3 Objetivo ......................................................................................................................................... 3 Datos ............................................................................................................................................. 3 Análisis de componentes principales ............................................................................................ 5 Elección entre ACP Normado o ACP No Normado ........................................................................ 5 Valores propios ............................................................................................................................. 5 Correlación entre variables ........................................................................................................... 6 Correlación variables-ejes ........................................................................................................... 77 Interpretación de las Componentes Principales ........................................................................... 8 Coordenadas ................................................................................................................................. 8 Correlaciones variable-factor ........................................................................................................ 8 Antiguos ejes unitarios .................................................................................................................. 8 Primer eje .................................................................................................................................. 9 Segundo eje ............................................................................................................................... 9 Tercer eje................................................................................................................................... 9 Conclusiones del plano 1-2 ......................................................................................................... 10 Proyecciones ............................................................................................................................... 10 Plano 1-2 según Contribución Relativa ....................................................................................... 10 Plano 1-2 según Contribución Relativa por posición .................................................................. 11 Clasificación Automática ............................................................................................................. 12 Dendograma ................................................................................................................................ 12 Índices de nivel ............................................................................................................................ 13 Estabilización por centros móviles .............................................................................................. 13 Composición y caracterización de las clases ............................................................................... 14 Situación de los centros .......................................................................................................... 14 Coordenadas ........................................................................................................................... 15 Iden-libelle............................................................................................................................... 15 EFF. .......................................................................................................................................... 15 Disto. ....................................................................................................................................... 15 Clase 1 ..................................................................................................................................... 15 Clase 2 ..................................................................................................................................... 15 Clase 3 ..................................................................................................................................... 15 Clase 4 ..................................................................................................................................... 15 Clase 5 ..................................................................................................................................... 15 ANOVA para las variables ........................................................................................................ 15 Página 1 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Conclusión ................................................................................................................................... 19 Página 2 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Introducción League of Legends (también conocido por sus siglas LoL) es un videojuego de género multiplayer online battle arena (MOBA) desarrollado por Riot Games para Microsoft Windows y OS X. En octubre del 2012, contaba con 70 millones de jugadores registrados. Para marzo del 2013 se registró un pico de 5 millones de jugadores conectados al mismo tiempo en todo el mundo. Es un juego de alta competitividad siendo uno de los juegos más populares de los deportes electrónicos (e-sports). Actualmente se realizan campeonatos mundiales del LoL donde participan 14 equipos de todo el mundo de 5 personas cada uno y el premio para el equipo ganador es de 1 millón de dólares. Dos equipos de cinco integrantes con un campeón cada uno, donde cada campeón es diferente, con diferentes habilidades y características, compiten con el objetivo de destruir el nexo del equipo rival en un mapa de tres carriles, dando lugar a 5 posibles posiciones: jungla, top, medio, adc y soporte. Cada equipo deberá matar a los súbditos del equipo contrario programado de forma automática para que avancen a través de los 3 carriles, saliendo del nexo un numero continuo de súbditos cada cierto tiempo, destruyendo torretas hasta llegar al nexo enemigo y destruirlo. Los campeones irán recibiendo más daño o más resistencia gracias a matar el máximo número de súbditos, asesinar a campeones enemigos (reviven trascurrido un cierto tiempo), muriendo el menor número de veces posible (dado que esto favorece al campeón contrario) y ayudando a asesinar a campeones. Realizar estas tareas te otorga oro gracias al cual te permite comprar objetos para multiplicar el poder de un campeón según te interese. Objetivo Voy a realizar una clasificación de los campeones de League of Legends según las estadísticas del último año que ofrece la página oficial. Con todos los datos he decidido realizar un Análisis de Componentes Principales o ACP con ello trataré de reducir la dimensión de los datos (pese a la perdida de información), para poder describir a los campeones o personajes en función de sus características, agrupando aquellos que tengan un comportamiento parecido o similar, siendo esta información útil para diversas cuestiones. Datos En el informe que presento a continuación tomo los datos de todos los campeones del League of Legends, siendo un total de 128 personajes, cada uno asignado a una de las cinco posibles posiciones del juego (jungla, top, medio, adc o soporte); sobre los cuales mediremos 9 variables continuas y 1 variable nominal. Los valores recogidos en estas variables son una media hecha por los creadores del LoL a través de cientos de datos obtenidos de jugadas realizadas en los campeonatos mundiales por los profesionales. A continuación adjunto una tabla explicando las variables de forma detallada: Página 3 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Variable Descripción Role Posición en la que juega el campeón Win Percent Porcentaje medio de partidas ganadas con ese campeón Kills Número medio de asesinatos que realiza ese campeón en una partida Deaths Número medio de veces que muere el campeón en una partida Número de asistencias (ayudar a otro campeón a asesinar al contrario) realizadas por ese campeón en una partida Media del daño total realizado por un campeón al equipo contrario Damage Dealt en una partida Media del daño total recibido por un campeón a manos del equipo Damage Taken contrario en una partida Media del total de la vida regenerada por un campeón en una Total Healing partida Media del total de súbditos matados por un campeón en una Minions Killed partida Assists Gold Earned Media de oro total ganado en una partida Role será la variable categórica nominal, siendo la posición a la que pertenece cada campeón, con 5 niveles: Top Medio Role ADC Soporte Jungla A continuación un análisis descriptivo de sus variables: Libellé de la variable Moyenne Win Percent 50,337 Kills 6,127 Deaths 6,117 Assists 8,549 Damage Dealt 18735,400 Damage Taken 24284,200 Total Healing 5437,580 Minions Killed 123,668 Gold Earned 11857,000 Ecart-type Minimum Maximum 2,569 1,974 0,676 2,657 4804,000 5771,840 4714,160 66,683 992,885 43,450 0,720 4,450 4,630 4840,000 14369,000 1043,000 13,400 9017,000 54,980 9,770 8,020 15,860 29470,000 36607,000 26500,000 208,500 14175,000 Página 4 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Como se puede observar a simple vista al analizar las variables estas presentan gran heterogeneidad entre ellas, tanto en las desviaciones como en sus medias siendo Damage Taken la variable que posee valores más altos con una media de 24284,2 y una desviación 5771,840 que comparado frente a Deaths que posee el valor más bajo de las medias con 6,117 y una desviación de 0,676. Análisis de componentes principales Aplicaré un Análisis de Componentes principales para realizar el estudio de los individuos y variables, recordamos que las poseemos 9 variables cuantitativas continuas y 1 variable categórica nominal denominada Role (la posición en la que suelen encontrarse cada campeón) con una población de 128 personajes del League of Legends. La variable TEAM la emplearemos como una variable ilustrativa, es decir realizaremos el estudio sin diferenciar la posición en la que suelen jugarse cada campeón. Elección entre ACP Normado o ACP No Normado El objetivo del ACP es reducir la dimensión de los datos, a un número menor de nuevas variables que recojan la mayor parte de la información y faciliten comprender los datos. En el caso de elegir un ACP No Normado la variabilidad pequeña será absorbida por la grande, siendo en este caso las variables Damage Taken y Total Healing las que tendrían una mayor importancia, como no considero que estas variables tengan mayor importancia que otras variables que consideramos importantes y poseen menores desviaciones decido realizar un ACP Normado. Valores propios Numéro 1 2 3 4 5 6 7 8 9 Valeur propre 48232600,0000 20171800,0000 10903600,0000 296389,0000 1717,4400 0,0000 0,0000 0,0000 0,0000 Pourcentage 60,59 25,34 13,70 0,37 0,00 0,00 0,00 0,00 0,00 Pourcentage cumulé 60,59 85,93 99,63 100,00 100,00 100,00 100,00 100,00 100,00 En un ACP Normado la suma de los valores propios es igual al número de variables, por lo tanto el valor esperado de inercia de cada eje es 1. Conociendo esta información y con los valores propios calculados con seleccionar los 2 primeros ejes proporcionaría un 86% de la información (valores propios: 48232600, 20171800. Página 5 de 20 Celia Santiago González Grado en Estadística Análisis de Datos También es destacable que los últimos 6 ejes no aportan información y que con tan solo los 3 primeros ejes ya recojo casi el 100% de la información. Correlación entre variables Win Percent Kills Deaths Assists Damage Dealt Damage Taken Total Healing Minions Killed Win Percent 1,00 Kills -0,09 1,00 Deaths -0,39 0,43 1,00 Assists 0,26 -0,80 -0,45 1,00 -0,07 0,71 0,45 -0,69 1,00 0,01 -0,02 -0,24 -0,15 -0,25 1,00 0,06 -0,24 -0,31 0,18 -0,40 0,53 1,00 -0,14 0,47 0,31 -0,68 0,77 -0,22 -0,41 1,00 0,02 0,85 0,32 -0,80 0,81 -0,04 -0,26 0,68 Damage Dealt Damage Taken Total Healing Minions Killed Gold Earned Gold Earned En la tabla obtenida podemos ver que existen casi los mismos casos de correlaciones positivas que negativas, siendo un 56 % negativas frente a un 44% que son positivas. Observo que tengo tanto altas correlaciones positivas como altas correlaciones negativas. Destaco que la variable Win Percent es la que tiene más correlaciones casi nulas con alguna correlación media pero no significativa. En cuanto a las correlaciones negativas destacan: - - Kills - Assists lo que tiene sentido, puesto que cuantas más asistencias te lleves (esto significa que ayudas a alguien de tu equipo con tu campeón a matar a un oponente, llevándose el otro los beneficios de la baja) menos muertes causaras porque no te sumará el plus de haberte llevado la baja. Assists - Gold Earned, también tiene sentido: más asistencias, menos oro te llevas por lo que no puedes comprarte más objetos para causar un mayor daño. Minions Killed - Assists: cuantos más súbditos mates es menos probabilidad hay de que solo te lleves una asistencia. Damage Dealt - Assists, con estas dos variables pasa lo mismo que con las dos anteriores, cuando más daño hagas menos probable es de que solo te lleves una asistencia. En cuanto a las variables positivas destacan: Damage Dealt - Kills, Damage Dealt- Gold Earned, Damage Dealt- Minions Killed, Gold Earned - Kills. Todas ellas tienen sentido y están relacionadas entre sí: cuantos más súbditos mates más dinero obtienes con lo que puedes comprar objetos Página 6 de 20 1,00 Celia Santiago González Grado en Estadística Análisis de Datos para obtener más daño, cuanto más daño más muertes se consiguen, lo que da más dinero. Es un bucle. Correlación variables-ejes Realizamos un gráfico de puntos-variable en el plano 1-2, el cual recoge una información total del 86%, dado que es importante conocer la correlación existente entra las variables y los ejes factoriales, con ello podemos apreciar la calidad de representación de las diferentes variables en el plano. Las variables mejor representadas son aquellas que más se aproximan a la esfera, por lo que observo que todas se aproximan bastante, menos la variable Win Percent que tiene una calidad peor de representación. Observo que las variables Total Healing, Damage Taken y Win Percent tienen correlaciones negativas tanto en el eje 1 como en el 2, mientras que las variables Deaths, Minions Killed y Damage Dealt tiene correlaciones positivas en ambos ejes. Página 7 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Interpretación de las Componentes Principales Coordenadas Win Percent Kills Deaths Assists Damage Dealt Damage Taken Total Healing Minions Killed Gold Earned Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 -0,12 -0,14 -0,06 0,35 0,40 0,61 1,30 -0,22 0,84 0,38 0,26 0,18 -0,03 -0,04 0,05 -0,48 -2,00 0,13 -0,81 0,50 2846,56 3683,58 -1182,15 -96,03 0,33 -5046,75 2428,42 1395,32 -17,50 0,00 -3812,28 -395,22 -2744,74 1,25 -0,08 34,09 38,68 -5,98 5,72 -41,43 354,00 740,34 -159,93 535,56 0,50 Correlaciones variable-factor Win Percent Kills Deaths Assists Damage Dealt Damage Taken Total Healing Minions Killed Gold Earned Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 -0,21 -0,08 0,89 -0,30 0,02 0,84 -0,27 0,06 -0,30 -0,10 0,59 0,24 -0,53 -0,44 0,09 -0,87 0,37 0,13 -0,06 0,08 0,90 0,04 0,17 0,05 0,17 -0,22 -0,87 -0,14 0,08 -0,32 -0,47 -0,69 -0,13 -0,06 0,53 0,81 0,08 0,13 0,47 0,15 0,89 -0,26 0,24 -0,04 0,02 Antiguos ejes unitarios Win Percent Kills Deaths Assists Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 -0,10 -0,06 0,80 -0,38 0,02 0,40 -0,21 0,05 -0,38 -0,15 0,28 0,19 -0,47 -0,57 0,13 -0,41 0,29 0,12 -0,08 0,12 Página 8 de 20 Celia Santiago González Damage Dealt Damage Taken Total Healing Minions Killed Gold Earned Grado en Estadística 0,43 -0,10 -0,22 0,39 0,42 0,03 -0,69 -0,55 0,07 -0,20 0,15 -0,12 -0,12 0,12 0,22 Análisis de Datos 0,06 0,10 -0,08 0,60 -0,05 0,25 -0,47 0,78 0,22 0,03 Primer eje U1 = -0.1*WP + 0.4*Kills + 0.28*Deaths - ….. + 0.39*MK + 0.42*GE Esta primera componente principal, recoge el 60% de la información y presenta correlaciones tanto negativas como positivas con las variables originales. Las correlaciones positivas más altas serían la de Damage Dealt (0.9), Gold Earned (0.89) y Kills (0.84), por lo que obtener valores altos en este eje será indicio de valores altos en estas variables. La correlación negativa a destacar sería la de Assists (-0.87) lo que me indica que obtener valores bajos en este eje será indicio de valores altos en esta variable y viceversa. Ninguna de las variables tiene un coeficiente cercano al 0 por lo que todas tienen, en mayor y menos medida, relevancia. Segundo eje U2 = -0.06*WP – 0.21*Kills + 0.19*Deaths + ….. + 0.07*MK – 0.2*GE Esta segunda componente principal recoge el 25% de la información. Observo que no hay ninguna correlación positiva demasiado alta a destacar, mientras que hay dos correlaciones negativas significativas: Damage Taken (-0.87) y Total Healing (-0.69) lo que me indica que obtener valores bajos en este segundo eje será indicio de valores altos en estas variables y viceversa. En este eje las variables Win Rates, Damage Dealt y Minions Killed no tendrán relevancia dado que su correlación es prácticamente 0. Tercer eje U3= 0.8*WP + 0.05*Kills – 0.47*Deaths + ….. + 0.12*MK + 0.22 GE Página 9 de 20 Celia Santiago González Grado en Estadística Análisis de Datos En esta tercera componente principal recoge el 13.7% de la información. Observo que hay tanto correlaciones positivas como negativas pero todas son muy bajas por lo que la mayoría de las variables no serán muy influyentes a excepción de la variable Win Rate que tiene una correlación de 0.89, lo que me indica que cuanto más altos sean los valores en este eje será indicio de valores altos en esta variable. Descritos los 3 primeros ejes recojo casi el 100% de la información. Conclusiones del plano 1-2 - Los campeones situados a la izquierda del plano tendrán una valoración alta en Damage Taken y Total Healing. Los campeones situados de la mitad hacia abajo del plano obtendrán una alta valoración en Assists, mientras que los que estén en la parte superior obtendrás valores muy positivos en Damage Dealt, Kills y Gold Earned. Proyecciones Plano 1-2 según Contribución Relativa En este primer plano represento el plano factorial 1-2 con un 86% de la información, donde el tamaño de cada campeón será en relación a su contribución relativa, a mayor tamaño del punto mayor contribución relativa poseerá, ósea mayor calidad en la representación. Página 10 de 20 Celia Santiago González Grado en Estadística Análisis de Datos En general la mayoría de los puntos del plano 1-2 están bien representados, pero observo que son los puntos situados en los extremos los que poseen mayor contribución relativa, siendo los campeones cercanos al origen de coordenadas los que poseen una representación de peor calidad. Observo que existe cierto patrón en la representación, en la parte inferior del gráfico se encuentran más dispersos que en la parte superior, a su vez observo que la parte izquierda están más disperso que la derecha. También observo que los individuos se encuentran concentrados cerca del eje de abscisas (Factor 1). Plano 1-2 según Contribución Relativa por posición Observo cierto patrón respecto a las diferentes posiciones donde se suele jugar cada campeón. En el caso de los campeones que se les juega en la posición de suporte están en la parte inferior del gráfico donde se recogen mayor número de asistencias. El campeón Soraka que aparece en la parte inferior del plano tiene mucha contribución relativa por lo que está muy bien representada y esto me indica que se lleva un gran número de asistencias. En el caso de los campeones que normalmente se juegan en la posición de ADC están situados en la parte derecha del plano, cerca del eje de abscisas, esto me indica que soportan poco daño. Zac es el campeón representado más a la izquierda del plano sobre el eje de abscisas y tiene una gran contribución relativa, esto me indica que este campeón en las variables Damage Taken y Total Healing tendrá altas puntuaciones. Página 11 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Clasificación Automática Realizo una clasificación automática de los individuos, agrupándolos de manera que los campeones de cada clase sean lo más homogéneos posibles, mientras que las clases entre sí sean lo más heterogéneo posible. Mediante un método jerárquico de inercia de Ward hago una clasificación automática puesto que el número de individuos no es grande, con lo que obtengo el número de clases. Dendograma Realizo el corte en 6 clases, estando los vértices de altura a diferentes niveles, si el corte tuviese demasiados niveles los índices de agregación distarían muy poco, obteniendo demasiadas clases para un número de individuos no muy grande. Con este corte obtendré tamaños de clases bastante homogéneos: todos están entre el 27% y el 12% de información. También realizo otro corte en 5 clases que también parece que me proporciona unos buenos porcentajes de información: entre el 27% y el 13%. Para ayudarme a escoger cual sería el corte indicado utilizo los índices de nivel. Página 12 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Índices de nivel Observo en el gráfico con los índices de nivel que parece razonable hacer el corte en 5 ó 6 clases puesto que la diferencia de alturas entre vértices consecutivos es considerable. Al ser 5 los diferentes roles que puede tener cada campeón elijo mi corte en 5 clases. Estabilización por centros móviles Una vez decidido que el corte en el dendograma para obtener 5 clases realizo una estabilización por centros móviles. Mediante el proceso de centros móviles (búsqueda del centro de gravedad y asignación de individuos más cercanos….) se buscarán unas clases un poco más precisas. Tras realizar el proceso se pasará a la caracterización de cada clase, individuos que las forman, etc. Lo que se pretende con una estabilización por centro móviles es reducir la inercia intraclase (aumentando la interclases) hasta que se estabilice, es decir que varié muy poco. Interacción 0 1 2 3 4 I.Total 9,00 9,00 9,00 9,00 9,00 I. Interclase 5.50621 5.59509 5.61693 5.62230 5.62230 I.Intraclase 0.61180 0.62168 0.62410 0.62470 0.62470 Se puede observar como la inercia interclases (entre las 5 clases) va aumentando con el paso de las iteraciones y se estabiliza en la tercera interacción fijándose en 5,62, signo de que el método funciona bien. En la siguiente tabla se ve de manera pormenorizada, qué implica la estabilización por centros móviles en las 5 clases de la partición Descomposición de la inercia: Clases Inercia Antes Individuos Después Antes Después Página 13 de 20 Celia Santiago González Grado en Estadística Interclase 5.5062 Análisis de Datos 5.6223 1 0.9884 0.8916 32 30 2 0.8225 0.6096 20 17 3 0.4311 0.5057 25 27 4 0.7073 0.8264 34 37 5 0.5445 0.5445 17 17 En conjunto, las clases 3 y 4 han aumentado sus inercias mientras que las clases 1 y 2 se han visto reducidas. La clase 5 se han mantenido estática. Observo que estos aumentos y descensos vienen provocados por el número de individuos que compone cada clase, es decir, que todas las clases que han disminuido su inercia también ha disminuido su número de individuos y de forma análoga ha sucedido lo mismo con las clases que han sufrido aumentos. No puedo dictaminar a simple vista qué clase es mejor, pues aunque en un principio la que tenga menor inercia será la que posea mayor calidad, ésta dependerá del número de individuos que tenga. Por tanto, para medir la calidad de una clase tengo que observar la inercia dividida por el número de individuos. Clases Inercia/Individuos Antes Inercia/Individuos Después 1 0.03088 0.02972 2 0.04112 0.03585 3 0.01724 0.01872 4 0.02080 0.02233 5 0.03202 0.03202 Tras realizar el denograma se observaba que la mejor clase era la 4 con un 27% de información, ahora tras el proceso de estabilización pasa al segundo puesto (se le han añadido 3 campeones), también la primera clase, que en el denograma estaba en el segundo puesto, se va visto desplazada al tercer puesto, habiendo disminuido en 2 campeones. La tercera clase que ocupaba el tercer puesto en el denograma ahora ocupa el primer puesto tras el proceso de estabilización habiendo ganado dos individuos. Más importante que los cambios de posición entre el antes y el después es la calidad tras el algoritmo, así que solo se debe tener en cuenta esta última para establecer qué clase es más precisa. Por lo que ahora la clase más precisa es la 3, seguida de la 4, 1, 5 y por último la 2. Composición y caracterización de las clases Ahora estudiare por separado las clases, analizando los campeones que las componen y sus características. Pero antes analizaré los aspectos generales para dar una primera visión de cómo van a ser dichas clases: la ubicación de los centros de cada clase y la posible heterocedasticidad que pueda tener una variable dentro de un conjunto de individuos. Situación de los centros Página 14 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Coordenadas Iden-libelle EFF. 1 2 3 4 5 Disto. Clase 1 32 0.21 -1.12 -0.49 -0.21 -0.11 1.62 Clase 2 20 -1.53 -1.41 0.80 0.27 -0.17 5.10 Clase 3 25 1.53 0.69 -1.10 0.37 -0.04 4.20 Clase 4 34 1.59 0.64 0.88 -0.20 0.20 3.81 Clase 5 17 -4.04 1.48 -0.16 -0.07 0.08 18.61 La clase 1 es la que tiene sus coordenadas más cerca del origen, lo que me indica que los campeones que la formen tendrán una tendencia a tener unas características en torno a la media. Con coordenadas también muy parecidas a las de la clase 1 están la clase 3 y 4, lo que me indica lo mismo. La clase 2 estará formada por campeones con peores características. Esto lo analizaré mejor clase por clase. ANOVA para las variables En la tabla que se muestra a continuación se puede ver, en orden descendente, las variables que son más diferentes entre las cinco clases, es decir, la que esté situada más arriba, séase la que tenga un valor de Fisher más alto, será aquella variable cuya media sea lo más divergente de una clase a otra (En este caso la variable Assists). Por otro lado, la variable que esté situada más abajo, por lo que tiene el valor de Fisher más bajo, será una variable que presente las cinco medias muy parecidas (En este caso la variable Total Healing). Así se podrá observar qué variables son aquellas que pueden diferenciar unas clases de otras, y en las que hay que fijarse de un modo más detallado. Libellé de la variable Fisher Nb. de degrés de liberté Valeur-Test Probabilité Assists Gold Earned Damage Dealt Damage Taken Kills Minions Killed Win Percent Deaths Total Healing 98,31 97,22 93,68 70,05 66,84 46,49 33,10 25,09 20,37 123 123 123 123 123 123 123 123 123 12,72 12,68 12,55 11,48 11,31 9,98 8,76 7,80 7,09 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 Visto esto, paso a analizar clase por clase: 1. Clase 1 La clase 1 está formada por los siguientes 30 campeones: Página 15 de 20 Celia Santiago González Grado en Estadística Análisis de Datos CLASSE 1 / 5 Aat Cho Dar Eli Eve Fio Gar Hec Ire Jar Kha Kin Lee Mao Mas Nas Nid Noc Ola Qui Ren Ren Sha Sin Swa Try Vi Vla Xin Yor Para ver de forma más exhaustiva las características de estos campeones adjunto una tabla donde se describen no sólo las características medias de una observación perteneciente a dicha clase, sino que también se aprecia qué variables son las más constantes en la clase, o cuáles tienen mayor dispersión. Ecarttype général ValeurTest Probabilité 24284,200 5437,580 Ecarttype dans la classe 2841,030 3913,350 5771,840 4714,160 5,41 3,18 0,000 0,001 8,549 1,480 2,657 -3,32 0,000 Variables caractéristiques Moyenne dans la classe Moyenne générale Damage Taken Total Healing 29296,400 7840,870 Assists 7,136 Esta clase representa campeones que tienen valores positivos en Daño Recibido y en media total de vida regenerada por lo que son campeones que podrán resistir mejor. Por otro lado son campeones que tendrán Asistencias por debajo de la media. Son campeones usados normalmente en posiciones de top o jungla. 2. Clase 2 La clase 2 está formada por los siguientes 17 campeones: CLASSE 2 / 5 Amu Dr. Fid Gra Nun Ram Rek Sej She Shy Sio Ska Tru Udy Vol War Zac Ecarttype général ValeurTest Probabilité 24284,200 5437,580 50,337 Ecarttype dans la classe 2937,480 5789,400 2,563 5771,840 4714,160 2,569 6,24 4,91 2,46 0,000 0,000 0,007 18735,400 123,668 2422,690 48,665 4804,000 66,683 -3,13 -3,95 0,001 0,000 Variables caractéristiques Moyenne dans la classe Moyenne générale Damage Taken Total Healing Win Percent 32452,600 10685,500 51,772 Damage Dealt Minions Killed 15326,900 63,982 Página 16 de 20 Celia Santiago González Deaths 5,220 Grado en Estadística 6,117 0,374 Análisis de Datos 0,676 -5,86 0,000 Observo que los campeones de este grupo suelen usarse en Top y Jungla pero tienen unas diferentes características con respecto a la clase 1: tendrán valores muy positivos en Daño recibido, media total de regeneración de vida y además se observa una relación con el porcentaje de partidas que se ganan usando a estos campeones, lo que me indica que ahora mismo están muy “rotos”. Por otro lado, obtienen valores por debajo de la media en Daño realizado, minions matados y número de veces que el campeón muere, lo que me indica que son buenos campeones “tanques”, que sean los primeros en iniciar la batalla en primera línea para recibir todo el daño del equipo contrario resistiendo. 3. Clase 3 La clase 3 está formada por los siguientes 27 campeones: CLASSE 3 / 5 Aka Azi Cai Cas Ekk Gna Ill Jax Jay Kar Kas Kat Kog LeB Lis Mor Ori Pop Riv Rum Ryz Syn Urg Vay Vei Vik Yas Ecarttype général ValeurTest Probabilité 6,117 123,668 18735,400 6,127 Ecarttype dans la classe 0,542 14,378 2283,500 1,167 0,676 66,683 4804,000 1,974 4,94 4,02 3,10 2,34 0,000 0,000 0,001 0,010 24284,200 5437,580 8,549 50,337 3523,730 1364,610 1,021 1,510 5771,840 4714,160 2,657 2,569 -2,69 -3,52 -3,84 -7,36 0,004 0,000 0,000 0,000 Variables caractéristiques Moyenne dans la classe Moyenne générale Deaths Minions Killed Damage Dealt Kills 6,690 169,719 21289,600 6,920 Damage Taken Total Healing Assists Win Percent 21617,400 2587,370 6,796 47,093 Esta tercera clase está compuesta por campeones que van tanto en Top, como en Medio, como de ADC. Observo que tendrán valores por encima de la media en número medio de veces que mueren en una partida, en minions matados, en Daño realizado y en llevarse el máximo número de asesinatos al equipo enemigo. Por otro lado tendrán valores por debajo de la media en las variables: Daño recibido, media total de vida regenerada, asistencias y un porcentaje inferior a la media de partidas ganadas cuando juegas con este campeón. Todo esto me indica que son campeones que tienen mucho daño por lo que se usan para matar a los enemigos de forma más rápida y eficaz pero a la vez son los campeones que más protección necesitan puesto que son muy débiles y si reciben daño directo son fáciles de matar. Página 17 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Pese a todo esto ahora mismo (debido a la información que me aporta el porcentaje de partidas ganadas) no están especialmente “rotos” (que estén más fuertes que los demás debido a las mejoras que hacen los creadores del juego cada cierto tiempo). 4. Clase 4 La clase 4 está formada por los siguientes 37 campeones, es la clase con mayor número de individuos y son los siguientes: CLASSE 4 / 5 Ahr Ani Ann Ash Bra Cor Dia Dra Ezr Fiz Gal Gan Gra Hei Jin Kal Kay Ken Luc Lux Mal Mal Mis Pan Siv Tal Tee Tri Twi Twi Var Vel Wuk Xer Zed Zig Zyr Ecarttype général ValeurTest Probabilité 18735,400 11857,000 123,668 50,337 6,127 Ecarttype dans la classe 2215,360 577,945 33,834 1,421 1,206 4804,000 992,885 66,683 2,569 1,974 5,82 4,98 4,93 4,67 3,65 0,000 0,000 0,000 0,000 0,000 5437,580 24284,200 1654,540 2449,250 4714,160 5771,840 -4,05 -5,36 0,000 0,000 Variables caractéristiques Moyenne dans la classe Moyenne générale Damage Dealt Gold Earned Minions Killed Win Percent Kills 22625,900 12544,600 169,397 52,005 7,130 Total Healing Damage Taken 2780,140 19976,200 Esta cuarta clase recoge un poco de todas las posiciones, tanto de ADC, como Medio, Top y Jungla, menos campeones usados en la posición de Soporte. Esta clase es muy parecida a la clase 3: son campeones con mucho daño, minions matados y número de muertes realizadas, además de tener una media por encima de las variables porcentaje de partidas ganadas jugadas con estos campeones y el oro ganado por partida. También como en la clase 3 obtendrán valores por debajo de la media en total de daño recibido y media total de vida regenerada. Todo esto me indica que la única diferencia con la clase 3 es que en este momento estos campeones debido a las mejoras que incluyen los creadores del juego en los personajes cada poco tiempo hacen que estén más “rotos” que los demás, ósea, hagan un poco más de daño o por sus nuevas habilidades estén en una posición aventajada que los demás del mismo estilo. 5. Clase 5 La clase 5 está formada por los siguientes 17 campeones: CLASSE 5 / 5 Página 18 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Ali Bar Bli Bra Jan Kar Leo Lul Mor Nam Nau Son Sor Tah Tar Thr Zil Variables caractéristiques Moyenne dans la classe Moyenne générale Assists 14,004 8,549 Ecarttype dans la classe 0,955 Damage Taken Deaths Minions Killed Damage Dealt Kills Gold Earned 20882,600 5,704 31,941 10028,800 2,186 9777,880 24284,200 6,117 123,668 18735,400 6,127 11857,000 4568,590 0,465 12,014 3099,790 0,683 444,594 Ecarttype général ValeurTest Probabilité 2,657 9,05 0,000 5771,840 0,676 66,683 4804,000 1,974 992,885 -2,60 -2,69 -6,07 -7,99 -8,80 -9,24 0,005 0,004 0,000 0,000 0,000 0,000 En esta última clase observo que todos los campeones pertenecen a la posición de Support. Esta clase obtendrá en la variable Asistencias valores por encima de la media mientras que en las variables: Daño recibido, número de veces que muere, número de veces que se lleva una baja, número medio de minions matados por partida, Daño realizado y oro ganado por partida, estos campeones tendrán valores por debajo de la media. Esto me indica que, como nos indica el role al que pertenecen, estos campeones se encargan de acompañar a otro que tenga mucho daño y sea muy débil, para ayudarle a matar y defenderle, dependiendo de sus habilidades, por eso se lleva ese mayor número de asistencias. Conclusión Ya finalizado el análisis de componentes principales y la clasificación automática presentaremos las conclusiones finales, para ello realizo la representación de los individuos separándolos por clases en el plano 1-2. Página 19 de 20 Celia Santiago González Grado en Estadística Análisis de Datos Observo, después de hacer el análisis completo que a lo mejor una división en una clase menos, séase, en 4 clases no habría sido una idea descabellada, puesto que observo que las clases 3 y 4 tienen características muy parecidas entre sí y casi la clase 3 está contenida en la clase 4. Por otro lado, la clase 5 es la que más dista de todas las demás clases, que son los que tienen características más dispares a las demás. Pese a parecer que son los campeones con peores características, son necesarios a la hora de jugar porque, como he explicado con anterioridad, sus habilidades son muy útiles a la hora de acompañar a otros campeones para protegerlos o bien ayudarlos a matar a los campeones enemigos. La clase 1 con la clase 2 también se entrelazan un poco los campeones dado que comparten algunas características en común aunque los campeones de la clase 2 están diseñados más para tener una mayor resistencia a la hora de la batalla y llevarse menos bajas por lo que tendrían menos daños, mientras que la clase 1 también resistiría pero tendría a su vez bastante daño. En conclusión considero que haberlo dividido en 5 clases ha sido correcto (aunque podría haberlo hecho en 4). También observo que algunos campeones, gracias a esta división de clases, según sus características podrían ser válidos para jugarlos en otras posiciones diferentes a las comúnmente jugadas, aunque para determinarlo exactamente debería de estudiar las habilidades diferentes de cada campeón, no solo sus características, cosa que sería muy difícil dado que tienen todos habilidades muy diferentes. Página 20 de 20