“¿Qué segmento tiene mayor importancia en un Ironman?, pregunta retórica para presentar un modelo de predicción de rendimiento basado en los puestos parciales conseguidos” En este texto se presenta un modelo matemático apto para predecir el resultado final de un triatlón de distancia ironman a partir de los puestos parciales obtenidos por los competidores. El modelo se manifiesta sorprendentemente fiable, gracias a lo cual los factores de importancia (o peso) dados a cada segmento resultan buenas orientaciones sobre la relación que el puesto obtenido por un competidor en cada segmento tiene con respecto al resultado o puesto final. El texto se ilustra con ejemplos reales en los que se pone a prueba el modelo presentado y sirve de excusa para motivar una discusión clásica, aunque no demasiado científica entre los aficionados al triatlón. José Gutiérrez López Licenciado en Educación Física Master en Alto Rendimiento Deportivo DEA en Ciencias de la Actividad Física Entrenador Superior de Triatlón Entrenador Nacional de Ciclismo Introducción El contenido de esta ponencia es un hallazgo de lo más casual, aunque no por ello se le debe restar importancia. Es más, es un descubrimiento que sorprende por la inusitada precisión con la que un modelo matemático sencillo se ajusta a la explicación de un fenómeno real como es la clasificación de los participantes de triatlones ironman. La historia del casual hallazgo comienza cuando el autor y un amigo se plantean la posibilidad de iniciar una preparación a un año vista para tomar parte en una prueba ironman. Motivado por tal circunstancia, el mencionado amigo (Jesús Pérez Arriaga, investigador profesional en el campo de las Telecomunicaciones con beca nacional Ramón y Cajal, y desempeño ubicado en el seno de la Universidad de Cantabria), se entretiene revisando posibles tiempos parciales de competidores en diversas pruebas del circuito Ironman. Se enfrasca de tal manera en el asunto que animado por una apreciación del autor de este trabajo, comprueba como la premisa de la enorme importancia que aquel da al segmento final de carrera, resalta sobremanera. Ante esta circunstancia, sin más motivación que la simple curiosidad pone a prueba un modelo matemático sencillo muy utilizado en su trabajo habitual para probar el comportamiento de diferentes fenómenos en un primer contacto. La sorpresa aparece cuando, atónito, comprueba, triatlón tras triatlón (ironman todos ellos), como el modelo predice el resultado final de la prueba en función de los puestos parciales de cada segmento, asignando a cada segmento un coeficiente de importancia bien diferenciado. El modelo matemático El modelo matemático al que nos referimos se denomina Canonical Correlation Analisys (CCA), y queda expresado por la siguiente fórmula: R = a 1.x + a 2 .y + a3.z Donde: R = la variable dependiente (resultante) a1, a2, a3 = coeficientes constantes para las variables x, y, z = variables independientes estudiadas relacionadas con R Para facilitar nuestra lectura a la fórmula anterior la vamos a cambiar los símbolos de manera que nos ayuden a tener más presentes los significados de cada componente de la fórmula. De igual manera vamos a identificar cada variable, asignándola un significado dentro del problema que pretendemos estudiar. De tal manera que la escribiremos así: T = n.N + b.B + c.C Donde: T (antes R) = es la variable resultado, el puesto final obtenido n, b, c = los coeficientes constantes de las respectivas variables (n de natación, b de bicicleta y c de carrera) N, B, C = las variables independientes estudiadas, los puestos parciales conseguidos en cada segmento (N de natación, B de bicicleta y C de carrera) El siguiente paso es probar el modelo con datos reales de clasificación de algún ironman. Para ello recurrimos a un potente y prestigioso software matemático (Matlab 6.5, en concreto a su paquete estadístico). Al programa le solicitamos la comprobación del modelo CCA y le aportamos los datos de clasificación de una prueba completa en formato de archivo con columnas. Por ejemplo: 1 2 3 4 5 6 7 8 9 25 12 4 56 161 7 1 24 67 34 1 78 4 107 2 42 7 4 15 29 21 179 8 45 11 123 6 (datos ficticios) La primera columna corresponde a T (puesto final en el triatlón), la segunda a N (puesto parcial en el segmento de natación), la tercera a B (puesto parcial en el segmento de bicicleta) y la cuarta a C (puesto parcial en el segmento de carrera). Los datos van sin texto accesorio y se copian dentro de un archivo de Matlab con terminación .txt. Al programa le damos la orden de aplicar el “programa creado por JPA” CCA_puestos_0(‘nombredelarchivo’). Y nos genera la siguiente información: Numero de participantes:1935 Coeficientes de correlacion: Natacion - Ciclismo: 0.686293 Natacion - Carrera: 0.549436 Ciclismo - Carrera: 0.722907 Factores de importancia (CCA): Natacion: 1.042713e-001 Ciclismo: 3.890193e-001 Carrera: 5.067093e-001 Precision del modelo CCA: 0.995813 (Con datos correspondientes al Ironman de Florida 2005) - - - El número de participantes es la cantidad de triatletas que han tomado parte en la prueba (y que la han terminado). Los coeficientes de correlación indican la correlación existente entre las tres variables independientes (que no lo son tanto) tomadas de dos en dos: natación respecto a bicicleta y a carrera, bicicleta respecto a las otras dos y carrera respecto a las otras dos. En el presente ejemplo la correlación más fuerte la encontramos entre los segmentos de bicicleta y carrera (0,72). Los factores de importancia son los coeficientes (constantes para cada prueba estudiada) aplicados a cada segmento de la prueba. Entre los tres suman 1. Cuanto más valor tenga cada uno, más importancia tiene el puesto conseguido en ese segmento con respecto al resultado final de la competición. El texto del programa debe ser interpretado correctamente, en el ejemplo los factores de importancia serían: natación 0,104273 (10,4%); ciclismo 0,3890193 (38,9%); carrera 0,5067093 (50,6%). Por último la precisión del modelo indica la medida en que el modelo, con los factores generados, se ajusta a la realidad de los datos. Cuánto explica de toda la diversidad de la muestra de datos. Un modelo perfecto tendría el valor de 1, lo cual resulta prácticamente imposible al trabajar con datos reales en casi cualquier modelo. En nuestro ejemplo (real) se obtiene 0,995813. Esta fue precisamente la causa de sorpresa desencadenada en el creador del modelo. Aquí, el modelo se ajusta con una precisión casi perfecta a los datos reales utilizados, que repetimos, son, todos los participantes de la prueba. Además el programa aporta una representación gráfica de toda la muestra. En ella se puede observar como cada sujeto se acerca, más o menos, a la función expresada por la ecuación del modelo. Observemos el caso concreto de nuestro ejemplo: En el gráfico anterior, cada círculo azul corresponde a un triatleta. De 1935 datos de la muestra (triatletas), podemos contar unos 15 que llegan a separarse completamente del grueso de la muestra. La precisión del modelo en el ejemplo se manifiesta altísima. El extremo inferior e izquierdo de la figura representa los peor clasificados y el ascenso en diagonal sigue dirección hacia los mejor clasificados (extremo superior derecho). Las referencias de los ejes son meras escalas arbitrarias que ubican la muestra. La aplicación del modelo Una vez obtenido el hallazgo, interesaba comprobar si los resultados conseguidos eran fruto de la casualidad de una prueba o bien serviría para explicar (y por lo tanto predecir) lo que ocurriría en otras pruebas diferentes (dentro aún de la distancia ironman). Para proceder recurrimos a recopilar información de varios triatlones ironman internacionales. En la página www.ironman.com se ofrece acceso a todas las pruebas del circuito Ironman. Dentro de estas pruebas encontramos diferencia entre las que ofrecen servicio online de selección de resultados y las que ofrecen sólo listados de clasificación en archivo de texto. Hemos probado tan sólo las primeras pues nos permiten generar archivos .txt para el Matlab con sólo cortar, pegar y retocar los datos obtenidos de selecciones exclusivas de los “overall” totales, natación, bicicleta y carrera en formato de columnas. El resto de las pruebas exigirían un laborioso trabajo de transformación de los datos que no nos hubiera permitido llegar a tiempo para presentar este trabajo en estas Jornadas Técnicas. Aún así son varios los triatlones probados con el modelo. A continuación mostramos resumidos los datos obtenidos de varias pruebas del circuito Ironman del año 2006 (Coeur d’Alene, Arizona, Canadá, Florida y Lake Placid): Ironman Coeur d'Alene 06 Arizona 06 Canada 06 Florida 06 Lake Placid 06 Promedios Nº 1940 1726 2175 2109 2045 Factores de importancia Natación Bicicleta Carrera 0,106 0,411 0,481 0,107 0,392 0,5 0,109 0,374 0,516 0,124 0,394 0,481 0,102 0,417 0,48 0,1096 0,3976 0,4916 Coef. Precisión 0,9944 0,9938 0,9947 0,9958 0,9963 Coef. de correlación N-B N-C B-C 0,63 0,38 0,62 0,62 0,44 0,63 0,62 0,45 0,68 0,65 0,55 0,73 0,61 0,47 0,75 0,626 0,458 0,682 A partir de los anteriores resultados podemos realizar varios e interesantes comentarios: - Disponemos de unas muestras de participantes numerosas, que hacen especialmente interesante la experiencia y difíciles de alcanzar en otro tipo de eve ntos. - El factor de importancia asignado a la natación (0,109 de promedio) se mantiene especialmente estable independientemente de la prueba a la que se refiera (apenas destaca un poco más en Florida). Y por cierto, ¡es muy bajo!, sólo representa un 11% de la importancia. - El factor de importancia del segmento ciclista es el que mas variación muestra de los tres. Aunque tampoco demasiado. Representa un 39,7% de la importancia (pese a la mayor duración del segmento). Hay dos casos que merecerán la pena comentarse a parte (Coeur d’Alene y Lake Placid). - El factor de importancia de la carrera varía en una medida intermedia al de los otros dos segmentos. Su importancia es la mayor de las asignadas a los diferentes segmentos con un 49% de promedio. - Los coeficientes de precisión son elevadísimos para todas las pruebas superiores a 0,99 todos ellos. Esto representa un altísimo nivel de precisión del modelo. - La menor correlación entre segmentos la encontramos entre la natación y la carrera. - La mayor correlación entre segmentos se encuentra entre la carrera y la bicicleta (a excepción de la primera de las competiciones), aunque relativamente parecida a las halladas entre la natación y el ciclismo. Procedemos a partir de aquí a mostrar las representaciones gráficas de las muestras para las pruebas seleccionadas: De las gráficas anteriores también pueden desprenderse algunos comentarios de interés: - La agrupación de sujetos a la función es espectacular. Algo lógicamente ya expresado por los elevados coeficientes de precisión del modelo empleado. - - Apenas hay dispersión en ninguna zona del gráfico. Esto significa que el modelo es igualmente válido para predecir los resultados tanto en todas las gamas de participantes, desde los de peor nivel, hasta los de más alto nivel. El mayor número de desviaciones (aún siendo muy escasas) aparecen entre los puestos inmediatamente por debajo de los mejores y de ahí hacia la mitad de la clasificación. Bondades del modelo De los datos mostrados concluimos que el modelo es francamente poderoso como predictor del puesto final de la prueba de ironman, en función de los puestos parciales conseguidos durante la misma. Que esto tenga o no una gran utilidad para los participantes o sus entrenadores es ya cuestión de su saber hacer, su capacidad de análisis y su conocimiento. Modestamente pensamos que si que la tiene (y mucha). Sin embargo aquí nos vamos a limitar a defender sus bondades científicas: - - - El modelo muestra un impresionantemente elevado coeficiente de precisión, esto resulta indiscutible. La experiencia parte de una muestra muy amplia de participantes difícil de obtener en cualquier otro tipo de competiciones. Esto da un alto de grado de validez al modelo, máxime cuando estos altos niveles de muestra se repiten en cada una de las competiciones estudiadas. El modelo muestra un excelente comportamiento en cada una de las gamas de la muestra, lo cual lo hace válido para predecir el resultado de la prueba en cualquier grupo de nivel de los participantes. Desde el más alto rendimiento hasta los más populares. El modelo continúa funcionando sin perder las bondades anteriores en todas aquellas competiciones de ironman en las que se ha probado. Y además los diferentes coeficientes de importancia no sufren grandes variaciones, lo cual invita a pensar en la posibilidad de utilizar estos coeficientes como predictores universales para la distancia ironman. Limitaciones del modelo Al elegir las variables que se pretendían estudiar, inicialmente se pensó en la posibilidad de experimentar un modelo de este tipo que tuviera en cuenta los tiempos (marcas) parciales de cada segmento, ya que estos podrían resultar mucho más prácticos para la utilización y las conclusiones extraídas por parte de los entrenadores y los deportistas. Sin embargo tal decisión hubiera provocado una serie de dificultades de ajuste que hubieran trastocado demasiado la aplicación del CCA. Todo ello vendría derivado del factor tiempo de duración de cada segmento. El hecho de que unos segmentos tengan una duración básica claramente diferente a otros, enmascararía la importancia real que pudieran mostrar con respecto al resultado final. Para obtener un coeficiente de importancia verdadero habría que haber trabajado probablemente con marcas ponderadas (ajustadas para tratar de minimizar el efecto del tiempo de segmento). De la forma que se ha hecho, se obtiene la importancia real del puesto, y a partir de ahí, quién lo desee puede indagar las marcas correspondientes para cada puesto parcial en los listados de resultados. Al fina l se pueden llegar a encontrar las mismas conclusiones que utilizando un modelo basado en las marcas, que por otro lado resultaría más complicado, y no necesariamente más acertado. El siguiente punto en cuestión es la validez o no del modelo para otras distancias. Esto es algo que no se ha acometido en este trabajo, por lo que no garantizamos que tenga posibilidades y precisión suficiente, simplemente lo desconocemos. En cualquier caso es probable que, aún encontrando suficiente precisión, los coeficientes de importancia y los de correlación entre segmentos sufrirían importantes variaciones con respecto a la distancia ironman. En esta línea tan sólo hemos probado con un par de pruebas de ½ ironman, obteniendo unos resultados claramente inferiores: Medio California 2006 Medio Florida 2006 Nº Participantes Natación Factores de Bicicleta importancia Carrera N-B Coeficientes de N-C correlación B-C Coeficiente de precisión Nº Participantes Natación Factores de Bicicleta importancia Carrera N-B Coeficientes de N-C correlación B-C Coeficiente de precisión 1944 0,030 0,749 0,220 0,800 0,616 0,737 0,945 1893 0,283 0,176 0,539 0,721 0,841 0,888 0,726 Repasemos brevemente algunas de las cuestiones que llaman la atención de los datos mostrados en la tabla anterior: - Los coeficientes de precisión han bajado claramente (en el caso de Florida ostensiblemente incluso). Mantienen cierto nivel de predicción pero no roza la perfección de los casos de ironman, y además muestran gran disparidad entre ellos. - Los factores de importancia se muestran impredecibles al comparar ambas pruebas pasando del 3% al 28% en la natación; del 75% al 17% en el ciclismo; y del 22% al 54% en la carrera. Imposible determinar coeficientes que expliquen más de una prueba concreta. - Los coeficientes de correlación entre los segmentos aumentan en todos los casos. Esto es algo que llama la atención y que sugiere que a medida que las distancias se han reducido, la correlación y dependencia entre los rendimientos obtenidos en los diferentes segmentos aumenta. Sería interesante continuar investigando por ahí. Pasemos ahora a comprobar que ocurre con los gráficos en los que se muestra la dispersión de los sujetos: En esta ocasión hay también varios detalles que merecen la pena de ser resaltados: - La dispersión aumenta considerablemente en ambas pruebas, especialmente en Florida. En California se mantiene cierta linealidad, especialmente en los dos extremos y más evidente en la primera mitad de puestos que en la segunda. En Florida apenas hay linealidad en los últimos. - La dispersión (sobre todo en el caso de Florida) se refiere no sólo a la cantidad de sujetos que se alejan de la predicción, sino también en la dimensión de dicho alejamiento, que es amplia. Posibles explicaciones Conocido el modelo y los resultados de predicción para el caso de la distancia ironman, el siguiente paso sería buscar justificaciones que expliquen por qué la realidad se comporta así, a qué se puede deber el valor del factor de importancia de cada segmento e incluso la cuestión de la correlación entre segmentos. No es este el objeto de este trabajo, pero sin embargo, trataremos de ir iniciando un posible debate futuro al respecto sobre las tres cuestiones planteadas. 1. La realidad parece mostrarse así e indicar que el resultado final de la prueba corresponde a la suma de los resultados parciales de los segmentos, mediatizados éstos por ciertos factores de corrección. No parece ilógico, tratándose la competición de una sucesión de esfuerzos aeróbicos en modalidades continuas de desplazamiento. 2. Su importancia dependerá en principio de varios factores: 2.1. El factor duración, el cual dará cierta ventaja de importancia al ciclismo, seguido de la carrera, penalizando más a la natación. 2.2. El factor fatiga, que sin duda cobrará mayor importancia cuanto más tardío sea el segmento realizado. En esta línea, la natación vuelve a aparecer como el segmento menos relevante por acometerse en primer lugar, siendo la carrera el de mayor fatiga acumulada. 2.3. El tipo de fatiga de la carrera respecto a la bicicleta incluye unas connotaciones que no se producen en el segundo segmento. Nos referimos a la fatiga y desgaste muscular producidos por los continuados impactos y fases de contracción excéntrica que se producen el momento de amortiguación de cada zancada. Este tipo de desgaste parece mostrarse como definitivo en carreras de resistencia, especialmente las que superan los 25-30 km. Este aspecto evidentemente sólo hace hincapié sobre la carrera. 2.4. A los efectos de fatiga acum ulada se unen los de deshidratación y depleción de nutrientes que se acusan más en el tercer segmento. Además la posibilidad física de comer y beber en competición puede darse con facilidad durante el segmento ciclista pero no así durante la carrera que exige paradas en puntos concretos. 2.5. Las curvas de rendimiento estable aeróbico para la natación y la bicicleta son “planas” desde niveles de rendimiento más próximos a los niveles máximos para las disciplinas de la natación y del ciclismo. En la carrera estas curvas parecen presentar mayor pendiente por lo que incluso a niveles de rendimiento muy ligeros, se pueden producir cambios significativos de velocidades medias. Todo ello parece justificar que el segmento de carrera aparezca como el que mayor factor de importancia tiene, seguido por el de ciclismo, dejando en último lugar al de la natación. 3. Las correlaciones entre segmentos son, sin duda mucho más difíciles de analizar. No vamos a entrar en mucho detalle aquí sobre ellas, aunque si comentar que la correlación más fuerte casi siempre aparece entre los segmentos de ciclismo y carrera a pié. Esto probablemente se deba a que de hecho son los segmentos que mayor transferencia presentan entre sí, tanto en cuanto a rendimiento de los deportistas como en los efectos cruzados producidos por su entrenamiento. No en vano ambas disciplinas se fundamentan en el trabajo muscular del tren inferior. Lo que ya no resulta tan fácil de explicar, al menos inicialmente es por qué el segmento ciclista presenta niveles de correlación cercanos con las otras dos disciplinas. El segmento ciclista es el que más correlaciona con los otros dos. Quizá estén apareciendo pistas sobre una posible mayor facilidad de adaptación hacia este deporte desde los orígenes de las demás disciplinas, por encima de la adaptación hacia la natación o la carrera desde las otras modalidades. En cualquier caso, queda señalado el detalle pero no nos aventuramos a exponer verdaderas explicaciones. Un punto que si llama la atención poderosamente es que, aún no siendo un número significativo de eventos probados, la experimentación del modelo en dos pruebas más cortas muestra un claro incremento de la correlación entre segmentos. Esto parece indicar que la dependencia entre las variables de rendimiento por disciplinas es mucho más evidente en pruebas más cortas que en la distancia ironman en la cual los rendimientos parecen más independientes entre los segmentos. Que esto se confirme en distancias más cortas como la olímpica es algo que no hemos comprobado y se aparta del objetivo de este trabajo, pero sería interesante de observar, aunque difícilmente encontrásemos muestras de competidores tan amplias. Pero sí muestras más amplias de número de eventos. Hay queda el reto o la invitación para investigarlo. Uno de los detalles que anteriormente fueron mencionados y aplazados para un posterior comentario es el referido a las dos pruebas en las que mayor importancia alcanza el segmento del ciclismo respecto a la importancia que obtiene en el resto de eventos. Coeur d’Alene con 0,411 y especialmente Lake Placid con 0,417 son las dos indicadas, y en ambas se da la circunstancia de que en sus perfiles ciclistas aparecen algunas elevaciones intermedias de cierta relevancia. Estas variaciones orográficas son aparentemente más acusadas en Lake Placid. Aquí se ilustra el perfil del segmento: En el caso de Coeur d’Alene los accidentes geográficos son más numerosos (6), pero con menor diferencia de altura y más cortos, aunque aparentemente más pendientes. Esto no busca demostrar nada, tan sólo dar una posible orientación de cómo el perfil del segmento podría hacer variar en cierta medida (quizá importante), la asignación de factores de importancia al segmento ciclista. Otro tema, sin duda polémico, pero que no queremos dejar en el tintero, es cómo a partir de modelos predictivos como el que nos ocupa, se nos invita a valorar el esfuerzo y cantidad de entrenamiento dedicado a cada segmento. No vamos a desarrollar este tema aquí, aunque si, aún a riesgo de ser muy criticados, vamos a iniciarlo. El factor de importancia asignado a la natación en ironman es de 0,1096 de media. Pero ¿cuánto entrenan los triatletas de cada disciplina?. ¿Por qué so se tiende a investigar los efectos reales de mejora que se consiguen en cada modalidad a costa del entrenamiento?. Es decir: ¿qué grado de mejora (de sus marcas o puestos en el segmento) obtienen con el entrenamiento los triatletas en cada disciplina?, ¿hay disciplinas más susceptibles a evolucionar a base de entrenamiento que otras?, ¿ha y edades para cada una?... y un sin fin de preguntas fáciles de hacer y no necesariamente difíciles de investigar. La cuestión es si el conocimiento de las respuestas a estas y otras preguntas servirían para racionalizar el entrenamiento, o éste seguiría en cierta medida marcado por determinadas modas, mitos o tendencias, más subculturales que científicas. Propuestas concretas para avanzar en el estudio Este es un estudio concreto y rápido, castigado por la premura del tiempo marcado por el evento al que por primera vez se presenta. Tanto, que no incluye referencias bibliográficas que ilustren algunos de los comentarios expuestos en la búsqueda de posibles explicaciones al éxito del modelo matemático presentado. Quizá merezca la pena que con tiempo nos pongamos manos a la obra y demos mayor empaque científico al trabajo. Eso es algo que aún está por decidir. Lo que si nos atrevemos a plantear son algunas posibles líneas de investigación que se van abriendo a raíz de lo encontrado en esta experiencia. Básicamente son dos: a) Probar el modelo con un número significativo de eventos, tanto en distancia media como olímpica. Partir de ahí extraer conclusiones sobre su validez y, sobre todo, sobre la evolución de las correlaciones entre segmentos en función de la distancia de prueba. b) Avanzar en el estudio de la aplicación del modelo en distancia ironman. En este sentido sería interesante poder probar determinados eventos concretos en los cuales sus peculiaridades orográficas, climáticas o de otra índole puedan hacernos pensar que generen alteraciones respecto a los factores de importancia asignados a cada segmento. Por ejemplo el ironman de Lanzarote en condiciones de fuerte viento, ¿podría incrementar significativamente el factor de importancia del segmento ciclista?. Y otro caso tan o más interesante: recomendamos probar el modelo en Hawaii (el formato de los datos no nos lo ha facilitado a tiempo). Éste ironman presenta una premisa que lo hace diferente a los demás, exige calificación previa a los competidores, esto en cierta medida incrementa el nivel general, y cuando menos, incrementa la experiencia de los participantes. Consideramos que por ambas razones, merecería la pena estudiar el caso.