24 de Noviembre de 2022
Ciencia de datos

Los datos revolucionan el fútbol

Los clubes y las selecciones nacionales recurren cada vez más al análisis de datos y la inteligencia artificial a la hora de incorporar jugadores o preparar partidos.

Partido entre Uruguay y Costa Rica en la Copa del Mundo de 2014. Las selecciones nacionales de fútbol recurren cada vez más a la ciencia de datos para mejorar sus resultados. [Danilo Borges/Portal da Copa/Wikimedia Commons, CC BY 3.0 BR]

El ceño fruncido de Cristiano Ronaldo saltó a los titulares el mes pasado, cuando el astro portugués fue sustituido a falta de 18 minutos para el final de un partido entre el Manchester United y el Newcastle. Pero esa reacción no es exclusiva de Ronaldo: pocos futbolistas están de acuerdo cuando su entrenador decide mandarlos al banquillo y dar entrada a un suplente.

Durante la Copa del Mundo que acaba de comenzar en Catar, los jugadores tendrán más argumentos para defender su presencia en el campo. Poco después del pitido final, los organizadores del torneo enviarán a cada jugador un desglose detallado de su actuación. Los delanteros podrán mostrar cuántos de sus desmarques fueron ignorados, y los defensas dispondrán de datos para evidenciar cómo hostigaron al equipo contrario cuando este tenía la posesión.

Es la última incursión de las cifras en el mundo del balompié. El análisis de datos ya ayuda a gestionarlo todo, desde los fichajes y la intensidad de los entrenamientos hasta la táctica a usar contra cada rival, ofreciendo incluso recomendaciones sobre la dirección en que conviene chutar desde cada punto del campo.

Entretanto, los futbolistas se enfrentan a un escrutinio más propio de un astronauta. Los chalecos y bandas que visten pueden detectar el movimiento, seguir su posición mediante GPS y contar el número de disparos que realizan con cada pie. Las cámaras captan todo desde múltiples ángulos, desde el tiempo que los jugadores mantienen la pelota hasta los balones aéreos ganados. Y para dar sentido a esta información, la mayoría de los equipos de élite emplean a analistas, entre los que hay matemáticos, científicos de datos y físicos procedentes de importantes empresas y laboratorios, como Microsoft o el CERN, el laboratorio europeo de física de partículas.

Las ideas de esos analistas están alterando la forma de jugar: los delanteros ya no disparan tanto de lejos, los extremos pasan a un compañero en vez de hacer centros y los entrenadores se obsesionan con recuperar la posesión lo más cerca posible del área rival. Todos estos cambios tácticos se basan en pruebas sólidas que respaldan la intuición del entrenador.

«Los macrodatos han abierto una nueva era en el fútbol», asegura Daniel Memmert, científico deportivo de la Escuela Superior de Deportes de Alemania. «Han cambiado la filosofía y el comportamiento de los equipos, la forma de analizar a los rivales, y la manera de desarrollar el talento y ojear jugadores.»

Estadísticas avanzadas

Uno de los ejemplos más famosos de la influencia de los datos en el deporte proviene de un juego distinto. En su libro Moneyball, Michael Lewis explica cómo Billy Beane, presidente del equipo de béisbol Oakland Athletics, se basó en estadísticas avanzadas para construir un equipo ganador con un presupuesto reducido en 2002. Beane contrató a los jugadores a partir de datos detallados sobre su rendimiento, incluidos algunos previamente infravalorados, como la frecuencia con la que un bateador llegaba a la base.

Beane tenía una ventaja respecto a quienes tratan de hacer lo propio en el fútbol. «El fútbol es mucho más complejo que el béisbol», explica Memmert. El béisbol es un juego con interrupciones constantes y donde, en cada momento, solo hay un equipo intentando sumar puntos. Además, las estadísticas del béisbol se habían recogido y estudiado regularmente durante décadas. En cambio, el fútbol es un juego de «invasión» (donde se gana y se pierde terreno todo el tiempo), fluido y con tanteo bajo, y es mucho más difícil registrar quién hace qué y cómo afecta eso al resultado. Durante decenios, los estadísticos del fútbol se han centrado en los goles marcados y encajados, y en buscar una manera de modelizarlos para hacer predicciones.

Hoy en día se siguen usando variantes de ese método para pronosticar los resultados de los partidos. Un modelo matemático que supone que los goles marcados y encajados se distribuyen en torno a un valor medio, desarrollado por epidemiólogos de la Universidad de Oxford, predijo correctamente que Italia ganaría a Inglaterra en la final de la Eurocopa de 2020. Y también acertó seis de los ocho cuartos de final.

Y esos buenos resultados no son flor de un día. Las predicciones estadísticas de los partidos son más precisas de lo que muchos se piensan, subraya Matthew Penn, estudiante de doctorado en Oxford que desarrolló el modelo de la Eurocopa de 2020.

«El objetivo es asignar a cada equipo una puntuación ofensiva y otra defensiva, obtenidas a partir del número total de goles que ha marcado cada equipo y de la dificultad relativa de sus rivales», detalla. «Al final, se obtiene un gran sistema de ecuaciones para hallar esos dos conjuntos de puntuaciones, y entonces resulta muy sencillo predecir cualquier resultado.» Para la Copa del Mundo de Catar, el modelo de Penn sugiere que Bélgica (que no figura entre los principales favoritos en las casas de apuestas) es el equipo con más opciones de llevarse el trofeo, seguida de Brasil.

 

¿QUIÉN GANARÁ LA COPA DEL MUNDO?
Un modelo estadístico de «doble Poisson» que considera las virtudes ofensivas y defensivas de cada selección otorga a Bélgica la mayor probabilidad de ganar el Mundial de fútbol de Catar. Los resultados muestran algunas diferencias significativas respecto al ranking de la FIFA.
MODELO ESTADÍSTICO

PROBABILIDAD DE GANAR (%)

RANKING DE LA FIFA

1. Bélgica 13,88 1. Brasil
2. Brasil 13,51 2. Bélgica
3. Francia 12,11 3. Argentina
4. Argentina 11,52 4. Francia
5. Países Bajos 9,65 5. Inglaterra
6. Alemania 7,24 6. Italia†
7. España 6,37 7. España
8. Suiza 5,29 8. Países Bajos
9. Portugal 3,78 9. Portugal
10. Uruguay 3,36 10. Dinamarca
11. Dinamarca 3,17 11. Alemania
12. Inglaterra 2,56 12. Croacia
13. Polonia* 2,33 13. México
14. Croacia 1,46 14. Uruguay
15. México 0,67 15. Suiza
*En el puesto 26 del ranking de la FIFA; †No se clasificó para el Mundial.

 

¿Funciona realmente?

Lo que más les interesa a los entrenadores es la información sobre los lances del juego y cómo influyeron en ellos los jugadores.

Los analistas del fútbol llevan mucho tiempo registrando ese tipo de información. Uno de los que más éxitos cosechó fue Charles Reep, un antiguo contable de la Real Fuerza Aérea del Reino Unido que se pasó gran parte de la década de 1950 viendo partidos en Inglaterra y realizando observaciones básicas de factores como las posiciones en el campo y las secuencias de pases. Reep llegó a usar sus datos para analizar el rendimiento de los equipos y sugerir tácticas. En el club Wolverhampton Wanderers, ayudó a introducir un estilo de juego directo e incisivo que huía de los pases laterales y con el que ganaron tres campeonatos de liga en cinco años.

Las técnicas modernas facilitan sobremanera la obtención y el análisis de esas estadísticas, lo que ha llevado a la mayoría de los grandes clubes y a muchas selecciones nacionales a contratar analistas de datos desde hace más de un decenio. Y esa tendencia se extiende a las categorías inferiores: además de realizar su doctorado, Penn trabaja como analista de datos a tiempo parcial para el Oxford City, un club de fútbol semiprofesional que compite en la National League South, en la sexta división inglesa.

Muchos analistas atribuyen parte del reciente éxito del Brentford (un club londinense que ascendió a la primera división inglesa hace dos temporadas, por primera vez en 74 años) a un algoritmo interno que califica a los jugadores de diversas ligas y ayuda al equipo a descubrir talentos ocultos. El equipo de datos del Liverpool, donde hay físicos que trabajaron en el CERN y en la Universidad de Cambridge, ha desarrollado un modelo que evalúa si las acciones de un jugador sobre el terreno de juego aumentan las probabilidades de marcar un gol. Y científicos deportivos de la Universidad de Lisboa, en colaboración con el Fútbol Club Barcelona, publicaron el año pasado un análisis sobre las oportunidades de pase a lo largo de un partido, para distintos tipos de pases.

«Creo que lo más útil de todo lo que hacemos [en el Oxford City] son los informes previos al partido», opina Penn. «Analizamos las características de los jugadores del equipo contrario y elaboramos gráficos que muestran cómo suelen jugar y moverse. Y luego doy algunos consejos o sugiero cambios tácticos.» Antes de un partido reciente contra un equipo que estaba invicto, el análisis de Penn identificó que el lateral izquierdo tenía malas estadísticas en el juego aéreo. «Así que mi sugerencia fue situar a nuestro delantero más alto en la parte derecha del campo», señala. Y el Oxford ganó el partido. Ese es el tipo de información que puede obtener a simple vista un ojeador experimentado, pero, según Penn, «los datos siempre van a estar menos sesgados que la opinión de alguien».

Los equipos no tienen que generar ellos mismos los datos brutos para ese tipo de análisis tácticos: pueden comprar la información a empresas privadas que analizan los vídeos de los partidos para registrar el resultado de unos 3000 lances del juego, como regates, pases y entradas. Al principio, esos datos se obtenían de forma manual, pero ahora se suele recurrir a la «visión artificial», un tipo de inteligencia artificial (IA). A menudo, los datos vienen acompañados de estadísticas descriptivas, como el porcentaje de pases completados por cada jugador.

Joanna Marks, que estudia un grado de matemáticas en la Universidad de Warwick y trabaja junto a Penn en el Oxford City, desarrolló a comienzos de este año un modelo que usaba esos datos brutos para evaluar la eficacia en el pase de todos los jugadores de la liga de Oxford. Ese es el tipo de análisis detallado que no suele estar disponible en los datos brutos suministrados por las empresas.

«Hay que tener en cuenta el tipo de pase que intentan. No se puede considerar solo el porcentaje de pases completados, porque algunos son mucho más difíciles que otros», explica Marks. «El modelo ayuda a preparar los partidos, porque si uno descubre que el equipo rival pasa muy bien desde una zona del campo, entonces sabe a qué atenerse.»

Ravi Ramineni trabajó como analista de datos en Microsoft hasta 2012, cuando aceptó un puesto similar en los Seattle Sounders de Washington, su club local de la liga de fútbol estadounidense. Una de sus primeras tareas fue usar los datos de GPS sobre la distancia recorrida por los jugadores para optimizar sus sesiones de entrenamiento y preparación. «Recogiendo esos datos durante el entrenamiento, es posible saber si este ha sido demasiado intenso o demasiado suave, a fin de prevenir lesiones.»

¿Funcionó? «Tuvimos algunas temporadas muy buenas cuando aplicamos esos métodos. Pero no estoy seguro. Lo más difícil de cuantificar es si se ha logrado evitar una lesión.»

Esa incerteza plantea un problema a la hora de evaluar el papel que desempeñan los datos en el éxito deportivo: no hay ningún experimento de control para comprobar la eficacia. Aun así, Ramineni afirma que los entrenadores de los Sounders se mostraron receptivos a sus análisis, tanto en los entrenamientos como al juzgar las virtudes de los jugadores.

«Me dieron línea directa con los entrenadores, e incluso pude ir a hablar en persona con los jugadores», valora. «En otros equipos no pasa eso. A veces el entrenador ni siquiera interactúa con el analista de datos.»

Asistentes virtuales

Los analistas cada vez prestan más atención al juego sin balón. «Algo que se oye sin cesar en el análisis del fútbol es que necesitamos saber qué hace el jugador cuando no tiene la pelota», incide Ramineni.

Eso es más difícil y caro, porque requiere cámaras específicas que no se limitan a seguir la jugada principal, sino que vigilan a los jugadores que no participan de forma directa en ella y etiquetan su ubicación unas 25 veces por segundo. Las empresas que suministraban este tipo de datos solían firmar contratos de exclusividad con las ligas nacionales, destaca Ramineni, lo que dificultaba el acceso a otros profesionales. «Si estaba ojeando a un jugador internacional de Sudamérica o Europa para la liga estadounidense, no podía consultar sus estadísticas sin balón», apunta.

En los últimos años ha surgido una técnica más potente que aprovecha la IA para predecir los movimientos de los jugadores en los partidos grabados, incluso cuando no los enfocan las cámaras. Eso significa que las empresas de datos pueden usar las imágenes de los partidos (disponibles sin restricciones) para realizar análisis exhaustivos de los jugadores de cualquier parte del mundo, con y sin balón.

Uno de esos modelos predictivos es fruto de un acuerdo entre los investigadores de DeepMind, la división de IA de Google, y el equipo de datos del Liverpool. «Ese tipo de aplicación nos permite plantearnos cuestiones tácticas o situaciones ficticias», explica Ian Graham, director de investigación del Liverpool, que dejó un posdoctorado en física de polímeros en la Universidad de Cambridge para trabajar con las estadísticas del fútbol. «Para un lance concreto del partido, el modelo produce miles de simulaciones sobre otras cosas distintas que podrían haber pasado. Así, podemos juzgar el resultado de una jugada de ataque en esa fase del encuentro».

<span>Esta animación compara los movimientos reales de los jugadores durante un partido de fútbol (</span><em>atacantes en azul oscuro, defensas en rojo</em><span>) con las predicciones de un modelo que prevé las trayectorias de los jugadores que están fuera de cámara. La zona sombreada en gris es el campo de visión de la cámara de televisión, que sigue el balón (</span><em>línea negra</em><span>). El modelo predice la posición de los atacantes (</span><em>verde</em><span>) y de los defensores (</span><em>naranja</em><span>) que están fuera del campo de visión, cuyas posiciones reales aparecen en azul claro y rosa, respectivamente. [Fuente: «</span><a href="https://sites.google.com/view/imputation-of-football">Multiagent off-screen behavior prediction in football</a><span>», Shayegan Omidshafiei et al./DeepMind]</span>

Los departamentos de análisis de los clubes no suelen compartir detalles concretos sobre lo que hacen o cómo de bien funciona, así que publicar ese trabajo resultó algo incómodo para el Liverpool, pero era un requisito para trabajar con Deep Mind.

«El Liverpool cuenta con uno de los departamentos de análisis más grandes y desarrollados del mundo del fútbol, y no tenemos ni de lejos los recursos necesarios para desarrollar esos modelos nosotros mismos», admite Graham. Eso le da la tranquilidad de que ningún otro equipo es capaz de hacerlo.

Al igual que otros analistas de datos, Graham es reacio a atribuirse el mérito de los éxitos deportivos. «El fútbol presenta una gran variabilidad, así que los equipos a menudo pierden cuando no deberían perder y ganan cuando no deberían ganar», afirma. «En muchos sentidos, nuestro trabajo es más fácil cuando al equipo le va mal, porque el análisis suele mostrar que hemos jugado bien. Y si seguimos jugando así, esa temporada acabaremos ganando el número esperado de partidos.»

Karl Tuyls, científico computacional de DeepMind, afirma que la modelización fuera de cámara es el primer paso hacia la creación de un asistente virtual e impulsado por la IA que use datos en tiempo real para facilitar la toma de decisiones en el fútbol y otros deportes. «Podemos imaginar un sistema de IA que examina el rendimiento de la primera parte y sugiere un cambio táctico que podría dar mejores resultados», comparte.

Ese enfoque también podría ser útil en otros ámbitos, por ejemplo, para modelizar las trayectorias de los coches sin conductor y de los peatones en una calle muy concurrida de la ciudad, añade Tuyls.

Cambios en el juego

¿Cuál es el siguiente paso? Como cualquier científico, los expertos que analizan los datos del fútbol subrayan que hace falta investigar más. Sarah Rudd, ex científica de datos de Microsoft que dejó el Arsenal el año pasado, tras casi una década trabajando como analista del club londinense, envidia las ingentes cantidades de datos de telemetría que producen los coches de carreras, y que permiten a los ingenieros ajustar y mejorar su rendimiento.

«Siempre miramos a la Fórmula 1 y decimos que sería increíble estar a ese nivel», revela. «En el fútbol aún hay muchas cosas que no se miden, y otras que sí se miden pero aún no sabemos cómo aprovechar.»

El próximo avance podría ser recabar datos que reflejen la orientación de los jugadores, o incluso cómo reparten su peso. «Puede que los datos de seguimiento no tengan aún el nivel de detalle que busca la gente», reconoce Rudd. «Todavía no captan esa pequeña finta o cambio de peso que hace un jugador para desequilibrar al defensa o engañar al portero.»

El conocimiento incompleto de la posición de un jugador también puede ser un problema, incluso para los análisis basados en la IA que realiza el Liverpool. «El modelo podría concluir que un jugador se equivocó porque debería haber empezado a correr en un punto y no lo hizo», ilustra Graham. «Pero quizá es que acababa de tropezar y estaba tirado en el suelo.»

¿Qué cambios en el juego ha provocado esta avalancha de datos que está experimentando el fútbol moderno? «Diría que la contratación de jugadores es el aspecto donde la inversión trae más cuenta», afirma Ramineni. Aunque otra área importante es el de las jugadas de estrategia a balón parado, cuando un equipo saca una falta después de que el juego se detenga.

Una conclusión clara que se extrae del análisis de datos es que los jugadores no deberían disparar desde lejos del área. «Si miras cualquier liga del mundo, la distancia desde la que tiran a puerta los jugadores era mucho mayor hace diez años», destaca Ramineni. «Eso ha ocurrido porque los analistas de datos empezaron a decir: "¿Por qué chutas desde ahí? ¡Solo hay un 2 por ciento de probabilidades [de marcar]!".» Muchos equipos también piden a sus jugadores que no intenten centros largos al área, añade, después de que las estadísticas mostraran que la mayoría no generaban peligro.

Y a medida que siga creciendo el volumen de datos generados, también lo harán las oportunidades de trabajo, concluye Ramineni. «Creo que los datos ya están dejando su huella en todos los aspectos del deporte, y ya no hay vuelta atrás.»

David Adam/Nature News

Artículo traducido y adaptado por Investigación y Ciencia con permiso de Nature Research Group.

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.

Responsable: Prensa Científica, S.A. Finalidad: enviarle por correo electrónico los boletines que haya solicitado recibir. Derechos: tiene derecho a acceder, rectificar y suprimir sus datos, así como a otros derechos, como se explica en la información adicional y detallada que puede consultar en nuestra Política de Privacidad.