¿Miente el big data?

0
232
Todos los pronósticos previos y durante los partidos basados en big data e inteligencia artificial auguraban el peor desenlace para el Real Madrid.

Sin embargo, los jugadores no sólo fueron capaces de doblegar a sus rivales para ir pasando las diferentes rondas, sino que también batieron a las predicciones. Entonces, ¿miente el big data?.
Pese a errar en octavos contra el PSG y en cuartos contra el Chelsea, el big data tenía muy claro que el Real Madrid no ganaría al City en su estadio. La tecnología, que se usa en diferentes competiciones, solo le daba una posibilidad de victoria del 15% a la entidad madridista para el partido de ida disputado en el Etihad Stadium. El 4-3 a favor del equipo de Guardiola dio la razón a la inteligencia artificial de Google que para el partido de vuelta en el Bernabéu sólo daba un 29% de opciones a la remontada blanca y señalaba que el City era el favorito para salir con la victoria con un 46%.
Es más, las probabilidades de remontada del Real Madrid bajaron hasta el 1% a falta de un par de minutos, según se pudo ver sobreimpresionado en la retransmisión. Y hubiera acertado de no haber sido porque un Rodrygo, en estado de trance, marcó dos goles para mandar el partido a la prórroga. El resto es épica, magia o lo que cada uno quiera creer o llamar. ¿Se volvió a equivocar el big data en la Champions League? ¿Miente el big data?
¿DÓNDE ESTÁ EL ERROR?
Los pronósticos se basan en modelos matemáticos que calculan probabilidades de que un evento ocurra, por lo que aquellas situaciones que son poco comunes, que no han ocurrido aún y son poco probables son muy difíciles de predecir. “El big data no miente, solo es capaz de ofrecer respuestas sobre aquellas situaciones que se han producido previamente de manera más común. Para predecir un resultado necesitamos construir un modelo matemático, normalmente mediante aprendizaje automático, que extrae patrones o situaciones que aparecen de manera común en los datos, si un patrón no aparece en muchas ocasiones se considerará que es poco probable.
Es lo que ocurrió el pasado Open de Australia en el que, con dos sets en contra, Rafa Nadal fue capaz de remontar el partido a Medvedev para convertirse en el único tenista masculino con 21 Grand Slam. El big data solo daba al balear un 4% de opciones de llevarse el trofeo.
La fiabilidad de los pronósticos está íntimamente ligada a la materia prima con la que se trabaja y a la matemática que se les aplica. En este caso, la materia prima son los datos y es fundamental que sean de calidad y permitan describir correctamente el problema que se esté estudiando. Cuantas más fuentes de datos relevantes se tengan para trabajar y mayor sea el historial disponible, mejor se podrá describir el contexto en el que se desarrolla el problema que se quiere resolver y, por tanto, más fácil será para el sistema de IA conocer y aprender.
Sin embargo, los exoertos  advierten de que toda esa materia prima por sí sola no es suficiente y que es fundamental elegir bien los tipos de algoritmos matemáticos que se van a encargar de responder a las preguntas que se hagan al sistema y entrenar correctamente los modelos de inteligencia artificial que las integran. En consecuencia, es necesario tener una buena materia prima y una matemática adecuada para que el sistema inteligente ofrezca pronósticos fidedignos y cercanos a la realidad.
Ante situaciones excepcionales, el reto pasa por entrenar a la inteligencia artificial para que aprenda a usar los datos asociados a esas casuísticas improbables para poder predecirlas en el futuro.La imprevisibilidad depende de la cantidad de información que tengamos para predecir el resultado, no podemos predecir si va a haber alguien en una habitación si solo miramos a través del agujero de la cerradura, y sí si miramos a través de un conjunto de cámaras que nos permiten observar la habitación de manera completa.
Pero no nos olvidemos que al final los datos, también hay que entenderlos y comprender la idea que está detrás de la probabilidad, ya que lo que puede parecernos una mentira, en realidad refleja una verdad. Cuando se indica que un determinado equipo tiene un 1% de probabilidad de ganar la contienda significa que, en esa situación, si se jugaran 100 partidos, en uno de esos cien ganaría.

 

Deja un comentario