Eurovisión 2018. Una Excusa más para Demostrar el Valor de los Datos

Jairo Mejía, Iskra Velitchkova y Beatriz Alonso

d&a blog, dataviz

Los datos son cada vez más específicos, con una dimensión más profunda y mayores niveles de riqueza para que individuos u organizaciones puedan sacar conclusiones. Los datos son especialmente granulares y estructurados cuando afectan a las operaciones básicas de empresas, gobiernos u otras organizaciones. Sorprendentemente, esto también aplica a eventos que aglutinan las pasiones de aficionados de todo el mundo: el fútbol, el béisbol o el concurso musical europeo más importante de todos: Eurovisión.

El Festival de la Canción de Eurovisión comenzó hace más de 60 años, reuniendo a audiencias de la Unión Europea y más allá de sus fronteras para un maratón internacional de música televisada. Mucho se ha escrito sobre la política del voto, la influencia positiva de la vecindad, los cambios en la preferencia de género, o el bombo mediático. En BBVA Data & Analytics nos encantan los datos y (algunos de nosotros) somos expertos en Eurovisión. Así que con un poco de ayuda de Spotify, una de las compañías que mejor aplica la analítica avanzada y el aprendizaje automático a la música, y algunos modelos estadísticos básicos, hemos analizado la historia de los ganadores de Eurovisión y cómo esto podría ayudarnos a establecer alguna medida de propensión sobre quién podría estar en la cima del concurso de este año en Lisboa, que se espera atraiga a más de 180 millones de espectadores, mucho más que la Superbowl.

Los datos son la clave

Del mismo modo que BBVA trata de ampliar la sensorización de datos de sus operaciones y de las experiencias de sus clientes para mejorar el desarrollo de productos y servicios, Spotify ha desplegado un amplio sistema de aprendizaje automático para extraer un gran número de características de canciones, artistas, álbumes o listas de reproducción, que soportan un excelente sistema de recomendación.

Hemos decidido confiar en estos datos para desarrollar un ejemplo de cómo los mismos pueden ayudarnos a entender eventos, tendencias, preferencias, etc. Hemos extraído con fines puramente de investigación nueve rasgos genéricos que describen el género de una canción (sonoridad, bailabilidad, valencia, tempo, energía, en vivo, tono, acústica y ratio de letras) de todas las canciones disponibles que han participado en Eurovisión desde el año 2000. No utilizamos el conjunto completo de datos disponible desde 1956 para evitar distorsiones debidas a los cambios en las preferencias de género en décadas anteriores (parece razonable asumir que el estilo y las preferencias en música pop han cambiado significativamente en el tiempo y hay investigaciones  que lo confirman empíricamente: como se muestra en este trabajo). Luego etiquetamos esas canciones para mostrar si estaban en el top 5 de los participantes o no.

La visualización es el prisma

Al visualizar los datos obtenidos, pudimos identificar tendencias, valores atípicos y determinar la importancia de algunas características sobre otras. Valence, que describe lo positiva o triste que es una canción, ha estado inclinándose hacia el lado pesimista desde el año 2000, con canciones más tristes siendo premiadas desde 2008. Este punto coincide con el comienzo de la crisis económica, por lo que sería interesante investigar más sobre si existe una verdadera relación causa-efecto.

La canción típica de Eurovisión es básicamente suave, relativamente acústica y cada vez menos positiva que el promedio de éxitos de canciones del verano en países como España. Los ganadores tienden a tener una sonoridad más alta que el promedio (con la notable excepción de Portugal -Salvador Sobral- el año pasado, que fue especialmente suave, lenta y triste), pero no necesariamente una canción para tocar en la pista de baile.

También hemos extraído y analizado lo que hace que una canción sea un éxito de verano en España, y hemos determinado que la receta que crea un gran éxito musical en verano no funciona muy bien con el público de Eurovisión. Esto podría significar que los espectadores leales de Eurovisión, y los que votan y participan, no se ven tan afectados por consideraciones de bailabilidad o de positividad de la canción, sino por otras variables: por ejemplo, el grado de romanticismo de la canción, si entienden el mensaje de la letra (el inglés se ha convertido en un idioma común en el concurso) o si la nacionalidad o la excentricidad del cantante influye en el resultado final.

Encontrar los “tapados” de Eurovisión de este año

Los favoritos de este año, “Toy” (Israel) y “Fuego” (Chipre), no parecen seguir la receta de una canción típica de Eurovisión, mientras que “That’s How You Write a Song” (Noruega) parece ser el gran “tapado” por la que el público tradicional de Eurovisión votaría. Hungría, Irlanda, España, Austria o Estonia son, según nuestro análisis, los concursantes que podrían sorprender a los espectadores cuando se emitan los votos finales. No obstante, si de hecho existe una causalidad entre el crecimiento económico y el gusto por las canciones más alegres y si analizamos la propensión de las canciones de Eurovisión a convertirse en éxitos de verano este año, Israel, Alemania o Chipre estarían a la cabeza de la lista.

A pesar de sus limitaciones, hemos utilizado un clasificador de Random Forest, para entender qué características de audio hacen de una canción un potencial ganador de Eurovisión. Esta solución de algoritmo clasificador aplica una combinación de varios Árboles de Decisión, un método que criba y finalmente clasifica una muestra como un ganador potencial o no. El clasificador sopesa si una canción puede seguir hacia el nivel inferior del árbol si tiene un cierto valor de un conjunto de características (por ejemplo, tempo o bailabilidad). Eventualmente aquellos que pasan las suficientes pruebas binarias del clasificador serán los más similares a los ganadores anteriores y por lo tanto tienen propensión a ganar con la “fórmula de Eurovisión”.

Los dos modelos de propensión con las canciones de este año (Éxito de Eurovisión y Canción del Verano)

Destacamos el término “propensión” , ya que hay factores para ganar Eurovisión que obviamente no están representados en nuevo variables descriptivas del sonido, pero nos interesa conocer algo más sobre la propensión que tienen ciertos tipos de canciones sobre otras para hacerse con el certamen.

Este sábado sabremos con seguridad si lo que se ajusta al gusto de la mayoría para bailar en verano está alineado con lo que puede gustar a la audiencia, muy especial, de Eurovisión.

Echa un vistazo a nuestra historia de datos