Cómo predicen Spotify y Shazam quién será el próximo Justin Bieber

Los algoritmos permiten a los ingenieros de Spotify y Shazam escudriñar su big data como si fuera una bola de cristal: además de predecir qué artistas se llevarán un galardón en los premios Grammy, la actividad de sus usuarios sirve para encontrar el próximo éxito de la lista Billboard o la canción del verano. Pero ¿hasta qué punto se puede confiar en sus vaticinios y recomendaciones?

En 2008, las principales discográficas accedieron a participar en un experimento: primero EMI y Sony, seguidas por Warner Music y Universal, acordaron ceder su enorme catálogo sonoro a una pequeña startup sueca recién salida del parvulario.

A sus 25 años, el cofundador y actual CEO de la empresa escandinava, Daniel Ek, planeaba revolucionar la industria musical y borrar la sombra de la piratería con un servicio de música digital sin precedentes. Su nombre es una combinación de las palabras inglesas ‘spot‘ e ‘identify’ porque «Spotify te ayuda a encontrar e identificar tus canciones favoritas, tanto las que has olvidado como las que todavía no conoces», anunció la compañía durante su lanzamiento.

Hace una década que Ek y su colega Martin Lorentzon fundaron la empresa Spotify AB en Estocolmo. El servicio de música en streaming ha saludado en este tiempo a 75 millones de usuarios y ha conseguido atraer a 20 millones de suscriptores.

La herramienta ha madurado desde la primeriza versión beta, lanzada en 2007. A finales de aquel año, la novedad era compartir listas de canciones. Hoy, gracias a una maraña de algoritmos cada vez más complejos, no solo ofrece recomendaciones personalizadas, sino que es capaz de descubrir artistas emergentes y predecir los hits que encabezarán las listas de éxitos.

«La base de usuarios de Spotify solo constituye una pequeña parte de todas las personas que escuchan música globalmente, pero es suficientemente grande para que sus recomendaciones tengan un efecto medible», sostiene Sander Dieleman, un ingeniero que ha desarrollado modelos de recomendación musical basados en deep learning para la empresa sueca.

Enhorabuena a los futuros premiados

Los investigadores de Spotify consiguen prever los ganadores de los premios Grammy basándose en el big data proporcionado por sus usuarios (aproximadamente 1,5 terabytes diarios de información): hábitos, suscripciones a listas o a un artista, popularidad de los grupos, canciones y álbumes. Su objetivo es comprobar si los galardonados reflejan las rutinas y gustos musicales exhibidos en la plataforma.

El pasado año, sus herramientas de análisis pronosticaron los ganadores de las cuatro categorías más importantes. No atinaron del todo, pero se quedaron muy cerca. Sam Smith, vencedor en las secciones de mejores canción y álbum del año, aparecía en segundo lugar en los rankings de Spotify, aunque lo señalaron acertadamente como mejor artista revelación.

La firma sueca no está sola en su ambición para liderar la clarividencia musical: compiten con la aplicación de reconocimiento de canciones Shazam. Como el servicio que ofrecen es distinto, también lo es la estrategia que siguen en sus predicciones, aunque no tanto los resultados. Al igual que Spotify, solo dieron en el clavo en la categoría de mejor artista revelación de los Grammy.

«Cuando un usuario de Shazam saca el móvil del bolsillo para consultar una canción, no solo quiere saber el título, sino que está diciendo que le gusta lo suficiente para desbloquearlo y apretar el botón azul [que arranca la búsqueda]», explicaba Cait O’Riordan, responsable de producto de la plataforma, durante la conferencia Strata Hadoop World, en Londres. Por eso, para hacer sus estimaciones, los algoritmos de Shazam tienen en cuenta el número de veces que los temas son consultados en la herramienta.  

spotify

Así, encontrar al mejor entre los mejores puede parecer una labor relativamente sencilla para un algoritmo, pero no hay que subestimar el poder del big data y las herramientas matemáticas: también sirven para hallar diamantes en bruto.

Las pesquisas de los 100 millones de usuarios mensuales de Shazam proporcionan datos suficientes para que los investigadores de la plataforma puedan encontrar patrones como quien resuelve pasatiempos. «Empleamos mucho tiempo analizándolos y averiguando qué significan nuestros hallazgos», aseguraba O’Riordan en Londres.

Entre otras cosas, los utilizan para predecir cuál será el próximo número uno de Billboard, la lista de éxitos estadounidense, hasta 33 días antes de que salga a la luz. El secreto está en observar cómo se comporta un hit en sus primeras etapas y buscar tendencias similares.

Ningún cantante ha comenzado su carrera desde el estrellato, ni tampoco una letra o melodía es popular desde el principio, así que los picos en las búsquedas en Shazam después de que un tema se haga público son un indicativo de su acogida entre los oyentes.

Por ejemplo, la evolución en la app de los temas Roar de Katy Perry y Applause, de Lady Gaga, durante las primeras 48 horas tras su lanzamiento en 2013, reflejaba la supremacía del primero. Ambos singles habían estado precedidos por intensas campañas de marketing, pero los datos mostraban que los aplausos conseguidos por Gaga estaban condenados a extinguirse.

A partir de las búsquedas es posible incluso conocer la parte más pegadiza de una canción: la gente suele fijarse en el principio y en el estribillo.

Otra de las tendencias que han observado en Shazam es el interés que despiertan las bandas sonoras de películas, como el tema See you again, de Wiz Khalifa, que suena en la séptima entrega de Fast and Furious. A partir del estreno del film, las búsquedas de la canción se dispararon: durante su primera semana en los cines ya obtuvo un millón de shazams. Aunque los datos también permiten visualizar cuándo un tema se va a pique, como le pasó a Rihanna con ‘Towards the Sun’ después del estreno de Home.

El verano y su canción

En Spotify demuestran sus dotes predictivas no solo con los premios, sino también con la canción del verano. Poco antes de la llegada de la época estival, elaboran una lista de posibles éxitos basándose en la evolución de artistas y canciones en la plataforma, y las posibles tendencias futuras.

Además, algoritmos y expertos tienen en cuenta algo así como el ‘buen rollo’ que desprenden los temas, necesario para cuajar en las fiestas veraniegas. En la plataforma sueca han comenzado a ahondar en las melodías, algo que hacen para crear listas de nuevos descubrimientos semanales personalizadas, en las que también se incluyen artistas que no suenan en la radio y que solo unos pocos conocen.

En la preparación de estos muestrarios musicales, se fijan en las listas creadas por los usuarios y en sus gustos —crean una especie de perfil individual—, para luego ofrecer a quienes tienen preferencias en común productos similares. En Spotify, los consejeros (sin saberlo) son los otros o, en términos más técnicos, aplican lo que se conoce como filtrado colaborativo: un «si te gusta esto, puede que también te guste esto otro».

Ahora, además, tienen en cuenta la melodía de las canciones gracias al deep learning y, en parte, al trabajo de Dieleman, basado en el uso de redes neuronales. En sus investigaciones, utilizaba el filtrado colaborativo para obtener una especie de representación espacial de cada canción, en la que se muestran algunas de sus características.

Las redes neuronales «aprenden la relación que existe entre la señal de audio y esos otros datos derivados de las preferencias de los usuarios», explica Dieleman. Una vez construido este modelo, es posible analizar únicamente las ondas sonoras de una canción para vincularla a diferentes gustos musicales y mostrársela a la persona adecuada. «Esto beneficia sobre todo a los temas y artistas menos conocidos», indica.

[pullquote]Por mucho que Ek y sus colegas se empeñen, por ahora, los algoritmos no entienden de música[/pullquote]

Como conocen el valor de esta información, Spotify ha anunciado recientemente que la pondrá a disposición de artistas, discográficas y otros profesionales de la industria musical, para que puedan conocer en detalle a su audiencia. La oferta es jugosa, pero ¿hasta qué punto deben confiar en los datos para juzgar el éxito presente o futuro de una banda?

En opinión de Francisco Martínez (más conocido como Paco Loco), uno de los productores musicales españoles de más largo recorrido, «los grandes sacan más provecho a estas plataformas» porque los nuevos grupos «necesitan medios para publicitarse y hay mucha oferta». Reconoce su importancia para la difusión, pero cree que hay cosas más importantes que estar en Spotify.

Dieleman admite que hay muchos factores que se escapan incluso a los modelos predictivos basados en deep learning: «la variabilidad geográfica, las campañas de marketing o, simplemente, la imagen del artista», dice.

Muchos de los mejores grupos han despegado impulsados por visionarios sin miedo a los malos pronósticos. Es el caso de Tom Zutaut, el descubridor de talentos de Geffen Records que no dudó en apostar por Guns N’Roses cuando nadie más lo hacía. Zutaut  arriesgó su carrera para salvar su primer disco, Appetite For Destruction: pese a que radios y cadenas de televisión tenían miedo de emitir cualquier tema de la banda, consiguió que la MTV mostrase un videoclip de Welcome to the Jungle, cambiando el futuro del grupo.

Si las discográficas solo se fiaran del big data, ¿despreciarían el buen ojo de los cazatalentos musicales como Zutaut? ¿Estarían los grupos más transgresores destinados al ostracismo? Por mucho que Ek y sus colegas se empeñen, por ahora, los algoritmos no entienden de música.

2 Comments ¿Qué opinas?

  1. Me encanta el artículo, acabas de describir por qué se está desarrollando un nuevo perfil profesional que entienda de negocio y de la parte más analítica y técnica del Big Data. Considero que es necesario no sólo interpretar datos sino transformarlos en conocimiento a través de, por ejemplo, análisis anteriores de campañas de Marketing. Un saludo 🙂

Comments are closed.

No te pierdas...