MasTecnoCiencia
Curiosidades

¿Cómo sabe Shazam qué canción suena? Esta es la mejor explicación que vas a ver

Seguro que si la tienes te lo has preguntado más de una y mil veces. ¿Cómo puede una ‘app’ como Shazam saber la canción que estás grabando en solo 15 o 20 segundos? Es una de esas cosas ‘mágicas’ de la tecnología que aún nos cuesta entender, pero por suerte tenemos expertos y divulgadores a los que les da por explicárnoslo de forma muy sencilla.

Ese es el caso de Jaime Altozano, un ‘youtuber’ español experto en música que es conocido en internet (tiene más de un millón de seguidores) por explicar todo tipo de conocimientos sobre este arte a través de contenidos sencillos y didacticos. Su último vídeo lo ha dedicado a desentrañar los secretos de Shazam y explicar para todos los públicos el algoritmo que creó uno de los fundadores de Shazam, Avery Wang, y que explicó en este ‘paper’.

En el vídeo que te dejamos bajo este párrafo, Altozano explica cómo para conseguir que que el sistema encontrase la canción correcta en un tiempo récord Wang decidió apostar por desmembrar las canciones y convertir las melodías en imágenes, tirando de sus frecuencias. Una vez hecho eso, el sistema convierte las canciones en datos cogiendo pequeñas huellas digitales sacadas de los picos que muestra cada sintonía y los guarda así en una base de datos. Pero el algoritmo no guarda los picos de cualquier forma sino que los registra apuntando su frecuencia, la frecuencia del siguiente pico más cercano y el tiempo que pasa entre ambos puntos. Así, consigue construir huellas casi únicas (como las de nuestros dedos) que le ayudan a encontrar coincidencias comparando lo que grabas con su base de datos.

Tal es el éxito del trabajo de Wang que, para bien o para mal, cómo explica el youtuber, este algoritmo ya no solo lo usa Shazam sino que se ha generalizado y lo utilizan sitios como YouTube para cazar a todos los creadores de contenido que se saltan sus leyes de ‘copyright’ metiendo alguna canción con derechos en sus vídeos. La razón de su popularización es tan simple como que para conseguir un controlador eficaz solo tienes que invertir en una gran base de datos. El resto lo puede hacer un algoritmo de forma automática. Por cierto, no solo funciona con música sino que en contenidos visuales también se podría utilizar convirtiendo los clips en datos y cogiendo puntos únicos de estos vídeos.

«Decidí hacer el vídeo porque quería entender cómo funcionaban los filtros de contenido. Ahora cada vez más redes los van a tener que implantar, especialmente con la salida del Artículo 17 (antiguo Artículo 13) de la Directiva de la Unión Europea», explica Altozano en conversación con Teknautas. «Al final ese artículo es un lío. Y es un lío que nos va a afectar a todos. Y como por la vía legal no me quedaba muy claro qué nos deparaba el futuro me fui por la vía técnica. A entender cómo puede una máquina reconocer pequeños fragmentos de una obra. Y ni Youtube, ni Facebook, ni ninguna otra te dicen cómo programan ellos sus detectores de contenido. Pero resulta que Shazam… sí. Te lo explica detalle por detalle. Está libre para quien quiera leerlo en internet. Así que se lo agradecí mucho (me parece increíble que compartan el conocimiento de esa manera y no hayan querido guardarlo bajo llave para ellos) y decidí dedicarles el vídeo», apunta.

¿Lo sabías?  Truco: cómo congelar el agua al instante como si fuera “magia”

Para terminar, Altozano deja un pequeño truco que te podría llegar a interesar si quieres burlar el control de estas plataformas o al menos intentar hacerlo. Este sistema necesita de la variable tiempo para dar con las coincidencias exactas por lo que si aceleras la canción o la ralentizas es posible que el algoritmo no consiga dar con el ‘match’. Eso sí, como comenta el experto, hay miles de ingenieros en estas compañías centrados en que esto no ocurra, tú sabrás si quieres probar.

«Lo más sorprendente de que Shazam funcione así, para mí, es que es un algoritmo bastante entendible por un humano. Cada vez estamos más acostumbrados a sistemas montados con redes neuronales en las que nadie puede ya saber qué hace cada capa de la red. Como la red neuronal que te recomienda vídeos en Youtube. O la que detecta tu cara cuando subes una foto a Facebook. Y sin embargo Shazam (también por ser tan antiguo) funciona de una manera mucho más… artesanal. Y eso es muy divertido de entender», termina el youtuber.



Source : elconfidencial

Related posts

Nuestros vuelos serán más cortos y baratos gracias a una app de la NASA

Rocambol

Felicitaciones y mensajes de Navidad originales y graciosas

Rocambol

Comprueba el operador y el histórico de portabilidad de un número fijo o móvil

Rocambol

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

A %d blogueros les gusta esto: