Maldita Tecnología
16/10/2020

Cómo sabe YouTube qué vídeos estamos buscando aunque nos inventemos palabras y descripciones

Que levante la mano quien alguna vez no ha intentado buscar una canción de la que no se acordaba escribiendo en Google o YouTube algo parecido a un tarareo o palabras inventadas del inglés. Lo increíble de esos casos seguramente sea el hecho de que el buscador acierte aunque busquemos algo como “mamaaaa” para encontrar “Bohemian Rhapsody”, de Queen, o “rili rili wan” para el famoso “Wannabe” de las Spice Girls.

¿Cómo consigue el buscador de YouTube (o sea, el de Google), enseñarnos los resultados correctos aunque nos inventemos palabras o incluso usemos frases absurdas para encontrar canciones o vídeos? Principalmente, a través de las millones y millones de búsquedas que hacemos los usuarios a lo largo del día. Con ellas se van formando patrones que luego se analizan para ver donde coinciden.

Pongamos el ejemplo de Queen: si muchas personas están buscando a la vez esa canción pero no recuerdan la letra o el nombre, pueden buscar algo significativo de la canción, como puede ser “mamaaaa” por el fragmento en el que Freddie Mercury dice “Mamma, I just killed a man”. Si entre las opciones que ofrece el buscador está la canción del grupo, habrá un gran porcentaje de gente que haga clic.

Fuente: GIPHY.

Los algoritmos aprenden de la reacción de la gente a los resultados de búsqueda

Esa reacción en masa hace que los algoritmos del buscador aprendan que esa es la respuesta que estaba buscando la gente, de modo que esa acción queda grabada para que la próxima búsqueda que se haga con esos términos también de como resultado la canción.

¿Cómo se genera esa reacción en cadena? Es decir, ¿qué pasa la primera vez que el algoritmo del buscador se topa con un query que no se ha hecho antes? Desde Google explican que registran miles de millones de búsquedas al día y que un 15% de todas ellas “no se han visto antes”. Por ello, los algoritmos tienen que anticiparse a lo que se busca.

Esto significa que los algoritmos tienen que aprender a interpretar lo que una persona puede estar buscando. Por ello, usan un modelo de machine learning que se encarga de analizar las palabras que forman el query en su conjunto para sacar contexto de la búsqueda, en vez de interpretar las palabras de una en una y por separado.

También salvan otros obstáculos como las faltas de ortografía, y las búsquedas cada vez están menos limitadas al uso de palabras clave, aunque los resultados siguen siendo más precisos si las usamos: si se plantea una pregunta demasiado larga o con un formato de conversación, será más difícil que el buscador nos ofrezca información útil.

Usan datos sobre nuestra navegación, como el idioma o la ubicación

Además tienen en cuenta otros datos sobre nuestra navegación, por ejemplo desde qué parte del planeta estamos conectados o qué búsquedas hemos hecho anteriormente. Si te fijas, cuando vas a hacer una búsqueda en Google sobre algo que ya has buscado antes, el propio buscador te ofrecerá sugerencias que pueden coincidir con cosas que ya has mirado.

Otra cosa que ocurre es que muchas veces son los propios usuarios los que identifican que hay un patrón en lo que la gente recuerda o interpreta de una canción, de modo que se le termina asociando una frase concreta aunque no tenga nada que ver. Pasa con “Billy Jean”, de Michael Jackson, que aparece si buscas “tú quieres una manzana”. O cuando al buscar la frase “agua en el hoyo” el buscador nos pone “Is this love?” de Bob Marley.

Los propios usuarios terminan subiendo un vídeo con la frase en cuestión como nombre porque saben que hay gente que la encontrará así.

Búsqueda de la frase "tú quieres una manzana".
Búsqueda de la frase "agua en el hoyo".

Con el paso del tiempo, las búsquedas de una de esas “interpretaciones” son tan masivas que al final es el propio YouTube quien te sugiere escribir “ebribodi dens nau” si empiezas a escribir esas palabras sin sentido. El resultado es el “Gonna make you sweat (Everybody dance now)” de principios de los 90 de C+C Music Factory.

Búsqueda hecha en YouTube.

En definitiva, los buscadores actúan como gran parte de los algoritmos que hacen funcionar a las redes sociales: analizan nuestra navegación, nuestra reacción a las cosas que nos muestran y en qué pinchamos y con qué interactuamos más. Del análisis sacan más cosas que recomendarnos y nos fichan un poco más como usuarios.

Google ahora permite buscar una canción tarareándola *

Con la última actualización de la aplicación de Google o del cuadro de búsqueda disponible para móviles, Google también va a permitir que se hagan búsquedas de este tipo por audio. Ese deseo que todos hemos tenido en algún momento de tararear una canción y que nos dijeran qué canción es la que nos rondaba por la cabeza es el que quieren cumplir (aunque habrá que ver cómo de bien funciona).

La idea sigue basada en algoritmos de aprendizaje automático que puedan relacionar el tono de un silbido o un tarareo con una melodía ya existente. Hay aplicaciones muy populares como Shazam, que nos revela el título y el cantante de una canción si la reproducimos con la aplicación activa. Para ello necesita un registro tremendo de canciones. Esta nueva función de Google trabaja con un registro igual de grande, pero utilizando sistemas de inteligencia artificial para relacionar con ellas nuestros taraeos.

Eso sí, no contará con la exactitud de la canción original sino con sonidos abstractos que emitamos nosotros, por lo que supone una dificultad mucho más grande y por ello habrá que esperar a determinar cómo funciona la herramienta.

Primera fecha de publicación de este artículo: 16/10/2020.

* Hemos actualizado este artículo a 16 de octubre para incluir la última incorporación de Google a las búsquedas.

Otros artículos de Maldita.es