El pasado 6 de julio se celebró la final de la tercera edición del concurso AI Song Contest, es decir, el conocido como el Eurovisión de la inteligencia artificial. La propuesta de España, la canción gallega ‘AI-lalelo’, quedó segunda y fue favorita del público. ¿Puede realmente un programa basado en inteligencia artificial (IA) componer una canción o sería más bien una herramienta de trabajo colaborativa con un equipo humano? Hemos hablado con compositores y expertos en inteligencia artificial para entenderlo. ¡Pon el oído!
Sonidos gallegos: GPT-3, Google Magenta y revisión humana
En ‘AI-lalelo’, se ha usado inteligencia artificial para la composición de las letras y la melodía, y parte de los ritmos y de los instrumentos. La armonía, estructura, voces y el resto de ritmos e instrumentos corre a cargo del equipo humano. Es decir, es una canción hecha con la ayuda de la inteligencia artificial, no lo ha conseguido un programa por sí mismo.
Como en cualquier modelo de inteligencia artificial, ha habido que nutrir a la máquina. Para la letra, se enseñó al sistema de generación de texto de OpenAI, GPT-3, a escribir en gallego y componer copla con cantigas populares de Galicia. Después, se le pidió que conformara una letra sobre una costurera. “Nosotros hemos intervenido para elegir la letra que más nos convencía y corregir alguna falta de ortografía”, explica Juan Alonso, tecnólogo en aprendizaje automático y redes neuronales y miembro del equipo que ha compuesto la canción que ha representado a España.
Para la música, primero hicieron una selección de melodías para que se adaptaran al estilo que buscaban. “Cuando la IA generaba una que nos gustaba, volvíamos a meterla en Google Magenta [herramienta de Google para usar el aprendizaje automático como herramienta creativa] e iterábamos el proceso estrofa a estrofa”, detalla. Es decir, siempre ha habido un juez humano supervisando y tomando la última palabra. “Sin un humano que filtre, los resultados son dignos pero no se puede hacer un ajuste fino y concreto”, apostilla Alonso.
Inspiración artificial para generar nuevas ideas, pero después de recibir datos de una persona
Pero entonces, ¿esto es realmente inteligencia artificial? “Hoy en día, se considera inteligencia artificial todo lo que lleve aprendizaje automático: modelos que observan grandes cantidades de datos, infieren patrones y aprenden cómo están construidos para imitarlos. Por eso, sí, esta canción del Eurovisión de la IA se ha compuesto utilizando IA”, afirma Carmen Torrijos, lingüista computacional y responsable de Inteligencia Artificial y Datos en Prodigioso Volcán.
¿Y sería posible hacerlo sin un humano? Aunque los modelos de aprendizaje automático son mucho más autónomos que antes, no componen por sí solos, explica Torrijos: “El trabajo de recopilar las cantigas, convertirlas a texto plano, organizarlas e introducirlas en el modelo es humano. La máquina recibe instrucciones. Lo único que es artificial y autónomo es el centrifugado. Además, el resultado está cocinado, porque no se ha seleccionado lo primero que ha salido”.
Aunque la inteligencia artificial no pueda componer una canción tal y como la entendemos por sí misma, sí es una herramienta de la que pueden servirse artistas y compositores. “En procesos creativos es muy útil porque, al centrifugar la información de manera más ágil, puede generar ideas nuevas. Es como una inspiración artificial”, sugiere la experta de Prodigioso Volcán.
Herramienta creativa: de reproducir una zanfoña a imitar el sonido de un koala
Veamos un par de ejemplos prácticos. ¿Podría la IA replicar cómo suena cualquier instrumento? “Pedimos a un miembro del equipo que tocara durante 15 minutos la zanfoña. Con esa información, entrenamos a una red neuronal que no solo aprendió a imitar el sonido de cada nota, también a hacerlo más suave o más fuerte o a pasar de una nota a otra deslizándose (como en un violín), algo que no se puede hacer con una zanfoña real”, explica Alonso del equipo de ‘AI-lalelo’.
¿Y para qué quieres tú una zanfoña reconstruida por IA pudiendo tener una real? Alonso responde: “Puede que no tengas acceso a alguien que la sepa tocar o que quieras agregarle esos matices. Con esto se crea un instrumento que suena como una zanfoña pero tiene mayores posibilidades expresivas”.
Aún más allá: ¿se puede hacer lo mismo con el sonido de los animales? Sí. Es lo que llevó al equipo de Australia a ganar el primer AI Song Contest en 2020. Entrenaron redes neuronales con los sonidos del koala y la cucaburra para darle ‘sabor australiano’ a la canción.
“Era un enfoque muy, muy colaborativo con la IA. Cuando te presentas al concurso, tienes que escribir un documento del proceso técnico completo; en esa fase te das cuenta de que se trata de una colaboración entre humanos y máquinas”, explica a Maldita.es Caroline Pegram, directora de Estrategia de Innovación de Uncanny Valley, el estudio australiano que creó la canción ganadora, y jueza del Eurovisión de la IA los dos últimos años.
Pegram agrupa todo lo analizado en una clarificadora conclusión: “Pulsar un botón y producir una canción pop completa con inteligencia artificial no es una realidad... todavía. ¿Lo será algún día? Soy escéptica sobre que un ordenador pueda inyectar la emoción que los humanos pueden aportar a la composición de una canción. Sin embargo, hay muchas posibilidades para utilizar el aprendizaje automático y la IA como herramienta en las industrias creativas. Es fundamental que no provoquemos innecesariamente el miedo y la ansiedad de los artistas por pensar que serán sustituidos por una máquina. Tenemos que buscar diseñar soluciones teniendo en cuenta todo el sistema: las personas, la tecnología y el entorno”.
Por cierto, el ganador de este año ha sido Tailandia, porque, según una miembro del jurado, “el uso de la IA para crear la melodía, entonación y efectos de esa línea de oboe eléctrico es una combinación que no había visto antes”. Veremos si la IA es capaz de sorprender (junto a su equipo humano) el año que viene.
Primera fecha de publicación de este artículo: 18/07/2022