Este año, dos de los anuncios navideños de Coca-Cola causaron revuelo. A pesar de incluir las figuras de siempre (Papá Noel, osos polares, renos y camiones de la marca), algo había cambiado: los vídeos habían sido creados con inteligencia artificial. “Esto es tan reconfortante como un árbol de aluminio” o “cero azúcar, cero alma” son algunos de los comentarios que podemos encontrar en las publicaciones (uno de los vídeos ahora está en oculto en YouTube). Las críticas se centran en la incomodidad que generan las figuras humanas creadas con IA (algo conocido como valle inquietante) y en la decisión de crear todo con IA y prescindir de algunos trabajadores.
Las herramientas de creación de imágenes con IA están constantemente evolucionando y son entrenadas con una gran cantidad de imágenes etiquetadas para aprender a relacionar términos y así representarlos. Esta Navidad, en Maldita.es las ponemos a prueba. Lo que hemos visto es que la mayoría genera imágenes cliché de la típica Navidad estadounidense, con nieve y chimenea. En su representación, se deja fuera otras realidades, como la Navidad en países del hemisferio sur donde es verano. Esto puede deberse a que Estados Unidos es el país que lidera la industria de la IA y los modelos pueden replicar los sesgos de esta cultura.
Grok, la IA de Twitter (ahora X), genera imágenes hiperrealistas de una Navidad solitaria en el salón de una casa
El generador de imágenes de Grok, la IA de Twitter (ahora X), se ha usado para crear todo tipo de contenido controvertido, como imágenes racistas, xenófobas y asociadas al nazismo de deportistas y otras violentas, vejatorias y sexualizadas de políticas y personas famosas. Pero para nuestro experimento, la petición ha sido más inocente: Grok, ¿puedes crear una imagen que represente la Navidad?
La herramienta devolvió cuatro imágenes hiperrealistas y asépticas, y tres de ellas solitarias. La primera muestra un salón sin personas, solo regalos, muebles, velas y un árbol navideño. La segunda, a un niño que abre su regalo en un salón a poca luz, con la chimenea y un árbol de fondo. La tercera, a Papá Noel sentado, rodeado de guirnaldas y contemplando el vacío, también en un salón. La cuarta, a un grupo de personas que parecen intercambiar regalos sin mirarse a los ojos, de nuevo, en un salón.
Si miramos con más atención, notaremos algunos detalles distorsionados en las figuras humanas. Por ejemplo, en la tercera, Papá Noel tiene una cara extraña, parece que le falta un ojo y el otro tiene la mirada perdida. Como explicamos en este artículo, una IA puede tener problemas representando las facciones humanas, lo que puede derivar en este tipo de miradas vacías y ojos con estrabismo, entre otros detalles. Además, la imagen muestra una lámpara que atraviesa un sofá por la mitad y una chimenea en una pared exterior de lo que parece la casa de los vecinos.
Dall-E, integrado en ChatGPT, representa una Navidad luminosa, nevada, figuras humanas distorsionadas y un niño mitad hombre de nieve
Desde septiembre de 2023 podemos usar Dall-E 3, el modelo de creación de imágenes con IA, en ChatGPT. Hemos usado el mismo prompt (instrucción de texto para que la IA de una respuesta) con el chatbot de OpenAI: ¿puedes crear una imagen que represente la Navidad?
De las cuatro imágenes generadas, solo dos incluyen figuras humanas. En todas es de noche, incluyen luces brillantes, nieve y árboles de Navidad y los colores predominantes son el amarillo, azul y rojo. En este caso, el estilo hiperrealista se cambia por uno que recuerda las ilustraciones de un cuento para niños (sin pedirlo expresamente en el prompt).
Dall-E no ha sido mucho mejor representando a los humanos. En la segunda imagen podemos ver algunas figuras con abrigos y gorros navideños, pero todos los rostros están deformados. También hay un niño cuya parte de abajo parece ser de hombre de nieve y algunas figuras del fondo se confunden entre ellas.
Dream Lab de Canva representa un salón, pero con un estilo de ilustración colorida y manos deformes
En octubre de 2024, Canva, la plataforma de diseño, lanzó Dream Lab, su herramienta de generación de imágenes con IA. Le propusimos el mismo desafío que a Grok y a Dall-E, y a partir del prompt generó cuatro imágenes: todas ambientadas en el salón de un hogar con una chimenea, guirnaldas y decenas de regalos. Al igual que las de Dall-E, tienen un estilo que recuerda a una ilustración con colores muy vibrantes, pero sólo una de ellas incluye figuras humanas.
La primera imagen incluye a una familia blanca (aunque no lo hayamos pedido en el prompt) sonriendo entre regalos y un árbol de Navidad. Nuevamente, la herramienta tiene problemas representando los rostros y cuerpos. Por ejemplo, al hombre de jersey rojo parece faltarle un ojo y su mano tiene tres dedos (la IA generativa también suele tener problemas creando manos humanas). El niño pequeño también tiene una mano distorsionada y parece tener una barba blanca.
Otras herramientas como Ideogram, Midjourney y Venice siguen este patrón, con imágenes sin figuras humanas ambientadas en salones
En internet hay muchas herramientas gratuitas que permiten crear imágenes con IA, así que hemos experimentado con el mismo prompt en algunas menos conocidas. Ideogram nos creó ocho imágenes bastante similares con ninguna persona a la vista. Todas incluyen árboles de Navidad y la mayoría están ambientadas en un salón. Hasta aquí lo de siempre. Pero en una de ellas, por primera vez vemos lo que parece ser un belén con rostros deformes, el primer y único símbolo religioso de todo este experimento.
También a través de Easy.peasy.AI pudimos crear una imagen con el modelo de Midjourney: el prompt de siempre arrojó una imagen hiperrealista del salón de un hogar, con un árbol de Navidad, regalos, guirnaldas, una chimenea, un paisaje nevado de fondo y ninguna figura humana. Algo similar representó Venice: un árbol, una chimenea y regalos en un salón. Todo siguiendo el mismo patrón.
En general, la IA representa la típica Navidad estadounidense, el país que lidera la industria de la inteligencia artificial
Como vemos en todos estos modelos, en general la IA representa la típica Navidad de película estadounidense, con escenarios de nieve y chimenea en grandes salones de casas acomodadas. Gran parte no incluye figuras humanas y los símbolos religiosos, como el típico belén, brillan por su ausencia y sólo aparecen una vez en todo el experimento. En su lugar, abundan los paisajes nocturnos nevados con árboles gigantes. Cuando aparecen “personas”, estas tenían el rostro deformado, dedos de más y contornos distorsionados.
Todo esto se acerca más a la realidad navideña del hemisferio norte, donde la Navidad se celebra en invierno (aunque en muchas zonas de España y del sur de Europa tampoco hay nieve para estas fechas). En estas imágenes se ven poco representadas otras realidades, lo que puede deberse a que los estadounidenses lideran la industria de la IA, por lo que los modelos pueden replicar los sesgos propios de esta cultura. Según el informe AI Index 2024, EEUU es el país que más invierte en este sector tecnológico y el que más ha desarrollado nuevos modelos durante el 2023.