Maldita Tecnología

Pros y contras de las máquinas que "leen" y "escriben": el caso de GPT-3

Publicado el May 27, 2022, 10:43:35 AM

Tiempo de lectura: 5 minutos

¿Has leído alguna vez un texto creado por un programa de inteligencia artificial? Los hay, los hay... Imitando columnas de opinión, crónicas deportivas, cuentos y mucho más. Ahora bien, no podemos decir que sean muy precisos o que no tengan incluso un punto de absurdidad. En Maldita.es os hemos hablado antes de hasta qué punto se pueden redactar noticias usando estos programas informáticos o en qué punto están a la hora de detectar y desmentir desinformación (muy lejos).

En esta Maldita Twitchería entrevistamos a Carmen Torrijos, lingüista computacional y responsable de Inteligencia Artificial y Datos en Prodigioso Volcán. Con ella aprendemos cómo se crean y se entrenan los programas basados en inteligencia artificial que tratan de generar textos: cuentos, relatos, poemas, recetas, noticias, lista de ideas... Cualquier cosa que se nos ocurra. En este programa repasamos la teoría, pero también la práctica; vemos para qué sirven y dónde y por qué se equivocan estos sistemas usando el ejemplo de GPT-3, uno de los modelos de lenguaje más avanzados que existen en este campo.

Un recorrido por la evolución de la generación de lenguaje por parte de máquinas

Programar una máquina para que sea capaz de procesar textos y generar los suyos propios con cierta cohesión y coherencia no es nada fácil. Torrijos nos explica que hace aproximadamente una década, se usaban "sistemas de reglas", que se basaban en que las personas tenían que especificar todos y cada uno de los pasos que tenía que seguir un programa informático para generar los textos: señalar la puntuación, las reglas gramaticales, etc. Sin embargo, eso cambia cuando se avanza en el campo de la inteligencia artificial y se desarrolla el machine learning: "Ya no necesitas darle todas las reglas de cómo funciona el lenguaje, sino que observando el lenguaje [el programa] son capaces de inferir esas reglas ellos solos", explica Torrijos.

"Ha habido una evolución enorme estos años", recuerda la investigadora. "De hecho, es una velocidad tan rápida que el mundo de la empresa y la inteligencia artificial aplicada no llega, la gente no está aplicando las mejoras que hay porque no nos da tiempo a trasladar todo lo que se hace en tecnología a la realidad".

Veámoslo con un ejemplo: ¿cómo se crea y se entrena un programa de generación de textos?

Torrijos nos explicó el funcionamiento de una familia de modelos de lenguaje llamado MarIA, creada a partir de textos de la Biblioteca Nacional, y que usamos como ejemplo en este programa para explicar cómo aprende una máquina a "leer" y "escribir" en español. Siempre recordamos que estas no son acciones que puedan llegar a hacer estos programas: "Son metáforas", explica la especialista. "En realidad son cálculos numéricos y cálculos matemáticos, no leen como lee un humano, no escriben como escribe un humano y el proceso cognitivo no es el mismo", señala. Para crearlo se necesitaron, según los datos que nos mostró la investigadora, en torno a 59.000 GB (equivalente al 40% de todo Spotify) y mucho, mucho tiempo. El análisis de los textos no lo hicieron tampoco humanos, sino un supercomputador del Centro Nacional de Supercomputación (BSC), situado en Barcelona. "MarIA permite clasificar texto, resumirlo, simplicarlo y generar texto, claro", explica.

Erase una vez... Inserte texto generado por GPT-3

GPT-3 es un modelo de generación de lenguaje basado en inteligencia artificial y creado por la empresa OpenAI. Esta compañía es también la creadora de DALL-E y de DALL-E 2, un programa que es capaz de crear imágenes ficticias a partir de una descripción que podamos inventarnos. Te hablamos de esta tecnología específica en otro de nuestros programas con la ayuda del divulgador Carlos Santana, más conocido como DotCSV. En esta ocasión, ponemos a prueba en directo las capacidades de GPT-3. ¿El resultado? Pruebas sorprendentes que en ocasiones tienen sentido y otras un tanto desastrosas que no nos hacen más que reír (porque el programa no es tan inteligente como parece).

Al final, nos planteamos la gran pregunta: ¿para qué podemos usar realmente un programa como este a día de hoy y que resulte útil y eficiente? "Puedes usarlo para hacer una creación automática de contenidos, por ejemplo, pero la vas a tener que revisar mucho. Es verdad que quita algo de trabajo porque no está hecha desde cero, pero la vas a tener que revisar como lo harías con una traducción automática, con el mismo ojo", señala Torrijos. "Tiene muchísimos fallos de semántica, por lo que hay que revisar con mucha atención", concluye. Personalmente, la investigadora expone que lo usa para procesos creativos.

Pros y contras de las máquinas que "leen" y "escriben": el caso de GPT-3

Un recorrido por la evolución de la generación de lenguaje por parte de máquinas

Veámoslo con un ejemplo: ¿cómo se crea y se entrena un programa de generación de textos?

Erase una vez... *Inserte texto generado por GPT-3*

Erase una vez... Inserte texto generado por GPT-3