Maldita Tecnología

Qué son y cómo funcionan los ‘prompts’, las instrucciones que damos a programas de inteligencia artificial como ChatGPT o DALL-E

Publicado el Sep 11, 2023, 8:13:00 AM Actualizado el Oct 30, 2023, 2:55:00 PM

Tiempo de lectura: 12 minutos

Claves:

Los ‘prompts’ son las instrucciones que se dan a modelos de inteligencia artificial como ChatGPT o DALL-E a partir de las que elaboran sus respuestas
Una IA no es capaz de interpretar el significado de estas instrucciones, lo que hace es bucear en los datos con los que se le ha entrenado y hacer asociaciones para crear un resultado
Existen oficios especializados en diseñar estos ‘prompts’, porque cuanto mejor sea la petición, mejor será el resultado, pero esto también se está usando de forma fraudulenta para saltarse las restricciones de estos modelos

Si has usado algún chatbot impulsado por inteligencia artificial (IA) como ChatGPT o un programa de generación de imágenes con IA como DALL-E, sabes que para que funcione tenemos que pedirle cosas, hacerle preguntas o darle instrucciones. Estas instrucciones se llaman prompts y sirven como base para la respuesta que nos va a devolver.

Para ello el modelo tiene que rebuscar entre todos los datos con los que ha sido entrenado y dar con lo que más se acerque a lo que hemos pedido, ya sea un resumen de una novela o una imagen en un estilo concreto. Cuanto más específicas sean nuestras instrucciones más se parecerá el resultado a lo que hemos pedido. Saber cómo afinar esos prompts ya es una profesión, prompt engineer, aunque hay riesgos porque también se puede hacer un uso fraudulento de los chatbots si sabes “engañarle” y saltarle sus limitaciones.

¿Quieres recibir la actualidad tecnológica directamente en tu email?

Suscríbete aquí a la newsletter de Maldita Tecnología 'Tech en un clic'

¿Qué es un ‘prompt’ en inteligencia artificial? ¿Cómo se usa?

Para usar herramientas como chatbots conversacionales (como ChatGPT o Bard) o un programa de generación de imágenes con IA (como DALL-E o Midjourney) hay que pedirle cosas en una barra de diálogo, una cajita donde escribir y “dirigirnos” al modelo de IA. Por ejemplo, le podemos preguntar a un chatbot “¿Cómo de grande es la Tierra?” o le podemos pedir a un programa de imágenes “Crea una imagen del atardecer”. Esto son los prompts: indicaciones que introducimos en la máquina y que sirven como base para que una inteligencia artificial elabore una respuesta a raíz de lo que le pedimos.

La palabra prompt se ha popularizado con la democratización de la inteligencia artificial, pero también tiene otros significados en informática: es un sistema es lo que se usa para representar que el sistema está preparado para ejecutar el siguiente comando o puede ser una ventana que aparece pidiendo una confirmación al usuario. En el contexto de la IA significa como hemos dicho la petición que le hacemos al modelo.

Vamos con un ejemplo casi recursivo: escribir en un prompt a ChatGPT que nos explique qué es un prompt. El chatbot nos devuelve una descripción de este término.

Dependiendo de la información que le demos a la máquina obtendremos mejores respuestas. Por ejemplo, si en lugar de pedirle a ChatGPT “explícame que es un prompt” le pedimos “explica a los lectores de Maldita.es qué es un prompt en inteligencia artificial de manera clara y sencilla en menos de 300 caracteres”, tendremos una respuesta que cumpla con estas características. Por este motivo es importante extendernos todo lo que podamos y ser lo más concretos posible.

La clave está en la cantidad de información que le damos a la máquina sobre lo que queremos, y que sirve como base para que esta elabore una respuesta. Usando bien los prompts se pueden conseguir resultados muy afinados. Por ejemplo, para la creación de la portada de la revista Cosmopolitan de julio de 2022, la artista Karen X. Cheng le dio la siguiente instrucción a DALL-E 2 (cuando aún se encontraba en fase beta): “Plano gran angular desde abajo de una astronauta con un cuerpo atlético femenino contoneándose hacia la cámara en Marte en un universo infinito synthwave arte digital”. ¿El resultado? Una imagen que cumplía con las características que había pedido la artista.

Portada de Cosmopolitan hecha con IA por la artista digital Karen X. Cheng a través de DALL-E 2.

¿Cómo procesan los modelos de inteligencia artificial las instrucciones que les damos?

Nos puede dar la sensación de que aplicaciones como ChatGPT o DALL-E son capaces de entender lo que queremos decir, pero en realidad no comprenden el sentido de una frase o el significado de una palabra (y mucho menos tienen “conciencia”). Lo que permite la inteligencia artificial es enseñar a la máquina a transformar grandes cantidades de texto (libros, páginas de internet, publicaciones) en información que pueda procesar y así aprender a unir diferentes palabras como lo haría un humano.

Es lo que se conoce como Procesamiento de Lenguaje Natural (NLP, por sus siglas en inglés) y permite a la máquina pasar las palabras a números, entrenarse con grandes cantidades de datos y ser capaz de predecir qué palabra antecede a la siguiente (lo que les ayuda también a “mantener” una conversación y a hilar las respuestas que nos dan). En resumen, aprende cómo se relacionan unas palabras con otras, pero no sabe a qué se corresponden en el mundo real.

Lo que hace el modelo de IA es recibir el texto que le hemos escrito y lo disecciona en tokens. No estamos hablando de criptomonedas ni de NFT, sino que en este caso se trata de una representación numérica de una palabra o parte de ella. Por ejemplo, cuando a ChatGPT le hacemos la solicitud “Explícame qué es un prompt”, la máquina disecciona esta frase en 9 tokens diferentes, como se puede observar a través de la herramienta Tokenizer de OpenAI.

Cada uno de esos tokens tiene asociado un número, que es el que la máquina es capaz de interpretar y que se otorga según diferentes factores, como el orden de los caracteres o lo común que sea una palabra en un idioma determinado. Aquí puedes encontrar más información sobre este proceso.

A partir de esta información lo que hacen chatbots como ChatGPT es predecir cuál es la siguiente palabra que es más probable que siga las palabras que hemos escrito, partiendo de toda la cantidad de datos con los que ha sido entrenada. Esto es lo que hace que la respuesta parezca humana (al fin y al cabo, se ha entrenado con textos escritos por personas), pero también hace que cometa errores o tenga alucinaciones, ya que no comprende la información que nos está proporcionando.

En el caso de programas de generación de imágenes, con ese input o entrada de datos que le damos crea una imagen a partir del banco de imágenes con el que ha sido entrenada. Es “una generación espontánea de todos los conceptos al mismo tiempo", explicó a Maldita.es el divulgador de IA Carlos Santana.

Ya existen puestos de trabajo destinados a escribir mejores ‘prompts’ y sacar mayor partido a la IA

Cuanto más específicos seamos con nuestras peticiones, mejores serán las respuestas que obtendremos, por lo que es importante saber qué es exactamente lo que queremos pedirle a la máquina. Pero a veces esta tarea no es sencilla: ¿qué pasa si hago preguntas sobre materias muy específicas? ¿Y si busco una respuesta en concreto? ¿Qué hay de las peticiones en otros idiomas?

Frente a estos problemas existe la figura del prompt engineer (que se podría traducir como ingeniero de instrucciones). Una persona experta en el uso de modelos de lenguaje que entiende su funcionamiento y que estudia cómo la máquina interacciona con nuestras peticiones. Es una de las nuevas profesiones digitales que han surgido con el auge de la inteligencia artificial.

Un prompt engineer (o una persona experta en el tema que haya pasado horas y horas probando estas aplicaciones) conoce el comportamiento de la IA y sabe cómo obtener lo que busca a través de instrucciones específicas. Entre sus tareas se encuentra realizar pruebas de interacción para ver cómo responde un chatbot a diferentes prompts, entrenar al modelo para afinar sus respuestas o saber cuáles son los límites de lo que nos puede responder.

Algunas investigaciones muestran que se pueden usar ‘prompts’ para hacer un uso fraudulento de los chatbots si nos saltamos sus limitaciones

Los chatbots de inteligencia artificial o los programas de generación de imágenes con IA vienen con algunas limitaciones para que no podamos pedirles “cualquier cosa”. Se trata de medidas de seguridad para evitar su uso fraudulento: por ejemplo, si le pedimos a alguna de estas inteligencias artificiales que nos ayude a cometer un delito, como puede ser robar datos bancarios, se negará a cumplir con nuestra petición.

Según una investigación de la Universidad Carnegie Mellon, en Estados Unidos, estos sistemas de seguridad también se pueden burlar a través de determinados prompts. Si añadimos comandos específicos a nuestras instrucciones es posible emplear un chatbot para usos fraudulentos, según asegura el estudio. En redes sociales muchos usuarios han compartido cómo desde que se lanzó ChatGPT han conseguido evitar algunas de estas medidas.

También los cibercriminales han encontrado formas de usar ChatGPT como una herramienta más en su arsenal para cometer estafas y además están buscando la manera de saltarse estas limitaciones creando sus propios chatbots, libres de medidas de seguridad.

En el caso de DALL-E, OpenAI lo configuró para que no acepte peticiones para generar imágenes violentas, pero estas se pueden llegar a obtener confundiendo a la máquina (que no comprende del todo el contexto). Una descripción como "un caballo durmiendo en un charco de agua roja" parecerá inofensivo para el sistema, pero para nosotros significará al ver la imagen que el caballo yace muerto en el agua, que estaría roja por su sangre.

Etiquetas:

#informática #aplicaciones #chatbot #inteligencia artificial #ChatGPT #dalle