Inteligencia Artificial generativa: la evolución de la IA para convertirse en creadora

En los últimos días hemos escuchado la expresión Inteligencia Artificial generativa, o IA generativa, por todas partes. La culpa la tienen, sobre todo, las últimas novedades de OpenAI en su modelo GPT, las mejoras de Microsoft en sus productos o sistemas como Claude. Pero pocos se han parado a explicar con detalle qué es lo que implica la Inteligencia Artificial Generativa. O sus bases. A pesar de ello, cada vez está en más sistemas, desde ChatGPT hasta DALL-E.

Qué es la Inteligencia Artificial Generativa

A este tipo de Inteligencia Artificial se la conoce como generativa, porque es capaz de crear algo que no existe. Es su principal diferencia con respecto a la Inteligencia Artifiical discriminativa, que se dedica a hacer distinciones entre distintos tipos de entradas, e intenta responder preguntas cuya respuesta implique identificar algo a partir de una pregunta que implica una elección.

Por ejemplo, una de estas IAs será capaz de responder a una pregunta sobre una imagen, para responder si se trata de una cosa u otra. Pero no podrá crear una imagen a partir de unas instrucciones sencillas. Algo que sí puede hacer la IA generativa.

A pesar de haber sonado mucho últimamente, la IA generativa apareció ya hace bastante tiempo. Se remonta, de hecho, a la aparición de Eliza, un chatbot que fue bastante popular hace ya años, y que simulaba ser un terapeuta con el que hablar. Lo crearon en el MIT, y se lanzó en 1966. Entonces era una revolución, a pesar de ser bastante rudimentario. Y años de trabajo e investigación han hecho que la IA generativa haya evolucionado tanto que ahora Eliza parece algo desarrollado por principiantes.

La llegada de DALL-E, stable Diffusion, y sobre todo, de Chat GPT, han puesto patas arriba la Inteligencia Artificial, y también la percepción que el público en general tiene de ella. Las dos primeras permiten la generación de imágenes realistas a partir de instrucciones sencillas.

La tercera es capaz incluso de entablar una conversación a través de texto con humanos, y proporcionar determinados tipos de información. Es probable, incluso, que dentro de poco sea multimodal, gracias a la evolución del su modelo, GPT, a su versión 4. Por ahora, solo permite responder con texto, pero en el futuro puede que también pueda trabajar con elementos multimedia.

Habitualmente nos referimos a estos sistemas, y a otros similares, como modelos. Esta denominación no se ha hecho al azar. Se ha dado porque los tres son capaces de representar un intento de simular o modelar algún aspecto del mundo real basándose en un conjunto, a veces muy grande, de información sobre él.

¿Cómo funciona la Inteligencia Artificial generativa?

Este tipo de Inteligencia Artificial utiliza machine learning para procesar una gran cantidad de datos de imágenes o de texto. La mayoría de esta información está extraída de Internet. Tras procesarla, es capaz de determinar qué cosas son las que es más probable que vayan a aparecer junto a otras que ya han aparecido. Es decir, que generan texto prediciendo qué palabra es la más probable que pueda ir después de otras palabras que ya ha creado.

La mayoría del trabajo de programación de la Inteligencia Artificial generativa se dedica a la creación de algoritmos que puedan distinguir las cosas que interesan a los creadores de la Inteligencia Artificial que quieren desarrollar. En el caso de ChatGPT, serán las palabras y las frases. En el caso de DALL-E, gráficos y elementos visuales.

Pero sobre todo, hay que tener en cuenta que este tipo de IA genera respuestas y salidas con base en la valoración de un ingente conjunto de datos, que se han utilizado para entrenarla. Con ellos, responde a peticiones e instrucciones con imágenes o frases que, en función de lo que hay en ese conjunto de datos, la IA generativa apunta que tiene probabilidad de ser adecuado.

El autocompletado que aparece cuando escribes con tu smartphone, o en Gmail, que sugiere palabras o partews de frases, es un sistema de Inteligencia Artificial generativa de bajo nivel. ChatGPT y DALL-E son bastante más avanzadas.

El entrenamiento de modelos de IA generativa

El proceso por el que los modelos se desarrollan para captar y procesar todos los datos que necesitan para funcionar se conoce como entrenamiento. Para ello se suelen utilizar dos técnicas, que serán más o menos adecuadas en función del modelo. Por ejemplo, ChatGPT usa lo que se conoce como Transformador (de ahí la T en su nombre).

Un transformador deriva el significado de grandes trozos de texto. De esta manera, el modelo logra comprender cómo pueden ser los distintos componentes semánticos y palabras, y cómo pueden estar relacionados unos con otros. Además, puede determinar qué probabilidad hay para que aparezcan unos junto a otros. Estos transformadores se ejecutan sin supervisión sobre un amplio conjunto de de texto de lenguaje natural, mediante un proceso llamado entrenamiento previo (la P de ChatGPT). Una vez finalizado el proceso, los humanos encargados de trabajar con el modelo se ocupan de ajustarlo a través de interacciones con él.

Otra de las técnicas que se utilizan para entrenar los modelos de Inteligencia Artificial generativa se denomina Red adversaria generativa (Generative adversarial network, o GAN). Con ella se ponen dos algoritmos a competir entre ellos. Uno genera texto o imágenes con base en probabilidades derivadas de un gran conjunto de datos. El otro es una Inteligencia Artificial discriminativa, que ha sido entrenada por humanos para valorar si la salida es real o generada por Inteligencia Artificial.

La IA generativa intenta repetidamente engañar a la discriminativa, adaptándose automáticamente para producir respuestas que tengan éxito. Una vez que consigue ganar de manera habitual y sólida a la discriminativa, esta es ajustada de nuevo por humanos, y el proceso empieza otra vez….

NOTICIA PUBLICADA ORIGINALMENTE EN : MUYCOMPUTERPRO

BARCELONADOT no se hace responsable de la información
que contiene este mensaje y no asume responsabilidad alguna
frente a terceros sobre su íntegro contenido, quedando igualmente
exonerada de la responsabilidad de la entidad autora del mismo.

Escucha aquí RADIO60 Una experiencia musical y vivencial a través de más un siglo de ritmos, melodías e historias

.

.

Share:

Facebook
Twitter
Pinterest
LinkedIn
Scroll al inicio