OpenAI ha integrado en ChatGPT un nuevo generador de imágenes nativo y gratuito, disponible para todos los usuarios, que supera las limitaciones históricas de la IA visual: ahora genera textos legibles, escenas coherentes y objetos detallados, eliminando la dependencia del modelo DALL·E.
GPT-4o, el modelo multimodal de OpenAI, ya no solo procesa texto, imagen, audio y vídeo: ahora también genera imágenes de forma directa desde ChatGPT, sin necesidad de invocar a modelos externos como DALL·E 3. Esta integración se activa para todos los usuarios, incluso los gratuitos, y estará disponible también en Sora y próximamente a través de la API para desarrolladores.
A diferencia de DALL·E, que usaba un sistema de difusión para reconstruir imágenes, GPT-4o adopta un enfoque autorregresivo, generando píxel a píxel y línea por línea. Esto le permite producir imágenes con mayor coherencia, especialmente cuando se integran múltiples elementos o texto legible. De hecho, una de sus mejoras más notables es su capacidad para insertar texto claro y correctamente alineado, resolviendo un gran problema de los modelos anteriores.
Además, GPT-4o destaca por su comprensión del contexto conversacional, lo que permite crear imágenes coherentes a lo largo de múltiples iteraciones (como mantener el mismo personaje con estilo homogéneo) y manejar con precisión hasta 20 objetos distintos con atributos complejos. También ofrece una amplia gama de estilos, desde bocetos hasta hiperrealismo, y puede transformar imágenes ya existentes en nuevas versiones estilizadas.
Entre sus aplicaciones prácticas se destacan: diseño gráfico, creación de logotipos, ilustraciones educativas, desarrollo de videojuegos, marketing digital, y más. Los usuarios pueden incluso personalizar dimensiones, colores, fondos transparentes y elementos visuales con detalle.
Aunque el sistema aún presenta limitaciones, como recortes en imágenes verticales largas o problemas con texto pequeño, OpenAI trabaja en mejoras constantes. Además, se han implementado medidas éticas y de seguridad como la inclusión de metadatos C2PA en todas las imágenes generadas y la moderación automática de contenidos sensibles.
«¿Estamos ante el inicio de una nueva era donde la creatividad visual automatizada redefine el papel del diseñador humano?»
. .
.
Este es un resumen comentado, basado en el artículo: «ChatGPT por fin tiene un generador de imágenes propio y gratis. Resuelve de forma increíble uno de los grandes problemas de la IA» de Marcos Merino publicado en Genbeta el 26 marzo 2025.
. .









