ChatGPT Da el Siguiente Gran Salto: Imágenes Generadas por IA Como Nunca Antes

Sam Altman, CEO de OpenAI, anunció durante una transmisión en vivo un cambio importante en las capacidades de generación de imágenes de ChatGPT. Tras más de un año de espera, la esperada mejora finalmente llegó.
Ahora, ChatGPT puede aprovechar el modelo GPT-4o para crear y modificar imágenes y fotografías de forma nativa. Hasta ahora, GPT-4o, la base del popular chatbot, solo generaba y editaba texto. Esta nueva funcionalidad está disponible para suscriptores del plan Pro de $200 dólares mensuales, tanto en ChatGPT como en Sora, el producto de generación de video de OpenAI.
Se espera que la función se implemente pronto para usuarios con planes Plus y gratuitos, así como para desarrolladores que utilizan el servicio API de la compañía. OpenAI indica que GPT-4o, con su salida de imagen, "piensa" un poco más que su predecesor, DALL-E 3, para generar imágenes más precisas y detalladas. Incluso puede editar imágenes existentes, incluyendo aquellas con personas, transformándolas o "rellenando" detalles de primer plano y fondo.
Para alimentar esta nueva función, OpenAI confirmó al Wall Street Journal que entrenó a GPT-4o con "datos públicamente disponibles", así como datos propietarios de sus colaboraciones con empresas como Shutterstock. La compañía enfatizó su compromiso con los derechos de autor:
"Respetamos los derechos de los artistas en cuanto a cómo hacemos la salida, y tenemos políticas implementadas que nos impiden generar imágenes que imiten directamente el trabajo de cualquier artista vivo,"declaró Brad Lightcap, director de operaciones de OpenAI. OpenAI ofrece un formulario de exclusión voluntaria para que los creadores soliciten la eliminación de sus obras de los conjuntos de datos de entrenamiento. También asegura respetar las solicitudes para evitar que sus robots de extracción web recopilen datos de entrenamiento, incluidas imágenes, de sitios web.
Este avance de ChatGPT llega poco después del lanzamiento de la función experimental de salida de imágenes nativa de Gemini 2.0 Flash de Google, un evento que, aunque generó gran expectación en redes sociales, también evidenció la necesidad de mayores protecciones contra la eliminación de marcas de agua y la creación de imágenes con personajes protegidos por derechos de autor.