ChatGPT ahora puede generar imágenes también

ChatGPT ahora puede generar imágenes también | OpenAI ha lanzado una nueva versión de su generador de imágenes DALL-E a un pequeño grupo de probadores e incorporó la tecnología en su popular chatbot ChatGPT.
ChatGPT ahora puede generar imágenes, y son sorprendentemente detalladas.
El miércoles, OpenAI, la startup de inteligencia artificial con sede en San Francisco, lanzó una nueva versión de su generador de imágenes DALL-E a un pequeño grupo de probadores e integró la tecnología en ChatGPT, su chatbot en línea.
DALLE-E 3
Llamada DALL-E 3, puede producir imágenes más convincentes que las versiones anteriores de la tecnología, mostrando una habilidad particular para imágenes que contienen letras, números y manos humanas, afirmó la compañía.
"Es mucho mejor entendiendo y representando lo que el usuario está solicitando", dijo Aditya Ramesh, un investigador de OpenAI, añadiendo que la tecnología fue desarrollada para tener una comprensión más precisa del idioma inglés.
Al agregar la última versión de DALL-E a ChatGPT, OpenAI está consolidando su chatbot como un centro para la inteligencia artificial generativa, capaz de producir texto, imágenes, sonidos, software y otros medios digitales por sí mismo. Desde que ChatGPT se volvió viral el año pasado, ha desencadenado una competencia entre los gigantes tecnológicos del Valle del Silicio por estar a la vanguardia de la IA con avances.
El martes, Google lanzó una nueva versión de su chatbot, Bard, que se integra con varios de los servicios más populares de la compañía, incluyendo Gmail, YouTube y Docs. Midjourney y Stable Diffusion, otros dos generadores de imágenes, actualizaron sus modelos este verano.
OpenAI ha ofrecido durante mucho tiempo formas de conectar su chatbot con otros servicios en línea, incluyendo Expedia, OpenTable y Wikipedia. Pero esta es la primera vez que la startup combina un chatbot con un generador de imágenes.
DALL-E y ChatGPT eran aplicaciones separadas anteriormente. Pero con el último lanzamiento, las personas pueden usar el servicio de ChatGPT para producir imágenes digitales simplemente describiendo lo que quieren ver. O pueden crear imágenes usando descripciones generadas por el chatbot, automatizando aún más la generación de gráficos, arte y otros medios.
En una demostración esta semana, Gabriel Goh, un investigador de OpenAI, mostró cómo ChatGPT ahora puede generar descripciones textuales detalladas que luego se utilizan para producir imágenes. Después de crear descripciones de un logotipo para un restaurante llamado Mountain Ramen, por ejemplo, el bot generó varias imágenes a partir de esas descripciones en cuestión de segundos.
La nueva versión de DALL-E
La nueva versión de DALL-E puede producir imágenes a partir de descripciones de varios párrafos y seguir detenidamente las instrucciones detalladas, señaló el Sr. Goh. Sin embargo, como todos los generadores de imágenes y otros sistemas de IA, también es propenso a cometer errores, afirmó.
Mientras trabaja en perfeccionar la tecnología, OpenAI no compartirá DALL-E 3 con el público en general hasta el próximo mes. DALL-E 3 estará disponible a través de ChatGPT Plus, un servicio que cuesta $20 al mes.
Expertos han advertido que la tecnología de generación de imágenes puede ser utilizada para difundir grandes cantidades de desinformación en línea. Para protegerse contra eso con DALL-E 3, OpenAI ha incorporado herramientas diseñadas para prevenir temas problemáticos, como imágenes sexualmente explícitas y representaciones de figuras públicas. La compañía también está tratando de limitar la capacidad de DALL-E para imitar estilos específicos de artistas.
En los últimos meses, la IA ha sido utilizada como fuente de desinformación visual. Una falsificación sintética y no especialmente sofisticada de una aparente explosión en el Pentágono provocó una breve caída en el mercado de valores en mayo, entre otros ejemplos. Los expertos en votación también temen que la tecnología pueda ser utilizada maliciosamente durante elecciones importantes.
Sandhini Agarwal, una investigadora de OpenAI que se centra en seguridad y políticas, dijo que DALL-E 3 tiende a generar imágenes que son más estilizadas que fotorrealistas. Aun así, reconoció que el modelo podría ser estimulado para producir escenas convincentes, como el tipo de imágenes granuladas captadas por cámaras de seguridad.
En su mayor parte, OpenAI no planea bloquear contenido potencialmente problemático proveniente de DALL-E 3. La Sra. Agarwal dijo que tal enfoque era "demasiado amplio" porque las imágenes podrían ser inofensivas o peligrosas dependiendo del contexto en el que aparezcan.
"Realmente depende de dónde se esté utilizando y de cómo la gente esté hablando sobre ello", afirmó.
Deja una respuesta