En mayo, Google reveló la tercera generación de su modelo de generación de imágenes, Imagen 3. Avanzando rápidamente hasta agosto, el gigante tecnológico anunció planes para hacerlo disponible para usuarios de todo el mundo, y ahora esa promesa se ha cumplido.
No importa dónde estés, ahora puedes acceder a Imagen 3
Google ha implementado oficialmente la generación de imágenes con Imagen 3 para todos los usuarios de Gemini a nivel mundial. Este modelo actualizado cuenta con detalles más nítidos, colores más vibrantes y menos defectos que las versiones anteriores.
La generación de imágenes con Imagen 3 ahora está disponible para todos los usuarios de Gemini en todo el mundo.
Imagen 3 es nuestro modelo de generación de imágenes de mayor calidad hasta ahora y ofrece un grado aún mayor de fotorrealismo, una mejor interpretación de instrucciones y menos artefactos distractivos que nunca. pic.twitter.com/E8CrcyFcz5
— Google Gemini App (@GeminiApp) 9 de octubre de 2024Probablemente, una de las mejoras más destacadas en Imagen 3 es su habilidad para renderear texto, algo que ha sido objeto de bromas para otros modelos de texto a imagen como DALL-E y Adobe Firefly. Google está promocionando esta capacidad como una forma de crear imágenes personalizadas con texto, perfectas para todo, desde tarjetas de felicitación hasta fotos con mensajes especiales.Para probar las características de Imagen 3, simplemente abre Gemini en tu dispositivo móvil o de escritorio, según prefieras. Luego, inicia tus indicaciones con palabras como “dibujar”, “generar” o “crear”, junto con el estilo que estás buscando. Recuerda, cuantos más detalles incluyas, mejor podrá captar el modelo tu visión. Gemini te informará que está “Creando tu imagen con Imagen 3.”
Solo un aviso: actualmente, los usuarios gratuitos no tienen la opción de generar imágenes con personas. Si deseas crear ese tipo de imágenes, tendrás que suscribirte a Gemini Advanced. El nivel de pago te ofrece:
Acceso al modelo de próxima generación de Google, 1.5 Pro Ventana de contexto de 1 millón de tokens, capaz de manejar cargas de hasta 1,500 páginas Acceso prioritario a las últimas funciones La capacidad de ejecutar y editar código Python directamente en Gemini Advanced Un generoso almacenamiento de 2 TB a través de Google One Integración de Gemini en Gmail, Docs y más (disponible en ciertos idiomas)
Debo decir que las capacidades de Imagen 3 son bastante notables. Es por eso que realmente creo que necesitamos una etiquetación más clara para el contenido generado por IA, y creo que los reguladores de todo el mundo deben intervenir y abordar este problema para evitar la propagación de desinformación. Por ejemplo, no hace mucho, la Unión Europea creó el Pacto de IA de la UE, un acuerdo voluntario entre empresas tecnológicas y la UE centrado en fomentar un desarrollo de IA responsable y ético. Ahora, si será efectivo o no aún está en el aire.