Apple revela herramienta de inteligencia artificial que puede convertir imágenes estáticas en animaciones: la investigación Keyframer muestra la animación LLM impulsada por GPT-4.

Acaba de publicarse un informe de investigación de 31 páginas, que muestra una nueva herramienta de animación que podría representar un gran avance en la implementación de IA para Apple.

VentureBeat fue el primero en detectar el informe titulado “Keyframer: Empowering Animation Design using Large Language Models”. En el informe, Keyframer se describe como una herramienta alimentada por Large Language Models como el ChatGPT-4 de Open AI que puede convertir imágenes simples en animaciones.

El informe de investigación de Keyframer dice: “Keyframer aprovecha las capacidades de generación de código de LLM y las posibilidades de entrada de lenguaje natural para permitir a los usuarios generar animaciones utilizando indicaciones altamente semánticas”. Esto significa que los usuarios no tienen que dar indicaciones específicas sobre dimensiones, tamaños y objetos, simplemente pueden solicitar cambios informalmente como “hacer que se vea genial” para obtener una respuesta.

El 84,4% de los usuarios que probaron esta tecnología utilizaron indicaciones ‘semánticas’ para obtener el resultado deseado.

¿Cómo funciona todo?

El informe habla extensamente sobre las herramientas AI generativas y cómo se ve obstaculizado “debido a la naturaleza serendípica e incierta del espacio de diseño”. Aunque muchas otras herramientas de IA han trabajado en la generación de imágenes y animaciones, Keyframer intenta destacarse explorando imágenes existentes sin generar nuevo contenido.

Si la investigación resulta fructífera y Keyframer se convierte en una aplicación oficial, probablemente formaría parte de la suite de aplicaciones disponibles en iPhone, donde puedes agregar tu imagen y seleccionar indicaciones para hacerla mover. Esto podría ser una gran herramienta para presentaciones o formas breves de mostrar información rápidamente. Un usuario lo activaría con comandos como ‘mover X hacia arriba’ o ‘hacer que se vea más bonito’, y utilizaría ChatGPT-4 para adivinar lo que pretendía con esa frase y crear una animación. Luego, podrías ajustar la animación con indicaciones y cambios adicionales, al igual que lo harías al hablar con otro ser humano.

LEAR  Google Messages está planeando otro pequeño cambio de imagen. Aquí están los cambios que están en proceso.

Está diseñado como una herramienta aditiva para la creatividad y no como un reemplazo de esta. La conclusión del informe dice “esperamos inspirar futuras herramientas de diseño de animación que combinen las poderosas capacidades generativas de LLM para acelerar la prototipación de diseño con editores dinámicos”. Se informa que Apple está trabajando en una importante actualización de IA este año, y este informe es probablemente uno de los muchos pasos en el proceso de investigación.

More from iMore