Una nueva entrevista con el director detrás del viral Sora clip Air Head ha revelado que la inteligencia artificial jugó un papel menor en su producción de lo que se afirmaba originalmente.
Revelado por Patrick Cederberg (quien hizo la postproducción del video viral) en una entrevista con Fxguide, se ha confirmado que el programa de texto a video de OpenAI estuvo lejos de ser la única fuerza involucrada en su producción. El clip de 1 minuto y 21 segundos se realizó con una combinación de técnicas tradicionales de filmación y edición de postproducción para lograr el aspecto de la imagen final.
Air Head fue hecho por ShyKids y cuenta la breve historia de un hombre con un globo literal por cabeza. Si bien se utilizó voz humana en off, por la forma en que OpenAI estaba promocionando el clip en canales sociales como YouTube, ciertamente dejó la impresión de que los visuales estaban puramente impulsados por la inteligencia artificial, pero eso no es del todo cierto.
Como se revela en el clip detrás de escena, se realizó una gran cantidad de trabajo por parte de ShyKids, quienes tomaron la salida cruda de Sora y ayudaron a limpiarla para convertirla en el producto final. Esto incluyó el roto de los fondos manualmente, eliminando las caras que ocasionalmente aparecían en los globos y corrigiendo el color.
Luego está el hecho de que Sora lleva mucho tiempo para lograr las cosas correctamente. Cederberg explica que hubo “cientos de generaciones de 10 a 20 segundos cada una” que luego se editaron cuidadosamente en lo que el equipo describió como una relación de “300:1” entre lo que se generó y lo que se preparó para futuros retoques.
Tal trabajo manual también incluyó editar la cabeza que aparecería y desaparecería, e incluso cambiar el color del globo en sí que aparecería rojo en lugar de amarillo. Si bien Sora se utilizó para generar las imágenes iniciales con buenos resultados, claramente había mucho más sucediendo detrás de escena para que el producto final se viera tan bien como lo hace, por lo que aún estamos lejos de producciones de calidad cinematográfica instantánea.
Sora sigue siendo un secreto muy bien guardado, salvo por un puñado de proyectos cuidadosamente seleccionados que se han permitido salir a la superficie, con Air Head entre los más populares. El clip tiene más de 120,000 visitas en el momento de la escritura, con OpenAI alabándolo como “experimentación” con el programa, minimizando el evidente trabajo que se hizo en el producto final.
Sora es impresionante pero no estamos convencidos
Aunque OpenAI ha hecho un buen trabajo mostrando lo que su servicio de texto a video puede hacer a través del gran modelo de lenguaje, la falta de transparencia es preocupante.
Air Head es un clip impresionante de un talentoso equipo, pero fue sometido a una gran cantidad de edición para llevar el producto final a donde está en el corto.
No es exactamente el enfoque de un clic y listo que muchos de los defensores de la tecnología han representado. Resulta ser simplemente una herramienta que podría usarse para mejorar las imágenes en lugar de crearlas desde cero, algo que ya es lo suficientemente común en la producción de video, lo que hace que Sora parezca menos revolucionario de lo que parecía al principio.