Synthesia lanzó una opción para crear avatares generados por inteligencia artificial grabando imágenes de ti mismo con una cámara web o tu teléfono.
Synthesia, una startup británica de inteligencia artificial, mostró el lunes una serie de nuevas actualizaciones de productos que incluyen la capacidad de crear tus propias presentaciones al estilo de Apple con avatares de IA utilizando solo una cámara web de laptop o tu teléfono.
La empresa de siete años, respaldada por Nvidia, dijo que las nuevas actualizaciones del producto la convertirán más en una suite de producción de video integral para grandes empresas, en lugar de ser solo una plataforma que ofrece a los usuarios la capacidad de crear avatares generados por IA.
Entre las nuevas actualizaciones que Synthesia está lanzando se encuentra la capacidad de producir avatares de IA utilizando cámaras web o un teléfono, avatares de “cuerpo completo” con manos y brazos, y una herramienta de grabación de pantalla que muestra un avatar de IA guiándote a través de lo que estás viendo.
¿Qué es Synthesia?
Synthesia, que afirma ser utilizada por casi la mitad de las empresas de Fortune 500, utiliza avatares de IA para todo tipo de propósitos.
Estos pueden variar desde la creación de videos de capacitación personalizados para guiar a los empleados en ciertos procesos, hasta la generación de material promocional que puede mostrarse en forma de video en lugar de un correo electrónico u otras comunicaciones textuales.
Pero eso no siempre fue así. Según el cofundador y CEO Victor Riparbelli, en los primeros tres años de la historia de la empresa, Synthesia en realidad comenzó intentando vender su tecnología a agencias de Hollywood y compañías de producción de video de gran presupuesto. La firma utilizó visión por computadora para una herramienta de doblaje de IA que hacía que los movimientos de la boca fueran más realistas para diferentes idiomas.
“Lo que descubrimos fue que el umbral de calidad para hacer algo con estos chicos era tan grande que, no importa lo que hiciéramos, seríamos una parte muy pequeña de un proceso mucho más grande”, dijo Riparbelli a CNBC en una entrevista en la oficina de la empresa en Londres.
“Lo más interesante era el aspecto de democratización: Hay millones de personas en el mundo que quieren hacer video, pero no lo están haciendo hoy porque no tienen presupuesto.”
En un evento al estilo de Apple, el CEO de Synthesia presentó los nuevos productos de la empresa, destacándolos como una suite de herramientas más enfocadas en la productividad para ser utilizadas por empresas, en lugar de ser solo una plataforma que ofrece avatares de IA.
Presentaciones al estilo de Apple con una cámara web
Una de las mayores características nuevas que la empresa mostró fue la opción de crear avatares generados por IA grabando menos de cinco minutos de imágenes utilizando una cámara web o tu teléfono. También puedes clonar tu voz para que los avatares hablen en varios idiomas diferentes.
Típicamente, para hacer un avatar de IA utilizando la plataforma de Synthesia, debes ir a un estudio en persona. Los actores humanos entran en una cabina de grabación, graban su voz y realizan líneas frente a un fondo verde en un set de filmación real.
Todo esto es información de entrenamiento para proporcionar al algoritmo de IA de Synthesia los matices faciales y vocales que necesita para crear avatares humanos que hablen de manera expresiva. A principios de este año, Synthesia presentó nuevos avatares expresivos que pueden transmitir emociones humanas, como felicidad, tristeza y frustración.
Pero ahora, Synthesia está introduciendo un nuevo software que facilitará a los usuarios producir una versión digital de ellos mismos desde cualquier lugar, utilizando solo una cámara web y el software de Synthesia.
La empresa también está lanzando la capacidad de crear avatares de cuerpo completo. Esto es diferente a los avatares actuales de Synthesia, que se limitan solo a la vista de retrato. Ahora, puedes ir a un estudio con docenas de cámaras, sensores y luces a tu alrededor para hacer avatares que puedan mover sus manos.
Generar manos es algo que tradicionalmente es difícil para la IA hacer, a menudo porque las manos son solo una parte pequeña del cuerpo humano y no suelen ser el enfoque en el contenido visual.
Synthesia también presentó la opción de reproducir videos de avatares de IA hablando en cualquier idioma que deseen, ya sea inglés, francés, alemán o chino.
En el futuro, Synthesia dice que podrá adaptar los avatares de IA para diferentes países: Por ejemplo, un avatar nigeriano guiando a un usuario a través de un tutorial en lugar de uno estadounidense.
El asistente de video de IA de Synthesia puede producir resúmenes de artículos y documentos enteros.
Synthesia también lanzó un nuevo asistente de video de IA que puede producir resúmenes de artículos y documentos enteros. Esto podría ser un especialista en recursos humanos haciendo un video rápido explicando los paquetes de beneficios de la empresa, por ejemplo.
La herramienta de grabación de pantalla de Synthesia muestra un avatar de IA guiándote a través de lo que estás viendo.
Otra gran característica que la empresa está implementando es una nueva herramienta de grabación de pantalla, que muestra un avatar de IA guiándote a través de lo que estás viendo.
No persiguiendo un ‘momento de PR’
En la entrevista de CNBC con él, Riparbelli caracterizó lo que Synthesia está tratando de hacer como una revisión del producto enfocada en la empresa, que la haría más similar a gigantes como Microsoft, Salesforce y Zoom en la categoría empresarial.
“El mundo ha quedado impresionado por estas cosas durante los últimos 12 a 18 a 24 meses, lo cual es increíble”, dijo Riparbelli a CNBC.
“Pero ahora hemos experimentado mucho y hemos descubierto los casos de uso adecuados para estas tecnologías que tienen un valor de negocio duradero. No son solo un momento de PR a corto plazo.”
“Necesitas tener ese objetivo comercial de reducir los tickets de soporte al cliente mostrando videos en lugar de texto; o vender haciendo videos en lugar de simplemente enviar correos electrónicos”, agregó.
“Ahora las personas están creando flujos de trabajo en torno a eso. Necesitan mejores formas de lograr sus objetivos comerciales, no solo una interfaz con modelos de IA. Eso es hacia donde vamos como empresa.”
El año pasado, Synthesia recaudó $90 millones de inversores que incluyen al fabricante de chips estadounidense Nvidia y la firma de capital de riesgo Accel, en una ronda de financiamiento que la valoró en $1 mil millones, otorgándole el estatus de “unicornio”.
Los competidores de la empresa incluyen herramientas de video de IA como Veed, Colossyan, Elai y HeyGen. Y la aplicación de redes sociales de propiedad china TikTok también presentó recientemente Symphony Assistant, un producto que permite a los creadores hacer sus propios avatares de IA.
La empresa gana dinero a través de varios planes de precios de suscripción que van desde $22 para un plan “starter” hasta $67 para un plan “creator”, y planes “enterprise” personalizados donde los precios se basan en negociaciones con el equipo de ventas de Synthesia.