Primero, existían asistentes digitales parlantes como Siri, Alexa y Google Assistant. Luego aparecieron chatbots en línea como ChatGPT y Google Bard. Ahora, los dos se están fusionando.
El jueves, Google presentó Gemini, una aplicación para teléfonos inteligentes que se comporta como un asistente digital parlante y chatbot conversacional. Al responder a solicitudes de voz y texto, puede responder preguntas, escribir poesía, generar imágenes, redactar correos electrónicos, analizar fotos personales y realizar otras acciones, como configurar un temporizador o hacer una llamada telefónica.
Disponible de inmediato para hablantes de inglés en más de 150 países y territorios, incluyendo los Estados Unidos, Gemini reemplaza a Bard y Google Assistant. Está respaldado por la tecnología de inteligencia artificial que la empresa ha estado desarrollando desde principios del año pasado.
La nueva aplicación está diseñada para realizar una variedad de tareas, incluyendo servir como tutor personal, ayudar a los programadores informáticos con tareas de codificación e incluso preparar a los buscadores de empleo para entrevistas, dijo Google.
“Puede ayudarte a interpretar diferentes escenarios”, dijo Sissie Hsiao, vicepresidenta de Google a cargo de la unidad Google Assistant, durante una reunión informativa con periodistas.
Cuando ChatGPT llegó de OpenAI a finales de 2022, impresionando al público con la forma en que respondió preguntas, redactó trabajos y generó código informático, Google se vio en apuros. Al igual que otros gigantes tecnológicos, la empresa había pasado años desarrollando una tecnología similar pero no había lanzado un producto tan avanzado como ChatGPT.
(The New York Times demandó a OpenAI y a su socio, Microsoft, en diciembre, alegando infracción de derechos de autor de contenido periodístico relacionado con sistemas de inteligencia artificial.)
Google lanzó su propio chatbot, Bard, en marzo con críticas regulares. En las semanas siguientes, la compañía fusionó sus dos principales laboratorios de inteligencia artificial: Google Brain y DeepMind, y anunció que el laboratorio combinado estaba desarrollando una nueva tecnología de inteligencia artificial llamada Gemini.
Gemini es lo que los investigadores llaman un gran modelo de lenguaje, o MJL, un sistema matemático que puede aprender habilidades analizando grandes cantidades de datos, incluyendo libros, programas informáticos y conversaciones en línea. Al identificar patrones en todo ese texto, un MJL puede aprender a generar texto por sí mismo. Eso significa que puede redactar poesía, generar código informático e incluso mantener una conversación.
También tiende a cometer errores. Puede equivocarse en datos o “alucinar”, inventar cosas.
Gemini es un sistema “multimodal”, lo que significa que puede responder tanto a imágenes como a sonidos. Después de analizar un problema matemático que incluía gráficos, formas y otras imágenes, podía responder a la pregunta de manera similar a como lo haría un estudiante de secundaria.
En diciembre, Google utilizó una versión limitada de esta tecnología para actualizar Bard. Ahora, la empresa ha retirado el nombre de Bard y está lanzando una versión más poderosa de la tecnología a través de la aplicación Gemini, disponible en teléfonos Android y en la web. Una versión para iPhones llegará “en las próximas semanas”, dijo Google.
Google creó una versión gratuita pero limitada de la aplicación Gemini. Una versión más poderosa, llamada Gemini Advanced y respaldada por una versión del modelo de lenguaje Ultra de Google, está disponible por una suscripción mensual de $19.99. Google ofrece un período de prueba gratuito de dos meses.
Google ha publicado resultados de pruebas comparativas afirmando que Ultra superó a la última tecnología de OpenAI, GPT-4, en varias áreas clave, incluida la generación de código informático y la síntesis de artículos de noticias.
La aplicación Gemini también puede generar, analizar y responder a imágenes. Los usuarios pueden cargar una foto de su fiesta del Super Bowl, por ejemplo, y pedir a la aplicación que genere un título.
Google también dijo que ofrecerá una tecnología similar a través de los servicios empresariales Google Workspace y Google Cloud. Esto permitirá a los clientes usar la tecnología junto con aplicaciones como Gmail y Google Docs.
En los teléfonos Android, la nueva aplicación reemplazará a Google Assistant si los usuarios descargan Gemini. Al igual que Google Assistant, puede responder a comandos de voz, aunque también responde a comandos de texto.
Google dijo que también seguirá ofreciendo y mejorando Google Assistant.
El año pasado, OpenAI lanzó una versión similar de su chatbot ChatGPT que puede responder a comandos de voz. La mayoría de los expertos de la industria creen que la tecnología de inteligencia artificial que impulsa los chatbots como ChatGPT se fusionará y reemplazará a los asistentes digitales como Siri de Apple y Alexa de Amazon.