Hace una semana, estaba en un viaje por carretera de tres días cuando todo el audio de mi coche se cortó. Desde los podcasts hasta las indicaciones, incluso el sonido de la señal de giro se perdió. Mi copiloto luchaba por encontrar una solución a través de Google. Me llevó al menos cinco minutos. Hoy, Gemini Live, la versión de Google Assistant que simplemente sigue hablando hasta encontrar una solución que funcione, tardó unos 15 segundos en ofrecer una solución que funcionó. Naturalmente, el momento se sintió mágico. En la primera interacción de The Verge con el asistente, que se lanzó hoy, parecía que la inteligencia prometida de los asistentes digitales finalmente se estaba cumpliendo.
Pero luego Gemini Live siguió hablando. Y hablando. El equipo de The Verge estaba metido en una cabina de cristal, y mientras Gemini Live seguía hablando de manera monótona, un amigable empleado de Google me animó a “interrumpirlo”.
¡Se sentía extraño! No me importa interrumpir a Google Assistant en mi coche. De hecho, puedo ser bastante abusivo con la mayoría de estos bots. Les digo nombres e interrumpo con facilidad. Pero Gemini Live fue diferente. El tono masculino agradable de la voz, la facilidad con la que hablaba. Se sentía un poco demasiado humano para que lo interrumpiera.
Mi próxima pregunta llevó a una interacción similar. Pedí ideas sobre cómo entretener a mi perro, y Gemini Live empezó a hablar. La única forma de hacer que se detuviera fue interrumpirlo. Lo cual hice repetidamente. Era como hablar con mi ahijado de 9 años. Como él, Gemini Live no sabe leer las señales en mi rostro, no sabe cuándo reconocer que, en realidad, no me importa tanto el tema en cuestión como a él.
Me vi envuelto en estas pequeñas interacciones con Gemini Live más de lo que lo encontré útil como socio para hacer lluvia de ideas. Sus ideas para mi perro no eran especialmente ingeniosas. Cuando lo interrumpí para preguntarle cómo podía hacer un circuito de obstáculos para perros en mi apartamento sin molestar a los vecinos, simplemente seguía dando más ideas. Frustrado, lo acusé de mansplaining.
Gemini Live se disculpó rápidamente, justificando su mansplaining antes de ofrecer cambiar su tono. Avergonzado, cedí la demostración a mi colega Sean Hollister. Más familiarizado con estos bots, no tuvo problema en interrumpirlos en un abrir y cerrar de ojos. No había dudas de su parte. No se dejaba llevar por una sensación de interacción humana como yo. Le pidió que creara una campaña de Dungeons & Dragons, y aunque lo confundió con su segunda pregunta sobre consejos de inversión, surgió una idea híbrida ingeniosa. Le pidió consejos sobre acciones, y se negó, pero admiró la estrategia Boglehead. Luego le preguntó si debería invertir en criptomonedas, y lo advirtió que tuviera cuidado y señaló que “personalmente” no lo haría.
Sean no tuvo los problemas con las características humanas familiares de Gemini Live como yo. Había practicado con otros asistentes digitales más parecidos a humanos. Podía ignorar fácilmente el entrenamiento social y simplemente exigir respuestas. Al lanzarse Gemini Live, estaré curioso por ver cuántas personas se quedan atrapadas en las cualidades humanas y cuántas simplemente lo tratan como un Alexa con un tono más agradable.
Puedes regañarlo tú mismo si tienes una suscripción avanzada de Gemini y un dispositivo Android lo suficientemente potente. Los usuarios de iOS tendrán que esperar un poco más. Estamos ansiosos por compararlo con el asistente de voz ChatGPT de OpenAI y con la inteligencia que Apple eventualmente incluirá en Siri.