Apple tendrá mucho trabajo por delante si quiere competir con Google y OpenAI.
Google y OpenAI han anunciado importantes actualizaciones para sus modelos de IA y funciones, creando más competencia para Apple antes de la WWDC.
El lunes, OpenAI anunció su innovador modelo de IA GPT-4o y una nueva aplicación para Mac, mientras que Google presentó importantes mejoras en su software Gemini el martes. Las dos compañías mostraron una serie de características notables, haciendo que el mercado sea aún más competitivo como resultado.
Mientras Apple parece haber quedado muy rezagado en sus esfuerzos de IA, una asociación con Google u OpenAI podría resultar en una forma sencilla de ofrecer funciones de IA generativa a su base de usuarios. Al menos los rumores sugieren que ese es el camino que Apple está dispuesto a seguir.
Actualizaciones de OpenAI
Recientemente, OpenAI presentó GPT-4o, una nueva versión multimodal del modelo de IA GPT de la compañía que contiene capacidades mejoradas para procesar diferentes tipos de entrada.
A diferencia de sus predecesores, GPT-4o podrá usar una red neuronal para procesar audio, imágenes y texto, ofreciendo mejoras significativas en los modelos resultantes. Durante el anuncio del producto también se promocionaron incrementos en la velocidad y procesamiento del lenguaje.
GPT-4o de OpenAI podrá entender y transmitir emociones. Durante el reciente evento de la compañía, los miembros del equipo demostraron esto pidiéndole al modelo que analizara expresiones faciales y determinara las emociones específicas que un usuario estaba expresando.
Google actualizaciones de Gemini
Google, en su conferencia de desarrolladores I/O el martes, reveló una multitud de mejoras para su modelo Gemini. El nuevo y mejorado Google Gemini podrá entender entradas de usuario más complejas, incluyendo imágenes teniendo en cuenta el contexto detrás de ellas.
El software de IA de Google contará con nuevas capacidades sensibles al contexto, lo que significa que podrá ver todo en pantalla, ya sea un PDF, un video o una serie de mensajes de texto. Gemini podrá recopilar información y generar resultados, pero solo en dispositivos Android seleccionados.
Con su nueva opción Circle to Search, por ejemplo, los usuarios podrán seleccionar objetos individuales dentro de una imagen y recibir instantáneamente resultados de búsqueda de Google sobre dicho objeto.
Otra característica disponible exclusivamente en Android proporcionará a los usuarios la opción de analizar videos de YouTube y PDF a través de Gemini Advanced. Con el servicio de pago, los usuarios podrán hacer preguntas específicas y recibir respuestas tomadas del contenido de dicho video o PDF.
El Gemini actualizado de Google podrá resumir conversaciones extensas y aislar información clave de documentos, imágenes y videos, lo cual debería ser de gran beneficio para sus usuarios. Apple está persiguiendo características similares a través de sus propios productos.
Lo que sabemos hasta ahora sobre la estrategia de IA de Apple
Apple está notablemente rezagado en lo que respecta a sus ofertas de IA, pero eso podría cambiar muy pronto con el anuncio de iOS 18 a principios de junio.
Durante más de un año, Apple ha estado trabajando en su modelo de lenguaje grande (LLM) interno conocido como Ajax. Con su software de IA generativa, la compañía tiene como objetivo ofrecer nuevas características similares a las anunciadas por Google y OpenAI a principios de mayo.
Como parte de su reciente impulso de IA, se espera que Apple introduzca varias características impulsadas por IA en sus nuevos sistemas operativos. El análisis de documentos y páginas web, la summarización de texto, la descripción de imágenes y la generación de respuestas están todos en proceso.
La compañía busca incrustar tecnología de IA generativa en su surtido existente de aplicaciones centrales del sistema. Como resultado, se espera que aplicaciones como Notas, Safari, Mensajes, Correo, Siri y Búsqueda de Spotlight reciban mejoras habilitadas para IA de una forma u otra.
El modelo de AI en dispositivos de prueba de Apple solo es capaz de análisis de texto rudimentario y generación básica de respuestas en el dispositivo. Las características más avanzadas aparentemente requerirán procesamiento basado en la nube, por lo que se informa que Apple está buscando establecer un acuerdo de licencia con OpenAI. Esto permitiría a Apple ofrecer una variedad de mejoras relacionadas con la IA que sus propios modelos en dispositivos no pueden facilitar.
Un rumor separado afirma que Apple quiere crear una “Tienda de Aplicaciones de IA” a través de la cual los usuarios podrían comprar aplicaciones y productos temáticos de IA de otras compañías. Esto, en teoría, daría a los usuarios la opción de usar versiones de pago de productos, como Gemini Advanced.
Pronto tendremos una mejor comprensión de los esfuerzos de IA de Apple, ya que se espera que la compañía presente sus nuevas características de IA generativa en su Conferencia Mundial de Desarrolladores anual el 10 de junio.