Cómo funcionan los modelos de base en el dispositivo y en el servidor de Apple

Apple anunció nuevos modelos de lenguaje de IA en la WWDC. Estos modelos se ejecutan tanto localmente en dispositivos de Apple como en los propios servidores de inteligencia artificial de Apple Silicon.
La inteligencia artificial (IA) se basa en modelos de lenguaje que proporcionan información de conocimiento para entrenar a la IA y producir resultados para consultas.
Utilizando modelos de lenguaje, las computadoras pueden ser entrenadas en temas específicos para actuar como expertos en ciertos temas.
La alineación de la IA se refiere al proceso de diseñar e implementar sistemas de IA para que se ajusten a los objetivos humanos, valores y resultados deseados. En otras palabras, la alineación está destinada a mantener a la IA en la tarea y no volverse peligrosa al desviarse de su propósito original.
En la WWDC 2024, Apple anunció Apple Intelligence: la propia IA de Apple que proporcionará tanto IA en el dispositivo como en el servidor. Al utilizar nuevos modelos en Apple Intelligence, la IA de Apple se volverá más enfocada, más rápida y más precisa.
Modelos de lenguaje base
Apple llama a sus modelos generales de IA generativa modelos de lenguaje base. Estos modelos son Modelos de Lenguaje Grande (LLMs), que utilizan hasta 3 mil millones de parámetros, y están diseñados para IA generativa básica que la mayoría de los usuarios podrían querer usar.
Apple Foundation Models.
Apple llama a estos dos modelos AFM-on-device y AFM-on-server respectivamente.
Apple también tiene otros modelos de propósito general integrados en Apple Intelligence. Estos modelos pueden ejecutarse tanto en el dispositivo como en los servidores de Apple.
Apple proporciona un detallado documento técnico de cuarenta y siete páginas sobre cómo funcionan sus modelos base de lenguaje. Desde un punto de vista técnico, los modelos base de Apple utilizan un conjunto de técnicas de IA que incluyen:
Arquitectura de transformador
Matriz de incrustación IO
Pre-normalización
Normalización de clave de consulta
Atención de grupo de consultas
Activación SwiGLU
Incrustaciones posicionales RoPE
Ajuste fino
Ajustes y entrada humanos
Apple Foundation Models.
Apple Intelligence también utiliza un rastreador web automatizado llamado AppleBot. Los sitios pueden informar a AppleBot que no utilice su contenido optando por no participar en sus archivos robots.txt.
Para el código de IA, Apple Intelligence también aprende del software de código abierto alojado en GitHub, del cual aprende y condensa, eliminando automáticamente los casos duplicados.
El documento técnico de Apple describe cómo funcionan los modelos y los métodos de entrenamiento utilizados en detalle, incluyendo algunas matemáticas avanzadas al final.
Cómputo en la nube privada
Apple Private Cloud Compute (PCC) es un servicio de IA remoto que utiliza todos los modelos anteriores, además de tener acceso a modelos adicionales para una inteligencia expandida.
Según esta publicación en el blog que describe PCC, Apple tiene varios objetivos con PCC, que incluyen velocidad, precisión, privacidad y fiabilidad del sitio.
PCC también utiliza el Módulo Seguro y el Arranque Seguro igual que los dispositivos de consumo de Apple para garantizar que el sistema operativo y los datos no puedan ser manipulados.
Al igual que muchas otras ofertas de IA de empresas tecnológicas, PCC proporciona una ejecución remota de consultas de IA, pero con un rendimiento más rápido.
Apple resume sus modelos base con:
“Nuestros modelos se han creado con el propósito de ayudar a los usuarios a realizar actividades cotidianas en sus productos de Apple, y se han desarrollado de manera responsable en cada etapa y guiados por los valores fundamentales de Apple. Esperamos compartir más información pronto sobre nuestra amplia familia de modelos generativos, incluyendo modelos de lenguaje, difusión y codificación.”
También, consulta nuestros artículos iOS 17.6 y más llega tras el lanzamiento de la versión beta de Apple Intelligence y Apple admite usar hardware Google Tensor para entrenar Apple Intelligence.
Apple Intelligence promete proporcionar a los usuarios de iOS y Mac una IA más rápida y optimizada en los dispositivos y en la nube. Tendremos que esperar y ver cómo se desarrolla con el inminente lanzamiento de iOS 18 y la próxima iteración de macOS.

LEAR  Departamento de Justicia de EE. UU. Demandará a Apple por prácticas anticompetitivas mañana