Cómo funcionan los modelos de base en servidores y dispositivos de Apple

por admin

Icono de Siri en un centro de datos

Cómo funcionan los modelos de base en servidores y dispositivos de Apple

Apple anunció nuevos modelos de lenguaje de IA en la WWDC. Estos modelos se ejecutan tanto localmente en dispositivos Apple como en los propios servidores de IA de Apple con tecnología Apple Silicon.

La inteligencia artificial (IA) se basa en modelos de lenguaje que proporcionan información de conocimiento para entrenar a la IA a producir resultados para indicaciones (consultas).

Utilizando modelos de lenguaje, las computadoras pueden ser entrenadas en temas específicos para que actúen como expertos en el dominio de ciertos tópicos.

AI alineación Se refiere al proceso de diseño e implementación de sistemas de IA para que se ajusten a los objetivos, valores y resultados deseados de los seres humanos. En otras palabras, la alineación tiene como objetivo mantener a la IA en la tarea y no volverse peligrosa al desviarse de su propósito original.

En la WWDC 2024, Apple anunció Apple Intelligence, la inteligencia artificial propia de Apple que proporcionará inteligencia artificial tanto en el dispositivo como en el servidor. Al utilizar nuevos modelos en Apple Intelligence, la inteligencia artificial de Apple será más específica, más rápida y más precisa.

Modelos de lenguaje de base

Apple denomina a sus modelos generativos generales de IA modelos de lenguaje básicos. Estos modelos son modelos de lenguaje grandes (LLM), que utilizan hasta 3 mil millones de parámetros y están diseñados para la IA generativa básica que la mayoría de los usuarios podrían querer utilizar.

Gráfico del modelo de la Fundación Apple.

Modelos de la Fundación Apple.

Apple llama a estos dos modelos AFM en el dispositivoy AFM en el servidor respectivamente.

Apple también cuenta con otros modelos de uso general integrados en Apple Intelligence. Estos modelos pueden ejecutarse tanto en el dispositivo como en los servidores de Apple.

Apple ofrece un informe técnico bastante detallado de cuarenta y siete páginas sobre cómo funcionan sus modelos de lenguaje básicos. Desde un punto de vista técnico, los modelos básicos de Apple utilizan una base de técnicas de IA, que incluyen:

  • Arquitectura del transformador
  • Matriz de incrustación de E/S
  • Prenormalización
  • Normalización de claves de consulta
  • Atención de consultas agrupadas
  • Activación de SwiGLU
  • Incrustaciones posicionales de RoPE
  • Sintonia FINA
  • Ajustes y aportaciones humanas
Entrenamiento de modelos de Apple Foundation para IA.

Modelos de la Fundación Apple.

Apple Intelligence también utiliza un rastreador web automatizado llamado AppleBot. Los sitios pueden informar a AppleBot que no use su contenido al optar por no hacerlo en sus archivos robots.txt.

Para la inteligencia artificial del código, Apple Intelligence también aprende del software de código abierto alojado en GitHub, del cual aprende y lo condensa, eliminando automáticamente los casos duplicados.

El documento técnico de Apple describe en detalle cómo funcionan los modelos y los métodos de entrenamiento utilizados, incluyendo algunas operaciones matemáticas avanzadas al final.

Computación en la nube privada

Apple Private Cloud Compute (PCC) es un servicio de inteligencia artificial remoto que utiliza todos los modelos anteriores y además tiene acceso a modelos adicionales para una inteligencia ampliada.

Según esta publicación de blog que describe PCC, Apple tiene varios objetivos con PCC, que incluyen velocidad, precisión, privacidad y confiabilidad del sitio.

PCC también utiliza el mismo Secure Enclave y Secure Boot que los dispositivos de consumo de Apple para garantizar que el sistema operativo y los datos no puedan ser alterados.

Al igual que muchas otras ofertas de IA de empresas tecnológicas, PCC ofrece ejecución remota de indicaciones de IA, pero con un rendimiento más rápido.

Apple resume sus modelos base con:

«Nuestros modelos se crearon con el objetivo de ayudar a los usuarios a realizar actividades cotidianas en sus productos Apple, y se desarrollaron de manera responsable en cada etapa y guiados por los valores fundamentales de Apple. Esperamos compartir pronto más información sobre nuestra familia más amplia de modelos generativos, incluidos los modelos de lenguaje, difusión y codificación».

Vea también nuestros artículos iOS 17.6 y más llegan tras el lanzamiento de la versión beta de Apple Intelligence y Apple admite haber usado hardware de Google Tensor para entrenar a Apple Intelligence.

Apple Intelligence promete ofrecer a los usuarios de iOS y Mac una inteligencia artificial más rápida y optimizada en los dispositivos y en la nube. Tendremos que esperar y ver cómo resulta con el inminente lanzamiento de iOS 18 y la próxima versión de macOS.

Síguenos en YouTube: @PCenterES

También le puede interesar

Deja un comentario