Apple s'efforce d'intégrer un modèle Gemini massif dans l'iPhone pour alimenter le récent Siri

Un nouveau jalon vient d’être franchi dans l’univers de l’intelligence artificielle.

Apple s’efforce d’intégrer un modèle Gemini massif dans l’iPhone pour alimenter le récent Siri

Alors qu’Apple tente de réduire Gemini pour l’iPhone, un composant cloud est probablement inévitable.

Il est désormais impossible d’éviter totalement l’IA générative lors de l’interaction avec la technologie, mais Apple en a un peu moins. Ce n’est cependant pas entièrement par choix. Le fabricant d’iPhone a retardé à plusieurs reprises le Siri amélioré par l’IA depuis sa première promesse en 2024, cependant un accord avec Google fusionnera l’assistant emblématique avec Gemini plus tard cette année. À l’approche de la Conférence mondiale des développeurs, Apple s’efforce d’apporter une grande intelligence de l’IA au modeste environnement de traitement d’un smartphone. Cependant, les fans d’Apple n’apprécieront peut-être pas le résultat.

Sur ce point, apple se vante depuis longtemps de la valeur de confidentialité de l’exécution de l’IA localement, mais un nouveau rapport suggère que malgré tous les efforts d’Apple, le relooking Gemini de l’iPhone s’appuiera fortement sur Google et Nvidia dans le cloud. The Information rapporte que Siri, infusé par Gemini, d’Apple fonctionnera à la fois sur l’appareil et dans le cloud, un renversement apparent de sa préférence axée sur la confidentialité pour l’IA locale.

À chaque annonce de nouvelle puce, nous entendons parler de la façon dont le silicium a été optimisé pour l’IA – même Apple le fait en mettant l’accent sur les mises à niveau du moteur neuronal. D’après le langage grandiose, vous pensez peut-être que les smartphones sont équipés pour gérer de puissants modèles d’IA, mais ce n’est pas nécessairement le cas. En fait, les GPU de la plupart des téléphones peuvent traiter plus de jetons IA que les NPU axés sur l’IA. Des composants tels que le Neural Engine d’Apple sont conçus pour un traitement contextuel et efficace de l’IA. Même si les téléphones disposaient d’un traitement IA plus rapide, ils n’avaient pas la RAM nécessaire pour conserver d’énormes modèles en mémoire.

Même les plus grands modèles d’IA restent des assistants médiocres, ce qui rend l’IA locale très difficile. Les modèles d’IA qui fonctionnent sur les téléphones sont physiquement plus petits, comportant au plus quelques milliards de paramètres. Comparez cela aux derniers modèles Gemini de Google, qui comportent des milliards de paramètres, rapporte The Information. Les modèles d’IA sur appareil sont en outre « quantifiés » pour fonctionner avec une précision moindre, ce qui les rend plus rapides mais affecte la précision de la génération de jetons. Tout cela s’ajoute au fait que les IA se sentent moins intelligentes que leurs frères cloud, et même les gros modèles basés sur le cloud peuvent parfois être assez stupides.

Par ailleurs, google propose des versions de Gemini optimisées pour les appareils mobiles, qu’il appelle Gemini Nano. Néanmoins, ceux-ci sont conçus pour alimenter des fonctionnalités contextuelles telles que Magic Cue et le résumé audio. Siri, en revanche, est censé être un assistant conversationnel : vous lui parlez et il fait des choses. C’est une expérience différente qui nécessite un autre type de système. Sur Android, Google ne prend même pas la peine d’essayer de le faire localement. Parler aux Gémeaux va toujours directement vers le cloud.

Les prochaines semaines permettront d’en mesurer la portée réelle.

Sur le même sujet :

Nvidia parie 150 milliards de dollars sur Taiwan alors que le projet de Trump de faire des États-Unis un centre d’IA se retourne contre lui

Lire l’article complet sur Ars Technica AI : Ars Technica AI