La dernière innovation de Google dans le domaine de l'intelligence artificielle a fait des débuts surprenants aujourd'hui, malgré les informations selon lesquelles elle serait reporté à 2024. Ce modèle de langage, né dans l'ombre de ChatGPT, se présente comme un percée dans le paysage technologique. Avec des fonctionnalités de pointe et des promesses d’intégrations révolutionnaires, Gemini fera certainement parler d’elle. Voici ce que Google avait à dire sur le nouveau modèle linguistique.
Caractéristiques de Gemini, la réponse ambitieuse de Google à OpenAI
Gemini se décline en trois variantes : Nano, Pro e Ultra, chacun étant conçu à des fins spécifiques. Cette diversification démontre la polyvalence et l'ambition de Google de rendre l'IA accessible à tous.
- Gemini Nano est une version plus légère, idéale pour utilisation direct sur les appareils Android comme le Google Pixel 8 Pro
- Gemini Pro, plus robuste, est destiné aux améliorer les services d'IA de Google, dont Barde
- Gemini Ultra, le plus puissant des trois, est conçu pour centres de données et applications métiers
L'une des caractéristiques les plus intéressantes du Gemini est sa capacité multimodal. Contrairement à d'autres modèles qui se concentrent uniquement sur le texte, les Gémeaux peuvent comprendre et interagir avec la vidéo et l'audio. Un peu comme j'ai commencé à faire ChatGPT il y a quelques mois. Cette approche intégrée promet de révolutionner la façon dont nous interagissons avec la technologie, ouvrant de nouvelles frontières en matière d’apprentissage automatique.
Selon les informations fournies par Google, outre ses capacités, le modèle linguistique brille par son efficacité. Formé sur Unités de traitement de tenseur de Google, offre des performances supérieures à un coût réduit. Avec l'introduction du TPU v5p, Google vise à améliorer encore l'efficacité de la formation et de l'exécution de modèles à grande échelle.
Gemini Nano marque les débuts de Google dans le secteur des appareils mobiles, promettant d'apporter des fonctionnalités avancées d'IA aux meilleurs smartphones Android, comme le Pixel 8 Pro. Il n'y aura pas d'application dédiée pour accéder à Nano, mais Google a l'intention l'intégrer dans les fonctions existantes comme un résumé dans l'application Recorder et une réponse intelligente dans Gboard pour WhatsApp. Grâce à la plateforme AICore, les développeurs pourront profiter de Gemini Nano, ouvrant la voie à de nouvelles applications passionnantes.
En remontant le niveau, on retrouve Gemini Pro, disponible pour les développeurs et les entreprises clientes à partir du 13 décembre via la nouvelle API de Google AI Studio ou Google Cloud Vertex AI. Google Bard, une plate-forme d'invites textuelles, exploite déjà Gemini Pro et prévoit d'étendre la prise en charge à d'autres modes. Actuellement disponible dans 170 pays, Google prévoit de étendez Bard avec le modèle Pro dans plus de régions et de langues.
Passant au Gemini Ultra, nous nous retrouvons face au modèle le plus excitant de tous. Il faudra cependant attendre encore un peu avant de pouvoir l'utiliser, car Google le fait effectuer des contrôles rigoureux de sécurité et de fiabilité. Ultra sera initialement disponible pour un groupe sélectionné de clients, de développeurs et de partenaires pour des commentaires préliminaires, avant d'être mis à la disposition des développeurs et des entreprises clientes au début de l'année prochaine. Ce modèle est également attendu à intégrer dans une nouvelle expérience Bard avancée.
En termes de performances, Google Gemini a obtenu des résultats impressionnants, dépassant 90 % au test MMLU et battant les modèles d'IA existants dans de nombreux tests académiques. Bien que Gemini Pro surpasse GPT-3.5, il est à son tour surpassé par GPT-4, tandis qu'Ultra a un avantage marginal sur GPT-4. Cela place le modèle de Google dans une position compétitive dans le domaine de l'IA.
En ce qui concerne la sécurité, Google affirme que Gemini a été développé en mettant fortement l'accent sur responsabilité et sur la sécurité, même si des questions restent ouvertes quant à son impact sur la vie privée, l’éthique et l’emploi.