Êtes-vous intéressé par eux OFFRES? Économisez avec nos coupons sur WHATSAPP o TELEGRAM!

Llama 3 défie les géants : voici le nouveau modèle d'IA de Meta

18 avril 2024

Meta en a ajouté deux nouveaux modèles linguistiques à sa série : Lama 3 8B e Lama 3 70B. Ceux-ci promettent des performances supérieures dans le monde de l’intelligence artificielle. La nouvelle la plus marquante ? La présence de 8 milliards et 70 milliards de paramètres respectivement. Ces chiffres représentent la complexité et la capacité du modèle à gérer et essayer information.

Llama 3, ce n'est pas seulement deux modèles : plus de matériel est en route

Meta ne s'arrête pas là ; envisage de sortir plus de modèles dans la série Llama 3, mais sans préciser de date. Cette stratégie crée de l'anticipation et démontre également la volonté de l'entreprise d'améliorer continuellement son offre.

I nouveaux modèles de lama ils sont décrits comme un progrès par rapport aux modèles précédents. Cette amélioration est due en partie à l'utilisation de deux clusters GPU personnalisés, chacun avec 24.000 XNUMX unités, ce qui a permis aux modèles d'être entraînés avec plus d'efficacité et de précision. Meta affirme qu'en raison du nombre de paramètres qu'ils possèdent, ces modèles sont parmi les meilleurs disponibles aujourd'hui pour l'intelligence artificielle générative.

Les performances de Llama 3 ont été mesurées à l'aide de divers tests d'IA, qui sont des tests standardisés utilisés pour évaluer les capacités des modèles d'IA. Ceux-ci inclus MMLU pour la connaissance, ARC pour l'acquisition de compétences, e GOUTTE pour raisonner sur des blocs de texte. Même si les opinions divergent sur l’utilité de ces benchmarks, ils restent une méthode courante pour évaluer et comparer les capacités des modèles d’IA.

En particulier, Llama 3 8B a surpassé les modèles open source similaires avec moins de paramètres, tels que Mistral et Google Gemma, dans au moins neuf benchmarks différents. Cela comprend des tests sur les connaissances générales, le raisonnement et les compétences spécifiques dans des domaines tels que la biologie, la physique, la chimie et même la génération de code et les problèmes mathématiques. Ce que GPT-4, par exemple, ne peut pas très bien faire.

Le plus grand modèle, le Llama 3 70B, non seulement rivalise mais dépasse dans certains cas les modèles phares tels que Gemini 1.5 Pro de Google lors de différents tests, démontrant que malgré une forte concurrence, elle peut tenir tête même aux géants du secteur. Cependant, il est important de noter que s'il surpasse certains modèles phares tels que Claude 3 Sonnet par Anthropic dans plusieurs tests, il n'atteint pas les performances du modèle Claude 3 Opus plus avancé.