Êtes-vous intéressé par eux OFFRES? Économisez avec nos coupons sur WHATSAPP o TELEGRAM!

Il y a un énorme problème qui freine la formation des réseaux de neurones

Dans le monde dynamique deastuce artificiel, les grandes entreprises technologiques sont confrontées à un défi inattendu qui pourrait ralentir le rythme de l'innovation : la croissance difficulté à trouver des données de qualité pour former leurs modèles. Cette pénurie de données affecte le développement de technologies avancées telles que GPT-5, tandis que des entreprises du calibre de Microsoft et OpenAI recherchent des solutions innovantes pour surmonter cet obstacle.

Défis de la formation à l’IA : il y a une soif de données et cela ralentit les progrès

À une époque marquée par une augmentation sans précédent de la puissance de calcul et l'avancement des techniques d'apprentissage automatique, OpenAI et ses semblables sont confrontés à un paradoxe: L'abondance de données en ligne ne se traduit pas automatiquement par une ressource utilisable pour la formation en IA. Le besoin de données précises, pertinent et à jour est plus essentiel que jamais, en particulier lorsqu'il s'agit de former des modèles de plus en plus complexes comme le prévu GPT-5.

La transition de GPT-4 à GPT-5 illustre cette croissance exponentielle de la demande de données : alors que le premier ne nécessitait « que » 12 XNUMX milliards de jetons, les estimations pour le successeur se situent autour de 60 à 100 XNUMX milliards. L'écart entre la disponibilité et le besoin de données de haute qualité apparaît comme un obstacle important, estimant un pénurie qui pourrait varier entre 10 et 20 XNUMX milliards de jetons.

logo openai sur smartphone en fond blanc

Ce déficit de données de qualité se traduit par un véritable goulot d’étranglement pour l’avancement de l’IA. Les données souvent obsolètes ou de mauvaise qualité qui peuplent le Web représentent un grave problème limite pour l’efficacité de l’apprentissage automatique. De plus, les restrictions imposées par l’accès aux données par les grandes plateformes ne font qu’exacerber le problème, limitant encore davantage les ressources disponibles pour la formation. modèles linguistiques.

En réponse à ce défi, les stratégies adoptées varient des innovations techniques aux partenariats stratégiques. OpenAI, par exemple, vise à améliorer laen utilisant des données audio et vidéo via son outil de reconnaissance vocale Whisper, afin d’élargir le pool de données disponibles. En parallèle, l'entreprise explore la possibilité de générer des données synthétiques de qualité qui peut servir à combler le déficit existant.

Gianluca Cobucci
Gianluca Cobucci

Passionné de code, de langages et langages, d'interfaces homme-machine. Tout ce qui est évolution technologique m'intéresse. J'essaie de divulguer ma passion avec la plus grande clarté, en m'appuyant sur des sources fiables et non « au premier passage ».

Souscrire
notifier
invité

0 commentaires
Commentaires en ligne
Voir tous les commentaires
XiaomiToday.it
Logo