Êtes-vous intéressé par eux OFFRES? Économisez avec nos coupons sur WHATSAPP o TELEGRAM!

ChatGPT est désormais un assistant qui peut voir, entendre et parler

ChatGPT, développé par OpenAI, introduit de nouvelles fonctionnalités qui vous permettent d'interagir par la voix et les images, offrant une interface intuitive et davantage de façons d'intégrer ChatGPT dans votre vie quotidienne. Dans une récente annonce sur son site Internet, OpenAI a décidé de révéler ces nouvelles fonctionnalités en avance. De même, il a également souligné les avantages qu’ils apportent et les défis qu’ils présentent sur le marché en pleine croissance de l’IA.

ChatGPT : interaction vocale

Avec la nouvelle fonctionnalité vocale, les utilisateurs peuvent avoir conversations interactives avec ChatGPT. Cela vous permet d'utiliser l'assistant même en déplacement, augmentant ainsi le potentiel du chatbot. Par exemple, un utilisateur pourrait demander à ChatGPT de raconter une histoire pour enfants lors de ses déplacements, ce qui la rendrait plus agréable.

commandes vocales chatgpt
Une histoire créée par le chatbot

Ou encore, lors d'un dîner entre amis, un débat sur un sujet précis pourrait émerger ; dans ce cas, les utilisateurs peuvent utiliser le bot pour obtenir des informations précises et résoudre le débat de manière constructive.

La technologie vocale de ChatGPT utilise un modèle avancé de synthèse vocale. En collaboration avec des comédiens professionnels, ce modèle est capable de générer de l'audio humanoïde à partir de texte et de courts échantillons de voix, rendant l'interaction avec ChatGPT encore plus naturelle et intuitive. Merci également à Chuchotement, un système de reconnaissance vocale open source développé par OpenAI, les mots prononcés sont retranscrit en texte avec une grande précision, permettant au chatbot de comprendre et de répondre efficacement aux demandes des utilisateurs.

ChatGPT : interaction visuelle

Comme ci-dessus, le modèle IA peut désormais analyser une ou plusieurs images, permettant aux utilisateurs de résoudre des problèmes, de planifier des repas ou d'analyser des graphiques complexes. Par exemple, un utilisateur pourrait soumettre une photo du contenu de son réfrigérateur. Le chatbot doit donc être utilisé analyser les aliments présents et proposer des recettes à base de ces ingrédients, fournissant également des instructions étape par étape pour la préparation.

commandes d'image chatgpt

Lire aussi: GPT-4 : Gemini sera le rival de Google. Voici les différences

De plus, si l'utilisateur a besoin de se concentrer sur un élément particulier de l'image, L'application mobile de ChatGPT comprend un outil de dessin ce qui permet de mettre en évidence des zones spécifiques de l'image, rendant la communication et l'analyse encore plus précises et personnalisées.

La compréhension des images est optimisée par les modèles multimodaux GPT-3.5 et GPT-4. Ces modèles avancés ils appliquent leurs compétences linguistiques à un large éventail d'images, telles que des photographies, des captures d'écran et des documents qui contiennent à la fois du texte et des images, permettant à ChatGPT de comprendre et d'interpréter le contexte visuel avec précision et en détail.

Il convient de mentionner qu'à partir de poco OpenAI a intégré non seulement cela canva mais aussi DALL-E 3 dans ChatGPT, ou le modèle d'image génératif.

Quand et pour qui il sera disponible

Au cours des deux prochaines semaines, OpenAI implémentera la voix et les images dans ChatGPT pour les utilisateurs utilisateurs avec des abonnements Plus et Enterprise. 

La fonction qui permet l'interaction vocale sera disponible sur iOS et Android mais pas sur la version Web, qui est celle utilisée par la plupart des gens.

La fonction qui permet une interaction visuelle sera disponible à la place sur toutes les plateformes, donc Android, iOS et web.

Source | OpenAI

Mots clés:

Gianluca Cobucci
Gianluca Cobucci

Passionné de code, de langages et langages, d'interfaces homme-machine. Tout ce qui est évolution technologique m'intéresse. J'essaie de divulguer ma passion avec la plus grande clarté, en m'appuyant sur des sources fiables et non « au premier passage ».

Souscrire
notifier
invité

0 commentaires
Commentaires en ligne
Voir tous les commentaires
XiaomiToday.it
Logo