mercredi, avril 24, 2024
Internet

Les 5 meilleures nouvelles fonctionnalités GPT-4 expliquées

GPT-4 est là, et ce sont les nouvelles fonctionnalités que vous devriez découvrir.

OpenAI a enfin lancé sa mise à jour GPT très attendue, GPT-4. Le Large Language Model (LLM) est livré avec de nouvelles fonctionnalités et capacités puissantes qui ont déjà choqué les utilisateurs du monde entier.

En plus d’être nettement meilleur que GPT-3.5, le LLM existant qui alimente le chatbot viral ChatGPT d’OpenAI, GPT-4 peut comprendre des entrées plus complexes, a une limite d’entrée de caractères beaucoup plus grande, a des capacités multimodales et serait plus sûr à utiliser.

VOIR AUSSI: 6 extensions Chrome étonnantes de ChatGPT pour de meilleures requêtes et réponses Prompt IA dans les navigateurs

1. GPT-4 peut comprendre des entrées plus complexes

L’une des nouvelles fonctionnalités les plus importantes de GPT-4 est sa capacité à comprendre des invites plus complexes et nuancées. Selon OpenAI, GPT-4 « présente des performances de niveau humain sur diverses références professionnelles et académiques ».

Cela a été démontré en soumettant GPT-4 à plusieurs examens de niveau humain et à des tests standardisés, tels que le SAT, le BAR et le GRE, sans formation spécifique. Non seulement GTP-4 a compris et résolu ces tests avec un score relativement élevé dans tous les domaines, mais il a également battu son prédécesseur, GPT-3.5, à chaque fois.

La capacité à comprendre des invites de saisie plus nuancées est également facilitée par le fait que GPT-4 a une limite de mots beaucoup plus grande. Le nouveau modèle peut gérer des invites d’entrée jusqu’à 25 000 mots (pour le contexte, GPT-3.5 était limité à 8 000 mots). Cela affectera directement les détails que les utilisateurs peuvent insérer dans leurs invites, donnant ainsi au modèle beaucoup plus d’informations à utiliser et produisant des sorties plus longues.

GPT-4 prend également en charge plus de 26 langues, y compris des langues à faibles ressources telles que le letton, le gallois et le swahili. Lorsqu’il est comparé à une précision de trois coups sur la référence MMLU, GPT-4 a battu GPT-3.5 ainsi que d’autres LLM de premier plan tels que PaLM et Chinchilla en termes de performances en anglais dans 24 langues.

2. Capacités multimodales

La version précédente de ChatGPT était limitée aux invites textuelles. En revanche, l’une des fonctionnalités les plus récentes de GPT-4 est ses capacités multimodales. Le modèle peut accepter des invites de texte et d’image.

Cela signifie que l’IA peut accepter une image en entrée et l’interpréter et la comprendre comme une invite de texte. Cette capacité couvre toutes les tailles et tous les types d’images et de texte, y compris les documents combinant les deux, les croquis dessinés à la main et même les captures d’écran.

Cependant, les capacités de lecture d’images du GPT-4 vont au-delà de leur simple interprétation. OpenAI l’a présenté dans son flux de développeurs (ci-dessus), où ils ont fourni à GPT-4 une maquette dessinée à la main d’un site Web de blagues. Le modèle a été chargé d’écrire du code HTML et JavaScript pour transformer la maquette en site Web tout en remplaçant les blagues par de vraies.

GPT-4 a écrit le code en utilisant la mise en page spécifiée dans la maquette. Lors des tests, le code a produit un site de travail avec, comme vous pouvez le deviner, de vraies blagues. Cela signifie-t-il que les progrès de l’IA signifieront la fin de la programmation ? Pas tout à fait, mais c’est toujours une fonctionnalité qui sera utile pour aider les programmeurs.

Aussi prometteuse que cette fonctionnalité semble, elle est toujours en aperçu de recherche et n’est pas accessible au public. De plus, le modèle prend beaucoup de temps pour traiter les entrées visuelles, OpenAI lui-même déclarant que cela pourrait prendre du temps et du travail pour aller plus vite.

3. Une plus grande maniabilité

OpenAI affirme également que GPT-4 a un haut degré de maniabilité. Cela a également rendu plus difficile pour l’IA de casser le personnage, ce qui signifie qu’il est moins susceptible d’échouer lorsqu’il est implémenté dans une application pour jouer un certain personnage.

Les développeurs peuvent prescrire le style et la tâche de leur IA en décrivant la direction dans le message « système ». Ces messages permettent aux utilisateurs de l’API de personnaliser fortement l’expérience utilisateur dans certaines limites. Étant donné que ces messages sont également le moyen le plus simple de « jailbreaker » le modèle, ils travaillent également à les rendre plus sûrs. La démo de GPT-4 a mis en évidence ce point en demandant à un utilisateur d’essayer d’empêcher GPT-4 d’être un tuteur socratique et de répondre à sa requête. Cependant, le modèle a refusé de casser le caractère.

4. Sécurité

OpenAI a passé six mois à rendre GPT-4 plus sûr et plus aligné. La société affirme qu’il est 82 % moins susceptible de répondre aux demandes de contenu inapproprié ou autrement interdit, 29 % plus susceptible de répondre conformément aux politiques d’OpenAI aux demandes sensibles et 40 % plus susceptible de produire des réponses factuelles par rapport à GPT-3.5. .

Ce n’est pas parfait, et vous pouvez toujours vous attendre à ce qu’il « hallucine » de temps en temps et qu’il puisse se tromper dans ses prédictions. Bien sûr, GPT-4 a de meilleures perceptions et un meilleur pouvoir de prédiction, mais vous ne devriez toujours pas faire aveuglément confiance à l’IA.

5. Améliorations des performances

En plus d’évaluer les performances du modèle lors d’examens humains, OpenAI a également évalué le bot sur des références traditionnelles conçues pour les modèles d’apprentissage automatique.

Il affirme que GPT-4 « surclasse considérablement » les LLM existants et « la plupart des modèles de pointe ». Ces références incluent le MMLU susmentionné, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval et Drop, qui testent tous les capacités individuelles.

Vous trouverez des résultats similaires en comparant les performances sur les repères de vision académiques. Les tests exécutés incluent VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA et LSMDC, qui sont tous en tête de GPT-4. Cependant, OpenAI a déclaré que les résultats de GPT-4 dans ces tests « ne représentent pas pleinement l’étendue de ses capacités », car les chercheurs continuent de trouver des choses nouvelles et plus difficiles que le modèle peut aborder.

LIRE AUSSI: 7 applications Web AI impressionnantes que vous pouvez essayer dès maintenant

Petit pas pour GPT-4, pas de géant pour l’IA

Avec plus de précision, de sécurité d’utilisation et de fonctionnalités avancées, GPT-4 a été rendu public via le plan d’abonnement mensuel ChatGPT+ qui coûte 20 par mois. De plus, OpenAI s’est associé à différentes organisations pour commencer à créer des produits destinés aux consommateurs avec GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes et Khan Academy, entre autres, ont déjà implémenté GPT-4 dans leurs produits.

GPT-4 peut être une mise à jour incrémentielle par rapport à GPT-3.5, mais c’est une énorme victoire pour l’IA dans son ensemble. Au fur et à mesure que le modèle devient plus accessible, à la fois pour l’utilisateur moyen et les développeurs via son API, il semble qu’il constituera un bon argument pour les implémentations LLM dans tous les domaines.

Leave a Response

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.