GPT-4o de OpenAI confronté à des problèmes de régression, performance à la hauteur de GPT-4o Mini

GPT-4o de OpenAI confronté à des problèmes de régression, performance à la hauteur de GPT-4o Mini

Selon un nouveau rapport de Analyse artificiellele grand modèle de langage phare d’OpenAI pour ChatGPT, GPT-4o, a considérablement régressé ces dernières semaines, mettant les performances du modèle de pointe à égalité avec le modèle GPT-4o-mini, beaucoup plus petit et nettement moins performant.

Cette analyse intervient moins de 24 heures après que la société a annoncé une mise à niveau du modèle GPT-4o. « La capacité d’écriture créative du modèle s’est améliorée : une écriture plus naturelle, engageante et adaptée pour améliorer la pertinence et la lisibilité. » OpenAI a écrit sur X. « Il est également plus efficace de travailler avec des fichiers téléchargés, en fournissant des informations plus approfondies et des réponses plus approfondies. » La question de savoir si ces affirmations continuent de tenir est désormais mise en doute.

Vidéos recommandées

« Nous avons terminé hier l’exécution de nos évaluations indépendantes sur la version GPT-4o d’OpenAI et mesurons systématiquement des scores d’évaluation sensiblement inférieurs à ceux de la version d’août de GPT-4o », indique le communiqué. Analyse artificielle annoncée via un post X jeudi, notant que l’indice de qualité de l’analyse artificielle du modèle a diminué de 77 à 71 (et est désormais égal à celui du GPT-4o mini).

De plus, les performances de GPT-4o sur le benchmark GPQA Diamond ont diminué de 51 % à 39 %, tandis que ses benchmarks MATH ont diminué de 78 % à 69 %.

Simultanément, les chercheurs ont découvert que la vitesse de réponse du modèle avait plus que doublé, passant d’environ 80 jetons de sortie par seconde à environ 180 jetons/s. « Nous avons généralement observé des vitesses nettement plus rapides le jour du lancement pour les modèles OpenAI (probablement en raison de la capacité de provisionnement d’OpenAI avant l’adoption), mais nous n’avions pas vu auparavant une différence de vitesse 2x », ont écrit les chercheurs.

Attendez, le nouveau GPT-4o est-il un modèle plus petit et moins intelligent ?

Nous avons terminé hier nos évaluations indépendantes sur la version GPT-4o d’OpenAI et mesurons systématiquement des scores d’évaluation sensiblement inférieurs à ceux de la version d’août de GPT-4o.

GPT-4o (novembre) vs GPT-4o (août) :
➤… pic.twitter.com/gjY2pBFuUv

– Analyse artificielle (@ArtificialAnlys) 21 novembre 2024

« Sur la base de ces données, nous concluons qu’il est probable que le modèle GPT-4o d’OpenAI du 20 novembre soit un modèle plus petit que la version d’août », ont-ils poursuivi. « Étant donné qu’OpenAI n’a pas réduit les prix de la version du 20 novembre, nous recommandons aux développeurs de ne pas déplacer les charges de travail de la version d’août sans des tests minutieux. »

En relation :  Comment déplacer un dossier partagé vers un autre lecteur avec des autorisations dans Google Drive

GPT-4o a été lancé pour la première fois en mai 2024 pour surpasser les modèles GPT-3.5 et GPT-4 existants. Selon OpenAI, GPT-4o offre des résultats de référence de pointe dans les tâches vocales, multilingues et visuelles, ce qui le rend idéal pour les applications avancées telles que la traduction en temps réel et l’IA conversationnelle.

Moyens I/O Staff est une équipe professionnelle d'auteurs passionnés derrière nos contenus renommés. Nous offrons une couverture complète des dernières actualités et tendances en Tech, Apps mobiles, IA, Gaming, et autres. Notre objectif est de fournir des informations pertinentes et à jour pour vous tenir informé des évolutions majeures dans ces secteurs dynamiques. Que vous soyez passionné de nouvelles technologies ou de divertissement, Moyens.net est votre référence de qualité pour rester au courant des dernières évolutions numériques.