Selon un nouveau rapport de Analyse artificiellele grand modèle de langage phare d’OpenAI pour ChatGPT, GPT-4o, a considérablement régressé ces dernières semaines, mettant les performances du modèle de pointe à égalité avec le modèle GPT-4o-mini, beaucoup plus petit et nettement moins performant.

Cette analyse intervient moins de 24 heures après que la société a annoncé une mise à niveau du modèle GPT-4o. « La capacité d’écriture créative du modèle s’est améliorée : une écriture plus naturelle, engageante et adaptée pour améliorer la pertinence et la lisibilité. » OpenAI a écrit sur X. « Il est également plus efficace de travailler avec des fichiers téléchargés, en fournissant des informations plus approfondies et des réponses plus approfondies. » La question de savoir si ces affirmations continuent de tenir est désormais mise en doute.

Vidéos recommandées

« Nous avons terminé hier l’exécution de nos évaluations indépendantes sur la version GPT-4o d’OpenAI et mesurons systématiquement des scores d’évaluation sensiblement inférieurs à ceux de la version d’août de GPT-4o », indique le communiqué. Analyse artificielle annoncée via un post X jeudi, notant que l’indice de qualité de l’analyse artificielle du modèle a diminué de 77 à 71 (et est désormais égal à celui du GPT-4o mini).

De plus, les performances de GPT-4o sur le benchmark GPQA Diamond ont diminué de 51 % à 39 %, tandis que ses benchmarks MATH ont diminué de 78 % à 69 %.

Simultanément, les chercheurs ont découvert que la vitesse de réponse du modèle avait plus que doublé, passant d’environ 80 jetons de sortie par seconde à environ 180 jetons/s. « Nous avons généralement observé des vitesses nettement plus rapides le jour du lancement pour les modèles OpenAI (probablement en raison de la capacité de provisionnement d’OpenAI avant l’adoption), mais nous n’avions pas vu auparavant une différence de vitesse 2x », ont écrit les chercheurs.

Attendez, le nouveau GPT-4o est-il un modèle plus petit et moins intelligent ?

Nous avons terminé hier nos évaluations indépendantes sur la version GPT-4o d’OpenAI et mesurons systématiquement des scores d’évaluation sensiblement inférieurs à ceux de la version d’août de GPT-4o.

GPT-4o (novembre) vs GPT-4o (août) :
➤… pic.twitter.com/gjY2pBFuUv

– Analyse artificielle (@ArtificialAnlys) 21 novembre 2024

« Sur la base de ces données, nous concluons qu’il est probable que le modèle GPT-4o d’OpenAI du 20 novembre soit un modèle plus petit que la version d’août », ont-ils poursuivi. « Étant donné qu’OpenAI n’a pas réduit les prix de la version du 20 novembre, nous recommandons aux développeurs de ne pas déplacer les charges de travail de la version d’août sans des tests minutieux. »

GPT-4o a été lancé pour la première fois en mai 2024 pour surpasser les modèles GPT-3.5 et GPT-4 existants. Selon OpenAI, GPT-4o offre des résultats de référence de pointe dans les tâches vocales, multilingues et visuelles, ce qui le rend idéal pour les applications avancées telles que la traduction en temps réel et l’IA conversationnelle.

Soutenez notre effort ❤️

Si vous avez apprécié cet article, pensez à laisser un pourboire pour nous aider à continuer à publier du contenu de qualité.

Autre

€

Paiement sécurisé sur PayPal

Voir aussi: Étude : L'IA développe de nouveaux stéréotypes de recrutement, plus biaisés que ceux des humains

GPT-4o de OpenAI confronté à des problèmes de régression, performance à la hauteur de GPT-4o Mini

Soutenez notre effort ❤️

Scott Pilgrim EX : Bryan Lee O’Malley est de retour dans Dawn of Metal Scott

Onslaught d’Adam Wingard : La Suite Spirituelle de The Guest

Les Anneaux de Pouvoir S3 introduit des proto-Spectres de l’Anneau ; Lawless lance Xena

Ray Gunn de Brad Bird : la bande-annonce Comic-Con semble plus grande que l’animation

Meilleurs Joueurs de Coups de Pied Arrêtés pour FC 26 — FC Évolution

Xbox Free Play Days juillet 2026 Jeux gratuits dates et comment jouer

Meilleurs Milieux de Terrain d’Élite pour FC 26 Meilleurs Joueurs pour l’Évolution

FC 26 Festival du Football : Toutes les récompenses SBC de Choix de Joueur 93+ (1/4)

Comment cuisiner chaque recette de DragonSword : Awakening

Top 26 FC Players – Le Guide de l’Évolution du Métronome

Pannes du PlayStation Network aujourd’hui alimentent le contrecoup croissant

Emplacement de la carte du phare de Fortnite : Où le trouver

FC 24 FUTTIES Best-of Réédition Lot 1 : Joueurs et Comment les Obtenir

Codes de Défense de Jouets Juillet 2026 — Codes de Rachat & Récompenses les Plus Récentes