Microsoft revient sur le modèle de génération d'images Dall-E en réponse aux plaintes sur la qualité

Microsoft revient sur le modèle de génération d’images Dall-E en réponse aux plaintes sur la qualité

Microsoft a dû annuler sa dernière mise à jour de son système Bing Image Generation, qui a installé la dernière itération du modèle Dall-E d’OpenAI, appelée PR16, après que les utilisateurs de Bing se sont plaints avec véhémence d’une baisse de la qualité de l’image.

Depuis le lancement de Bing Image Creator au printemps dernier, les utilisateurs ont généré des milliards d’images avec des invites textuelles. Je suis heureux de partager nos dernières mises à jour pour améliorer votre expérience créative. À partir d’aujourd’hui, nous déployons le dernier modèle DALL-E 3 PR16, qui créera des images… pic.twitter.com/3p9HsYMlr6

– Jordi Ribas (@JordiRib1) 18 décembre 2024

Lorsque Microsoft a annoncé pour la première fois la mise à jour à la fin de l’année dernière, la société avait promis que le nouveau modèle serait « deux fois plus rapide qu’avant et avec une qualité supérieure ». Le responsable de la recherche de l’entreprise, Jordi Ribas, affirme que les tests d’évaluation internes de Microsoft ont déterminé que la qualité des images générées par le PR16 était « un peu meilleure en moyenne » que celle du précédent Dall-E PR13. Ce n’est pas ce que les utilisateurs ont vu. Un commentateur sur le subreddit Bing déploré, « Le DALLE [sic] que nous aimions, est parti pour toujours », car les deux images ci-dessous sont apparemment suffisamment différentes pour justifier une telle indignation ? Ça a l’air effrayant.

comparaison de la qualité d'image avant et après la mise à jour de Bing
Reddit

En réponse au tollé, Ribas a annoncé mardi que la société restaurerait le modèle de génération d’images sous-jacent de Bing à la version précédente jusqu’à ce qu’elle puisse résoudre les problèmes de qualité avec PR16. Cela pourrait cependant prendre quelques semaines.

Vidéos recommandées

« Nous avons pu [reproduce] certains des problèmes signalés et prévoyons de revenir au PR13 jusqu’à ce que nous puissions les résoudre », Ribas a écrit dans un article sur X. « Le processus de déploiement est malheureusement très lent. Cela a commencé il y a plus d’une semaine et il faudra encore 2 à 3 semaines pour atteindre 100 %.

Microsoft et OpenAI ne sont pas seuls dans leurs problèmes de générateur d’images. En février 2024, Google a dû désactiver temporairement le modèle d’image de Gemini après avoir commencé à renvoyer des représentations racistes de personnes de couleur, comme les nazis noirs.

En relation :  Comment utiliser le chat AI de Microsoft Bing dans n'importe quel navigateur Web
Moyens I/O Staff est une équipe professionnelle d'auteurs passionnés derrière nos contenus renommés. Nous offrons une couverture complète des dernières actualités et tendances en Tech, Apps mobiles, IA, Gaming, et autres. Notre objectif est de fournir des informations pertinentes et à jour pour vous tenir informé des évolutions majeures dans ces secteurs dynamiques. Que vous soyez passionné de nouvelles technologies ou de divertissement, Moyens.net est votre référence de qualité pour rester au courant des dernières évolutions numériques.