Alibaba vient de dévoiler son dernier modèle de raisonnement, et il semble que Deepseek et Openai pourraient avoir quelque chose à craindre – du moins si toutes les promesses d’Alibaba se révèlent. C’est open-source, alors je l’ai vérifié. Vous pouvez également l’essayer gratuitement, bien que sans surprise, vous constaterez qu’il y a des choses dont il ne vous parlera pas.
Le nouveau modèle, surnommé QWQ-32B (Quan-with-Questions), fonctionne sur beaucoup moins de paramètres, ce qui signifie qu’il nécessite moins de ressources, mais Alibaba affirme qu’il fonctionne au même niveau que Deepseek ou O1-MinI d’Openai.
Vidéos recommandées
Le modèle de grande langue R1 de Deepseek (LLM) a été à portée de main plus tôt en février lorsqu’il est sorti, soudainement capable de rivaliser avec le standard en or fixé par Chatgpt et d’autres alternatives, mais à un coût beaucoup plus faible. Il semble qu’Alibaba puisse pousser les limites encore plus loin ici.
Comme expliqué par S’aventurerDeepseek-R1 nécessite 671 milliards de paramètres pour fonctionner, dont 37 milliards sont activés. Pendant ce temps, le nouveau QWQ-32B d’Alibaba peut se débrouiller avec 32 milliards de paramètres. Ces chiffres sont totalement abstraits pour beaucoup, mais il y a une énorme différence de puissance de calcul; Alors que Deepseek R1 nécessite 1600 Go de VRAM pour fonctionner, QWQ-32B peut s’en sortir avec seulement 24 Go de VRAM. Dans la plupart des cas, cela signifiera H100 ou équivalents de Nvidia, mais même le RTX 4090 sportif axé sur le jeu. Le dernier RTX 5090 augmente à 32 Go.
Le QWQ-32B d’Alibaba est disponible sous une licence Apache 2.0, ce qui signifie que les entreprises et les chercheurs peuvent l’utiliser. Plus important encore, nous peut l’utiliser en essayant Chat qwen. Comme Deepseek, il est livré avec certaines limites, mais a également quelques avantages immédiats que j’ai remarqués assez rapidement.
Il semble donner des réponses assez approfondies même à des questions simples et simples. Cela peut être bon, mais d’une certaine manière, c’était surtout ennuyeux car cela vous donne beaucoup de contexte inutile que vous n’avez pas demandé. J’aime le fait que cela vous montre tout son processus de raisonnement, qui est similaire à la fonction de pensée profonde de Chatgpt – mais avec beaucoup moins de profondeur.
Interrogé sur les questions politiques, Qwen Chat l’a signalé comme inapproprié. Il pourrait y avoir des moyens de le jailbreaker – c’était possible avec Deepseek, après tout – mais je n’ai pas encore réussi.
Il reste à voir si les affirmations d’Alibaba se révèlent être vraies, mais il semble que Chatgpt et Deepseek aient maintenant un nouveau rival.