Deepseek V3-0324 bat First les modèles rivaux AI en Open-source
Deepseek V3-0324 est devenu le modèle non renvoyé le plus élevé sur le Indice d’intelligence d’analyse artificielle Dans une réalisation historique pour l’IA open-source.
Le nouveau modèle a avancé sept points de la référence pour dépasser les homologues propriétaires tels que Google Gemini 2.0 ProAnthropic Claude 3.7 Sonnetet des méta- Lama 3.3 70b.
Tandis que la V3-0324 suit les modèles de raisonnement, y compris la propre R1 de Deepseek et les offres d’Openai et Alibabala réalisation met en évidence la viabilité croissante des solutions open source dans les applications sensibles à la latence où les réponses immédiates sont essentielles.
Deepseek V3-0324 représente une nouvelle ère pour l’Open-source AI
Les modèles non de course – qui génèrent des réponses instantanément sans phases de «réflexion» délibératives – sont essentielles pour des cas d’utilisation en temps réel comme les chatbots, l’automatisation du service client et la traduction en direct. La dernière itération de Deepseek établit désormais la norme pour ces applications, éclipsant même les principaux outils propriétaires.
«C’est la première fois qu’un modèle de poids ouvert est le premier modèle non-renvoi, une étape importante pour l’open source», indique une analyse artificielle. Les performances du modèle se rapprochent des modèles de raisonnement propriétaire, bien que ces derniers restent supérieurs pour les tâches nécessitant une résolution de problèmes complexes.
Deepseek V3-0324 conserve la plupart des spécifications de son prédécesseur de décembre 2024, notamment:
- Fenêtre de contexte 128k (plafonnée à 64K via l’API de Deepseek)
- 671 milliards de paramètres totaux, nécessitant plus de 700 Go de mémoire GPU pour la précision FP8
- 37 milliards de paramètres actifs
- Fonctionnalité en texte uniquement (pas de support multimodal)
- Licence MIT
« Toujours pas quelque chose que vous pouvez courir à la maison! » L’analyse artificielle ironise, mettant l’accent sur ses exigences d’infrastructure de qualité d’entreprise.
L’IA open source apporte la chaleur
Tandis que des modèles de raisonnement propriétaire comme Deepseek R1 Maintenir la domination dans l’indice d’intelligence plus large, l’écart se rétrécit.
Il y a trois mois, Deepseek V3 correspondait presque aux modèles propriétaires d’Anthropic et de Google, mais n’a pas réussi à les dépasser. Aujourd’hui, la V3-0324 mise à jour mène non seulement des alternatives open source, mais surpasse également tous les rivaux propriétaires non renvoyants.
«Cette version est sans doute encore plus impressionnante que R1», explique l’analyse artificielle.
La progression de Deepseek signale un changement dans le secteur de l’IA, où les cadres open source rivalisent de plus en plus avec les systèmes fermés. Pour les développeurs et les entreprises, le V3-0324 sous licence MIT propose un outil puissant et adaptable, bien que ses coûts de calcul peuvent limiter l’accessibilité.
«Deepseek conduit désormais à la frontière des modèles de poids ouverts non remontés», déclare une analyse artificielle.
Avec R2 à l’horizon, la communauté attend un autre saut potentiel dans la performance de l’IA.
(Photo de Paul Hanaoka)
Voir aussi: Étreindre le visage des appels à la mise au point open source dans le plan d’action de l’IA

Vous voulez en savoir plus sur l’IA et les Big Data des leaders de l’industrie? Vérifier AI et Big Data Expo se déroulant à Amsterdam, en Californie et à Londres. L’événement complet est colocalisé avec d’autres événements de premier plan, notamment Conférence d’automatisation intelligente, Blockx, Semaine de transformation numériqueet Cyber Security & Cloud Expo.
Explorez d’autres événements et webinaires de technologie d’entreprise à venir alimentés par Techforge ici.
