DeepSeek : l’IA générative Open Source made in China

Le 20 janvier 2025, l’entreprise chinoise DeepSeek a lancé son LLM Open Source DeepSeek R1, bousculant le secteur de l’IA et les marchés financiers. Fondée en 2023 par Liang Wenfend, l’entreprise avait déjà lancé son modèle DeepSeek V3 en décembre 2024, rentrant ainsi dans la course technologique à l’intelligence artificielle. Les premières utilisations du modèle démontrent des performances considérables pour un modèle Open Source qui est moins énergivore et qui aurait été développé avec peu de ressources. Son déploiement massif soulève néanmoins de nombreuses inquiétudes quant à l’éthique et à la sécurité.

L’IA générative à moindre coût ?

L’une des particularités essentielles des modèles V3 et R1 de DeepSeek est leur faible coût de développement. À titre de comparaison, le développement du modèle GPT-4 d’Open AI aurait nécessité un investissement de 100 millions à 1 milliard de dollars, contre 5.6 millions de dollars annoncés par l’entreprise chinoise. Cette annonce doit néanmoins être traitée avec la plus grande précaution, puisque l’entreprise indiquait précédemment sur son site que ce montant ne représentait que l’entraînement de son modèle. L’entreprise chinoise affirme avoir pu réduire drastiquement le coût de développement de son modèle en utilisant des puces Nvidia H800, seules puces autorisées à l’export vers la Chine mais moins performantes. Plusieurs débats ont émergé face à ces annonces, affirmant que le coût de production avoisinerait davantage 100 millions de dollars et que l’entreprise chinoise aurait pu se procurer en quantité des puces Nvidia A100 ou H100. Quelques jours après l’annonce du projet Stargate lancé par l’administration Trump, le lancement d’un LLM moins énergivore et moins coûteux relance la compétition sino-américaine et bouscule tout le secteur de l’IA. En conséquence de l’arrivée de DeepSeek R1, Nvidia a vu son action chuter de 16.97 % lundi 27 janvier 2025 soit 589 milliards de dollars de capitalisation boursière. D’autres entreprises ont été impactées, telles que Microsoft qui a subit une perte de 4% et Meta avec une perte de 2%.

Un modèle Open Source performant

Comptabilisant 1,6 million de téléchargements samedi dernier, passant ainsi devant ChatGPT, le modèle DeepSeek est un modèle Open Source gratuit, contrairement à son principal concurrent. Ce choix a été fait pour inciter les utilisateurs à se tourner vers une solution moins chère, plus facile d’accès et qui laisse plus de place à la personnalisation. Mis à disposition sous une licence MIT, le modèle peut être étudié et modifié librement par tous, incitant la prise en main par un plus grand nombre d’utilisateurs. Cette démarche démontre la volonté de l’entreprise chinoise d’atteindre un déploiement de masse, y compris dans les zones qui n’étaient pas en capacité financière d’acquérir des solutions d’IA plus coûteuses mais tout aussi performantes. Comme le démontrent les derniers benchmarks, DeepSeek R1 fait preuve de performances qui rivalisent largement avec les derniers modèles d’OpenAI, en particulier dans la résolution de problèmes mathématiques et dans la génération de code. Le ChatBot Arena, développé par l’Université de Berkeley, place par ailleurs les modèles R1 et V3 de DeepSeek dans son top 10, aux côtés des modèles GPT-O1 et Gemini.

Un modèle d’IA sous contrôle ?

Si le modèle démontre une performance remarquable, de nombreux biais ont déjà été constatés par les utilisateurs, qui ont pu l’interroger sur des thématiques telles que Taïwan ou les manifestations de Tian’anmen. Les tests effectués font tous état d’absence de réponses, d’informations erronées, ou encore de réponses partielles qui sont rapidement effacées par le modèle, rappelant la censure du régime chinois mais également sa volonté d’influence. Cherchant à contrer ces blocages, des tentatives se sont rapidement mises en place pour tenter de « jailbreaker » le modèle et de le forcer à répondre. Son utilisation fait par ailleurs remonter des inquiétudes liées à la sécurité et à l’éthique en raison des données collectées et traitées par le modèle. À date, DeepSeek R1 n’est pas jugé compatible avec la réglementation européenne, en particulier avec le RGPD. La CNIL italienne a émis des interrogations quant au traitement des données des utilisateurs ce mercredi 29 janvier 2025, ce qui a conduit à l’interdiction du modèle en Italie. Tandis que Donald Trump a qualifié ce bousculement technologique de « réveil » pour les entreprises américaines, le modèle a parallèlement été interdit au sein de la marine nationale des Etats-Unis au titre de la protection de la sécurité nationale.

Le Guillou Zoé

Pour aller plus loin :