En ce début d’année, une nouvelle venue fait une entrée fracassante sur la scène de l’intelligence artificielle. DeepSeek, développée par l’entreprise chinoise du même nom, est un modèle d’IA open source qui n’a rien à envier à ses rivales comme ChatGPT ou Gemini. Conçue avec un budget limité et en contournant astucieusement les restrictions américaines, le moins que l’on puisse dire c’est qu’elle a réussi à faire parler d’elle en un temps record ! Et si DeepSeek attire tous les regards, elle suscite également des débats enflammés. Est-ce qu’une nouvelle étoile est née ? En tout cas ne chose est sûre, elle a déjà fait son premier pas sur la piste de danse…
__
Une invitée inattendue
DeepSeek n’est pas le fruit du hasard. Elle s’inscrit dans une stratégie chinoise visant à réduire sa dépendance aux technologies occidentales, notamment dans le domaine de l’innovation. Fondée en 2023 par Liang Wenfeng, le parcours de cette entreprise débute en novembre de la même année avec le lancement de DeepSeek Coder, suivi de DeepSeek LLM, puis de DeepSeek-V2 et V3 en mai et décembre 2024.
Mais c’est le mois de janvier 2025 qui a mis un coup de projecteur sur cette société chinoise avec l’annonce de DeepSeek-R1, qui aurait été développée avec seulement 5,6 millions de dollars. Bien que cette somme puisse sembler colossale à titre individuel, elle reste dérisoire en comparaison aux coûts de développement des modèles américains. Un écart non négligeable qui questionne sur les investissements massifs engagés dans ce domaine au pays de l’oncle Sam.
La prouesse technologique réside aussi dans l’utilisation des processeurs graphiques américains (GPU) utilisés pour entrainer ce modèle. DeepSeek affime avoir utilisé environ deux mille cartes américaines Nvidia H800, une version bridée des H100. A titre de comparaison, OpenAI aurait utilisé plus de 10 000 puces H100 pour former ses modèles GPT-4 et GPT-4o. Pas mal pour une nouvelle non ?
__
Se démarquer de ses rivales
Techniquement, ce nouveau modèle de DeepSeek emploie une chaîne de raisonnement développant des étapes logiques successives aux requêtes. Concrètement, cela signifie que DeepSeek-R1 utilise un processus en plusieurs étapes pour arriver à une réponse souvent appelée « chaîne de pensée ». Au lieu de répondre directement, il décompose la question en petites parties et résout chacune d’elles avant de donner une réponse complète. Cette approche permet d’apporter des réponses plus précises et mieux adaptées à certaines requêtes.
Une arrivée à la pointe qui inquiète les entreprises occidentales car il menace leur modèle économique. Son approche open source pourrait inciter d’autres acteurs à ouvrir leurs technologies pour rester compétitifs. Aussi, en offrant un accès plus abordable à une IA avancée, DeepSeek pourrait devenir une référence dans les pays émergents qui n’ont pas les moyens d’accéder aux solutions américaines.
__
Entre rumeurs et controverses
La controverse la plus vive entourant l’arrivée de cette IA concerne l’utilisation des puces Nvidia H800, spécialement conçues pour contourner les restrictions américaines. Depuis 2022, Washington a imposé des sanctions visant à limiter l’exportation de semi-conducteurs avancés, notamment les Nvidia A100 et H100. Pourtant, ces mesures n’ont pas empêché DeepSeek de s’inviter au bal et de rester dans la course, remettant en question l’efficacité de la stratégie américaine.
Une autre polémique entoure DeepSeek, cette fois-ci sur le terrain de la censure et de la protection des données. Comme tout modèle développé en Chine, l’IA est soumise aux directives strictes de Pékin. Certains sujets sensibles, comme la répression de Tian’Anmen en 1989 ou la question de l’indépendance de Taïwan, sont soigneusement éludés, confirmant les craintes d’un filtrage idéologique. Mais au-delà de la censure, c’est la gestion des données personnelles qui inquiète. Les serveurs de DeepSeek étant basés en Chine, les soupçons de surveillance massive se multiplient. Des craintes renforcées par les conditions générales d’utilisation de l’IA, qui précisent la collecte d’un large éventail de données.
Face à ces préoccupations, plusieurs pays ont déjà pris des mesures. Aux États-Unis, la Marine américaine a interdit l’usage de DeepSeek à ses employés, tandis qu’en Italie, la plateforme a été suspendue pour le moment. Taïwan a également interdit son utilisation au sein des agences gouvernementales, invoquant des risques pour la sécurité nationale. Autant de barrières qui pourraient freiner son adoption à l’international et limiter son rayonnement face aux modèles occidentaux.
__
Un bras de fer qui continu
Cette arrivée remarquée confirme aujourd’hui que la Chine est en capacité de rattraper son retard en matière d’innovation technologique et de pouvoir proposer une alternative aux modèles américains. Mais ces derniers ne comptent pas se laisser piquer la vedette aussi facilement. Washington pourrait encore resserrer les règles du jeu, et les tensions technologiques entre la Chine et les États-Unis risquent d’alimenter la compétition. DeepSeek a peut-être réussi son entrée, mais la soirée ne fait que commencer. Reste à voir qui va gagner la couronne…
__