DeepSeek, cette startup chinoise inconnue il y a encore quelques semaines, déchaîne les passions avec ses modèles d'IA à la fois puissants, économes et frugaux.
![]() |
L’IA chinoise qui fait trembler la tech américaine
Conçue avec une approche radicalement différente, l'IA DeepSeek se distingue par sa frugalité exceptionnelle, tant sur le plan économique que technologique. En effet, DeepSeek V3 a été développé avec un budget modeste de 5,6 millions de dollars, soit 20 fois moins que des projets concurrents comme GPT-4. En outre, il s'appuie sur des équipements hardware anciens, interdits d'exportation en Chine en raison des restrictions américaines, transformant ainsi une contrainte en avantage compétitif.
Ce modèle remet en question l’idée qu’il faut des ressources colossales pour créer des IA performantes. Ses résultats spectaculaires font vaciller les géants de la tech américaine, provoquant notamment une chute vertigineuse des actions de Nvidia, leader des semi-conducteurs, sur le marché boursier. Cette secousse résonne également comme un signal d’alarme pour l’ensemble du secteur, confronté à une remise en question de ses fondements.
Mais DeepSeek ne se limite pas à une prouesse technologique. Ses implications politiques et économiques sont également majeures. Le projet soulève des questions complexes sur la censure, la souveraineté numérique et les avantages offerts par son architecture open source.
DeepSeek est-il de nature à bousculer l'échiquier mondial de l’intelligence artificielle ?
Transcription :
[0:01] C'est l'énorme buzz du moment. DeepSeek, une startup chinoise sortie de nulle part, est en train de provoquer une onde de choc mondial dans le monde de l'IA et de paniquer notamment les big tech américaines.
[0:14] DeepSeek qui signifie littéralement recherche profonde. C'est cette entreprise chinoise qui a lancé en décembre dernier un premier modèle de langage LLM, DeepSeek V3, qui a commencé à attirer l'attention des spécialistes. Je vous en avais parlé début janvier. Il a une grosse particularité, des performances impressionnantes, alors qu'il aurait coûté 20 fois moins cher à mettre au point à peine 5,6 millions de dollars contre 80 millions pour le GPT-4 par exemple.
[0:44] DeepSync a été entraîné sur des cartes graphiques Nvidia dépassées, enfin un peu old school à base de puces H800 au lieu des composants de dernière génération, mais qui sont interdits d'exportation en Chine du fait de l'embargo américain sur les semi-conducteurs. Ça, c'était donc fin décembre. Le 20 janvier, deuxième effet Kiss Cool, DeepSync lance un nouveau modèle, un deuxième modèle baptisé R1, encore plus puissant et tout aussi frugal et économe. Disponible notamment sous forme d'application mobile qui a soudain battu des records de téléchargement. L'appli s'est classée numéro 1 devant ChatGPT en moins d'une semaine. A partir de là, patatras, le monde de la tech se demande tout d'un coup s'il n'y a pas un problème avec le discours ambiant emprunt de gigantisme qui laisse entendre qu'il faut toujours plus d'argent et toujours plus de puissance informatique
[1:32] pour créer des intelligences artificielles puissantes. L'affaire prend une tournure financière et politique. Les firmes américaines d'intelligence artificielle dévisse en bourse, en tête la toute-puissante Nvidia avec une chute assez spectaculaire de 17% au Nasdaq, le marché des valeurs technologiques, le 27 janvier. Sam Altman, le patron d'OpenAI, reconnaît les performances de DeepSync. L'investisseur Marc Andreessen évoque un moment Spoutnik, en référence à l'époque où l'Amérique avait pris un coup sur la tête parce que les Russes venaient de lancer le premier satellite spatial alors qu'ils préparaient eux-mêmes la conquête de l'espace en étant persuadés qu'ils seraient les premiers et les meilleurs.
[2:10] D'ailleurs, Donald Trump lui-même, qui pourtant a récemment fanfaronné devant
[2:13] la Chine avec son projet Stargate, parle d'un signal d'alarme pour la tech américaine. Bref, panique à bord. Et ce qui est étonnant aussi, c'est de voir l'emballement médiatique à propos de cette affaire. Tous les médias en parlent, y compris d'ailleurs en Chine, dans les médias d'information et sur les réseaux sociaux. Alors que le gouvernement chinois n'est pas lié directement à DeepSic, le Premier ministre s'est rendu sur place à Hangzhou, au siège de la société, pour comprendre ce qui était en train de se passer.
[2:40] DeepSic, c'est une entreprise qui a été créée en 2023 par un jeune geek génial, apparemment baptisé Liang Wengfen. Né en 1985, qui se dit convaincu que l'IA va changer le monde. Bref, il y croit dur comme fer. DeepSync n'est pas une très grosse entreprise, à peine 150 ingénieurs, moins bien payé en plus qu'à San Francisco ou à New York, très certainement, ce qui ajoute encore au côté bon marché de cette IA de compétition.
[3:04] Bien sûr, DeepSync bénéficie de la chance du challenger, on va dire, qui arrive après ceux qui ont ouvert la voie à coup de milliards. Mais ce qui est étonnant aussi, c'est de voir comment une contrainte, c'est-à-dire l'interdiction d'accéder aux meilleurs outils hardware, est devenue un avantage en faisant éclore une technologie plus frugale et tout aussi performante. D'ailleurs, comment ça marche ? DeepSync repose sur une architecture modulaire, c'est-à-dire qu'il se décompose en différents sous-modèles de langage spécialisés dans des tâches spécifiques. Et lorsqu'on effectue une requête, l'outil fait appel seulement aux parties du modèle qui sont nécessaires. Ça limite l'utilisation des ressources. En plus, il a été entraîné par distillation, c'est-à-dire en s'appuyant sur les réponses de modèles existants comme ChatGPT, GPT-4 ou Lama. Autrement dit, merci quand même OpenAI et Meta.
[3:55] Cela dit, il y a quand même un hic. Parce que malgré ses apparentes qualités, Dipsy a un problème, en tout cas du point de vue occidental. C'est qu'il est parfaitement conforme à la censure chinoise. Quand on l'interroge sur des questions qui fâchent, par exemple sur la nature du régime chinois, sur l'action du premier ministre chinois, sur le sort réservé aux Ouïghours, ou encore sur ce qui s'est passé à Plastien-Hemmène en 1989.
[4:20] L'outil fait des réponses politiquement correctes ou même parfois refuse carrément de répondre. Avec un petit bémol toutefois, assez intéressant, des journalistes britanniques du Guardian ont testé Dipsic en lui demandant de formuler ses réponses avec le langage « let's speak ». C'est un truc de geek qui consiste à remplacer certaines lettres par des chiffres, par exemple 4 à la place de A ou 3 à la place de E. Et là, surprise, Dipsic oublie alors d'être politiquement correct et il répond sans filtre aux questions qu'on lui pose. C'est intéressant parce que ça laisse penser que les réponses sont censurées, mais l'entraînement initial du modèle, lui, serait complet. Autrement dit, il disposerait bien des connaissances dont tout un chacun pourrait avoir besoin, mais simplement, il refuse de les donner lorsqu'on l'interroge,
[5:07] car c'est la règle en Chine. En outre, concernant toujours ce problème de censure, il faut préciser aussi que DeepSync est disponible également en version téléchargeable, C'est-à-dire que n'importe qui ou presque peut récupérer le moteur pour le faire tourner sur ses propres serveurs, sans connexion avec les serveurs chinois. Il est distribué sous licence open source. On peut en faire ce qu'on veut. Voilà qui ouvre des perspectives pour les startups qui voudraient bénéficier de la puissance de ce nouvel outil.
[5:36] Alors, DeepSeek est-il de nature à redéfinir le paysage mondial de l'intelligence artificielle ? Peut-il vraiment faire concurrence aux ténors du secteur, comme Chagipiti ou Jiminy de Google, qui, eux, fonctionnent sur des modèles propriétaires non open source ? Est-ce une Ferrari qui va ringardiser les actuels Rolls-Royce de l'IA ? Va-t-on assister à une guerre de l'intelligence artificielle, en tout cas à une nouvelle bataille dans cette guerre planétaire ? Et puis, pourquoi est-ce que ce ne sont pas des Européens, par exemple comme les Français de Mistral ou les Allemands d'Alef Alpha, qui ont eu l'idée de créer ce genre de modèle ultra-léger, comme dit Psyk ? Ça aurait été bien ? Bref, autant de questions posées aujourd'hui par l'arrivée de ce nouvel acteur qui apparaît vraiment comme un chien dans un jeu de quilles et dont on n'a sans doute pas fini de voir les dégâts et les effets collatéraux.