• Contact
  • Connexion

L’irruption de DeepSeek, ou la nécessité de repenser la souveraineté numérique

L’économiste Cecilia Rikap décrypte ici l’irruption de la start-up chinoise DeepSeek dans le secteur de l’intelligence artificielle, son impact récent sur les marchés financiers, et les enjeux de souveraineté numérique qu’elle soulève.

600 milliards de dollars. C’est la chute de la valorisation boursière de Nvidia le lundi 26 janvier. Au cours du week-end précédent, l’application d’intelligence artificielle (IA) de la start-up chinoise DeepSeek était devenue l’application gratuite la plus téléchargée aux États-Unis. La capitalisation boursière de Nvidia n’a pas été la seule à s’effondrer ce lundi-là en raison de cette nouveauté chinoise. Toutes les grandes entreprises technologiques américaines ont connu des chutes importantes, bien que moins spectaculaires, entraînant une perte totale d’un trillion de dollars en une seule journée.

Cette surréaction boursière—en partie corrigée dans les jours suivants—ne s’explique pas par le fait que le modèle R1 de DeepSeek soit meilleur que les modèles existants. En réalité, R1 ne présente pas de différences significatives avec les autres modèles d’IA générative de pointe, notamment ChatGPT. Mais le fait qu’un modèle chinois soit considéré aussi performant que ChatGPT et les autres modèles américains est, sans aucun doute, une nouveauté majeure. C’est également une raison géopolitique suffisante pour faire vaciller la valeur boursière des plus grandes entreprises américaines—qui sont aussi les plus grandes du monde.

Cependant, le fait que DeepSeek soit chinois n’est qu’une partie de l’explication. La véritable raison pour laquelle non seulement la bourse mais aussi Trump et tout le système global de développement de l’IA générative dominé par les États-Unis ont été ébranlés est que DeepSeek R1 a été beaucoup moins coûteux à produire et, en prime, est partiellement accessible en open source, permettant à d’autres de le télécharger et de l’utiliser pour développer leurs propres applications. De plus, il est proposé à un coût inférieur à celui du modèle Llama de Meta—également en accès semi-ouvert—lorsqu’il est utilisé via les services cloud des autres géants technologiques.

Une IA low-cost

DeepSeek R1 est moins cher sous tous les angles. C’est le premier modèle de pointe qui a nécessité pour son entraînement une fraction de la puissance de calcul—et donc du coût—utilisée par les autres modèles de haut niveau.

La start-up chinoise a utilisé une technique d’apprentissage pour les modèles d’IA appelée distillation. Dans ce contexte, la distillation consiste à extraire automatiquement les connaissances de modèles préexistants. Grâce à cette base, l’entraînement restant est plus court et chaque cycle d’entraînement requiert moins d’investissement, car le point de départ est bien meilleur que de repartir de zéro.

L’innovation ne réside pas dans la méthode elle-même, car cette technique était déjà utilisée auparavant. Cependant, jusqu’à présent, elle ne produisait que des modèles plus petits, moins performants que les originaux. DeepSeek, bien qu’il ait un nombre réduit de paramètres (ce qui le rend également plus économique à utiliser), parvient à rivaliser avec les modèles les plus avancés.

Bien qu’il soit impossible d’établir une comparaison directe avec le coût d’entraînement des modèles comme GPT d’OpenAI ou Llama de Meta—puisque nous devrions connaître le coût total de production de DeepSeek R1, une information tenue secrète—il est évident que DeepSeek produit de l’IA low-cost. La dernière phase d’entraînement n’a nécessité que 5,6 millions de dollars. C’est ici que la start-up chinoise remet en cause le paradigme du développement de l’IA générative imposé par les géants technologiques américains.

Qui perd et qui gagne (encore) ?

Découvrir qu’il est possible de développer des modèles de pointe sans accumuler une quantité colossale de semiconducteurs d’IA de dernière génération et des volumes de données tout aussi gigantesques met en péril le modèle économique de Nvidia, une entreprise presque entièrement dédiée à la conception de ces puces électroniques. D’où l’effondrement de sa capitalisation boursière.

En revanche, la chute en bourse d’Amazon, Microsoft et Google ne signifie pas la fin de leur domination. Bien au contraire. Leur modèle économique ne repose pas principalement sur la vente de modèles d’IA – bien qu’ils en développent et en commercialisent aussi – mais sur le cloud. Autrement dit, le marché où ces modèles et d’autres technologies sont développés, utilisés et vendus. Ces entreprises bénéficient de l’expansion continue de l’adoption de l’IA, qui s’accélère encore avec l’arrivée de DeepSeek.

Le cloud fonctionne comme une sorte d’espace de co-working ou d’usine virtuelle où des services numériques sont produits et consommés grâce aux données téléchargées. Dans un contexte de méfiance à l’égard de la Chine, il est peu probable que les entreprises et gouvernements adoptent DeepSeek pour traiter leurs données. En revanche, que des utilisateurs l’adoptent gratuitement, y compris des milliers de développeurs cherchant à améliorer leur code ou à créer des applications, représente un marché bien différent de l’adoption de l’IA en cloud comme service personnalisé pour les entreprises et les États.

Dans ce contexte, la dépendance des start-ups occidentales en IA – des américaines OpenAI et Anthropic à la française Mistral – aux géants du Cloud s’accentue. Si auparavant, il était déjà difficilement envisageable pour ces entreprises d’opérer en dehors du cloud d’Amazon, Microsoft ou Google, cela devient désormais impossible. Ces géants ne sont pas seulement les principaux investisseurs en capital-risque des start-ups occidentales en IA générative, mais leurs infrastructures cloud concentrent également la demande croissante des entreprises, gouvernements et universités qui paient pour l’IA.

Pour OpenAI et les autres, se détacher signifierait perdre l’accès à cet écosystème de services. En réalité, leur principale différence avec DeepSeek réside dans leur intégration parfaite avec cet écosystème. Faire partie du cloud garantit que les services d’une start-up s’imbriquent parfaitement avec ceux déjà utilisés par les clients du cloud.

Cette compatibilité est le fruit du contrôle exercé par Amazon, Microsoft et Google sur toutes les start-ups de leurs écosystèmes, les forçant ainsi à payer une sorte de taxe privée pour proposer des services sur leurs plateformes. Aujourd’hui plus que jamais, développer des modèles sans la protection de ces géants technologiques — et surtout en utilisant des méthodes de développement plus coûteuses qui partent de zéro, contrairement à DeepSeek — n’est pas un modèle économique viable.

L’échiquier géopolitique du numérique

Pendant ce temps, OpenAI accuse la start-up chinoise d’avoir utilisé ses modèles — protégés par la propriété intellectuelle — pour distiller les connaissances nécessaires au développement de DeepSeek R1. Mais comme le dit l’adage, qui vole un voleur en est quitte pour cent ans de pardon — n’oublions pas qu’OpenAI a entraîné ses modèles linguistiques avec des millions de documents protégés par le droit d’auteur. Pourtant, Trump ne graciera certainement pas DeepSeek. En effet, depuis l’administration Obama, une tendance constante est que, à mesure que l’avance des États-Unis sur la Chine se réduit, la pression américaine sur le reste du monde pour bloquer la Chine augmente.

Les États-Unis ont tenté d’entraver le développement technologique chinois en matière d’IA en interdisant aux entreprises américaines et à celles qui souhaitent commercer avec les Etats-Unis de vendre des composants clés de la chaîne de valeur des semi-conducteurs — y compris les puces elles-mêmes — à la Chine. Mais avant l’entrée en vigueur de cette politique, la Chine a constitué des stocks de semi-conducteurs d’IA, une stratégie également suivie par le titulaire du fonds d’investissement qui finance DeepSeek. Et bien que la quantité de semi-conducteurs n’ait pas été suffisante pour suivre le paradigme en vigueur et que ceux-ci ne soient plus les semi-conducteurs les plus avancés du marché, la start-up a trouvé un moyen d’obtenir des résultats avec les semi-conducteurs dont elle disposait.

Une question reste ouverte : comment les États-Unis vont-ils réagir ? Un scénario probable est un renforcement des contrôles sur l’adoption des technologies chinoises dans le monde, et que DeepSeek subisse le même sort que Huawei avec la 5G. Cette dernière a été la première à développer la technologie, mais le gouvernement américain a bloqué un à un ses contrats en Occident, donnant ainsi à ses rivaux le temps d’imiter la technologie et de limiter la croissance du géant chinois des télécommunications.

Souveraineté numérique

Quelle que soit l’issue de la rivalité entre les deux puissances globales, l’émergence de DeepSeek R1 offre une opportunité de développer une IA publique par les pays non-alignés, en dehors des modèles dominants de contrôle et de concentration, tant américains que chinois. La possibilité de créer des modèles de pointe à moindre coût ouvre la voie à un projet international de développement technologique qui place au premier plan les besoins sociaux et les contraintes écologiques. L’importance centrale de ces technologies dans tous les domaines de la vie exige une solution publique et commune, qui soit utilisée, par exemple, par les écoles, les hôpitaux et autres institutions publiques.

Développer des modèles d’IA publics favorise également leur audit démocratique. Aujourd’hui, l’IA est développée dans une logique de rentabilité. Sans une intervention publique pour créer des modèles ouverts et audités, nous risquons de voir se multiplier des applications allant du contrôle et de la surveillance aux technologies qui remplacent la créativité humaine au lieu d’enrichir l’expérience de travail.

Chaque jour, nous sommes témoins des conséquences de la perte des espaces de délibération publique sur internet. Les réseaux sociaux fonctionnent avec des algorithmes d’IA qui déterminent quels messages sont affichés, où et quand, et lesquels ne le sont pas. De cette manière, une poignée d’entreprises influencent les perceptions collectives et l’opinion publique. Il est impératif que cela ne se reproduise pas dans l’adoption de l’IA par les États. En adoptant les techniques de distillation utilisées par DeepSeek, il devient possible, économiquement, de développer une IA publique, ouverte et auditable pour l’État, la santé et l’éducation publique.

Ce texte a d’abord été publié en espagnol pour la revue latino-americaine Nueva sociedad.

Voir en ligne L’irruption de DeepSeek, ou la nécessité de repenser la souveraineté numérique

Les opinions exprimées et les arguments avancés dans cet article demeurent l'entière responsabilité de l'auteur-e et ne reflètent pas nécessairement ceux du CETRI.


(Photo : Trong Khiem Nguyen CC https://www.flickr.com/photos/trongkhiem/54293160994)

Lire aussi ...

Batteries chinoises en course pour la transition, de l’Indonésie à l’Europe
Agnes Gagyi , Hao Zhang, Mads Barbersgaard, Pietje Vervest, Rachmi Hertanti 25-02-25
Les BRICS, vers un autre monde ?
Les BRICS, vers un autre monde ?
Laurent Delcourt, Vincent Gabriel 01-11-24
La terre ou la technologie ?
La terre ou la technologie ?
Laurent Delcourt 01-07-24
BRICS+ : une alternative pour le Sud global ? - Webinaire
BRICS+ : une alternative pour le Sud global ? - Webinaire
Agnès Adélaïde Metougou, Christophe Ventura, Laurent Delcourt, Martine Bulard 28-05-24
López Obrador : acto final
López Obrador : acto final
Humberto Beck, Patrick Iber 13-05-24
BRICS+ : entre discours et pratiques
BRICS+ : entre discours et pratiques
Jacques Briard, Laurent Delcourt 30-04-24