De la contrainte naît la créativité. Une maxime que pourrait faire sienne la Chine. Confronté depuis deux ans aux sanctions américaines sur la vente de puces les plus avancées destinées à l’intelligence artificielle, le pays vient de réaliser une prouesse technique avec le robot conversationnel lancé par l’entreprise DeepSeek. Le fondateur de la start-up basée à Hangzhou, Liang Wengfeng, n’aurait en effet dépensé que 5,6 millions de dollars pour développer son robot conversationnel R1, une somme dérisoire par rapport aux milliards investis par les géants de la tech américains.
En outre, il n’aurait utilisé qu’environ 2000 puces Nvidia H800, moins puissantes que celles de dernière génération car conçues pour se conformer aux contrôles d'exportation américains publiés en 2022. Des affirmations toutefois mises en cause par certains spécialistes, à l’instar du chercheur américain spécialiste des puces Chris Miller, qui affirme que l'application de DeepSeek aurait été conçue à l'aide de 50000 puces Nvidia H100 de dernière génération, arrivées en Chine par contrebande. Dans tous les cas, on reste là encore loin des quelques centaines de milliers de puces utilisées pour l’apprentissage de ChatGPT.
Une chute des valeurs boursières américaines de la tech... et de l'énergie
La mise en lumière du robot conversationnel R1 de DeepSeek (qui s'est placé en tête des téléchargements sur l'App Store américain à son lancement) a entraîné l’effondrement temporaire de plusieurs valeurs boursières américaines du secteur de la tech, dont Nvidia. En cause, des investisseurs s'inquiétant du fait que le modèle de DeepSeek avait égalé des rivaux tels qu'OpenAI en utilisant beaucoup moins de puces. Ce que dément la société américaine, qui a déclaré ce 28 janvier que «l'inférence», c'est-à-dire l'utilisation du robot conversationnel de DeepSeek, «requiert un nombre significatif de GPU Nvidia et de réseau de haute performance».
L'arrivée de R1, et son approche plus frugale, peut-elle remettre en cause la consommation énergétique exponentielle des centres de données ? «L’application est aussi efficace que ChatGPT, tout en consommant dix fois moins d’énergie à l’usage», se réjouit Kévin Polizzi, président de l’entreprise marseillaise Unitel cloud services. Un calcul à nuancer. «L’application de DeepSeek étant disponible en open source, la multiplication des projets qui pourrait en découler nécessitera une puissance de calcul considérable. C’est le fameux paradoxe de Jevons (également appelé effet rebond)», estime ainsi le cofondateur de la start-up marseillaise Sesterce Youssef El Manssouri. Le spécialiste de la location de capacité de calcul évoque notamment les déclarations enthousiastes du président directeur général de Hugging Face qui envisage déjà le développement d’une dizaine de nouveaux projets à partir du modèle de DeepSeek accessible sur sa plateforme. Jérôme Billois, expert chez Wavestone, insiste sur le fait que DeepSeek doit encore faire la preuve de la réplicabilité à grand échelle de sa technologie d’apprentissage, tout en saluant une réelle avancée «scientifique et technique» en faveur de moteurs d’intelligence artificielle «plus efficaces et moins énergivores».
Signe des questionnements qui agitent le secteur de l’énergie et des centres de données depuis l’irruption de DeepSeek, les titres des géants américains de l'énergie ont chuté en parallèle à ceux du secteur de la tech. Le groupe Constellation Energy, qui a scellé en 2023 un accord avec Microsoft pour le fournir en électricité, a ainsi perdu plus de 20% le 27 janvier sur le Nasdaq. Micro-secousse ou début d'un électrochoc plus durable ? Il faudra un peu de temps pour le savoir.



