IBM fait une entrée fracassante dans la course aux puces d’intelligence artificielle. Le géant d’Armonk (Etats-Unis) n’est plus présent dans la fabrication de semi-conducteurs, mais garde une activité de conception sur un modèle "fabless". Dans ce cadre, le groupe a profité de la conférence Hop Chips, qui s’est déroulée à Stanford, en Californie, du 22 au 24 août, pour dévoiler son premier processeur d’inférence Telum.
Il est le fruit d’un développement de trois ans mené en partenariat avec le fondeur sud-coréen Samsung, qui va fabriquer la puce en technologie de 7 nanomètres. Il est dédié tout particulièrement à la lutte en temps réel contre la fraude lors des opérations bancaires, financières, d’assurance ou lors des interactions avec les clients.
11 milliards de transistors
Les techniques actuelles de détection s’appliquent généralement après que la fraude se soit produite. Un processus qui peut prendre du temps et nécessiter des calculs intensifs, surtout lorsque l'analyse et la détection s’effectuent loin des transactions et des données critiques. Les exigences de latence font que la détection de fraudes complexes ne peut souvent pas être effectuée en temps réel, ce qui signifie qu'un acteur malveillant pourrait avoir déjà acheté avec succès des biens avec une carte de crédit volée avant que le détaillant ne s'aperçoive de la fraude.

- 47515.45-2.38
Mars 2026
Cours mensuel de l'étain - settlement$ USD/tonne
- 8.0353-0.03
15 Avril 2026
Yuan chinois (CNY) - quotidien¥ CNY/€
"Telum peut aider les clients à passer d'une posture de détection de la fraude à une posture de prévention de la fraude, en évoluant de la détection de nombreux cas de fraude aujourd'hui, à une ère potentiellement nouvelle de prévention de la fraude à grande échelle, sans impact sur les accords de niveau de service, avant que la transaction ne soit terminée", explique IBM dans le communiqué.
CONNIE ZHOU Module de calcul à deux puces Telum. Crédit photo: IBM
Big Blue revendique une conception innovante tirant parti de l’apprentissage profond (deep learning). Cadencé à une fréquence 5 GHz, son processeur Telum réunit huit cœurs de traitement avec accélérateurs de calcul qui portent la puissance de traitement à 6 teraflops (1 teraflops vaut 1000 milliards d’opérations en virgule flottante par seconde). Il réunit 11 milliards de transistors et fait appel à 15 Km d’interconnexions métalliques sur 17 couches. Deux exemplaires sont assemblés dans un module de calcul.
Nvidia domine le marché
Le processeur Telum ne se destine pas à la vente. Il est voué exclusivement au marché captif d’IBM (comme chez Google, Amazon, Tesla, Alibaba, Baidu ou Huawei). Il équipera la prochaine génération de gros ordinateurs centraux Z15 et serveurs à haute performance LinuxONE de Big Blue, prévus en 2022. Ce lancement marque néanmoins un point d’inflexion important sur le marché des puces d’intelligence artificielle, et un sacré défi à Nvidia qui domine le segment dédié aux data centers et au cloud.
Selon le cabinet Omdia, le marché mondial devrait bondir de 4 milliards de dollars en 2020, à 37,6 milliards de dollars en 2026. En 2020, Nvidia s’est arrogé 80% du gâteau. Il est suivi par Xilinx, Google, Intel et AMD. Le Top 5 est exclusivement américain. Avec sa puce Telum, IBM pourrait-il venir bousculer ce classement? Pas impossible.
Marché des puces d'intelligence artificielle pour data centers et cloud (Source: Omdia)
Omdia 


