IBM défie Nvidia avec sa puce d’intelligence artificielle Telum

Avec son premier processeur d’inférence Telum, IBM s’engouffre dans la bataille des puces d’intelligence artificielle. Un marché dominé par Nvidia côté data centers et cloud. IBM vise tout particulièrement les applications de détection de fraudes en temps réel.

Ridha Loukil

Publié le 2 septembre 2021 à 09h00

Réservé aux abonnés

IBM processeur Telum — IBM s’engouffre dans la bataille des puces d’intelligence artificielle avec son processeur d’inférence Telum.

IBM fait une entrée fracassante dans la course aux puces d’intelligence artificielle. Le géant d’Armonk (Etats-Unis) n’est plus présent dans la fabrication de semi-conducteurs, mais garde une activité de conception sur un modèle "fabless". Dans ce cadre, le groupe a profité de la conférence Hop Chips, qui s’est déroulée à Stanford, en Californie, du 22 au 24 août, pour dévoiler son premier processeur d’inférence Telum.

Il est le fruit d’un développement de trois ans mené en partenariat avec le fondeur sud-coréen Samsung, qui va fabriquer la puce en technologie de 7 nanomètres. Il est dédié tout particulièrement à la lutte en temps réel contre la fraude lors des opérations bancaires, financières, d’assurance ou lors des interactions avec les clients.

11 milliards de transistors

Les techniques actuelles de détection s’appliquent généralement après que la fraude se soit produite. Un processus qui peut prendre du temps et nécessiter des calculs intensifs, surtout lorsque l'analyse et la détection s’effectuent loin des transactions et des données critiques. Les exigences de latence font que la détection de fraudes complexes ne peut souvent pas être effectuée en temps réel, ce qui signifie qu'un acteur malveillant pourrait avoir déjà acheté avec succès des biens avec une carte de crédit volée avant que le détaillant ne s'aperçoive de la fraude.

Tous les indices

"Telum peut aider les clients à passer d'une posture de détection de la fraude à une posture de prévention de la fraude, en évoluant de la détection de nombreux cas de fraude aujourd'hui, à une ère potentiellement nouvelle de prévention de la fraude à grande échelle, sans impact sur les accords de niveau de service, avant que la transaction ne soit terminée", explique IBM dans le communiqué.

Module de calcul à deux puces Telum. Crédit photo: IBM

Big Blue revendique une conception innovante tirant parti de l’apprentissage profond (deep learning). Cadencé à une fréquence 5 GHz, son processeur Telum réunit huit cœurs de traitement avec accélérateurs de calcul qui portent la puissance de traitement à 6 teraflops (1 teraflops vaut 1000 milliards d’opérations en virgule flottante par seconde). Il réunit 11 milliards de transistors et fait appel à 15 Km d’interconnexions métalliques sur 17 couches. Deux exemplaires sont assemblés dans un module de calcul.

Nvidia domine le marché

Le processeur Telum ne se destine pas à la vente. Il est voué exclusivement au marché captif d’IBM (comme chez Google, Amazon, Tesla, Alibaba, Baidu ou Huawei). Il équipera la prochaine génération de gros ordinateurs centraux Z15 et serveurs à haute performance LinuxONE de Big Blue, prévus en 2022. Ce lancement marque néanmoins un point d’inflexion important sur le marché des puces d’intelligence artificielle, et un sacré défi à Nvidia qui domine le segment dédié aux data centers et au cloud.

Selon le cabinet Omdia, le marché mondial devrait bondir de 4 milliards de dollars en 2020, à 37,6 milliards de dollars en 2026. En 2020, Nvidia s’est arrogé 80% du gâteau. Il est suivi par Xilinx, Google, Intel et AMD. Le Top 5 est exclusivement américain. Avec sa puce Telum, IBM pourrait-il venir bousculer ce classement? Pas impossible.

Marché des puces d'intelligence artificielle pour data centers et cloud (Source: Omdia)

Omdia marché des puces IA pour datacenters et cloud Omdia marché des puces IA pour datacenters et cloud