CES 2024 : Neurocorgi, la puce neuro-inspirée du CEA qui modère la gourmandise énergétique de l’IA embarquée

Consommation énergétique réduite d’un facteur 10 à 1000, latence inférieure à dix millisecondes : au CES de Las Vegas, le CEA fait valoir les atouts de sa puce Neurocorgi dédiée à l’analyse d’image embarquée, dont l’architecture et le pré-entraînement minimisent les déplacements des données.

Frédéric Monflier

Publié le 10 janvier 2024 à 10h00

Réservé aux abonnés

Image d'illustration de l'article — La puce Neurocorgi sur son circuit imprimé.

Neurocorgi : ce prototype de puce électronique spécialisée (ASIC), destinée à l’analyse d’image embarquée, est présenté par le CEA durant le CES de Las Vegas, qui débute ce mardi 9 janvier 2024. Un réseau de neurones matériel, en quelque sorte, « l’extrême inverse d’un processeur généraliste programmable (CPU) qui remplit ce type de fonction de manière inefficace », observe Alexandre Valentian, à l’origine de la conception de cette puce et chef du laboratoire systèmes sur puce et technologies avancées (LSTA), implanté à Grenoble et dépendant du CEA-List.

L’efficacité supérieure de Neurocorgi se révèle d’abord sous le prisme énergétique, confie Alexandre Valentian : « La consommation énergétique est réduite d'un facteur 10 à 1000. Elle se situe bien en dessous de 100 milliwatts pour une application complète de reconnaissance d’images HD (1280x720 pixels) à 30 images par seconde. L’IA à la périphérie (edge AI) devient moins énergivore que le capteur d’image lui-même ! »

Une sobriété supérieure malgré un noeud technologique peu avancé

Un critère décisif pour une puce vouée à équiper des drones et autres systèmes autonomes fonctionnant sur batterie, au budget énergétique contraint par nature. Et ces résultats sont d’autant plus significatifs que la finesse de gravure, l'un des principaux facteurs de sobriété énergétique dans cette filière, n'est que de 22 nanomètres. Un « nœud » technologique peu avancé, peu coûteux… et donc très compétitif.

L’idée première du projet Neurocorgi, qui a germé en 2020, a été de minimiser les déplacements des données, particulièrement intensifs quand il s’agit d’IA. « La lecture d’une donnée dans la mémoire coûte cent à mille fois plus, d’un point de vue énergétique, que le calcul réalisé sur cette donnée », rappelle Alexandre Valentian.

Dans le secteur de l’électronique, ce gaspillage énergétique motive depuis plusieurs années des réflexions sur le rapprochement du lieu de stockage des données et du lieu de leur computation, voire leur co-localisation (in memory computing).

Loger les paramètres à l'intérieur de la puce

Dans le cas de Neurocorgi, « les paramètres propres au fonctionnement du réseau de neurones – poids synaptiques, seuils d’activation… - sont situés à l’intérieur de la puce elle-même, ce qui évite d’avoir à les lire sur une mémoire externe », indique Alexandre Valentian.

Le choix concomitant d’une topologie de réseau de neurones adaptée à l’embarqué, MobileNet, a limité ce nombre de paramètres à 15 millions, ce qui est plus facilement intégrable sur une puce. Une évolution vers MobileOne, une architecture plus récente et performante conçue par des chercheurs d’Apple, est envisageable.

La seconde idée fondatrice de Neurocorgi est inspirée du cortex visuel humain. « Nos premières couches neuronales – l’une étant sensible aux lignes verticales, l’autre aux lignes horizontales, l’abstraction progressant avec la profondeur des couches - sont figées dès l’enfance, explique Alexandre Valentian, ce qui ne nous empêche pas de reconnaître de nouveaux objets. »

Couches d'extraction génériques et apprentissage par transfert

Par analogie, les couches qui extraient les caractéristiques d’une image – la colonne vertébrale (backbone) du réseau - sont « câblées » physiquement dans la puce Neurocorgi. Pour que cela fonctionne avec n’importe quelle application de reconnaissance d’image, la condition nécessaire est que « ces premières couches soient suffisamment génériques, dont entraînées avec des quantités de données variées », précise Alexandre Valentian. C’est ce qui rend possible le « transfer learning » dans le jargon de l’IA, ou apprentissage par transfert.

L’apprentissage initial a été réalisé à partir d’ImageNet, célèbre banque d’images contenant des milliers de classes d’objets. Les valeurs ainsi calculées, dont les poids synaptiques, ont ensuite été injectées dans le code RTL (register transfer level, méthode de description de circuits microélectroniques) pour générer Neurocorgi.

« Il reste à entraîner le classificateur de sortie (qui fait le tri entre les différentes classes d’objet comme des chiens ou des bateaux, ndlr), poursuit Alexandre Valentian. Ou les têtes de détection si on fait de la détection multi-objets. ».

La classification (ou identification d’un objet), la segmentation sémantique (différenciation des classes d’objet – piéton, voiture… - par leur couleur) ainsi que la détection multi-objets (centrage d’un cadre sur chaque objet pour le localiser) sont les fonctions que peut remplir Neurocorgi. La détection multi-objets imposant 40% de paramètres supplémentaires, elle a fait l’objet d’un circuit particulier, Neurocorgi_coco.

Une architecture favorisant les flux de données

L’architecture de Neurocorgi, enfin, a été conçue pour raccourcir les trajets des données. « Spatialement, une partie de la puce est dédiée à la première couche de neurones, une deuxième partie pour la deuxième couche, et ainsi de suite, détaille Alexandre Valentian. Les données se déplacent d’une partie à l’autre, comme un produit qui se déplace d’atelier en atelier dans une chaîne de production. »

Ce flux diminue la latence. « Les premiers résultats de classification d’une image sortent en moins de 10 millisecondes, ce qui est inférieur au temps d’acquisition de l’image », se réjouit Alexandre Valentian.

Il reste une question cruciale : la puce Neurocorgi se montre-t-elle aussi précise dans ses prédictions qu’un circuit plus traditionnel qui exécute une IA de reconnaissance d’image ? « A topologie égale, on perd un à deux points pour classifier une image dans la base ImageNet », reconnaît Alexandre Valentian.

Commercialisation envisagée en 2026

Ce taux de réussite est en l’occurrence d’environ 70%, mais il progresse significativement, selon lui, quand l’application est affinée, c’est-à-dire quand le classificateur de sortie est entraîné sur un nombre de classes spécifiques restreint. « Sur un drone sous-marin, il n’y a besoin de distinguer que quatre sons différents », ajoute-t-il.

Neurocorgi serait aujourd’hui sans égal si l’on tient compte de l’énergie consommée par inférence. Plusieurs projets, avec des partenaires académiques et industriels, sont lancés pour l’éprouver en conditions réelles : système de désherbage automatique qui distingue les cultures des mauvaises herbes, en partenariat avec l’Institut polytechnique de Bordeaux, analyse d’image par des drones volant en haute altitude avec Thales, ou encore détection de piste d’atterrissage pour l’atterrissage autonome de petits aéronefs avec Boeing.

Le niveau de maturité technologique (TRL) de Neurocorgi est de 5. Alexandre Valentian situe la mise sur le marché en 2026.