Processeurs inspirés du cerveau pour l'intelligence artificielle : trois voies de recherche prometteuses

Nano-neurones magnétiques, memristors, neurones et synapses émulées par des transistors... Zoom sur trois grandes voies de recherche qui visent à réduire drastiquement le coût énergétique des calculs d'intelligence artificielle en s'inspirant du fonctionnement du cerveau.

Frédéric Monflier

Publié le 19 septembre 2023 à 11h45

Réservé aux abonnés

Image d'illustration de l'article — Photographie de la machine Bayésienne (dimension 2mmx2mm), une petite intelligence artificielle avec une efficacité énergétique des millers de fois supérieure à celle d'un microcontrôleur. Les seize blocs de memristors (apparaissant comme des carrés noirs) sont entourés de circuits à base de transistors.

Une machine bayésienne dont l’IA raisonne avec peu de données

Façonnée par l’équipe de Damien Querlioz, chercheur CNRS au Centre de nanosciences et de nanotechnologies, la « machine bayésienne » est une puce de 4 mm2 qui, pour détecter un mouvement, consomme 1 000 fois moins d’énergie qu’un microcontrôleur classique. Sa modération tient au fait que les quelque 30 000 transistors, chargés des calculs stochastiques (qui traitent d’aléas en fonction du temps), sont situés à quelques micromètres des mémoires, à savoir 2 048 memristors fabriqués à base d’oxyde d’hafnium. Cette architecture, inspirée du cerveau, minimise les mouvements de données. Elle est de plus opérationnelle aussitôt le circuit rallumé après une période d’inactivité, car ces mémoires sont non volatiles.

D’autre part, la méthode bayésienne mise en œuvre est une technique de machine learning différente des réseaux de neurones. « Elle est adaptée à une faible quantité d’informations et à un grand nombre d’incertitudes, précise Damien Querlioz. Une IA bayésienne livre aussi des décisions explicables, ce qui est important pour un diagnostic médical. » Car la machine bayésienne, qui a fait l’objet d’une publication dans « Nature » en décembre 2022, pourrait à terme détecter la chute ou l’inactivité d’une personne âgée ou dépendante. À l’heure actuelle, elle n’en est qu’à l’état de prototype encore trop limité. Mais elle montre la voie, que va emprunter une prochaine version, forte de 130 000 memristors, également fabriquée par le CEA-Leti.

Des millions de neurones émulés par des milliards de transistors

Les bons vieux transistors peuvent se retrouver à la pointe de l’ingénierie neuromorphique. En témoigne la puce TrueNorth d’IBM, présentée dès 2014, dont le million de neurones et les 256 millions de synapses sont entièrement constitués des briques historiques de l’électronique. C’est à la fois l’architecture matérielle et la mise en œuvre d’une IA à base de réseaux de neurones impulsionnels qui permet à cette puce d’émuler le fonctionnement dynamique du cerveau. Chacun des 4 096 cœurs est composé de matrices de 256 x 256 synapses, aux poids paramétrables, dont les lignes représentent les axones (fibres nerveuses qui acheminent les impulsions jusqu’aux synapses) et les colonnes, les dendrites (qui relient les jonctions synaptiques aux neurones). Les impulsions, matérialisées par des « 1 » ou des « 0 », sont multipliées par les poids synaptiques, puis envoyées aux neurones, qui s’activeront si les impulsions incidentes s’accumulent suffisamment dans un laps de temps donné.

D’après Big Blue, TrueNorth consomme une vingtaine de picojoules par impulsion et se montre plus de 176 000 fois plus économe qu’une puce classique. Malgré tout, la même impulsion dans un cerveau humain « brûle » 3 250 fois moins d’énergie... Un système de 64 puces TrueNorth a été assemblé en 2017, en partenariat avec un laboratoire de l’armée de l’air américaine. Le silence radio s’est imposé depuis. Intel a annoncé sa propre puce de ce type, Loihi, en 2017, puis Loihi 2 en 2021, forte de 1 million de neurones et de 120 millions de synapses. Ces puces se différencient notamment de TrueNorth par l’introduction de la plasticité des synapses (modification de leurs poids synaptique) selon le temps d’occurrence des impulsions, plus conforme à la « règle » biologique en vigueur dans nos cellules grises. Intel destine Loihi 2 aux chercheurs pour favoriser les travaux scientifiques sur le sujet. « Nous travaillons sur des prochaines versions qui seront plus proches de la commercialisation », indique Mike Davies, le directeur du laboratoire de calcul neuromorphique d’Intel.

Des nano-aimants en guise de cellules grises

En 2017, Julie Grollier, directrice de rechercHE à l’unité mixte de physique CNRS-Thales, Dévoilait dans « Nature » ses travaux sur des jonctions tunnel magnétique (JMT) de 350 nanomètres de diamètre, capables de distinguer des voyelles orales. Depuis, l’idée a été de montrer que ces mêmes nanoneurones, ainsi qu’ils sont appelés, pouvaient également endosser le rôle de jonctions synaptiques, les unes et les autres étant couplées grâce à des phénomènes d’oscillation et de résonance. Un tel nanoneurone agit en effet comme un oscillateur : l’injection d’un courant électrique, au-delà d’une certaine intensité, excite l’aimantation de la couche ferromagnétique libre, qui observe alors un mouvement de précession et produit une tension oscillante aux bornes du dipôle. L’amplitude de cette tension est une fonction non linéaire du courant : elle est nulle en dessous du seuil indiqué plus haut, avant d’augmenter. Voilà qui matérialise la fonction d’activation d’un neurone.

Cependant, l’émission radiofréquence induite par l’aimantation tournante peut être captée par une autre JMT, qui dispose d’une fréquence de résonance établie par un courant électrique additionnel. Quand la fréquence du signal incident est proche de la fréquence de résonance, apparaît une tension électrique proportionnelle à la puissance du signal RF entrant. Le facteur est une constante qui dépend de la différence de fréquence entre celle du signal RF et celle de résonance. En jouant sur cette fréquence de résonance et la puissance du signal RF, on peut coder l’équivalent d’un poids synaptique. Plusieurs JMT en série permettent d’effectuer une opération de sommation, les tensions électriques s’additionnant. Les JMT situées sur la couche suivante s’activent selon le résultat, et ainsi de suite... Composé de 9 JMT, un circuit expérimental a réussi à classifier des signaux RF avec une précision équivalente à celle d’un algorithme exécuté sur un PC.

D’après une simulation numérique, un système de quelques centaines de JMT pourrait identifier nativement (sans numérisation préalable du signal) un drone selon ses émissions RF, tout en ne consommant que 3,4 milliwatts, contre plusieurs centaines de watts habituellement. Le projet européen Radiospin capitalisera sur ces recherches pour concevoir des systèmes médicaux alternatifs à l’imagerie par rayons X.

Processeurs inspirés du cerveau pour l'intelligence artificielle : trois voies de recherche prometteuses

Une machine bayésienne dont l’IA raisonne avec peu de données

Des millions de neurones émulés par des milliards de transistors

Des nano-aimants en guise de cellules grises

À lire aussi