Offrir aux acteurs des sciences biomédicales une vision « holistique » de la biologie, en mettant à leur disposition des outils capables de révéler le moindre des mécanismes, la moindre des interactions régissant le vivant, de l’échelle du gène à celle de l’organisme tout entier, en passant par les niveaux cellulaire et tissulaire. Le tout, in silico…
Si le pari peut sembler audacieux, c’est bel et bien celui qu’entend relever la toute jeune pousse française Bioptimus, officiellement lancée, le 20 février dernier. Ce dernier intervient à l’issue d’une levée de fonds d’amorçage de 35 millions de dollars, menée par Sofinnova Partners, avec le soutien de Bpifrance et « d’autres investisseurs de la tech de premier plan », tel que le décrit le communiqué publié pour l'occasion. Des investisseurs parmi lesquels figure notamment Xavier Niel, dont l'un des derniers faits d'armes est la création d'un laboratoire de recherche dédié à l'intelligence artificielle (Kyutai), en fin d'année dernière. Un signe…
C'est en effet également dans ce vaste champ de l'IA que Bioptimus compte œuvrer pour « révolutionner la biologie ». Comment ? En développant, en premier lieu, un « modèle de fondation » (foundation model) dédié à l'étude du vivant.
Bâtir une assise large et polyvalente

« Un modèle de fondation est un modèle d'IA versatile, issu d'une phase de préapprentissage non supervisée, menée sur un très vaste jeu de données », éclaire Rodolphe Jenatton, ex-chercheur en apprentissage automatique au sein de l'équipe berlinoise de Google DeepMind, devenu directeur technique de Bioptimus, en décembre dernier.
Dans le cas d'un modèle de langage, cette phase - cruciale - de préapprentissage consiste, en substance, à nourrir le modèle d'une multitude de données textuelles afin qu'il se saisisse des structures latentes du langage en question - connexions syntaxiques, relations sémantiques et autres liens entre formes grammaticales.
Sur le principe, il en va de même pour le modèle dédié à la biologie que développe Bioptimus, à une différence près - et pas des moindres - qu'expose Rodolphe Jenatton : « La difficulté principale dans le domaine du vivant réside dans l'hétérogénéité des données. Il peut, par exemple, s'agir de séquences protéiques, d'images de tissus tumoraux, de profils d'expression génique… Le préapprentissage se révèle donc un véritable challenge, face auquel nous misons sur un modèle d'apprentissage profond apparenté aux transformers *, qui permet, en quelque sorte, de placer sur un dénominateur commun toutes ces données de natures diverses ». Mais le défi ne s'arrête pas là : outre leur caractère intrinsèquement multimodal, les données sur lesquelles compte s'appuyer Bioptimus sont elles-mêmes issues de sources disparates.
Trois grandes sources de données
Si une partie d'entre elles font tout simplement partie du domaine public, à l'image des séquences et des structures tridimensionnelles des protéines, d'autres restent en effet la chasse gardée de leurs propriétaires. « Il va donc nous falloir nouer des partenariats avec des fournisseurs de données complémentaires - des données histologiques, par exemple » , note M. Jenatton, qui met également en lumière une troisième grande source potentielle de données : Owkin.
À l'origine de la création de Bioptimus, la biotech qui mise, elle aussi, sur l'IA pour la médecine de précision, a en effet construit un réseau fédéré - aujourd'hui mondial - de partenaires médicaux, capables de générer des données multimodales issues de patients.
« Même si nous restons deux entités distinctes, nous comptons rester en étroite interaction. Owkin sera en mesure d'utiliser notre modèle de fondation pour améliorer ses solutions d'IA en médecine de précision, et nous bénéficierons, en retour, de son réseau de fournisseurs de données, composé d'acteurs industriels, hospitaliers et académiques du monde entier », décrit le directeur technique de Bioptimus.
Forte de ces trois grandes sources d'approvisionnement en données-publiques, issues de partenariats, ainsi que du réseau fédéré d'Owkin, la jeune pousse espère ainsi parachever la phase de préapprentissage de son modèle de fondation, au cours des prochains mois. Une étape qui, une fois franchie, augurera alors de la spécialisation de ce modèle « versatile » vers une série d'applications spécifiques.
D'un modèle polyvalent à une palette d'outils spécialisés
« Une fois notre modèle de fondation établi, nous allons pouvoir le spécialiser sur diverses “verticales” », prévoit en effet Rodolphe Jenatton. « Cela se fera en entraînant le modèle sur un plus petit jeu de données, étiquetées, cette fois, par un humain », précise le directeur technique de Bioptimus. Il avance ainsi, parmi les multiples applications possibles de la technologie actuellement développée par la jeune entreprise, l'exemple de la création de molécules thérapeutiques, ou encore celui du diagnostic de pathologies : « À partir de l'image d'un tissu, on pourra, par exemple, déterminer si un patient est atteint d'une maladie, et, si c'est le cas, de quel type de pathologie il s'agit ». Des cas d'usage auxquels Bioptimus, en collaboration avec Owkin, espère naturellement apporter des gains de performance substantiels, par rapport aux solutions plus conventionnelles proposées aujourd'hui par d'autres acteurs. Et ce, justement, grâce à l'approche « holistique » qui est la sienne.
« Les approches actuelles restent centrées sur l'étude d'un paramètre à la fois. Or imaginons que l'on cherche à comprendre l'effet d'un médicament sur un patient, il semble dans ce cas bien plus pertinent de modéliser tous les liens qui peuvent exister entre cette molécule thérapeutique et son organisme », explique M. Jenatton. « On risque en effet, sinon, de passer à côté de certains mécanismes insoupçonnés », justifie-t-il.
Cette approche globale que Bioptimus compte proposer aux acteurs des sciences biomédicales devrait, quant à elle, à l'inverse, leur offrir une vision d'ensemble des mécanismes et interactions entrant en jeu à toutes les échelles, mais aussi - et surtout - leur permettre de modéliser les effets - à tous les niveaux du changement d'un paramètre, à une échelle donnée. « L' idée est vraiment de pouvoir prédire, si l'on module un aspect à une échelle, les impacts que cela aura à n'importe quel autre niveau; celui du patient dans son ensemble, par exemple », illustre Rodolphe Jenatton, qui estime, par ailleurs, que les premiers modèles spécialisés sur des verticales précises pourraient voir le jour dans le courant de cette année. Des outils qui pourront alors être mis à disposition de la communauté scientifique selon deux modalités.
Une offre commerciale, mais aussi open source
Bioptimus tient en effet, d'une part, à développer une approche open source, en mettant librement à la disposition de la communauté scientifique certains de ses modèles. La jeune pousse mise aussi naturellement, d'autre part, sur une offre commerciale, qu'elle compte essentiellement axer autour d'un modèle SaaS (Software as a Service).
« Certains partenaires pharmaceutiques disposant de data propriétaires de niche pourraient aussi, pourquoi pas, nous solliciter pour faire évoluer notre modèle de base à l'aide de leurs propres données », imagine d'ores et déjà Rodolphe Jenatton. « Nous pourrions alors leur proposer une licence commerciale qui leur permettrait de spécialiser notre modèle en interne, avec, à la clé, la garantie que leurs données confidentielles ne soient jamais compromises », poursuit-il. Une perspective, parmi tant d'autres, que Bioptimus espère voir se concrétiser dans les mois et années à venir, à la faveur, pourquoi pas, d'une nouvelle levée de fonds ; en série A, cette fois.
*Transformer ou Transformateur : type d'architecture de réseau de neurones, qui transforme ou modifie une séquence d'entrée en séquence de sortie, en apprenant le contexte et en suivant les relations entre les composants de la séquence. Source : Amazon Web Services.
Bioptimus, fruit de l'union de talents d'Owkin et de Google DeepMind
L'origine de la création de Bioptimus remonte à l'été 2023. « Les foundation models devenant de plus en plus incontournables, des discussions ont émergé, à ce moment-là, au sein d'Owkin, pour se saisir de cette tendance et l'appliquer à la biologie », retrace, en effet, l'actuel directeur technique de Bioptimus, Rodolphe Jenatton. Après avoir étudié différents scénarios, l'entreprise opte finalement pour la création d'une entité dédiée à ce projet, « incubée » au sein d'Owkin.
« Trois membres de l'équipe Bioptimus sont, en effet, aujourd'hui encore, employés par Owkin : Éric Durand, David Cahané, ainsi que notre président, le professeur Jean-Philippe Vert », souligne M. Jenatton.
Des experts que rejoint alors un autre triode de spécialistes de l'IA - Felipe Llinares, Zelda Mariet et Rodolphe Jenatton - tous trois issus de Google DeepMind. « Nos trajectoires professionnelles se sont souvent croisées. Je connais, pour ma part, Jean-Philippe Vert depuis plus de quinze ans », glisse l'actuel directeur technique de Bioptimus, Rodolphe Jenatton qui voit, par ailleurs, dans les liens qui unissent Bioptimus à Owkin, une véritable relation « symbiotique » , vouée à perdurer.



