Réflexions

Et si l’intelligence artificielle n’était pas si artificielle ?

Et si l’intelligence artificielle n’était pas si artificielle ?

La leçon de Stéphane Mallat au Collège de France

L’expression a fait sourire la salle du Collège de France, en cette matinée d’octobre. Stéphane Mallat, mathématicien et titulaire de la chaire « Sciences des données », ouvrait le colloque de rentrée 2025 — consacré aux Formes de l’intelligence — par une intervention au titre volontairement provocateur : Mystères mathématiques d’intelligences pas si artificielles. La formule n’avait rien d’une coquetterie. Tout au long de sa leçon, le médaillé d’or du CNRS 2025 s’est employé à démontrer que les réseaux de neurones profonds, loin d’être les machines superficielles que certains décrivent, partagent avec l’esprit humain et avec la nature elle-même des principes mathématiques fondamentaux.

Au-delà des « perroquets stochastiques »

Il fallait commencer par tordre le cou à un cliché. Depuis quelques années, l’expression de perroquets stochastiques — popularisée en 2021 par les linguistes Emily Bender et Timnit Gebru — s’est imposée pour qualifier les grands modèles de langage : des systèmes qui ne feraient que recracher des séquences de mots vues à l’entraînement, sans rien comprendre. Mallat balaie l’idée. Pour lui, ce n’est tout simplement pas vrai. Les réseaux profonds apprennent une forme de connaissance d’une sophistication remarquable. Cela ne signifie pas qu’ils « comprennent » au sens humain — sur ce point le mathématicien reste prudent, allant jusqu’à dire qu’il ne sait pas si l’IA est « bête » — mais cela disqualifie l’image du simple psittacisme statistique.

Une connaissance qui rappelle Charles Sanders Peirce

Pour décrire ce que font ces modèles, Mallat puise dans la philosophie. La connaissance que construisent les réseaux de neurones, dit-il, s’inscrit dans la tradition pragmatique inaugurée par le philosophe et logicien américain Charles Sanders Peirce. L’idée centrale : on n’accède jamais à la connaissance par l’empirisme pur. Il faut des a priori.

C’est là qu’intervient l’argument mathématique le plus profond de la leçon — la fameuse « malédiction de la dimension ». Quand le nombre de variables explose, le volume des possibilités devient si vaste qu’aucune accumulation d’exemples ne pourra jamais le couvrir. Pour apprendre quelque chose dans un tel océan combinatoire, il faut introduire de la structure, des hypothèses préalables, une géométrie du problème. Bref, des a priori, exactement comme le scientifique qui formule des modèles avant d’observer. Ces a priori, dans le cas des réseaux profonds, sont inscrits dans leur architecture même.

Un parallèle vertigineux avec la physique

Le second moment fort de la conférence concerne la convergence entre l’étude des réseaux de neurones, la neurophysiologie et la physique. Pour Mallat, ce n’est pas un hasard si ces trois domaines se rapprochent : tous trois s’attaquent au même problème, comprendre le monde qui nous entoure. Et pour le comprendre, il faut le factoriser, c’est-à-dire le décomposer en éléments simples et combinables. Or, des manières de factoriser, il n’y en a pas tant que cela.

Les réseaux profonds construisent spontanément des représentations hiérarchiques à séparation d’échelle — un principe que la physique applique depuis Galilée et Newton, du microscopique au macroscopique. Si la machine retrouve d’elle-même la grammaire que les physiciens ont mis trois siècles à formaliser, c’est sans doute qu’elle touche à quelque chose de réel sur la structure du monde. D’où, peut-être, le titre de la conférence : ces intelligences ne sont pas si « artificielles », parce qu’elles redécouvrent les mêmes lois d’organisation que celles qui régissent la matière et le vivant.

Beaucoup reste à comprendre

Mallat se garde bien de tout triomphalisme. Les propriétés mathématiques des modèles probabilistes actuels demeurent, selon lui, largement inexplorées. Les architectures aujourd’hui déployées sont même, dit-il, beaucoup trop simples. Des pans entiers des mathématiques — celles de la grande dimension en particulier — s’ouvrent au chercheur. Et les enjeux ne sont pas que théoriques : la robustesse des systèmes, leur efficacité énergétique — chantier crucial à l’heure des centres de données qui engloutissent l’électricité de villes entières — dépendent directement de notre capacité à comprendre ce qui se passe sous le capot.

Une leçon qui dérange les deux camps

Le propos de Mallat a ceci d’intéressant qu’il dérange les deux camps habituels du débat sur l’IA. Aux sceptiques qui y voient un perroquet sans cervelle, il répond que les réseaux profonds construisent une connaissance authentique. Aux thuriféraires qui annoncent l’intelligence générale pour demain matin, il rappelle que l’on ne sait toujours pas vraiment pourquoi ces machines fonctionnent — et que le chantier mathématique est immense.

Entre les deux, une voie de crête : prendre l’IA pour ce qu’elle est, un objet scientifique digne d’étude, qui en dit autant sur les machines que sur la manière dont la nature, peut-être, se laisse connaître.