Réflexions

Mais au fait, qu’est-ce que l’intelligence ?

Mais au fait, qu’est-ce que l’intelligence ?

On parle d’intelligence artificielle, d’enfants intelligents, d’animaux intelligents, de systèmes intelligents. Le mot semble évident. Il ne l’est pas. Tour d’horizon des grandes définitions — et de leurs limites.

Un mot que personne n’arrive à définir

En 1921, le Journal of Educational Psychology organise un symposium réunissant les plus grands spécialistes américains de la question. Le sujet : « Qu’est-ce que l’intelligence ? ». Quatorze chercheurs participent. Quatorze réponses différentes en sortent.

Soixante-quinze ans plus tard, en 1996, l’American Psychological Association mandate un groupe d’experts pour clarifier le débat après la polémique autour du livre The Bell Curve. Leur conclusion officielle, publiée sous le titre Intelligence: Knowns and Unknowns : « les individus diffèrent dans leur capacité à comprendre des idées complexes, à s’adapter efficacement à leur environnement, à apprendre par l’expérience, à raisonner, à surmonter des obstacles par la réflexion. (…) Bien que ces différences puissent être considérables, elles ne sont jamais entièrement consistantes : la performance intellectuelle d’un individu varie selon les occasions, les domaines, les critères. Les concepts d' »intelligence » sont des tentatives de clarifier et organiser ce phénomène complexe. »

Autrement dit : on sait que ça existe, on ne sait pas exactement ce que c’est. Ce flou n’est pas anodin — il a des conséquences politiques, éducatives, et désormais technologiques majeures.

La tradition psychométrique : mesurer pour comprendre

La première grande école est celle de la mesure.

Francis Galton (1822-1911), cousin de Darwin, est le premier à vouloir quantifier l’intelligence, qu’il croit héréditaire et liée à des aptitudes sensorielles. Ses tests — temps de réaction, acuité visuelle — se révéleront sans valeur prédictive, mais l’idée de mesurer est lancée.

Alfred Binet (1857-1911), psychologue français, change de paradigme. Mandaté par le ministère de l’Instruction publique pour identifier les enfants en difficulté scolaire, il développe avec Théodore Simon en 1905 l’échelle métrique de l’intelligence. Sa logique est pragmatique : tester non pas des capacités sensorielles, mais des tâches cognitives complexes (raisonnement, mémoire, jugement). Ironie historique : Binet refusait l’idée que son test mesure une capacité fixe et innée. Il sera trahi par ses successeurs américains qui en feront le QI.

Charles Spearman (1863-1945) introduit en 1904 un concept décisif : le facteur g (« general intelligence »). En analysant statistiquement les corrélations entre différents tests, il observe que les performances dans des domaines très variés sont liées entre elles. Il en déduit l’existence d’une intelligence générale sous-jacente, distincte des aptitudes spécifiques (facteur s). Le facteur g reste à ce jour le concept le plus solide empiriquement de la psychométrie — et le plus contesté philosophiquement.

Raymond Cattell (1905-1998) raffine la chose en distinguant deux facettes :

Cette distinction est aujourd’hui largement acceptée et structure les tests modernes (Wechsler, Stanford-Binet).

La tradition psychométrique aboutit ainsi à une définition opérationnelle : l’intelligence est ce que mesurent les tests d’intelligence. C’est la formule provocatrice d’Edwin Boring en 1923. Tautologique, certes, mais honnête : elle reconnaît qu’on mesure une variable bien réelle, prédictive de réussite scolaire et professionnelle, sans prétendre épuiser le phénomène.

Les théories pluralistes : et si l’intelligence était multiple ?

À partir des années 1980, plusieurs chercheurs contestent la centralité du facteur g.

Howard Gardner, dans Frames of Mind (1983), propose la théorie des intelligences multiples. Il en distingue initialement sept, puis huit ou neuf : linguistique, logico-mathématique, spatiale, musicale, kinesthésique, interpersonnelle, intrapersonnelle, naturaliste, et parfois existentielle. Chaque intelligence serait relativement indépendante, ancrée dans des structures cérébrales distinctes.

Énorme succès dans le monde éducatif (notamment chez les enseignants français), la théorie est aussi très critiquée par les psychométriciens, qui lui reprochent l’absence de validation empirique solide. Pour ses détracteurs, Gardner appelle « intelligences » ce qu’on appelle ordinairement des talents ou des aptitudes, sans réelle valeur ajoutée scientifique.

Robert Sternberg propose en 1985 sa théorie triarchique, distinguant :

Sa thèse : les tests classiques ne mesurent que la première. La « réussite intelligente » dans la vie mobilise les trois.

Daniel Goleman popularise en 1995 le concept d’intelligence émotionnelle, théorisé auparavant par Peter Salovey et John Mayer (1990) : capacité à reconnaître, comprendre et gérer ses émotions et celles des autres. Le concept a connu un succès commercial colossal, mais sa solidité scientifique reste débattue.

Le point commun de ces approches : elles élargissent considérablement le périmètre. Mais elles diluent aussi le concept au point que certains se demandent s’il ne perd pas tout pouvoir explicatif.

Le tournant biologique : l’intelligence partout dans le vivant

Une autre rupture vient de la biologie comparée et de l’éthologie. Si l’intelligence se réduisait à ce que mesure le QI humain, elle serait une bizarrerie de notre espèce. Mais si on la définit comme capacité à résoudre des problèmes adaptatifs, alors elle se trouve partout.

Cette diversité pose une question fondamentale : l’intelligence est-elle une capacité mesurable sur une échelle linéaire, ou un ensemble de stratégies dont chaque espèce développe la version adaptée à sa niche écologique ? La seconde hypothèse, défendue par Frans de Waal dans Sommes-nous trop bêtes pour comprendre l’intelligence des animaux ? (2016), invite à la modestie : nous mesurons les autres à l’aune de ce que nous savons faire.

La définition computationnelle : l’intelligence comme calcul

Avec la naissance de l’informatique, une autre tradition émerge.

Alan Turing, dans son article fondateur de 1950, esquive purement et simplement la question. Plutôt que de demander « les machines peuvent-elles penser ? » (qu’il juge mal posée), il propose un test opérationnel : si un humain ne peut distinguer, par conversation textuelle, une machine d’un autre humain, alors la question d’attribuer à la machine une forme de pensée n’est plus pertinente. Le test de Turing ne définit pas l’intelligence ; il propose un critère d’attribution.

Allen Newell et Herbert Simon formalisent en 1976 l’hypothèse du système physique de symboles : un système physique manipulant des symboles selon des règles est nécessaire et suffisant pour produire de l’action intelligente. Cette définition a structuré toute l’IA classique (jusqu’aux années 1990).

Stuart Russell et Peter Norvig, dans le manuel de référence Artificial Intelligence: A Modern Approach, proposent une définition élégante : un agent est intelligent s’il agit rationnellement pour maximiser l’atteinte de ses objectifs, étant donné les informations dont il dispose. C’est volontairement minimaliste et fonctionnel.

Shane Legg et Marcus Hutter, en 2007, en proposent une formalisation mathématique très citée dans la communauté IA : « l’intelligence mesure la capacité d’un agent à atteindre des objectifs dans une large variété d’environnements ». La généralité — la capacité à transférer des compétences d’un domaine à un autre — devient le critère central.

François Chollet, ingénieur français chez Google et créateur de Keras, va plus loin dans son article On the Measure of Intelligence (2019). Pour lui, l’intelligence n’est pas la capacité à résoudre des tâches, mais l’efficacité avec laquelle on acquiert de nouvelles compétences face à des problèmes inédits. Sa proposition : un système qui mémorise un milliard d’exemples n’est pas intelligent ; un système qui apprend à généraliser à partir de très peu d’exemples l’est. Cette définition fonde son benchmark ARC (Abstraction and Reasoning Corpus), où les LLM actuels échouent largement là où un enfant réussit.

Les critiques : l’intelligence comme construction sociale

Toute mesure d’intelligence s’inscrit dans un contexte historique et politique. Plusieurs penseurs l’ont rappelé avec force.

Stephen Jay Gould, dans La Mal-mesure de l’homme (1981), retrace l’histoire des tests d’intelligence et de la craniométrie pour montrer comment ils ont été utilisés à des fins racistes, sexistes et eugénistes. Sa thèse n’est pas que l’intelligence n’existe pas, mais que la réification d’une grandeur abstraite (le facteur g, le QI) en chose mesurable et héréditaire a servi des projets idéologiques bien concrets.

L’effet Flynn, mis en évidence par James Flynn dans les années 1980, montre que le QI moyen a augmenté de manière spectaculaire au XXᵉ siècle dans tous les pays développés (environ 3 points par décennie). Cette hausse, trop rapide pour être génétique, est nécessairement liée à l’environnement : éducation, nutrition, complexité cognitive du quotidien. Conclusion : ce que mesure le QI n’est pas une capacité fixe mais quelque chose de profondément culturel et historique.

Les biais culturels des tests sont depuis longtemps documentés. Un test qui suppose la familiarité avec la lecture, avec certains objets, avec une logique de raisonnement abstrait occidental, désavantage mécaniquement les populations non occidentales ou non scolarisées. La question n’est pas de nier les capacités cognitives mais de demander : capacités à faire quoi, dans quel contexte, jugées par qui ?

Et l’intelligence artificielle dans tout cela ?

Revenons à la question qui a tout déclenché. Lorsqu’on parle d’« intelligence artificielle », à quelle définition se rattache-t-on ?

Selon la définition retenue, la réponse change radicalement.

C’est précisément pour cela que le débat sur l’« intelligence » des IA est si confus. Les protagonistes mobilisent des définitions différentes sans toujours le préciser. Quand un chercheur dit « ChatGPT n’est pas intelligent », il pense souvent à Chollet ou de Waal. Quand un autre dit « ChatGPT est intelligent », il pense à Spearman ou Legg-Hutter. Les deux ont raison dans leur cadre.

Une conclusion provisoire

Au terme de ce parcours, plusieurs constats émergent.

  1. Il n’existe pas de définition unique de l’intelligence. Toute affirmation présentant une définition comme évidente devrait éveiller la méfiance.
  2. Les définitions opérationnelles (« ce que mesurent les tests », « ce qui permet d’atteindre des objectifs ») sont scientifiquement utiles mais philosophiquement étroites.
  3. Les définitions philosophiques (compréhension, conscience, agentivité) sont riches mais peu mesurables.
  4. L’intelligence n’est probablement pas une chose, mais un faisceau de capacités dont les contours dépendent de ce qu’on attend du système — humain, animal, artificiel — qu’on évalue.
  5. Pour l’IA spécifiquement, le débat « est-ce vraiment intelligent ? » est moins productif que la question « quelles compétences cognitives ces systèmes ont-ils, et lesquelles leur manquent ? ». Le détail vaut mieux que l’étiquette.

Le mot « intelligence » a cet étrange statut : tout le monde croit savoir ce qu’il signifie tant qu’on ne le lui demande pas. Et c’est peut-être précisément ce flou qui le rend si commode — pour vendre des machines, pour hiérarchiser les humains, ou pour s’émerveiller devant un corbeau.


Pour aller plus loin : Stephen Jay Gould, La Mal-mesure de l’homme (1981) ; Howard Gardner, Frames of Mind (1983) ; Frans de Waal, Sommes-nous trop bêtes pour comprendre l’intelligence des animaux ? (2016) ; François Chollet, On the Measure of Intelligence (2019, accessible sur arXiv) ; Stuart Russell & Peter Norvig, Artificial Intelligence: A Modern Approach ; APA, Intelligence: Knowns and Unknowns (1996).