Réflexions

Histoire de l’IA — la Pascaline est-elle une intelligence artificielle ?

Histoire de l’IA — la Pascaline est-elle une intelligence artificielle ?

C’est une question que l’on me pose souvent, en variantes : « Quand tu écris sur l’IA, tu parles de quoi exactement, à partir de quand ça commence ? » Réponse longue ci-dessous. Réponse courte : ça dépend de ce qu’on appelle intelligence. Et c’est précisément pour ça que je commence par la Pascaline — un objet du XVIIᵉ siècle qui pose, en creux, toute la question.

Cet article est volontairement long. Il s’adresse à un collègue qui voudrait avoir, en une lecture, une vue d’ensemble cohérente — pour ne plus jamais se faire piéger par un « mais ChatGPT, c’est complètement nouveau ! » en salle des profs.

1. 1642 — la Pascaline, ancêtre supposé

Blaise Pascal a 18 ans, son père est commissaire des impôts à Rouen, et il regarde son père s’épuiser sur des additions de centaines de lignes, jour après jour. Trois ans de travail, une cinquantaine de prototypes assemblés par les horlogers de Rouen, et en 1645 le jeune Pascal présente sa machine — la Pascaline.

Ce qu’elle fait : addition et soustraction directes, multiplication et division par addition/soustraction répétées. La trouvaille technique : un mécanisme de retenue automatique — quand le cadran des unités passe de 9 à 0, il pousse le cadran des dizaines d’un cran. Banal aujourd’hui, révolutionnaire en 1642.

Ce qu’elle est, philosophiquement : « la première tentative dans l’histoire de substituer le travail d’une machine à celui de l’esprit humain » (formule classique des historiens des techniques). C’est cette phrase qu’il faut tenir. La Pascaline ne pense pas, elle ne raisonne pas, elle ne s’adapte pas. Mais elle remplace — pour la première fois mécaniquement — un acte qu’on croyait jusque-là réservé au mental humain.

Vingt machines vendues. Neuf encore connues aujourd’hui (musées des Arts et Métiers, Cluny, Dresde…). En 1671, Leibniz reprend le principe et y ajoute la multiplication automatique. Le geste est lancé.

2. 1642–1936 — la préhistoire conceptuelle

Trois siècles séparent la Pascaline de l’IA. Trois siècles pendant lesquels personne n’utilise le mot « intelligence artificielle » — mais où l’on accumule les briques.

À ce stade, on a : un rêve (Leibniz), une architecture (Babbage), une logique exécutable (Boole). Il manque la machine, et il manque la théorie.

3. 1936–1956 — les fondateurs

C’est le moment où tout bascule. Quatre noms, vingt ans.

Alan Turing (1936) publie « On Computable Numbers » et invente la machine de Turing — un modèle théorique d’un calculateur universel. Ce papier est l’acte de naissance de l’informatique théorique. Tout ce qu’on appelle aujourd’hui « calculable » est défini par référence à cet article.

Turing à nouveau (1950) : article « Computing Machinery and Intelligence » dans Mind. La question est posée frontalement : « Can machines think ? » Turing esquive le débat philosophique en proposant un test opérationnel — le jeu de l’imitation, qu’on appelle aujourd’hui test de Turing. Si une machine, en conversation textuelle, est indiscernable d’un humain pour un juge moyen, on peut, dit-il, parler d’intelligence.

John von Neumann (1945) : architecture « stored-program » — le programme et les données dans la même mémoire. C’est l’architecture de tous les ordinateurs depuis. Sans elle, pas de logiciel.

Conférence de Dartmouth (été 1956) : huit semaines à Dartmouth College, organisées par John McCarthy, Marvin Minsky, Claude Shannon et Nathaniel Rochester. Vingt participants, dont Newell, Simon, Solomonoff. McCarthy y impose le terme « Artificial Intelligence » — explicitement contre les dénominations rivales (« cybernétique », « machines pensantes »). C’est l’acte de naissance officiel de l’IA comme discipline scientifique autonome.

À partir de là, on a un nom, un programme de recherche, et des financements (DARPA principalement). Tout va aller très vite — et très loin dans les promesses.

4. 1956–1973 — l’âge symbolique

Première grande période de l’IA, dite symbolique (parce qu’elle manipule des symboles formels via des règles logiques) ou GOFAI (Good Old-Fashioned AI).

Les promesses de l’époque sont énormes : Simon prédit en 1965 que « les machines seront capables, dans vingt ans, de faire tout travail qu’un homme peut faire ». On y est en 1985. On va voir ce que ça a donné.

5. 1973–1980 — le premier hiver

En 1973, le mathématicien britannique Sir James Lighthill est chargé par le Parlement britannique d’évaluer la recherche en IA. Son rapport est dévastateur : il reproche à l’IA son « échec total à atteindre ses objectifs grandioses » et identifie le mur — l’explosion combinatoire. Quand un problème grossit, le nombre de possibilités à explorer explose exponentiellement, et aucune machine, aussi puissante soit-elle, ne peut suivre.

Le Science Research Council britannique coupe massivement les financements. La DARPA américaine suit. Beaucoup de labos d’IA ferment ou se reconvertissent. C’est le premier hiver de l’IA.

Leçon : l’IA souffre d’un mal récurrent — la promesse excessive. Une fois la promesse non tenue, le retour de bâton est brutal. On va voir le scénario se rejouer.

6. 1980–1987 — les systèmes experts

Renaissance par un changement d’angle. Plutôt que de viser l’intelligence générale, on vise l’expertise étroite. Les systèmes experts se concentrent sur un domaine très restreint, dans lequel ils encodent des centaines voire des milliers de règles « si … alors … » fournies par des experts humains.

7. 1987–1993 — le deuxième hiver

Et patatras. Les systèmes experts se révèlent fragiles : maintenance coûteuse (chaque changement de domaine demande un nouvel encodage manuel des règles), incapacité à généraliser, effet « de bord » dès qu’on sort du périmètre prévu. Et surtout : les machines Lisp dédiées sont rendues obsolètes par les PC standards d’IBM et d’Apple, qui, à coût équivalent, font aussi bien.

Le marché des machines Lisp s’effondre en 1987. La DARPA recoupe ses financements. Deuxième hiver de l’IA (1987-1993). Pendant ces années, on évite même de prononcer le mot « IA » dans les demandes de financement — on parle de « systèmes informatiques avancés », de « techniques d’apprentissage statistique ». L’IA est devenue tabou.

8. 1993–2012 — la lente renaissance statistique

Pendant l’hiver, des choses bougent en sous-main. Trois mouvements convergent.

Premier mouvement — le retour des réseaux de neurones. En 1986, Rumelhart, Hinton et Williams publient l’algorithme de rétropropagation du gradient (backpropagation), qui rend possible l’apprentissage de réseaux de neurones multicouches. Personne ne s’en rend tout de suite compte, mais le mur posé par Minsky en 1969 vient d’être contourné. Yann LeCun applique la méthode aux réseaux convolutifs, et lit des chèques bancaires automatiquement dès 1993.

Deuxième mouvement — les méthodes statistiques. SVM, forêts aléatoires, modèles bayésiens. L’IA cesse d’être un projet philosophique et devient un sous-domaine du machine learning, lui-même sous-domaine de la statistique appliquée. C’est moins glorieux mais ça marche.

Troisième mouvement — les coups d’éclat. En 1997, Deep Blue (IBM) bat Garry Kasparov aux échecs. Pas d’apprentissage : c’est de la force brute (200 millions de positions par seconde). Mais l’effet symbolique est colossal. En 2011, Watson (IBM) gagne à Jeopardy!, démontrant qu’une machine peut comprendre du langage naturel mal formulé.

Pendant ces vingt ans, l’IA s’est transformée silencieusement. Elle a abandonné l’ambition de copier la pensée pour épouser les données. Et elle attend une dernière révolution.

9. 2012–2017 — la révolution deep learning

Septembre 2012, compétition ImageNet. Une équipe de l’Université de Toronto — Geoffrey Hinton, Alex Krizhevsky, Ilya Sutskever — présente AlexNet, un réseau de neurones convolutif profond de 8 couches, entraîné sur des GPU de jeux vidéo. Résultat : il bat le second concurrent de 10 points (15,3 % d’erreur contre 26,2 %). Du jamais vu.

À partir de ce moment, le deep learning balaye tout. Reconnaissance d’images (2012), reconnaissance vocale (2013), traduction automatique (2014). Google, Facebook, Microsoft, Baidu rachètent ou recrutent en masse. Hinton entre chez Google. LeCun chez Facebook.

Mars 2016 : AlphaGo (DeepMind) bat Lee Sedol, l’un des meilleurs joueurs de Go du monde, 4 parties à 1. Le coup 37 de la deuxième partie est qualifié de « inhumain mais beau » par les experts. Pour la première fois, une machine ne se contente pas d’imiter le jeu humain — elle invente un coup qu’aucun humain n’aurait joué.

10. 2017–2022 — les Transformers et la naissance des LLM

12 juin 2017 : huit chercheurs de Google publient un papier intitulé « Attention Is All You Need ». Ils y proposent une nouvelle architecture de réseau de neurones — le Transformer — qui remplace les coûteux mécanismes récurrents (RNN, LSTM) par un mécanisme unique : l’attention. Pour chaque mot d’une séquence, le modèle apprend à pondérer l’importance de tous les autres mots de la séquence — y compris loin en arrière.

C’est l’innovation la plus importante de l’IA moderne. Tous les LLM actuels — GPT, Claude, Gemini, Llama, Mistral — sont des Transformers (ou des descendants directs). Le papier a, à ce jour, plus de 100 000 citations.

11. 2023–2026 — l’âge de la généralisation

Trois ans qui ont tout reconfiguré.

12. Alors, la Pascaline est-elle une IA ?

Réponse argumentée, en deux temps.

Au sens technique : non. Une IA, dans la définition héritée de Dartmouth (et largement réaffirmée depuis), c’est un système qui apprend, qui s’adapte, qui produit des comportements non explicitement programmés. La Pascaline ne fait rien de tout cela. Elle exécute mécaniquement un algorithme fixe — l’addition à retenue. Elle n’apprend pas, elle ne se trompe pas, elle ne « comprend » rien. Si on accepte de classer la Pascaline comme IA, alors un boulier l’est aussi, et le mot perd son sens.

Au sens conceptuel : oui — c’est l’ancêtre direct. La Pascaline est, dans l’histoire des techniques, le premier objet qui externalise mécaniquement une opération mentale humaine. Avant elle, calculer était un acte de l’esprit. Après elle, c’est un acte qu’une machine peut faire à votre place. Sans ce déplacement-là, toute l’histoire de l’IA est impensable. La Pascaline pose la question — « qu’est-ce qu’on peut faire faire à une machine ? » — qui n’a plus jamais été refermée depuis. Babbage, Turing, McCarthy, Hinton, Vaswani répondent tous, à leur tour, à la question que Pascal a ouverte en 1642.

Donc : si un élève de 4ᵉ vous demande « la Pascaline, c’est de l’IA ou pas ? », la bonne réponse est : « Non. Mais c’est ce sans quoi l’IA n’aurait pas pu naître. » C’est plus juste, et c’est aussi plus intéressant.

Ce que cette histoire change pour l’École

Trois choses, à mes yeux.

1. Dégonfler le mythe du « surgissement ». L’idée que l’IA serait apparue en novembre 2022 avec ChatGPT est fausse, et elle est toxique : elle fait croire qu’on est devant un phénomène surnaturel. Or l’IA est le résultat de 380 ans d’histoire des techniques, dont chaque étape s’explique. Ce n’est pas une magie, c’est un héritage cumulatif. Comprendre ça remet de la rationalité dans la conversation.

2. Voir les hivers comme des leçons. Deux fois (1973 et 1987), l’IA a promis ce qu’elle ne savait pas tenir, et la chute a été brutale. On vit aujourd’hui un troisième été — peut-être le bon, peut-être pas. Les chefs d’établissement et les enseignants ont tout intérêt à écouter cette musique-là plutôt que les promesses des vendeurs. La sobriété de Stéphane Mallat au Collège de France« on ne sait toujours pas vraiment pourquoi ces machines fonctionnent » — est précisément le bon ton.

3. Comprendre la trajectoire pour situer l’École. L’histoire de l’IA, c’est l’histoire de ce qu’on a réussi à externaliser. Le calcul (Pascaline), la logique (Boole, Turing), l’expertise étroite (MYCIN), la perception (AlexNet), le langage (GPT). À chaque étape, ce qui restait « proprement humain » a reculé d’un cran. La question pour l’École est donc claire : quelles sont les compétences qui n’ont pas reculé, et qui ne reculeront pas ? Le jugement, la délibération, la décision en valeurs conflictuelles, la relation. C’est précisément ce que j’écrivais sur la taylorisation discrète, et ce que dégagent les rapports sur l’IA et les métiers de demain.

L’École qui a compris cette histoire ne sera pas paniquée. Elle sera outillée pour décider ce qu’elle continue d’enseigner précisément parce que ça résiste à 380 ans de tentatives d’automatisation.

Et ça, en 1642, c’est exactement ce que cherchait Pascal en regardant son père s’épuiser sur ses calculs : libérer du temps mental pour ce qui en valait vraiment la peine. La boucle est bouclée.


Pour aller plus loin sur le site :

Sources (sélection) :