Réflexions

D’où viennent les noms des IA ?

2 mai 2026 · 3 vues

Derrière chaque nom d’IA se cache une histoire. Hommage à un scientifique oublié, acronyme technique, vent du sud, terme de théorie mathématique, référence à un roman de science-fiction des années 60, ou simplement nom de domaine pas cher au moment où il fallait se décider… Les choix de noms en disent souvent beaucoup sur la culture et les ambitions des entreprises qui les portent. Petit voyage étymologique dans le bestiaire de l’IA générative.

Les acronymes techniques

GPT et ChatGPT (OpenAI)

Le grand classique. GPT signifie Generative Pre-trained Transformer — « transformeur génératif pré-entraîné ». Trois mots qui résument l’architecture du modèle : il génère du texte, il a été pré-entraîné sur d’énormes corpus, et il repose sur l’architecture Transformer publiée par Google en 2017 dans l’article fondateur « Attention Is All You Need ». ChatGPT ajoute simplement le préfixe « Chat » pour désigner l’interface conversationnelle grand public lancée en novembre 2022.

Sans le savoir, en disant « ChatGPT » on prononce donc un acronyme triple-empilé : Conversation + Generation + Pre-training + Transformer.

LLaMA (Meta)

Le modèle ouvert de Meta s’écrit officiellement LLaMA : Large Language Model Meta AI. L’acronyme tombe astucieusement sur le mot anglais llama (le lama, animal andin), ce qui a donné lieu à toute une famille de noms d’animaux dans l’écosystème open source : Alpaca (Stanford), Vicuña (Berkeley), Guanaco… tous des camélidés sud-américains.

Les hommages cachés à des scientifiques

Claude (Anthropic)

C’est sans doute l’hommage le plus élégant du paysage IA. Claude est nommé en l’honneur de Claude Elwood Shannon (1916-2001), mathématicien et ingénieur américain, considéré comme le père de la théorie de l’information. Son article fondateur de 1948, « A Mathematical Theory of Communication », est qualifié par Scientific American de « Magna Carta de l’âge de l’information ».

C’est Shannon qui a inventé le bit comme unité de mesure de l’information. C’est lui qui a posé les bases mathématiques de tout ce qui rend possible l’IA moderne : compression, transmission, entropie, capacité d’un canal. Anecdote savoureuse : Shannon était aussi un excentrique passionné de jonglage, qui circulait à monocycle dans les couloirs des Bell Labs et qui avait construit un ordinateur portable caché dans une chaussure pour tricher à la roulette à Las Vegas. Le choix de son prénom pour l’IA d’Anthropic est donc à la fois un hommage scientifique et un clin d’œil à l’inventivité ludique.

À noter aussi : la sous-famille Haiku, Sonnet, Opus chez Claude, qui décline les modèles selon des formes poétiques par ordre de capacité croissante. Le clin d’œil littéraire est cohérent avec l’identité « lettrée » que cultive Anthropic.

Anthropic (le nom de l’entreprise)

Du grec ánthrōpos (ἄνθρωπος) — « être humain ». L’entreprise fondée en 2021 par Dario et Daniela Amodei avec d’anciens d’OpenAI revendique une approche centrée sur l’humain et sur la sécurité de l’IA. Le nom n’est donc pas neutre : il pose un positionnement éthique avant même de poser un produit.

Les noms qui sont aussi des concepts techniques

Perplexity

Voilà un nom particulièrement malin, parce qu’il fonctionne sur deux niveaux.

Au sens commun, perplexity en anglais (« perplexité ») évoque le doute, la confusion qu’on cherche à dissiper en posant une question. Le moteur s’appelle Perplexity parce qu’il est censé répondre à votre perplexité.

Mais surtout, en traitement du langage naturel, la perplexité est une mesure technique précise : elle évalue à quel point un modèle de langage prédit bien la suite d’un texte. Une faible perplexité = le modèle est peu « surpris » par le mot suivant = il est performant. C’est l’une des métriques historiques d’évaluation des LLM.

Le co-fondateur Aravind Srinivas (ex-OpenAI, ex-DeepMind, formé à l’IIT Madras) a aussi avoué une raison plus prosaïque : le nom de domaine était libre et bon marché — environ 120 dollars pour deux ans à l’époque. Ce qui devait être un terme « geek » obscur est devenu une marque grand public valorisée à plus de 21 milliards de dollars en 2026.

DeepSeek

Le nom de la startup chinoise qui a fait trembler la Silicon Valley en janvier 2025 se traduit littéralement par « recherche en profondeur » ou « quête profonde ». Le terme deep renvoie au deep learning (apprentissage profond), tandis que seek souligne la dimension exploratoire et investigatrice du modèle. Le choix n’est pas innocent : DeepSeek se positionne comme un outil capable de fouiller les couches les plus complexes des données, là où d’autres se contentent de surfaces.

L’entreprise, fondée en 2023 à Hangzhou par Liang Wenfeng (un ancien trader algorithmique reconverti dans l’IA), a pris tout le monde de court en sortant en janvier 2025 le modèle R1, aussi performant que GPT-4 mais entraîné pour 6 millions de dollars seulement — soit dix fois moins que ses concurrents américains. Ironie ultime du nom : c’est en cherchant à fouiller plus profond avec moins de moyens que DeepSeek a redéfini le marché.

Stable Diffusion

Le générateur d’images de Stability AI tire son nom de la technique mathématique sur laquelle il repose : les modèles de diffusion. Le principe : on apprend à un réseau à inverser progressivement un processus de bruit gaussien — l’image bruitée se « diffuse » jusqu’au bruit pur, et le modèle apprend à remonter le chemin. Stable parce que la version de Stability AI a stabilisé techniquement et démocratisé cette approche en open source.

Les noms évocateurs et poétiques

Mistral (et Mixtral)

La fierté française de l’IA générative. Mistral est le nom du vent du nord-ouest qui souffle sur la vallée du Rhône et la Provence — froid, sec, puissant, parfois capable de souffler plusieurs jours d’affilée. Le choix du nom par Arthur Mensch, Guillaume Lample et Timothée Lacroix (anciens de DeepMind et Meta) en 2023 ancre l’entreprise géographiquement et culturellement en France, tout en évoquant la puissance et la persistance.

Mixtral est un mot-valise : Mistral + mixture of experts (mélange d’experts), l’architecture qui combine plusieurs sous-modèles spécialisés pour gagner en efficacité.

Le Chat (Mistral)

L’assistant grand public de Mistral s’appelle simplement Le Chat. Triple jeu de mots : c’est un chat en français (animal), c’est aussi un chat en anglais (conversation), et l’article défini « Le » revendique fièrement l’origine francophone. C’est l’inverse stratégique du choix de Google qui a renommé Bard en Gemini pour internationaliser sa marque.

Gemini (Google)

Anciennement Bard (le barde, le poète-conteur des traditions celtes), l’IA de Google a été renommée Gemini en février 2024. Le nom évoque :

la constellation des Gémeaux ;
le programme spatial américain Gemini des années 1960, intermédiaire entre Mercury et Apollo ;
et surtout la dualité — deux jumeaux —, en référence à l’origine du modèle, fruit de la fusion entre les équipes Google Brain et DeepMind.

Midjourney

Littéralement « mi-chemin » ou « au milieu du voyage ». Le nom du générateur d’images créé par David Holz en 2022 évoque le voyage créatif comme processus, la traversée d’un imaginaire — pas le produit fini, mais le mouvement vers lui. Cohérent avec une marque qui s’est imposée comme la plus « artistique » des IA d’image, aux antipodes du fonctionnalisme de DALL-E.

Les références culturelles et littéraires

DALL-E (OpenAI)

Le générateur d’images d’OpenAI porte un nom-portmanteau aussi savoureux qu’instructif :

Salvador Dalí, peintre surréaliste espagnol (1904-1989), maître des images impossibles ;
WALL-E, le petit robot mignon du film d’animation Pixar (2008).

Surréalisme + robotique attendrissante : tout le programme tient dans le nom.

Grok (xAI / Elon Musk)

L’IA d’Elon Musk emprunte son nom au verbe « to grok », inventé par l’écrivain de science-fiction Robert Heinlein dans son roman culte Stranger in a Strange Land (1961). Dans le livre, grok est un mot martien qui signifie « comprendre quelque chose si profondément qu’on ne fait plus qu’un avec ». Le mot est passé dans le jargon hacker américain dès les années 1970-80 pour signifier « piger en profondeur ».

Choix cohérent avec le positionnement « libre, brut, sans filtres » que revendique xAI — et avec la culture geek classique qu’affectionne son fondateur.

Copilot (Microsoft / GitHub)

Nom transparent : co-pilote. Microsoft a fait de cette métaphore aéronautique son fer de lance : l’IA n’est pas le pilote (l’humain reste aux commandes), mais elle l’assiste, vérifie les paramètres, suggère des routes, prend en charge les tâches répétitives. Le nom rassure autant qu’il décrit.

Les noms d’IA chinoises

Qwen (Alibaba)

L’IA d’Alibaba s’appelle 通义千问 Tongyi Qianwen en chinois, ce qui signifie approximativement « Mille questions au sens universel ». Qwen est la transcription romanisée raccourcie. Le nom revendique une vocation encyclopédique et la capacité à traiter une grande diversité d’interrogations.

Doubao (ByteDance)

豆包 Doubao signifie littéralement « petit pain à la pâte de haricot » — une pâtisserie chinoise traditionnelle, douce et populaire. ByteDance (la maison-mère de TikTok) a choisi un nom familier, accessible, presque mignon, à l’opposé du registre techno-héroïque des concurrents. Stratégie marketing assumée : faire de l’IA un produit du quotidien.

Les IA françaises et européennes

Lucie

L’IA souveraine française Lucie, développée par LINAGORA en partenariat avec le CNRS et le PEReN, porte un prénom féminin évocateur : lux/lucis en latin signifie « la lumière », « ce qui éclaire ». Le nom revendique une mission d’éclairage et de transparence — par opposition aux modèles propriétaires opaques. Le lancement public de Lucie en janvier 2025 a connu un démarrage difficile (réponses absurdes très moquées sur les réseaux), mais le projet poursuit son développement comme alternative ouverte et francophone.

Bloom (BigScience)

BLOOM est l’acronyme de BigScience Large Open-science Open-access Multilingual Language Model. Le nom évoque aussi l’éclosion, la floraison — un projet collaboratif international piloté depuis Paris par Hugging Face, qui a regroupé plus de 1 000 chercheurs de 70 pays. C’est l’une des premières grandes IA véritablement ouvertes et multilingues.

Tendances : ce que les noms révèlent

En survolant ces étymologies, quelques logiques de nommage se dégagent :

Les Américains dominants jouent souvent sur les acronymes techniques (GPT, LLaMA, BLOOM) ou les références culturelles geek (Grok, DALL-E).
Les Européens privilégient les noms évocateurs ancrés territorialement (Mistral, Le Chat) ou symboliquement (Lucie, Anthropic).
Les Chinois alternent entre noms évocateurs grand public (Doubao = pâtisserie) et noms à ambition technique (DeepSeek, Qwen).
Les hommages aux scientifiques restent rares mais marquants (Claude → Shannon).
Les concepts techniques réutilisés comme marques fonctionnent surtout quand ils ont un double sens grand public (Perplexity, Stable Diffusion).

Dans tous les cas, le nom n’est jamais neutre : il dit quelque chose des ambitions, du positionnement et parfois des origines géographiques de l’entreprise. Quand on choisit son outil d’IA, on adopte aussi un peu de cette mythologie. Mistral n’est pas Claude n’est pas DeepSeek — pas seulement parce que les modèles diffèrent, mais parce que les récits qui les portent s’opposent.

Et la prochaine fois que vous taperez « Claude » dans la barre d’adresse, vous aurez peut-être une pensée pour ce mathématicien excentrique du Michigan qui circulait à monocycle en jonglant dans les couloirs des Bell Labs. C’est lui qui, sans le savoir, a rendu possible la conversation que vous êtes sur le point d’entamer.

Article publié le 2 mai 2026. Sources : Wikipedia, Britannica, articles des fondateurs, biographies de Claude Shannon (Goodman & Soni), interviews d’Aravind Srinivas et de l’équipe Mistral.