Réflexions

Lexique IA anglais-français : 50 termes pour la salle des profs ou ailleurs (bis !)

Lexique IA anglais-français : 50 termes pour la salle des profs ou ailleurs (bis !)

Lexique IA anglais-français : 50 termes pour la salle des profs

Pourquoi cette fiche

Le précédent article exposait pourquoi le vocabulaire IA est aujourd’hui une affaire de cadre d’établissement et plus seulement de curiosité technique. Celle-ci en est le pendant utilitaire : une fiche-ressource imprimable, à laisser sur la table de la salle des profs ou à joindre à une charte d’usage. Les définitions visent la sobriété — une ou deux phrases — pour qu’on puisse retrouver un terme rapidement sans relire trois pages.

Le référentiel utilisé est celui du BO du 26 septembre 2024, qui fixe la traduction française officielle de la majorité des termes en circulation. Quelques entrées, signalées comme telles, n’ont pas encore d’équivalent français consacré : on les laisse en anglais avec, à défaut, l’usage de terrain. Les cinq familles — briques, apprentissage, architectures, phénomènes, écosystème — permettent de retrouver un mot sans connaître son nom officiel : on cherche dans la bonne section selon ce dont on parle.

Briques techniques : ce qui constitue un modèle

C’est la famille la plus utile pour répondre à un collègue qui demande « mais concrètement, comment ça marche ? ». Le minimum vital pour comprendre une facture, une limite technique ou une promesse commerciale.

Anglais Français Définition courte
Artificial intelligence (AI) Intelligence artificielle (IA) Champ visant à imiter par dispositif matériel et logiciel certains mécanismes de la cognition humaine.
Large language model (LLM) Grand modèle de langage Modèle entraîné sur d’immenses corpus pour prédire les mots suivants à partir d’un contexte.
Foundation model Modèle de fondation Modèle généraliste de très grande taille destiné à être réutilisé pour des tâches variées.
Chatbot Dialogueur Logiciel spécialisé dans le dialogue en langage naturel. L’expression « agent conversationnel » est officiellement déconseillée.
Token Jeton textuel Unité élémentaire de texte traitée par un modèle, souvent un fragment de mot. Sert à mesurer taille, coût et limites.
Prompt Instruction générative Consigne donnée par l’utilisateur à un modèle génératif, en langage naturel.
System prompt Instruction système Consigne cachée placée en amont par le concepteur du dialogueur, qui définit son rôle et ses garde-fous.
Context window Fenêtre de contexte Volume de texte qu’un modèle peut prendre en compte d’un coup. Au-delà, il oublie le début.
Inference Inférence Phase où un modèle déjà entraîné produit une réponse, par opposition à l’entraînement.
Parameter Paramètre Poids interne d’un modèle, ajusté pendant l’entraînement. On parle de modèles à des milliards, voire des centaines de milliards de paramètres.
Temperature Température Paramètre qui règle le degré d’aléatoire dans la génération. Basse pour les réponses factuelles, haute pour la créativité.

Apprentissage : comment un modèle se construit

Cette famille concerne la fabrique du modèle, en amont de son usage. Elle est utile pour comprendre ce qu’un éditeur entend par « modèle adapté à l’éducation » ou par « modèle souverain ». Beaucoup de promesses se jouent ici, dans des termes que les commerciaux maîtrisent mieux que les acheteurs.

Anglais Français Définition courte
Machine learning Apprentissage automatique Processus par lequel un algorithme améliore ses performances par exposition répétée à des données.
Deep learning Apprentissage profond Apprentissage automatique utilisant un réseau de neurones à grand nombre de couches.
Supervised learning Apprentissage supervisé Apprentissage à partir de données annotées avec le résultat attendu.
Unsupervised learning Apprentissage non supervisé Apprentissage sans annotation préalable, le modèle dégage seul des régularités.
Self-supervised learning Apprentissage auto-supervisé Le modèle se génère lui-même ses étiquettes à partir des données. Méthode dominante pour les LLM.
Reinforcement learning Apprentissage par renforcement Apprentissage où un programme évalue positivement ou négativement les résultats successifs.
RLHF (Reinforcement Learning from Human Feedback) Apprentissage par renforcement à partir de retours humains Étape où des annotateurs humains classent les réponses du modèle pour l’aligner sur ce qu’on attend de lui.
Pretraining Préentraînement Phase initiale d’apprentissage sur un très grand corpus généraliste.
Fine-tuning Affinage Seconde phase d’entraînement adaptant un modèle préentraîné à une tâche, un domaine ou un style.
Dataset Jeu de données Corpus utilisé pour entraîner ou évaluer un modèle.
Synthetic data Données synthétiques Données générées par IA pour entraîner d’autres IA. Pratique en hausse, controversée pour ses effets de boucle.

Architectures et capacités : ce qu’un modèle sait faire

Cette famille répond aux promesses des fournisseurs. Quand un éditeur annonce « notre solution est multimodale et agentique avec raisonnement », il manie ce vocabulaire. Savoir ce qu’il recouvre permet de demander ce qui se cache derrière, et de vérifier la démonstration.

Anglais Français Définition courte
Transformer Transformeur Architecture de réseau de neurones à traitement parallèle, à la base de tous les LLM modernes depuis 2017.
Multimodal Multimodal Modèle capable de traiter plusieurs types d’entrées dans une même requête : texte, image, audio, vidéo.
Mixture of experts (MoE) Mélange d’experts Architecture où le modèle active seulement une partie de ses paramètres selon la requête, pour économiser du calcul.
Embedding Plongement (vectoriel) Représentation numérique d’un texte sous forme de vecteur, utilisée pour mesurer la similarité de sens.
Retrieval-augmented generation (RAG) Génération augmentée par récupération Architecture qui fait chercher au modèle des passages pertinents dans une base documentaire avant de générer.
Agent Agent IA qui enchaîne des actions — ouvrir une page, remplir un formulaire, envoyer un mail — sans repasser par l’humain à chaque étape.
Chain of thought Chaîne de pensée Procédé qui amène le modèle à expliciter son raisonnement étape par étape avant de répondre.
Reasoning Raisonnement Capacité d’un modèle à articuler plusieurs étapes logiques. Mot très marketing, à manier avec prudence.
Zero-shot / Few-shot À zéro coup / À quelques coups Capacité d’un modèle à accomplir une tâche sans exemple préalable (zero) ou avec quelques exemples dans le prompt (few).

Phénomènes et risques : ce qu’il faut pouvoir nommer

C’est la famille à laquelle un cadre d’EPLE est confronté en première ligne, sous forme de signalement, d’incident ou de question de parent. Ces mots ouvrent souvent une grille de réponse — administrative, pédagogique, parfois judiciaire.

Anglais Français Définition courte
Hallucination Hallucination Production par un modèle d’une information fausse avec la même assurance qu’une information vraie. Propriété structurelle, pas un bug.
Deepfake Hypertrucage Contenu audio, image ou vidéo généré par IA représentant une personne sans son consentement. Sanctionné par la loi SREN du 21 mai 2024.
Slop (pas d’équivalent officiel) — usages : bouillie générative, tout-venant IA Déversoir de contenus médiocres générés en masse par IA qui colonise résultats de recherche, fils sociaux et copies.
Prompt injection Injection d’instruction Attaque qui glisse des consignes cachées dans un texte analysé pour détourner un modèle de sa fonction.
Jailbreak Contournement Technique pour amener un modèle à produire ce que ses garde-fous interdisent, par formulation rusée.
Bias Biais (algorithmique) Distorsion systématique des réponses d’un modèle, héritée de ses données d’entraînement ou de son alignement.
Guardrails Garde-fous Filtres et règles intégrés au modèle pour empêcher certaines sorties.
Watermarking Tatouage numérique Marquage technique invisible permettant d’identifier un contenu généré par IA. Imposé par le règlement européen sur l’IA.
AI alignment Alignement de l’IA Ensemble des techniques visant à faire qu’un système IA respecte les valeurs et objectifs attendus par ses concepteurs et utilisateurs.

Écosystème et infrastructure : ce qui entoure le modèle

Cette dernière famille concerne ce qui n’est pas le modèle lui-même mais conditionne son usage : matériel, format, droit. C’est là que se nichent les questions d’achat public, de souveraineté et de conformité.

Anglais Français Définition courte
Generative AI (GenAI) IA générative Branche de l’IA qui produit des contenus textuels, graphiques ou audiovisuels.
Open weights Poids ouverts Modèle dont les paramètres sont publiés et téléchargeables, par opposition à un modèle propriétaire fermé.
Open source Code ouvert Logiciel dont le code source est librement consultable et modifiable. À ne pas confondre avec open weights.
Model card Notice de modèle préentraîné Document décrivant les données d’entraînement, le paramétrage et le cadre d’utilisation d’un modèle.
API (Application Programming Interface) Interface de programmation Point d’accès technique permettant à un logiciel d’utiliser un modèle à distance.
GPU (Graphics Processing Unit) Processeur graphique Composant matériel spécialisé dans le calcul parallèle, indispensable à l’entraînement et à l’inférence des LLM.
Data center Centre de données Bâtiment hébergeant les serveurs sur lesquels tournent les modèles. Forte consommation électrique et hydrique.
Quantization Quantification Technique réduisant la précision numérique des paramètres d’un modèle pour le faire tenir sur du matériel modeste.
Sandbox Bac à sable Environnement isolé pour tester un modèle sans risque pour le système hôte.
AI Act Règlement sur l’IA (RIA) Règlement européen 2024/1689, en vigueur depuis le 1ᵉʳ août 2024, qui classe les systèmes d’IA par niveau de risque.

Quelques mots qui attendent encore leur français

Tous les termes en usage n’ont pas leur équivalent dans le BO. Slop est emblématique : on en parle partout sans nom officiel. Prompt engineering circule en français comme ingénierie de l’instruction dans certains textes, ingénierie du prompt dans d’autres, sans consensus stabilisé. MCPModel Context Protocol, protocole d’interopérabilité entre modèles et applications, qui prend de l’ampleur depuis 2024 — n’a pas encore de traduction administrative française. Il faudra suivre les prochaines parutions de la commission d’enrichissement de la langue française pour voir ces termes se fixer.

Conclusion

Cette fiche n’a pas vocation à être lue d’un trait. Elle existe pour qu’on puisse y revenir, quand un mot croise une conversation et qu’on veut s’assurer qu’on l’emploie comme les textes l’emploient. Une copie imprimée sur le tableau d’affichage de la salle des profs, une autre dans le bureau du gestionnaire à l’heure des devis, et l’essentiel est en place pour la rentrée.

Pour aller plus loin