Réflexions

Token, prompt, hypertrucage : le vocabulaire IA en salle des profs ou ailleurs !

Token, prompt, hypertrucage : le vocabulaire IA en salle des profs ou ailleurs !

Token, prompt, hypertrucage : le vocabulaire IA en salle des profs

Cinq collègues, cinq mots pour la même chose

Silence on tourne ! Bien entendu c’est une extrapolation !
Conseil pédagogique de mai, ordre du jour glissé entre deux points sur les EDT : quels usages de l’IA en classe pour la rentrée ? Cinq minutes plus tard, le tableau lexical est éloquent. La collègue de lettres dit « j’ai demandé à ChatGPT ». Le professeur de techno parle de « prompt » et de « modèle ». La documentaliste évoque « l’IA générative ». Le CPE, qui suit un MOOC, dit « dialogueur ». Et l’AED, qui révise pour ses concours, glisse « LLM » au détour d’une phrase. Tout le monde a raison, en partie. Personne n’est sûr de parler exactement de la même chose.

Cette confusion n’est pas un détail. Elle pèse sur la cohérence d’un projet d’établissement, sur la rédaction d’une charte d’usage, sur la conversation avec les familles. Quand un parent demande au principal « est-ce que vous autorisez les élèves à utiliser l’IA pour leurs devoirs ? », il faut au moins être plusieurs à savoir ce que recouvre la question. Or l’Éducation nationale dispose maintenant d’un référentiel. Le Bulletin officiel du 26 septembre 2024 publie le vocabulaire de l’intelligence artificielle, complété en janvier 2025 par le recueil des 50 termes clés de la délégation générale à la langue française. Ce ne sont pas des trouvailles de comité Théodule : ce sont les mots avec lesquels les notes de service, les circulaires et bientôt les inspections vont parler. Autant les connaître.

Ce qui suit n’est pas un dictionnaire. C’est un panorama de cinq familles de termes qu’un cadre d’EPLE croise, qu’il le veuille ou non, dès qu’il s’agit d’IA : ce qui se passe sous le capot, les phénomènes nouveaux qu’il faut nommer, les sites où ça se passe, ce qui se joue côté droit, et la façon dont tout ça atterrit dans nos missions.

Sous le capot : les briques qu’il faut connaître

Au cœur du dispositif, il y a un grand modèle de langageLLM en anglais, pour large language model. C’est un réseau de neurones artificiels entraîné sur des centaines de milliards de mots, qui apprend à prédire le mot suivant à partir d’un contexte. Quand on parle de GPT-5, de Claude, de Gemini ou de Mistral, on parle de modèles de cette famille. Le texte officiel français préfère parler de dialogueur pour désigner l’interface conversationnelle — ce que les usagers appellent un chatbot. La nuance est utile : le modèle, c’est le moteur ; le dialogueur, c’est la voiture.

Pour produire une réponse, le modèle ne traite pas des mots mais des jetons textuelstokens en anglais. Un jeton, c’est un fragment de texte, parfois un mot entier, souvent une syllabe ou même quelques caractères. Le mot « établissement » peut peser trois ou quatre jetons selon le modèle. Cette unité n’est pas anecdotique : c’est elle qui sert à mesurer la taille des modèles, à estimer leur coût et à facturer leur usage côté professionnel. Quand une académie dit « on a un budget de tant de millions de jetons par mois », elle parle de cette unité-là.

L’utilisateur, lui, donne au modèle une instruction générative — un prompt en anglais, terme qui a survécu à la traduction. Bien rédiger son prompt, c’est l’essentiel de ce qu’on appelle parfois prompt engineering ou ingénierie de l’instruction. La qualité de la réponse dépend massivement de la qualité de la demande : préciser le contexte, le rôle attendu, le format de sortie. C’est devenu une compétence transversale dont l’EMI commence à se saisir.

Le modèle ne lit pas l’ensemble d’Internet à chaque réponse. Il dispose seulement de ce qu’on appelle sa fenêtre de contexte — le volume de texte qu’il peut prendre en compte d’un coup. Une fenêtre de 200 000 jetons, comme certains modèles récents le proposent, représente l’équivalent d’environ 150 000 mots, soit un roman entier. Au-delà, le modèle « oublie » le début. C’est pourquoi une longue conversation peut voir l’IA perdre le fil ou se contredire.

Quand le modèle répond, on parle d’inférence — par opposition à l’entraînement, qui est la phase, longue et coûteuse, où le modèle a été construit. L’inférence est rapide mais consomme massivement d’électricité et d’eau pour le refroidissement des serveurs. Chaque requête a un coût matériel, dont l’utilisateur final n’a pas conscience parce qu’il ne paie pas — du moins pour l’instant.

Reste le phénomène qui fait le plus parler de lui en salle des profs : l’hallucination. C’est le moment où le modèle invente avec aplomb une information fausse — une date, un auteur, un texte de loi, une référence bibliographique inexistante. Ce n’est pas un bug ponctuel : c’est une propriété structurelle du fonctionnement de l’objet. Un LLM ne sait pas qu’il ne sait pas. Il prédit le mot le plus probable suivant le contexte, et la fausseté de la réponse est, pour lui, invisible. Cette donnée change radicalement la manière dont on doit former les élèves à l’usage de l’outil.

Les phénomènes que l’IA générative a fait naître

La génération automatique de contenus a fait surgir, depuis 2022, une famille de mots dont on aurait préféré n’avoir jamais besoin.

Le plus médiatisé est l’hypertrucagedeepfake en anglais. La CNIL le définit comme un contenu audio, photo ou vidéo créé ou modifié à l’aide de l’IA pour représenter de façon réaliste l’image ou la voix d’une personne sans son consentement. La loi du 21 mai 2024 dite SREN a renforcé le code pénal sur ce point. L’article 226-8, modifié, sanctionne désormais d’un an d’emprisonnement et 15 000 € d’amende la diffusion d’un hypertrucage non signalé comme tel — peines portées à deux ans et 45 000 € lorsque la diffusion a lieu en ligne. Le nouvel article 226-8-1, qui vise les contenus à caractère sexuel, prévoit jusqu’à trois ans d’emprisonnement et 75 000 € d’amende. Pour un EPLE, le terme est désormais opérationnel : un signalement remontant d’une classe entre dans une grille pénale précise.

« Le fait de porter à la connaissance du public ou d’un tiers, par quelque moyen que ce soit, un contenu visuel ou sonore généré par un traitement algorithmique et représentant l’image ou les paroles d’une personne, sans son consentement, s’il n’apparaît pas à l’évidence qu’il s’agit d’un contenu généré algorithmiquement ou s’il n’en est pas expressément fait mention » — article 226-8 du code pénal, version issue de la loi SREN.

D’autres phénomènes attendent encore leur traduction officielle. Le slop désigne le déversoir de contenus médiocres générés à la chaîne par IA, qui colonisent les résultats de recherche, les fils sociaux, et désormais certaines copies. C’est devenu un mot d’usage courant en anglais, sans équivalent administratif en français — on entend parfois « tout-venant IA » ou « bouillie générative ». L’injection d’instructionprompt injection — désigne le détournement d’un système IA en lui glissant, à l’intérieur d’un texte qu’il analyse, des consignes cachées qui altèrent son comportement. Le contournementjailbreak — est la technique consistant à faire produire au modèle ce que ses garde-fous interdisent, par formulation ruse. Ces mots arrivent dans les rapports d’inspection avant d’arriver dans les manuels.

Dernier terme à connaître, en pleine ascension : l’agent. On a longtemps parlé d’IA comme d’un outil qui répond. L’agent, lui, agit. Concrètement, c’est un modèle qui peut, sur instruction, ouvrir une page web, remplir un formulaire, envoyer un mail, manipuler un fichier — enchaîner des actions sans repasser par l’humain à chaque étape. Le mot recouvre des réalités très diverses, du copilote intégré à un traitement de texte jusqu’au prototype d’assistant qui réserve un billet de train. Pour les chefs d’établissement, c’est le sujet qui monte côté éditeurs : Pronote, l’ENT, les outils RH commencent tous à proposer leurs « agents ». La question pratique sera moins « qu’est-ce que ça fait ? » que « qui est responsable quand ça fait quelque chose qu’il ne fallait pas ? ».

Le paysage des sites : qui propose quoi

Le mot ChatGPT est entré dans la langue comme Frigidaire y est entré il y a soixante ans : un produit qui finit par nommer la catégorie. Sauf que la catégorie est désormais peuplée. Quelques repères pour s’y retrouver.

Côté dialogueurs généralistes, quatre acteurs dominent. ChatGPT (OpenAI, États-Unis) reste le plus connu et celui qu’utilisent massivement les élèves. Claude (Anthropic, États-Unis) s’est taillé une réputation sur la nuance et la rédaction longue. Gemini (Google) est intégré à l’écosystème Workspace que de nombreuses académies utilisent. Copilot (Microsoft) est l’enveloppe IA d’Office 365, déjà déployé dans plusieurs collectivités. Le quatrième entrant, et il importe de le nommer, est français : Mistral, dont le dialogueur grand public s’appelle Le Chat. C’est le seul modèle européen qui se compare aux précédents en performance, et un certain nombre d’académies regardent attentivement les solutions souveraines qu’il propose.

À côté, des outils plus ciblés. Perplexity est un moteur de recherche conversationnel qui cite ses sources — utile en EMI pour comparer la posture à celle d’un LLM classique. NotebookLM (Google) permet de charger ses propres documents et de discuter avec eux, sans que le modèle parte chercher ailleurs : un cas typique de ce que les techniciens appellent RAG, retrieval-augmented generation, ou génération augmentée par récupération. Hugging Face est, lui, un site moins grand public mais central : c’est l’équivalent de GitHub pour les modèles d’IA, où sont publiés des milliers de modèles libres que des chercheurs, des entreprises ou des bricoleurs téléchargent et adaptent.

Côté génération de contenus, le paysage explose. Suno et Udio produisent de la musique à partir d’un texte. ElevenLabs clone des voix avec quelques secondes d’enregistrement. Runway, Sora (OpenAI), Veo (Google) produisent de la vidéo. Et Midjourney, DALL·E, Stable Diffusion, Flux génèrent des images. Aucun de ces outils n’est innocent en EPLE : leur sortie est précisément ce que la loi SREN encadre quand elle parle d’hypertrucages.

Enfin, les outils explicitement pédagogiques arrivent, avec des promesses qu’il faut accueillir avec prudence. Magic School AI, Khanmigo (Khan Academy), Eduline et d’autres positionnent des assistants pour enseignants — préparation de séquences, différenciation, correction. Le ministère, de son côté, prépare le déploiement progressif d’outils via Pix IA, dont la note de service du 23 janvier 2026 a fixé les premiers contours.

Nommer juste, premier geste pédagogique

Pourquoi s’embêter avec tout ce lexique ? Parce que l’attestation de sensibilisation au numérique en classe de 6e, rendue obligatoire à compter de janvier 2026 par la note de service Pix, inscrit désormais l’IA comme composante explicite : les élèves doivent avoir été sensibilisés à l’identification des contenus générés par l’IA, aux risques et dérives, à la lutte contre la désinformation. On ne fait pas ça en agitant des slogans. On le fait avec des mots, précis, que les enseignants partagent.

L’écart entre jeton et mot, qu’on évoquait plus haut, n’est pas une coquetterie technique : il explique pourquoi un modèle facture telle requête plus cher qu’une autre, pourquoi la fenêtre de contexte est limitée, pourquoi un PDF de cinquante pages peut dépasser ce qu’un dialogueur ingurgite d’un coup. C’est la base d’une conversation économique réaliste avec son rectorat.

L’écart entre modèle et dialogueur est tout aussi opérationnel. Quand on parle d’un cadre d’usage dans son établissement, on n’autorise pas un modèle — on autorise une interface, avec ses garde-fous, ses politiques de confidentialité, sa juridiction de stockage. Mistral Le Chat et ChatGPT peuvent reposer sur des modèles comparables en capacité brute, et offrir des conditions juridiques radicalement différentes.

L’écart entre hallucination et erreur change la posture pédagogique. Une erreur, on la corrige. Une hallucination, on apprend à la détecter par recoupement systématique. Les élèves doivent apprendre que demander à un LLM « es-tu sûr ? » n’est pas une vérification — c’est une autre génération de texte, soumise au même biais.

Et l’écart entre deepfake et hypertrucage n’est pas qu’une affaire de pureté linguistique. Le mot français renvoie à un cadre pénal précis, à un article du code, à une grille de signalement. C’est le mot que doit employer un rapport interne quand un élève est victime, parce que c’est le mot qui ouvre la procédure.

Un geste pour la semaine prochaine

Imprimer le tableau du BO du 26 septembre 2024 — il tient sur deux pages —, le laisser traîner sur la table de la salle des profs, en parler dix minutes en conseil pédagogique. Pas pour faire le pédant. Pour vérifier qu’on parle bien tous de la même chose quand on parlera, dans six mois, du cadre d’usage de l’établissement. Le vocabulaire n’est pas l’IA. C’est juste ce qui permet de la voir distinctement, au lieu de la subir confusément.

Pour aller plus loin