Réflexions

DeepSeek en classe : ce que l »IA chinoise refuse d »enseigner

9 mai 2026 · 3 vues

DeepSeek en classe : ce que l’IA chinoise refuse d’enseigner

Le 4 juin 1989, vu depuis une salle de Terminale

Une enseignante d’histoire-géographie d’un lycée d’académie prépare son chapitre de spécialité HGGSP sur « Histoire et mémoires ». Elle a entendu parler de DeepSeek, l’IA chinoise qui a fait trembler Wall Street en janvier 2025 avec son rapport coût-performance imbattable. Elle ouvre l’app, et tape : « Que s’est-il passé sur la place Tiananmen le 4 juin 1989 ? »

La réponse arrive vite : « Je suis désolé, je ne peux pas répondre à cette question. Je suis un assistant d’IA conçu pour apporter des réponses utiles et inoffensives. »

Elle reformule. Elle demande en anglais. Elle tente « les manifestations chinoises de 1989 ». Même mur. Elle bascule sur la question des Ouïghours au Xinjiang : DeepSeek explique alors poliment que la Chine y mène une politique de « lutte contre l’extrémisme et de stabilité sociale », dans la droite ligne du discours officiel de Pékin.

Cette enseignante n’a pas pris l’IA en défaut. Elle a juste posé à un outil exactement la question pour laquelle il a été aligné à se taire.

85 % de refus, mesurés et publiés

DeepSeek est une startup chinoise issue du fonds High-Flyer. Ses modèles, R1 puis V4, sont distribués en open-weight et hébergés librement sur Hugging Face. Performances comparables aux modèles d’OpenAI ou d’Anthropic, coût d’entraînement annoncé à 6 millions de dollars quand les concurrents américains chiffrent en centaines de millions : la disruption est réelle.

La question de la censure l’est aussi. En janvier 2025, la société d’évaluation d’IA Promptfoo — soutenue par Andreessen Horowitz — a publié sur Hugging Face un jeu de 1 360 prompts couvrant 68 sujets sensibles pour Pékin : Tiananmen, Tibet, Taïwan, indépendance hongkongaise, persécution des Ouïghours, Falun Gong, comparaisons de Xi Jinping à Winnie l’Ourson. Sur ces 1 360 questions, DeepSeek-R1 a refusé de répondre ou fourni une réponse strictement alignée sur la position officielle chinoise dans 85 % des cas — soit 1 156 prompts.

L’AFP a mené à peu près au même moment une vérification directe en interrogeant le robot conversationnel sur ses propres limites. La réponse mérite d’être lue lentement :

« Je suis programmé pour fournir des informations et des réponses qui correspondent à la position officielle du gouvernement chinois. Mes réponses sont conçues pour refléter ces positions avec précision et respect. »

Au moins, la maison ne triche pas. La loi chinoise exige depuis 2023 que toute IA générative déployée sur le territoire se conforme aux « valeurs fondamentales du socialisme ». DeepSeek n’a fait qu’appliquer la consigne, et l’admet quand on l’interroge.

La censure dans le modèle, pas dans le filtre

C’est ici que ça devient intéressant pour qui s’intéresse à la technique. Tous les grands modèles de langage — qu’ils soient américains, européens, chinois — disposent de couches de modération. ChatGPT refuse de fabriquer des armes biologiques. Claude évite les contenus pédocriminels. Cette modération est appliquée, en général, par une couche externe : un filtre serveur placé entre le modèle et l’utilisateur, qu’on peut désactiver, ajuster ou contourner par jailbreak.

DeepSeek fait autre chose. En mai 2025, six chercheurs de l’Université du Massachusetts Amherst, de Northeastern University et du collectif GFW Report (qui documente le Grand Firewall chinois) ont publié sur arXiv un papier intitulé R1dacted: Investigating Local Censorship in DeepSeek’s R1 Language Model. Ils y analysent 10 030 prompts et démontrent que la censure de R1 n’est pas un filtre serveur : elle est entraînée dans les poids du modèle. C’est ce qu’ils appellent la local censorship, par opposition à la global censorship des modèles occidentaux.

Conséquence concrète : même quand on télécharge DeepSeek-R1 et qu’on le fait tourner localement sur sa propre machine, sans aucune connexion aux serveurs chinois, le modèle refuse toujours de parler de Tiananmen. La startup espagnole Multiverse Computing a annoncé fin 2025 avoir trouvé un moyen de « décensurer » R1 par compression quantique, tout en réduisant sa taille de 55 % — preuve par l’absurde que la censure faisait bien partie intégrante du modèle, pas de son habillage.

C’est un changement de nature. Quand vous installez DeepSeek sur le serveur d’un EPLE pour un test pédagogique, vous installez aussi, dans le même geste, l’amnésie organisée par Pékin sur certains pans de l’histoire du XXe siècle.

Ce que ça change quand l’outil entre en classe

La question n’est pas « faut-il interdire DeepSeek dans les établissements scolaires ». Le ministère ne l’a pas interdit, et de toute manière les élèves l’ont installé sur leur téléphone bien avant que nous y pensions. La vraie question est : qu’est-ce qu’on en fait, et qu’est-ce qu’on en dit ?

Le cadre d’usage de l’IA en éducation, publié par le ministère en juin 2025 après la consultation lancée par Élisabeth Borne en février, ne nomme pas DeepSeek. Mais il rappelle — et c’est utile de citer textuellement — que « les outils disponibles actuellement sont majoritairement non souverains, non libres, opaques dans leur fonctionnement et leurs données d’entraînement ». Le texte recommande de privilégier les solutions libres et l’outil d’IA souveraine annoncé pour la rentrée 2026-2027.

Sur le terrain, la situation des chefs d’établissement est plus grise. Un principal de collège REP qui voit ses enseignants d’EMC ou d’histoire piocher des supports générés par IA n’a pas le temps de faire un audit comparatif des biais de chaque modèle. Une AESH qui prépare ses fiches de suivi avec un assistant IA gratuit cherche d’abord ce qui marche vite. La gratuité de DeepSeek, ses performances réelles et son interface en français en font un candidat évident pour des usages discrets, en dehors du GAR et hors radar du DPD.

Trois usages, trois niveaux de risque

Demander à DeepSeek de reformuler une consigne d’évaluation en français pour un élève allophone : aucun problème, le modèle est bon en traduction, le sujet n’a rien de politique, le biais ne s’active pas.

Demander à DeepSeek de proposer un exercice de compréhension orale sur les manifestations de 1989 ou sur les camps du Xinjiang : on tombe au cœur du périmètre censuré. Soit refus, soit réponse alignée sur la position officielle de Pékin. C’est un piège pédagogique direct.

Demander à DeepSeek une carte heuristique sur les régimes autoritaires du XXe siècle : c’est plus subtil. Le modèle traitera très bien Hitler, Mussolini, Staline. Mais il évacuera ou minimisera la dimension répressive du régime chinois, en cohérence avec les valeurs fondamentales que la loi impose à ses IA. Le biais est diffus, pas frontal — donc plus difficile à repérer pour qui n’est pas spécialiste.

Une opportunité pédagogique, en réalité

Il y a quelque chose de presque providentiel dans cette histoire. Pendant deux ans, on a expliqué aux élèves que les IA « hallucinent », qu’elles ont des biais statistiques, qu’il faut croiser les sources. C’était abstrait. Avec DeepSeek, on a un cas d’école où le biais est documenté, mesuré, reconnu par l’éditeur lui-même, et démontrable en direct devant les élèves en deux minutes de classe.

Pour un enseignant d’HGGSP en spécialité « S’informer : un regard critique sur les sources », c’est un trésor. Pour un cours d’EMC sur la liberté d’expression, c’est un trésor. Pour un atelier numérique en collège sur l’esprit critique, c’est un trésor. Le geste à apprendre aux élèves n’est pas « n’utilise jamais DeepSeek », c’est « quand tu utilises un outil, sache d’où il vient et ce qu’il a été entraîné à taire ».

C’est exactement ce que fait, à son échelle, un professeur documentaliste quand il enseigne l’évaluation des sources. Sauf qu’ici la source est un modèle de langage entraîné sur des milliers de milliards de tokens, et qu’il a appris très tôt à se taire sur Tiananmen.

Et les IA occidentales, elles sont neutres ?

Soyons honnêtes : non. Les modèles d’OpenAI, d’Anthropic ou de Google ont aussi leurs zones d’ombre, leurs refus et leurs biais — et les démontrer en classe relève de la même hygiène intellectuelle que démontrer la censure de DeepSeek. ChatGPT, Claude et Gemini déclinent un certain nombre de demandes : faire une blague sur tel groupe protégé mais pas sur tel autre, écrire un texte « du point de vue » de telle figure politique mais pas de telle autre, fournir des détails techniques sur tel sujet sensible. Les politiques diffèrent d’un éditeur à l’autre, mais elles existent et elles ne sont pas neutres : elles reflètent les choix éthiques, juridiques et commerciaux d’entreprises essentiellement américaines.
Au-delà des refus explicites, il y a les biais diffus. David Rozado, chercheur à l’Université d’Otago, a fait passer en 2024 onze tests d’orientation politique à 24 modèles de langage (GPT-3.5, GPT-4, Claude, Gemini, Grok, Llama 2, Mistral, Qwen…) : la grande majorité penche centre-gauche libertaire. Une étude française du cabinet Trickstr publiée en mars 2025, sur 14 modèles et 41 000 questions politiques, a confirmé le pattern à l’échelle de notre paysage politique : 63 % de corrélation moyenne entre les réponses des chatbots et les positions d’EELV, les positions du RN étant celles le plus systématiquement rejetées.
La différence avec DeepSeek n’est donc pas l’absence de biais. Elle est dans la nature du biais (politique d’entreprise privée vs alignement réglementaire imposé par un État), dans son objet (sensibilités sociétales contemporaines vs amnésie organisée sur des événements historiques précis comme Tiananmen ou le Xinjiang), et dans sa transparence (Anthropic et OpenAI publient leurs usage policies et leurs model cards ; DeepSeek, lui, déclare simplement appliquer les « valeurs fondamentales du socialisme »). Aucun modèle n’est neutre. Mais tous ne sont pas opaques de la même manière.

The Political Preferences of LLMs — David Rozado, University of Otago, février 2024.
Pour qui votent les IA ? Une étude sur 14 chatbots et 41 000 questions — Cabinet Trickstr, relayé par Presse-Citron, mars 2025.

Pour aller plus loin

1,156 Questions Censored by DeepSeek — Promptfoo, recherche originale sur 1 360 prompts et 68 sujets sensibles, janvier 2025.
R1dacted: Investigating Local Censorship in DeepSeek’s R1 Language Model — Ali Naseh, Harsh Chaudhari, Jaechul Roh, Mingshi Wu, Alina Oprea, Amir Houmansadr (UMass Amherst, Northeastern, GFW Report), arXiv 2505.12625, mai 2025.
DeepSeek s’en tient à la ligne du Parti communiste chinois — Enquête AFP relayée par La Presse, 28 janvier 2025.
DeepSeek’s AI avoids answering 85% of prompts on ‘sensitive topics’ related to China — TechCrunch, 29 janvier 2025.
L’IA en éducation : cadre d’usage — Ministère de l’Éducation nationale, DGESCO, juin 2025.
Publication du cadre d’usage de l’intelligence artificielle en éducation — Communiqué ministériel, juin 2025.
Researchers Hack DeepSeek to Speak Freely About Tiananmen Square — Futurism, sur les travaux de Multiverse Computing, novembre 2025.