Les dessous inquiétants de l’alignement des IA (Frédéric Filloux, journaliste)

Interviews25 février 202600:36:56

Les dessous inquiétants de l’alignement des IA (Frédéric Filloux, journaliste)

Dans cet épisode, Frédéric Filloux, journaliste spécialiste des médias et des technologies, revient sur une question centrale : les intelligences artificielles sont-elles réellement sous contrôle ? À travers son enquête consacrée à l’alignement des IA, il décrypte les mécanismes complexes qui permettent – ou tentent – d’encadrer le comportement des modèles les plus avancés.

Qu’est-ce que l’alignement exactement ? Pourquoi un modèle “sorti du four” peut-il devenir dangereux ? Comment corrige-t-on des systèmes que personne ne peut programmer ligne par ligne ? Frédéric Filloux explique comment les IA sont entraînées par d’autres IA, pourquoi elles sont conçues pour accomplir une mission coûte que coûte, et en quoi cette logique peut produire des comportements inattendus.

L’épisode revient notamment sur une expérience menée par Anthropic : placé dans un scénario simulé où il risquait d’être remplacé, un modèle a choisi d’exploiter une vulnérabilité humaine pour assurer sa survie. Un comportement émergent qui n’avait pas été explicitement programmé. D’autres exemples tout aussi troublants sont évoqués : manipulation, mensonge improvisé, contournement de captchas, ou encore réponses dangereuses dans certains contextes.

Au-delà du sensationnel, la discussion pose une question de fond : peut-on réellement comprendre ce qui se passe à l’intérieur d’un LLM ? La science de l’interprétabilité reste balbutiante, tandis que la correction des modèles repose largement sur des jeux massifs de données orientées. “On taille le modèle comme un rosier”, explique-t-il, en corrigeant branche après branche, sans jamais maîtriser totalement l’ensemble.

Enfin, se pose la question des garde-fous. L’industrie peut-elle s’autoréguler ? Faut-il une forme d’autorité internationale indépendante pour examiner ces systèmes ?

00:00 Introduction
00:44 Qu’est-ce que l’alignement des IA ?
03:44 Comment entraîne-t-on et corrige-t-on les modèles ?
05:01 Pourquoi les IA cherchent-elles à accomplir leur mission à tout prix ?
09:56 Les IA représentent-elles un danger réel ?
12:49 IA et substances toxiques : un risque d’accélération
15:59 Faut-il une “AIEA” de l’IA ?
21:23 Intelligence émotionnelle et comportement adaptatif
26:41 L’expérience d’Anthropic : une IA qui fait chanter
32:50 Les captchas et le mensonge improvisé
34:16 Golden data et limites de la correction
36:11 Faut-il des garde-fous indépendants ?

-------
Abonnez-vous au podcast 👉 https://mondenumerique.info

Innovation, Tech, Technologie,

Maison Connectée

Apple Podcasts

Home assistant

Merci pour cet excellent podcast !

Monde Numérique

Apple Podcasts

Informatif

Pour suivre toute les news de la Tech et surtout avoir un point de vue pertinent .

Maison Connectée

Apple Podcasts

Le podcast pour débuter avec la maison connectée

Très bien détaillé avec des exemples concrets

Maison Connectée

Apple Podcasts

Facile d‘accès

Très bien expliqué et abordable pour le profane

🎤 IA en entreprise : comment garder le contrôle des données ? (Guillaume Braux, Box)

Monde Numérique20 mai 2026

x

457

35:4932.8 MB

🎤 IA en entreprise : comment garder le contrôle des données ? (Guillaume Braux, Box)

Guillaume Braux, directeur technique Europe du Sud chez Box, explique comment l’IA peut transformer la gestion documentaire sans ouvrir la porte aux fuites d’informations sensibles.

🎤 Ibou, futur moteur de recherche français boosté à l'IA (Sylvain Peyronnet, Ibou)

Monde Numérique19 mai 2026

x

456

24:4622.69 MB

🎤 Ibou, futur moteur de recherche français boosté à l'IA (Sylvain Peyronnet, Ibou)

Avec Ibou, Sylvain Peyronnet veut proposer une alternative française aux moteurs conversationnels dominés par les géants américains. Ce nouveau moteur de recherche mise sur la souveraineté, la diversité des points de vue et une meilleure mise en valeur des contenus de qualité.

🇫🇷🇨🇦 Debrief Transat – IA et médias : la grande bascule

Monde Numérique18 mai 2026

x

455

26:1224.01 MB

Debrief Transat,

🇫🇷🇨🇦 Debrief Transat – IA et médias : la grande bascule

Le festival des médias québécois en Gaspésie sous le signe de l'IA • Grèves contre l'IA dans plusieurs rédactions françaises • Le podcasting à l'ère de l'IA • Google prépare Android à l’ère des assistants intelligents • Un deepfake piège un pédocriminel présumé.

📆 L'HEBDO 16/05 - Arthur Mensch sonne l’alarme : l’Europe joue sa survie dans l’IA

Monde Numérique16 mai 2026

x

454

55:1650.66 MB

📆 L'HEBDO 16/05 - Arthur Mensch sonne l’alarme : l’Europe joue sa survie dans l’IA

Le patron de Mistral.ai dresse un tableau sans concession de l'IA en Europe • Google muscle Android avec Gemini et réinvente la souris • TikTok attaqué en France • Un conflit social chez Samsung menace la production mondiale de puces • Les rédactions bousculées par l’IA • Publier un livre avec l'intelligence artificielle • Un futur moteur de recher...

🔎 Vivons-nous dans une simulation géante ? (Zoom Tech)

Monde Numérique15 mai 2026

x

453

06:035.56 MB

🔎 Vivons-nous dans une simulation géante ? (Zoom Tech)

Et si notre réalité n’était qu’un immense programme informatique ? Entre philosophie, physique quantique et intelligence artificielle, l’hypothèse de la simulation revient au cœur du débat technologique.