🎤 Interview – Hugging Face : l’explosion des modèles d'IA ouverts (Jeff Boudier)
Maison Connectée10 décembre 202517:31

🎤 Interview – Hugging Face : l’explosion des modèles d'IA ouverts (Jeff Boudier)

Avec deux millions de modèles d'intelligence artificielle générative disponibles, la startup franco-américaine Hugging Face est devenue la référence en matière d'IA open source. Elle prend désormais le virage des agents IA et de la robotique.

Interview : Jeff Boudier, Directeur commercial chez Hugging Face

Vous proposez aujourd'hui plus de deux millions de modèles sur Hugging Face, comment expliquer une telle diversité ?

L’IA ne se limite pas aux LLM comme ChatGPT : c’est un écosystème immense, une véritable foret amazonienne. Sur Hugging Face, on trouve des modèles qui génèrent du texte, mais aussi des images, de la vidéo, du son, qui travaillent dans toutes les langues ou encore sur des applications métiers comme la finance.

Notre mission est claire : démocratiser l’IA. Nous ne voulons pas d’un monde dominé par une poignée d’acteurs. Toute organisation, quelle que soit sa taille, doit pouvoir construire sa propre IA.
Pour cela, nous hébergeons des millions de modèles, datasets et applications, et nous fournissons des outils open source comme nos librairies d'entraînement ou l’écosystème Spaces, notre véritable App Store de l’IA. Plus de 12 millions d’AI builders les utilisent aujourd’hui.

Pourquoi vous être lancé aussi dans la robotique ?

Nous publions de nombreuses ressources scientifiques — de véritables “bouquins techniques” comme The Ultra-Scale Playbook — pour aider la communauté à comprendre et construire des modèles, mais il fallait aussi quelque chose de plus tangible pour le grand public. C’est là qu’intervient Richie Mini, notre robot pédagogique conçu avec Pollen Robotics (que nous avons acquis). Il écoute, voit, parle, interagit… et permet d’expérimenter concrètement avec des modèles de vision ou de parole. Le lancement a dépassé toutes nos attentes : plus de 5 000 robots vendus le premier mois, disponibles dans le monde entier pour environ 300 dollars.

Les agents IA sont-ils la prochaine révolution ?

Oui, les agents représentent clairement l’évolution naturelle de l’IA. L’an dernier, à AWS re:Invent, on parlait d’IA générative. Cette année, tout tourne autour des agents. Un agent ne se contente plus de générer une réponse : il choisit des outils, raisonne, explore plusieurs chemins avant d’aboutir. Cela ouvre d’immenses possibilités mais aussi de nouveaux défis, notamment technologiques et économiques : un système agent peut consommer des millions de tokens, ce qui change complètement l’équation du coût. Heureusement, les modèles ouverts ont fait un bond spectaculaire. Chaque semaine, un nouveau modèle open source de pointe apparaît sur Hugging Face : Mistral 3, DeepSeek V3.2, Qwen, etc. Avec Hugging Chat, on peut créer soi-même un agent capable de naviguer, raisonner ou utiliser des outils.


Jeff Boudier: [0:01] D'une certaine manière, Chat GPT, c'est un peu l'arbre qui cache la forêt, Jeff Boudier: [0:06] mais la forêt, c'est l'Amazonie, en fait. D'accord ? Donc, 2 millions de modèles, c'est quoi ? Oui, tu as des modèles qu'on appelle LLM qui vont produire du texte, mais tu as aussi des modèles qui vont produire des images, qui vont travailler sur la vidéo, qui vont travailler sur la parole, qui vont faire des trucs dans n'importe quelle langue, qui vont faire des trucs pour la finance, etc. Donc, c'est une diversité incroyable de modèles. Monde Numérique : [0:35] Bonjour, Jeff Boudier. Jeff Boudier: [0:37] Bonjour Jérôme. Monde Numérique : [0:38] Directeur commercial chez Hugging Face. Nous sommes à Las Vegas à l'événement ReInvent d'AWS, filet cloud d'Amazon, donc consacré à toutes les innovations technologiques autour du cloud. Ravi de te recevoir dans le monde numérique. Hugging Face, licorne maintenant, franco-américaine, qui a connu une croissance phénoménale. Qui propose plus d'un million de modèles d'intelligence artificielle. Est-ce qu'on peut dire qu'en effet, c'est un peu l'App Store de l'IA ? Jeff Boudier: [1:09] C'est une définition assez intéressante. Et d'ailleurs, App Store de l'IA, on a, un App Store de l'IA. On appelle ça Spaces. Donc, sur Hugging Face, c'est plus un million maintenant, c'est deux millions. C'est pour te dire. C'est difficile de garder le dernier chiffre. En tout, il y a six millions de modèles, datasets et applications. Et ces applications, c'est ce qu'on appelle Spaces. Donc, tu vas là-dessus et tu dis, trouve-moi un space pour enlever le background d'une image. Trouve-moi un space pour traduire le français en anglais, etc. Monde Numérique : [1:48] Pour publier des podcasts, etc. Jeff Boudier: [1:50] Alors, publier des podcasts, je pense qu'il va falloir faire un petit peu de boulot. Mais effectivement, il y a des centaines de milliers d'applications en libre-service et ces applications, tu peux les brancher à tes assistants. Donc, si tu utilises un Cloud Code pour programmer, si tu utilises Cloud juste pour poser des questions, tu peux brancher Hugging Face, ça s'appelle MCP, je ne sais pas si tu as entendu parler, Mais MCP Server, en fait, ça te permet de brancher des outils comme ça à tes assistants. Et donc, du coup, ton assistant, il peut consulter la documentation. Monde Numérique : [2:26] Donc, via une API ? Jeff Boudier: [2:27] Oui, oui. La version IA de l'API, en fait, c'est MCP. Monde Numérique : [2:35] OK. Donc, voilà, vous avez inventé chez GingFace ce concept un peu de magasin de modèles d'IA. Essentiellement des modèles open source. Jeff Boudier: [2:43] Oui, essentiellement. Enfin, complètement. Complètement. Enfin, je vais essayer essentiellement parce que parmi ces 6 millions de modèles, dataset et applications, il y a 2 millions qui sont en accès libre, open source ou des licences diverses. Et il y a aussi, et ça, les gens ne le savent pas forcément, 2 millions de modèles qui sont en fait privés. Ce n'est pas qu'ils sont propriétaires ou open source, ils sont privés, c'est-à-dire que des organisations, on est à temps. 300 000 organisations qui se sont créées sur Hugging Face pour pouvoir travailler de manière privée sur leur modèle, dataset, etc. Monde Numérique : [3:16] OK. Parce que vous fournissez le modèle et vous fournissez aussi l'hébergement. Jeff Boudier: [3:20] On héberge tout ça. Monde Numérique : [3:21] Vous hébergez tout ça. Jeff Boudier: [3:22] Et c'est... Alors, c'est une taille colossale. Je parlais de millions de modèles. On a 12 millions de... On les appelle AI Builders. C'est les utilisateurs de Hugging Face qui font de l'IA. Il y a 12 millions de AI Builders et aujourd'hui, on sert... Des centaines de pétabits de données par mois. Alors, centaines de pétabits, c'est quoi ? Monde Numérique : [3:46] C'est beaucoup. C'est à peu près comme Netflix. Ah, d'accord. Jeff Boudier: [3:48] Donc, on est à la taille de Netflix en termes de services de fichiers d'IA. Monde Numérique : [3:53] C'est qui vos clients, vos utilisateurs ? Jeff Boudier: [3:55] Alors, c'est vraiment un peu tout le monde. Dans les 12 millions de AI builders, déjà en termes de... Tu as des chercheurs ? Ceux qui produisent de l'IA, tu as des data scientists, ceux qui utilisent l'IA pour créer des modèles dans leur société, tu as les ingénieurs qui construisent les systèmes autour de l'IA, et maintenant tu as aussi les développeurs. Parce que quand tu construis une application web, une application mobile, une application serveur, etc., en fait, tu utilises tout un tas de petits modèles spécialisés open source, et donc de plus en plus, on a des développeurs qui viennent sur HagingFace, Jeff Boudier: [4:31] pour créer leur application avec des modèles ouverts. Monde Numérique : [4:34] C'est ça qu'on a un peu de mal à comprendre quand on est utilisateur lambda, grand public, non professionnel, on va dire. On connaît ChatGPT, on connaît Gemini, on connaît peut-être un peu Copilot aussi en entreprise et tout. Mais on a l'impression que c'est une poignée de chatbots, de modèles. Quel intérêt qu'il y ait 2 millions de modèles d'IA disponibles sur le marché ? Jeff Boudier: [4:57] C'est vrai que d'une certaine manière, ChatGPT, c'est un peu l'arbre qui cache la forêt. mais la forêt, c'est l'Amazonie, en fait. D'accord ? Donc, 2 millions de modèles, c'est quoi ? Oui, tu as des modèles qu'on appelle LLM qui vont produire du texte, mais tu as aussi des modèles qui vont produire des images, qui vont travailler sur la vidéo, qui vont travailler sur la parole, qui vont faire des trucs dans n'importe quelle langue, qui vont faire des trucs pour la finance, etc. Donc, c'est une diversité incroyable de modèles. Et en fait, notre mission, c'est de démocratiser l'IA et on ne veut pas vivre dans un monde où tu as une ou une poignée de sociétés qui contrôlent la technologie de toutes les boîtes du monde, de toutes les applications sur ton téléphone, de tous les sites que tu vas utiliser. Nous, on veut que toutes les boîtes, quelle que soit leur taille, tous les gens qui s'y intéressent puissent s'approprier et construire leur propre IA. Et donc, pour faire ça, on doit faire tous ces trucs. Donc, c'est héberger les millions de modèles pour les rendre faciles à disposition, publier des librairies logicielles ouvertes, donc open source, pour pouvoir utiliser tout ça et faire de l'entraînement, faire déployer des modèles, etc. Jeff Boudier: [6:13] Et on doit aussi, et c'est super important, faire de l'éducation pour que le grand public n'en reste pas à, ah oui, l'IA, c'est OpenAI, anthropiques, Jeff Boudier: [6:25] voilà, et la poignée d'acteurs propriétaires. Monde Numérique : [6:28] Et alors, ça passe par quoi cette éducation, c'est-à-dire ? Jeff Boudier: [6:31] Cette éducation... Monde Numérique : [6:33] Vous faites des robots, depuis peu vous vous êtes lancé aussi dans la robotique, et avec justement cette optique très didactique, pédagogique. Jeff Boudier: [6:40] Alors, éducation, on fournit des contenus scientifiques qui permettent à la communauté de l'IA de construire leur propre modèle. Donc, notre équipe de sciences a publié non seulement des modèles fondationnels de frontières pour faire du code, pour faire du texte, etc., mais surtout des bouquins. Je vais les appeler des bouquins. C'est des blogs post-techniques qui prennent des journées à lire. Ce sont des bouquins qui te permettent... De t'approprier toute la connaissance à travers de nos expériences de science en construisant tous ces modèles, the ultra-scale playbook, etc. Et ensuite, effectivement, il y a aussi le grand public. Donc, comment est-ce qu'on éduque le grand public à tous ces différents types de modèles qui peuvent t'écouter, te traduire, qui peuvent te voir, etc. Eh bien, justement, Richie Mini, c'est le robot dont tu parlais. Richie Mini, c'est quoi ? C'est un robot qui a à peu près cette taille que tu poses sur ton bureau. Monde Numérique : [7:45] Une grosse bouteille d'eau. Jeff Boudier: [7:45] À peu près. Avec une petite tête articulée super mignonne et des antennes vachement expressives. Et en fait, c'est un robot qui peut t'entendre, un haut-parleur, donc il peut te parler. C'est un robot qui peut te voir et s'exprimer. Jeff Boudier: [8:01] Et donc, avec ça, tu peux brancher ça à ton ordinateur. Tu vas sur Hugging Face et tu peux expérimenter avec tous ces modèles de paroles, de visions, et vraiment t'initier à l'IA de manière physique et palpable. Monde Numérique : [8:15] Donc ça, c'est utilisé, utilisable dans les écoles, les universités ? Jeff Boudier: [8:21] Oui, on a lancé ça il n'y a pas longtemps. Monde Numérique : [8:23] C'est tout neuf. Jeff Boudier: [8:25] Dès la sortie, ça a été un succès incroyable. Et je pense que les gens qui se passionnent le plus, ce sont vraiment les fans d'IA. Donc c'est les AI builders enthousiastes qui veulent expérimenter avec les modèles chez eux, de manière complètement autonome et privée. Et on a vendu plus de 5000 robots le premier mois. Monde Numérique : [8:48] D'accord. Disponible en France ? Jeff Boudier: [8:50] Oui, c'est global. D'ailleurs, la société qui, l'a conçue et qui l'a fait, c'est Pollen Robotics, dont on a fait l'acquisition plus tôt cette année. Ils faisaient des robots humanoïdes. Monde Numérique : [9:06] Oui, que j'avais vu au CES en janvier dernier en janvier 2025 ouais. Jeff Boudier: [9:11] Et donc maintenant, il y a la version Richie Mini, 300 dollars pour s'amuser sur l'IA. Monde Numérique : [9:17] Alors c'est amusant parce qu'avec Hugging Face, on a l'impression qu'on replonge un peu à l'époque des débuts de l'informatique, où finalement, tout le monde pouvait mettre les mains là-dedans. Il y avait des communautés de passionnés. Et c'est ça aussi un peu la magie du numérique, je veux dire. C'est que le ticket d'entrée n'est pas très élevé. Il suffit d'être très curieux et puis on peut accéder. On peut aujourd'hui jouer à l'IA, faire de l'IA, comme à l'époque on faisait de l'informatique finalement ? Jeff Boudier: [9:44] Et je pense que c'est même encore plus accessible. C'est encore plus accessible parce que, donc je parlais de Hugging Chat. Hugging Chat, c'est quoi ? C'est comme ton chat GPT, mais qu'avec des modèles ouverts en open source. C'est sur notre site, HuggingFace.co.chats. Tu as juste besoin de demander à faire des choses. Si tu veux aller créer un agent qui navigue pour aller faire tes courses. Donc, il y a un computer use. Monde Numérique : [10:09] Alors ça, c'est possible. Je peux aller créer, fabriquer mon propre agent ? Jeff Boudier: [10:12] Oui, oui. D'accord. Parce qu'en fait, toutes ces applications, je parlais tout à l'heure, on parlait de l'App Store de l'IA, d'accord ? Donc, les Spaces. Donc, ce genre d'applications et de démos, ce sont des sites, des mini-sites interactifs sur lesquels tu peux donner une photo, t'enregistrer, machin, et faire tourner l'IA. Tout ça, ce sont des repositories, je ne sais pas comment dire en français. Monde Numérique : [10:38] Oui, des... J'allais dire des dépotoirs. Jeff Boudier: [10:42] Alors, le dépotoir, tu peux le dupliquer en un bouton pour le mettre chez toi et le customiser. Et le programme, c'est juste un petit programme en Python. Donc, c'est vraiment très accessible, plus accessible, je pense, que l'informatique à l'époque. Monde Numérique : [10:55] C'est marrant. Les agents, tu as parlé des agents. C'est le mot-clé en ce moment. Effectivement. C'est la grande tendance. Monde Numérique : [11:03] Comment est-ce que tu vois ça ? Est-ce que vraiment, c'est la révolution dans la révolution de l'IA, les agents ? Jeff Boudier: [11:08] Alors, les agents, c'est l'évolution. C'est l'évolution de l'IA. L'année dernière, ici à ReInvent, moi, c'est la quatrième année que je suis à ReInvent. On travaille avec AWS depuis 5 ans, depuis que je suis chez HagingFace. Donc, l'année dernière, on parlait de Generative AI, donc l'IA Générative. Cette année, c'est Agents. Agence, c'est l'évolution, c'est-à-dire qu'au lieu d'avoir une application IA qui utilise un modèle, on va créer un système autour du modèle, un système dans lequel ce qui va en sortir n'est pas forcément déterministique, ou le chemin pour y arriver n'est pas forcément déterministique. En fonction de la question que tu lui poses, il va y avoir un processus de raisonnement où il va prendre des décisions d'utiliser tel ou tel outil pour finalement arriver à la conclusion qui sera proposée. Donc ça, effectivement, c'est une évolution au-dessus de l'IA générative et qui pose tout un tas de nouveaux challenges pour les entreprises. Monde Numérique : [12:16] Des challenges technologiques et aussi des challenges réglementaires. Comment est-ce que vous voyez, vous, en tant qu'entreprise française, mais fortement présente aussi aux États-Unis ? Jeff Boudier: [12:26] Ou entreprise américaine et fortement présente en France ? Monde Numérique : [12:29] Oui, on peut dire que c'est dans ce sens-là aussi, bien sûr. Jeff Boudier: [12:31] On a commencé à Brooklyn, quand même. Monde Numérique : [12:33] Ah oui, d'accord. Mais vous, les fondateurs sont français. Certes. Vous avez eu l'occasion, d'ailleurs, de les recevoir dans le monde numérique. Clément Deland, Thomas Wolf. Jeff Boudier: [12:42] Etc. Monde Numérique : [12:44] Oui, comment est-ce qu'en France, on a plein de bonnes choses en France, en Europe, etc., mais on pleurniche un peu aussi par rapport à la réglementation. Concrètement, est-ce que l'AI Act, qui est dans les tuyaux, son application va être un peu retardée, est-ce que c'est un problème pour toi, pour le développement de l'IA ? Jeff Boudier: [13:06] C'est une bonne question. On a une équipe incroyable pour toutes les questions de société et de public policy qui a produit des ressources pour décoder un petit peu l'AI Act et comment le prendre en main. Jeff Boudier: [13:25] Je pense que tout ça il y a une évolution les challenges dont on m'a, le plus parlé ici à reInvent, j'ai croisé énormément de boîtes qui ont expérimenté sur le sujet ils ne sont pas vraiment d'ordre réglementaire, ils sont plus d'ordre, technologique et d'ordre de contrôle des coûts parce qu'une chose qui n'est pas forcément bien comprise c'est que quand tu passes du modèle d'IA générative au système agent, en fait, tu passes d'un système qui va consommer peut-être un millier de tokens, donc tokens, c'est l'unité de mesure du truc, à des millions de tokens. Et donc, du coup, tu te retrouves à construire des systèmes où lorsque l'utilisateur pose une question, toi, ça ne va pas te coûter un centime, ça va te coûter 3 dollars, 5 dollars, etc. Donc, c'est extrêmement, c'est des nouveaux challenges. Donc là, il y a vraiment un gros, gros sujet pour réduire les coûts. Un sujet qui est d'ingénierie. On ne construit pas les agents de la même manière dont on construisait les applications web traditionnelles, les applications traditionnelles. Il y a des bonnes pratiques. Mais on est encore dans cette phase de découverte où les boîtes commencent par le chemin le plus simple. Jeff Boudier: [14:51] Sur les aspects réglementaires, ce que j'entends, c'est qu'effectivement, de la part, par exemple, d'entreprises américaines qui ont des directives très fortes et claires sur la provenance des modèles qu'ils ont l'autorisation d'utiliser. C'est la même chose, je pense, en Europe. La bonne nouvelle, c'est qu'on a des beaux modèles. Mistral a publié Mistral 3 sur Hugging Face au début de la semaine, je crois, juste lundi. Donc, on est vraiment dans une situation différente de ce point de vue-là, de là où on était il y a un an. Cette année, c'était un petit peu l'année de l'explosion des LLM et aussi de leur arrivée à maturité, où ils deviennent un petit peu boring, tu vois. Et on est dans une situation où l'année a commencé avec tremblement de terre, DeepSync R1. Jeff Boudier: [15:49] Désormais, on peut faire la même chose que ce qu'on ne pouvait faire qu'avec OpenAI en tropique, avec un modèle ouvert. Donc ça, c'était DeepSync R1. Aujourd'hui, sur Hugging Face, chaque semaine, il y a l'équivalent d'un DeepSync R1. D'ailleurs, lundi, il y avait DeepSync V3.2. Et donc, on est dans une situation... Monde Numérique : [16:10] Donc, ce n'est plus un truc exceptionnel, le DeepSync qui peut tourner comme ça avec des ressources beaucoup plus limitées. Jeff Boudier: [16:17] Le fait qu'il y ait un nouveau modèle ouvert sur Hugging Face qui soit à la pointe, au même niveau que les meilleurs modèles géants privés dont on parlait, des modèles privés dont on parlait, c'est quelque chose qui arrive chaque semaine. Et donc, si tu vas sur Artificial Analysis, tu sais, ils ont des dashboards où ils te montrent un petit peu le leaderboard, quels sont les meilleurs modèles au jour le jour. Dans les 20 meilleurs modèles, sur les questions de raisonnement et d'intelligence à gens, etc., sur les 20 meilleurs modèles, 9 sont open source. Et si tu veux du modèle américain, tu as OpenAI, GPT, OSS. Si tu veux du modèle européen, tu as Mistra. Si tu veux du modèle chinois, tu as Kuen, de Alibaba, tu as DeepSeek, tu as Kimi. Enfin, il y a un choix. Les entreprises ont vraiment le choix. Monde Numérique : [17:10] Merci beaucoup. Jeff Boudier: [17:11] Mais je t'en prie. Monde Numérique : [17:12] Jeff Boudier, directeur commercial chez Hugging Face. Merci de nous avoir éclairé sur l'état de l'art un peu de l'IA ici à ReInvent à Las Vegas.
innovation,informatique,technologies,tech news,High-tech,AWS,Open Source,agents ia,numérique,actualités,