Aristote, l'IA souveraine à la française (Renaud Monnet, Centrale Supelec)

Le Digital Lab de Centrale Supelec a développé une IA générative souveraine pour les universités et les entreprises.

🎤 Interview

Renaud Monnet, directeur du Digital Lab de Centrale Supelec

En quoi Aristote permet-il de rendre l'intelligence artificielle générative souveraine ?

Aristote est une solution installée sur des serveurs en France, afin d’offrir une garantie contre la fuite éventuelle de données, qui orchestre différentes IA open source. Aristote fait collaborer ces IA pour obtenir des résultats spécifiques. Cette solution est principalement destinée aux universités pour traiter des vidéos de cours, les résumer, créer des quiz et enrichir le contenu pédagogique, tout en garantissant une totale confidentialité. Il permet également la production automatique de comptes-rendus de réunion dans un cadre souverain, comme avec notre partenaire privé Whaller.

Pourquoi dites-vous qu’Aristote présente aussi un avantage sur le plan environnemental ?

Aristote consolide les usages de différentes universités sur des serveurs très haut gamme, permettant une utilisation optimale et rentable sur le plan économique et environnemental. Ainsi, en mutualisant les ressources, nous garantissons une utilisation continue et maximale des serveurs, ce qui permet de réduire les coûts et l'empreinte écologique. Cela offre une solution plus abordable et efficace que de gérer des serveurs individuellement pour chaque entreprise ou université.

Par ailleurs, en quoi consiste le modèle de langage Croissant également développé à Centrale Supelec ?

Croissant est un petit modèle de langage entraîné principalement en français, capable de traiter et de résumer des textes. Contrairement aux grands modèles américains, Croissant est frugal et peut fonctionner sur un simple PC ou téléphone, garantissant une totale confidentialité des données. Nous avons aussi créé Securitrad, un outil de traduction confidentiel qui fonctionne directement dans le navigateur sans envoyer de données sur des serveurs externes, répondant ainsi aux besoins de confidentialité des utilisateurs.

Renaud Monnet :

[0:00] Et ce que fait Aristote, c'est qu'il orchestre différentes intelligences artificielles, toutes open source et toutes installées en France, pour les faire collaborer ensemble.

Monde Numérique :

[0:16] Bonjour Renaud Monnet.

Renaud Monnet :

[0:17] Bonjour.

Monde Numérique :

[0:18] Vous êtes directeur du Digital Lab de Centrale Supélec. Alors Centrale Supélec, on ne te présente plus, grande école française installée sur le plateau de Saclay en région parisienne. Et le Digital Lab que vous dirigez, qu'est-ce que c'est exactement ?

Renaud Monnet :

[0:32] Le Digital Lab, on l'a créé il y a une dizaine d'années. C'est un dispositif de prototypage pour des usages digitaux innovants. Ce qu'on fait, c'est qu'on fait travailler des entreprises et des étudiants ensemble pour résoudre une problématique, créer un nouveau produit avec des coachs professionnels en design et en technologie. Et donc, notre méthodologie a permis de construire plus de 400 prototypes en 10 ans dans des domaines très variés, il y a vraiment tous les secteurs d'activité et avec des technologies qui parfois incluent l'intelligence artificielle, parfois du cloud, parfois des objets connectés, donc on innove en équipe et dans une approche centrée sur l'humain.

Monde Numérique :

[1:14] Et alors, vous avez développé notamment une solution qui s'appelle Aristote, qui va bien au-delà du cadre purement universitaire, puisque c'est utilisé aujourd'hui par des entreprises. On peut citer par exemple le réseau social à la française Waller, qui vient de signer un partenariat avec vous, car Aristote, c'est un outil, si j'ai bien compris, qui permet de rendre à l'intelligence artificielle générative, ce qui lui manque le plus aujourd'hui, notamment pour nous, les Français et les Européens, c'est de la souveraineté. C'est bien ça. Comment est-ce que vous rendez de la souveraineté aux grands modèles, les LLM, pour l'intelligence artificielle générative ?

Renaud Monnet :

[1:54] Alors, une IA souveraine, c'est avant tout une intelligence artificielle qu'on fait tourner sur des serveurs qui sont complètement maîtrisés, souverains en France et dont on est certain que les données ne fuitent pas. Donc la souveraineté de l'intelligence artificielle, c'est avant tout la souveraineté des serveurs. Pour pouvoir installer une intelligence artificielle sur un serveur français et souverain, il faut qu'elle soit open source, que vous puissiez l'utiliser librement, gratuitement, que la licence le permette. Et donc il y a quelques grandes intelligences artificielles open source dans le monde aujourd'hui. Il y en a une produite par le groupe Meta, qui s'appelle Lama. Il y en a une qui est produite par Mistral AI, la startup française. Et donc, ces modèles open source, vous les prenez, vous les modifiez éventuellement, vous les fine-tunez pour vos propres usages, mais surtout, vous les installez sur des serveurs souverains en France. Et ce que fait Aristote, c'est qu'il orchestre différentes intelligences artificielles, Tout open source et tout installé en France pour les faire collaborer ensemble,

Renaud Monnet :

[3:05] à la fin avoir un résultat qui est ce que le client cherche à obtenir. Notre cœur de cible, c'est vraiment des universités, des écoles. C'est un produit qui, avant tout, a des fins pédagogiques. Il vise à traiter des vidéos de cours.

Renaud Monnet :

[3:22] Les universités ont des dizaines de milliers de vidéos de cours qui ont été enregistrées. Et donc Aristote a pour vocation de traiter ces vidéos, d'en faire des résumés, des quiz, des enrichissements pédagogiques et par ailleurs on peut aussi faire des comptes rendus de réunion et c'est pour ça que Waller s'est appuyé sur Aristote pour produire automatiquement les comptes rendus de réunion dans Waller.

Monde Numérique :

[3:48] Donc en fait, quand on parle de souveraineté, le corollaire c'est vraiment la question de la confidentialité des données, ça veut dire s'assurer que les données ne partent pas n'importe où et notamment dans des pays étrangers.

Monde Numérique :

[4:02] Est-ce que du coup, Aristote règle définitivement le problème qu'on peut craindre avec du OpenAI, avec du ChatGPT, du Gemini ? Est-ce que vous pouvez travailler également avec ces grands noms de l'IA ?

Renaud Monnet :

[4:18] Alors, la question de savoir si les données que vous donnez à votre intelligence artificielle peuvent fuiter vers un pays étranger ou pas, ça dépend vraiment de ces données. Là, si on a envie tous les deux de rédiger un petit article qu'on va publier dans un quart d'heure, c'est peut-être pas si grave si on le donne à une intelligence artificielle américaine. En revanche, si on a envie de travailler sur un support de cours qui est pour un niveau master et qui a été fait par un professeur d'université, là, on n'a pas du tout envie que ce cours parte à l'étranger. Donc, Aristote, il est là pour proposer au monde de l'enseignement supérieur et au monde de l'éducation, une solution souveraine, alternative à ChatGPT, pour les situations dans lesquelles on n'a pas envie que les données fuitent. Donc, clairement, les données ne fuient pas quand on utilise Aristote, mais néanmoins, vous pouvez utiliser ChatGPT dans certaines situations à partir du moment où vous n'avez pas de crainte sur les données que vous utilisez. Il faut donc, Pour chaque usage, se demander si on utilise une IA plutôt américaine type Gemini ou Chagipiti ou une IA souveraine comme Aristote.

Renaud Monnet :

[5:30] Nous, ce qu'on a voulu faire avec Aristote, c'est proposer une alternative crédible et souveraine, éco-responsable et destinée au monde universitaire parce qu'il y a beaucoup de sujets de confidentialité dans l'université puisque vous savez que les programmes d'enseignement sont adossés à de la recherche et que la recherche est parfois

Renaud Monnet :

[5:50] ou souvent confidentielle.

Monde Numérique :

[5:51] Qu'est-ce que concrètement ça apporte par rapport à une IA et un modèle open source que j'installerais par exemple en tant qu'entreprise sur mes propres serveurs ? Finalement, il n'y aurait pas de lien avec des entreprises étrangères. En quoi est-ce qu'Aristote peut améliorer ça ?

Renaud Monnet :

[6:13] Alors, toute entreprise qui aujourd'hui est capable de prendre des serveurs d'intelligence artificielle qu'on appelle GPU de grande qualité, de très haute gamme.

Renaud Monnet :

[6:24] De les installer, de les opérer et de mettre des modèles dessus, effectivement, pourra apporter à peu près la même chose que ce qu'Aristote apporte. Néanmoins, nous, ce qu'on a voulu faire, c'est de dire, en mettant un service Aristote au service de l'ensemble des universités, Nous allons pouvoir consolider les usages de différentes universités sur les mêmes serveurs, donc en utiliser beaucoup moins, utiliser de ce fait des serveurs très haut de gamme, ce que potentiellement

Renaud Monnet :

[6:54] une entreprise ou une université ne pourrait pas forcément se payer. Nous, ce qu'on dit, c'est qu'un bon serveur, c'est un serveur qui est utilisé tout le temps, H24 à fond, puisque c'est comme ça qu'on le rentabilise du point de vue économique et également du point de vue environnemental. Vous savez que les études de l'ADEME ont montré que le coût environnemental d'un serveur, c'est 80% à sa fabrication et 20% à son utilisation. Autrement dit, une fois qu'il a été fabriqué, il faut l'utiliser à fond. Et donc, ce qu'apporte Aristote, c'est effectivement la consolidation des usages et le fait que les serveurs vont être utilisés à fond. Si chacun, en entreprise ou dans les universités, fait du chacun pour soi, soit ça va très bien fonctionner, mais ça va fonctionner avec des serveurs qui seront moins chargés et donc moins rentables.

Monde Numérique :

[7:44] Oui, donc il y a une optimisation pour répondre notamment à cet objectif de, j'allais dire de frugalité, non, mais de rentabilité.

Renaud Monnet :

[7:52] De frugalité, oui, de frugalité d'achat, puisque notre objectif, c'est d'acheter ou de louer le moins de serveurs possible. Et donc, effectivement, une fois que le serveur est là, c'est contre-intuitif, Mais la frugalité, ça consiste à lui donner un maximum de choses à faire et donc de collecter un maximum de tâches auprès d'un maximum d'acteurs et de les planifier dans le temps pour que même la nuit,

Renaud Monnet :

[8:15] le serveur soit chargé à fond.

Monde Numérique :

[8:18] Et aujourd'hui, Aristote est utilisé par combien d'entreprises, d'universités et d'entreprises éventuellement ?

Renaud Monnet :

[8:24] Alors aujourd'hui, il y a une plateforme qui s'appelle Pod, qui a été imaginée par l'Université de Lille et puis qui a été ensuite construite autour d'un consortium qui s'appelle ISUP. Et cette plateforme, elle est utilisée par 70 universités. La semaine dernière, elle a annoncé qu'elle s'était connectée à Aristote. Et donc, depuis mercredi dernier, les universités qui utilisent Pod sont en train de se connecter à Aristote, envoyer leurs premières vidéos pour qu'elles soient transcrites, traduites et enrichies avec des quiz. Et on est en train de regarder avec ces universités quels vont être les volumes qui vont nous envoyer d'ici la rentrée, puisque notre objectif est d'avoir un maximum de vidéos traduites,

Renaud Monnet :

[9:06] donc plusieurs dizaines de milliers potentiellement, d'ici septembre.

Monde Numérique :

[9:10] Parallèlement, vous avez développé à Centrale Supélec, Renaud Monnet, un LLM, un grand modèle de langage, mais qui est un petit modèle de langage, qui s'appelle Croissant. Vous pouvez nous en parler ?

Renaud Monnet :

[9:25] Oui, bien sûr. C'est le laboratoire MICS de Centrale Supélec qui a développé Croissant LLM. Le chercheur en charge de ce sujet s'appelle Pierre Colombeau. Et il a effectivement, avec son équipe, avec Manuel Feis, son doctorant notamment, entraîné un modèle pendant, on va dire, les fêtes de Noël et du jour de l'an, il y a six mois maintenant. Ce modèle, il a comme caractéristique d'être le modèle qui a ingéré le plus de données en français dans le monde. Donc, il est vraiment très franco-français. Du coup, il s'exprime bien en français. Il a ingéré la moitié de français et la moitié d'anglais. Du coup, il est plutôt bon pour les traductions anglais-français, français-anglais. C'est un très petit modèle, très frugal. Il est capable de tourner même sur un PC ou sur un téléphone. Et compte tenu de sa petite taille, c'est un modèle qui a peu de connaissances, donc qui est surtout pratique pour traiter du texte, traiter de l'information, la résumer, changer le niveau de langage, simplifier un texte ou lui donner peut-être une tournure un petit peu plus évoluée. Par contre, ce n'est pas un LLM qui va répondre à vos questions, il n'a pas de connaissances, ce n'est pas son travail.

Monde Numérique :

[10:44] Et il est utilisé lui aussi ou c'est juste un objet de recherche aujourd'hui ?

Renaud Monnet :

[10:49] Alors c'était d'abord un objet de recherche pour effectivement voir comment s'optimise l'apprentissage d'un LLM ça nous a permis de conduire d'autres travaux de recherche par la suite notamment dans le domaine du juridique on a sorti depuis d'autres modèles qui sont spécialisés dans le juridique en revanche on a été surpris par les capacités linguistiques de croissant donc surtout en français et donc on l'utilise effectivement dans certains noms d'applications, notamment la traduction et on a publié sur LinkedIn un petit outil de traduction qui s'appelle Securitrad et qui présente un intérêt tout bête, c'est que cette traduction se fait dans votre navigateur, donc tout ce que vous écrivez est traduit sans du tout sortir sur le réseau, ça reste totalement confidentiel alors que tous les autres traducteurs que vous connaissez, les Google, les Grammarly, Lille, Edipol, etc., eux envoient votre texte sur un serveur et donc finalement, savent exactement tout ce que vous écrivez et tout ce que vous traduisez.

Monde Numérique :

[11:53] Et c'est un outil qui est gratuit ?

Renaud Monnet :

[11:55] Tout à fait. Vous pouvez le trouver sur mon LinkedIn. Je l'ai publié à peu près il y a une semaine. Vous le téléchargez et il reste dans votre navigateur et vous pouvez l'utiliser à tout moment, dans le train, en avion, dans un pays étranger. Il ne consomme pas de connexion réseau. Donc, quand vous êtes dans un hôtel où vous n'avez pas de Wi-Fi,

Renaud Monnet :

[12:16] vous pouvez continuer à traduire des textes.

Monde Numérique :

[12:19] Est-ce qu'on peut dire, Renaud Monnet, que ces différents outils, donc Croissant, Aristote, sont des véritables, peut-être pas alternatives, mais en tout cas des atouts en matière de développement de l'intelligence artificielle en France et notamment d'IA plus souveraine que celle qu'on serait tenté d'utiliser sur les grandes plateformes américaines ?

Renaud Monnet :

[12:43] Ce qu'on peut dire de ces outils, effectivement, c'est que leur raison d'être, c'est d'être souverain. C'est pour ça qu'on les développe, c'est ce qu'on cherche à faire, on se focalise sur la souveraineté, et donc nous cherchons des solutions pour traiter des cas d'usage concrets, des cas d'usage en entreprise, des cas d'usage en université, des cas d'usage dans les administrations, avec des solutions qui sont souveraines. Ces solutions souveraines, elles sont difficiles à monter, elles ne sont pas forcément toujours au même niveau de performance que les solutions américaines, mais elles sont souveraines et elles sont frugales. C'est deux avantages importants. Il y a des situations dans lesquelles une entreprise ou une université ne peut pas se permettre d'utiliser une solution américaine et dans ce cas-là, nos solutions sont pertinentes. On ne va pas dire à ce stade que nos solutions atteignent le niveau de performance des solutions américaines, ce n'est pas vrai. La recherche française continue à produire des nouveaux modèles à s'améliorer il ya également des start up françaises qui font des très belles choses comme mistral donc on peut espérer que ces ias souveraine vont petit à petit rattraper les modèles américains à ce stade il ya vraiment le monde de l'ia souveraine d'un côté et le monde des ias américaine de l'autre avec chacune leurs leurs avantages et leurs inconvénients.

Monde Numérique :

[14:06] Merci beaucoup, Renaud Monnet, directeur du Digital Lab de Centrale Supélec.

IA,informatique,innovation,technologies,Actualité,numérique,Tech news,high tech,souveraineté,actu tech,Actualités Tech,actu high-tech,

Le Digital Lab de Centrale Supelec a développé une IA générative souveraine pour les universités et les entreprises.

🎤 Interview

Renaud Monnet, directeur du Digital Lab de Centrale Supelec

Newsletter

À écouter

Episodes récents

Envoyer un message audio

Aristote, l'IA souveraine à la française (Renaud Monnet, Centrale Supelec)