IA : les entreprise doivent protéger leurs données (Benoit Bouffard, LightOn)
18 juillet 202322:23

IA : les entreprise doivent protéger leurs données (Benoit Bouffard, LightOn)

Comment protéger les entreprises qui utilisent l'IA contre la fuite de données ? Des solutions françaises commencent à apparaître. 

Les outils d’intelligence artificielle générative sont de plus en plus utilisés par les entreprises, par exemple, sous forme d’agents conversationnels pour la relation client ou pour l’accès aux données de l’entreprise en interne. Mais comment être sûr que ces données ne vont pas être victimes de fuites, notamment vers l'étranger ? Des startups françaises développent des modèles autonomes d’IA censés répondre à ce besoin. C'est le cas de la startup LightOn qui propose une solution baptisée Paradigm. Les modèles sont entrainés sur des clouds publics avec des données publiques, mais ils tournent ensuite exclusivement en interne avec des données qui ne franchissent pas les frontières de l'entreprise.


Transcription

Monde Numérique : Bonjour Benoît Bouffard.

Benoit Bouffard : Bonjour Jérôme.

Monde Numérique : Vous êtes directeur Produit marketing et médias du groupe letton et letton, qui est donc une entreprise française pleine d'ambitions puisque votre credo, enfin en tout cas votre volonté, c'est de partir à l'assaut des entreprises pour leur proposer des solutions d'intelligence artificielle et au passage de concurrencer ChatGPT finalement. Alors comment fait-on pour concurrencer ChatGPT ?

Benoit Bouffard : En fait, il faut tout simplement essayer d'écouter les problématiques des grandes entreprises. Aujourd'hui, être LGBTI est un outil qui est très utilisé par le BIT, aussi utilisable par nous en tant qu'individu. Et les chromatiques d'une entreprise, surtout en Europe, sont bien spécifiques. Typiquement, il y a toute la partie sécurité et privacy. L'un des premiers aspects pourquoi les sociétés viennent nous voir, c'est notre capacité à pouvoir déployer toutes ces technologies dans l'infrastructure de l'entreprise. Pour tirer toute la quintessence de cette techno, il faut absolument pouvoir partager sa data. Sinon on obtient des réponses qui sont assez plates et génériques. Et à partir du moment où vous commencez à partager la data de votre société, très souvent vous êtes un peu inquiet du.

Monde Numérique : Oui, ça pose problème.

Benoit Bouffard : Exactement. Si on prend le cas de Carrefour, récemment, ils ont déployé chez GPT en tant que chatbot. C'est super, mais on peut voir que c'est très limité puisque pour l'instant il n'y a aucune information personnelle qui peut être utilisée. Donc vous demandez le suivi de votre commande, votre historique de commande ou même reprendre une nouvelle commande. Ce n'est pas possible, tout simplement parce que pour l'instant ils sont limités sur l'usage. Donc le premier aspect pour garantir cela, c'est la sécurité. Le deuxième aspect, c'est aussi tout l'accompagnement. Il y a une statistique qui est sortie, c'est qu'aujourd'hui près de 40 % des grands groupes qui veulent y aller mais ne se sentent pas capables de y aller par manque de connaissance. Et aujourd'hui, le c'est bien plus que simplement une techno, une plateforme, une API, c'est toute une équipe de spécialistes qui travaillent sur le sujet depuis près de six ans et qui peuvent accompagner des entreprises dans les différents scénarios possibles d'usages de cette lettre, de cette techno.

Monde Numérique : Alors vous êtes parmi les rares entreprises françaises qui avaient développé votre propre LLM, c'est à dire un grand modèle de langage sur lequel s'appuie la solution que vous commercialiser, qui s'appelle donc paradigme. Ça consiste en quoi ? Développer son propre LLM ?

Benoit Bouffard : Alors en fait, ça consiste à constituer une grande base de connaissances, un modèle de langage. En fait, c'est quelque chose d'assez. Si on simplifie au minimum au maximum, c'est quelque chose qui est censé prédire le prochain mot qui est le plus pertinent dans une, dans une ligne de phrase. Donc ça consiste en quoi ? Ça sert d'abord à aller chercher une grande variété de données qui sont accessibles publiquement pour gérer toutes les problèmes de copywriting et ainsi de suite, de dédoubler cette data, vérifier d'enlever tout ce qui peut toxique de cette data. Parce que, à part dans le noyau public, il n'y a pas que des choses qui sont propres. Et de trouver le computer, donc des infrastructures pour pouvoir entraîner ces machines. Et une fois qu'il y a toute cette cette chose qui a été mise en place, il va falloir lancer un entraînement sur ce modèle et vérifier au fur et à mesure de ce qu'on appelle les check points, vérifier si le modèle est bien en train d'apprendre au fur et à mesure. Et une fois que ce modèle est à disposition, c'est comme un diamant. Il va falloir le tailler petit à petit pour qu'il soit en capacité d'être éduqué à réaliser des tâches spécifiques. Donc il y a toute cette partie-là qui consiste à annoncer un grand modèle de langage.

Monde Numérique : Et donc ça, c'est une phase qui prend un certain temps, j'imagine.

Benoit Bouffard : Tout à fait un certain temps, un certain coût. Ça a été fait avec l'année dernière, ça nous a pris plusieurs mois à entraîner ce modèle et depuis qu'on a reçu ce modèle, nous, on a également depuis cinq mois ré entrainé ce modèle pour réussir à ce qu'il sorte un petit peu du carcan initial qu'il a été fait pour pouvoir le diriger. Donc c'est plusieurs mois de travail effectivement.

Monde Numérique : Et c'est ça qui nécessite des ressources informatiques importantes en plus.

Benoit Bouffard : Tout à fait. Ces grands modèles ne se déploient pas sur n'importe quelle infrastructure. Il faut énormément de GPU. Donc il y a quelques acteurs mondiaux des cloud providers qui permettent de faire ça et d'entraîner ces modèles. Et nous, la force qu'on a, c'est qu'aujourd'hui plus sa m'étends, plus ça coûte cher puisqu'il y a des frais de computing comme l'électricité. Si vous laissez la machine tourner. Et notre code HBase nous permet aujourd'hui de raccourcir de 20 % le temps de travail. Donc ça veut dire plus vite, mais aussi moins cher pour générer des modèles. Notre modèle, on en a profité, mais également construire des modèles sur mesure pour nos clients.

Monde Numérique : Vous l'avez entraîné sur quel type de machine ? Chez quel provider ?

Benoit Bouffard : Aujourd'hui, on a. En partenariat avec WS, on a été complètement utilisé cette infrastructure, mais là on est en train de discuter avec d'autres providers OVH, GCP. On est complètement agnostique sur le sujet, mais initialement ça a été fait avec IE. Ws.

Monde Numérique : Oui, mais alors. D'un côté vous parlez de souveraineté, de protection des données, et puis de l'autre côté, vous allez utiliser les ordinateurs de la WS. Est ce que ça ne pose pas un. Problème.

Benoit Bouffard : Alors faut vraiment distinguer deux choses. Il y a l'aspect entraîner un modèle. Il va à l'école, à Harvard, aux Etats-Unis, c'est une chose, il a utilisé ça. Maintenant, une fois que ce petit étudiant sort de l'école d'Harvard et rentre dans l'entreprise et n'en sort plus. Et quand il est sur Harvard, il a accès à une data publique, il n'a pas accès à la data de l'entreprise. Donc aujourd'hui, c'est comme si vous me disait j'utilise un ordinateur, là je vous parle avec un MacBook, je ne peux pas travailler avec autre chose. Il n'y a pas d'ordinateur français, il n'y a pas de téléphone français, donc je suis juste d'utiliser l'infrastructure qui existe. Mais une fois que ce gros bébé existe, il va dans l'interface de l'entreprise. Donc il n'y a pas de conflit d'intérêt entre ces deux sujets.

Monde Numérique : Hum. Et c'est après qu'il faut commencer à être vigilant sur les données qu'on va lui fournir.

Benoit Bouffard : Tout à fait. Il faut être vigilant pour deux aspects. Alors si on est dans l'infrastructure de l'entreprise, on peut déjà se garantir que ça reste à l'intérieur de l'entreprise. Donc il y a une vigilance moindre, mais il reste quand même un aspect vigilance. C'est comment compartimenter toute cette data au sein même de l'entreprise. Si vous êtes dans le département RH, vous avez accès à toutes les fiches de paie de l'entreprise. Ce n'est pas pour autant que vous vouliez que tous les employés connaissent le salaire des uns et des autres. Donc il faut effectivement être en capacité de pouvoir à la fois donner cette data au modèle, mais capable de compartimenter l'accès lorsqu'un utilisateur va interroger ce modèle pour obtenir des réponses.

Monde Numérique : Dans quel type d'applications peut il y avoir à votre à votre solution ?

Benoit Bouffard : Alors nous on est ce que me rappeler, c'est qu'on travaille sur le texte. Donc, à partir du moment où il y a besoin d'analyser, comprendre, rédiger du texte, on peut travailler avec des use case, les use case les plus utilisés qui reviennent le plus souvent. Il y a toute la partie chatbot qui est une vieille vieille dans le monde d'internet. Depuis quelques années, on entend beaucoup pas de chatbot, mais c'était limité sur des plus petits modèles et ça offrait une expérience souvent déceptive où le modèle qu'on ne prenait pas forcément le chatbot te répétait Désolé, je n'ai pas compris votre question. Ainsi de suite. Aujourd'hui, avec sa capacité et sa taille, il peut être capable de répondre à n'importe quel sujet. Deuxième aspect, c'est beaucoup de la recherche documentaire. Aujourd'hui, on est tous amenés à avoir une boîte mail, un endroit où on stocke nos documents, un calendrier, un outil de tchat dans l'entreprise. Quand je me pose une question, je dois poser souvent des questions et différents moteurs de recherche. L'idée est de pouvoir d'avoir un seul champ de recherche où je pose une question en langage naturel et hop, j'ai une réponse qui va aller chercher dans les différentes zones de la base documentaire de l'entreprise et un autre Yahoo skate et tout ce qui est brainstorming. Donc si vous voulez faire une fiche produit, si vous voulez faire un emailing, eh bien essayez de demander au modèle de vous accompagner pour la création de ce contenu. Il y en a une quinzaine, mais c'est le plus. Les plus populaires sont ceux là.

Monde Numérique : C'est une vraie révolution pour les entreprises, ça. A Benoit Bouffard.

Benoit Bouffard : Même moi je le vis au quotidien, j'ai la sensation de vivre un peu sur une autre planète. Quand je parle à mes alter ego, c'est que aujourd'hui, je ne sais plus travailler sans cette technologie. Accenture parle de 40 % du temps de travail qui va être impacté, surtout dans le service. Je pense que c'est une révolution comparable à celle de l'arrivée de l'ordinateur et de la main par rapport à la machine à écrire ou, si on prend encore plus ancien, l'arrivée des tracteurs pour les. Pour les agriculteurs qui travaillaient à l'avant, à la fourche et à la main. Donc oui, c'est un impact conséquent et je fais partie des plus pessimistes. Mais je pense que d'ici cinq ans, cela aura vraiment un impact concret sur tous les métiers. J'entends parler plutôt de deux ans, ça dépend de quels métiers le métier de développeur va être impacté beaucoup plus rapidement que d'autres. Mais oui, c'est un impact à mon avis, qui est aussi considérable que celui de l'arrivée de l'agriculture ou de l'ordinateur.

Monde Numérique : C'est à dire que quoi, selon vous, les développeurs n'auront plus besoin de produire eux mêmes du code ?

Benoit Bouffard : Il y aura toujours besoin d'humain. Souvent, les gens, quand je parle, même dans mon entourage, je. Non, mais je ne vais pas être remplacé la question. L'ordinateur n'a pas remplacé tous les travaux. La question, c'est que si vous avez un comptable demain qui ne sait pas utiliser un ordinateur, il a plus de travail. Donc je pense que ça reste ma vision et il faut garder. C'est une reste une vision de Benoit de l'Eden, mais je pense que les gens qui ne vont pas adhérer à cette technologie, qui ne vont pas avoir ce grand virage arriver, vont être en difficulté. Mais il restera toujours des développeurs pour des questions déjà de vérification parce qu'il faut toujours vérifier ce que fait une machine fait. Même dans l'industrie automobile, il y a quelqu'un qui vérifie comment on construit une voiture. Même si une voiture est construite à 90 % via des robots.

Monde Numérique : On sait que le gros problème aujourd'hui de ces IA génératives et de texte et de USDJPY, c'est ce qu'on appelle les hallucinations. Avec le système que vous avez décrit de prédiction des mots, parfois c'est absolument n'importe quoi, puisqu'en fait la machine ne comprend pas ce qu'elle ce qu'elle écrit. Comment est ce que vous faites face à ce problème chez Eaton ?

Benoit Bouffard : Pour nous, c'est un problème de engineering. Ce n'est pas un problème de technologie, c'est un problème d'usage. Il faut savoir dompter la bête entre guillemets. Donc la première chose, il faut savoir demander un besoin précis à cette machine. Si vous ne le le faites pas de façon précise, elle peut halluciner. Puis il y a l'autre fois l'autre possibilité. Comme éduquer un enfant en le disant ne jette pas, ne joue pas au ballon dans la chambre, mais joue au ballon dans le jardin. On va lui éduquer petit à petit aux règles spécifiques de l'entreprise et chaque entreprise ayant ses propres règles, Quand est ce qu'il hallucine ? Quand est ce qu'il a le signe ? Pas. C'est pour ça qu'on se tourne l'entreprise et essayer de spécifier les modèles pour chacun d'entre eux.

Monde Numérique : Mais ça c'est au niveau de la phase d'apprentissage, donc en amont.

Benoit Bouffard : Non. C'est au moment où après, une fois que le modèle a appris, c'est plutôt au niveau. Une fois que le modèle est calé sur une tâche précise ou sur une entreprise spécifique. Quand on parle hallucination, on peut mettre un autre terme. On parle de créativité aussi. La difficulté est de savoir quand est ce que vous voulez que le modèle vous génère quelque chose de créatif. Typiquement, s'il fait une fiche produit, vous comptez ce qui vous voulez, qui reste strict à une data qui a été demandée sur une étude de chiffres ou une étude financière. Et donc c'est vraiment au moment où on va le calibrer sur une tâche précise où on va pouvoir lui dire Écoute, là, non, tu es halluciné, ce n'est pas ce qu'on attend de toi ou au contraire, bravo, ta créativité est exactement ce que j'attendais de toi.

Monde Numérique : Mais ça, ça implique que la personne qui fait le prompte, qui rédige le prompte, soit mettre en face, soit apte à juger de la qualité des réponses. Est ce que dans les entreprises, on ne va pas aller vers des. Il n'y a pas un risque que des personnes moins informées sur certains sujets posent des questions et puis prennent la réponse au premier degré avec les conséquences que ça pourrait avoir si c'est faux.

Benoit Bouffard : Alors justement, Paradigm, la plateforme que vous mentionnez tout à l'heure qu'on qu'on lance actuellement auprès des entreprises, est justement là pour ça. Pas qu'eux, mais aussi là pour ça, pour accompagner toute cette phase de prompte. En fait, l'idée, c'est qu'aujourd'hui, très souvent, quand on génère un prompt, typiquement généralement un email, on a des critères qui sont assez subjectifs de succès, de savoir est ce que la personne est contente, pas contente du contenu qui a été généré. Et l'idée déjà, c'est de pouvoir intégrer une notion de critères de succès en disant bah tu veux que le mail soit en français, tu veux que le mail soit en anglais, tu veux que le mèl soit court, tu veux qu'il soit long, tu veux qu'il soit inspirational et ainsi de suite, De pouvoir vraiment mettre des critères qui soient vérifiables de façon assez objective. Et l'autre chose, c'est que derrière cet email va être envoyé à des clients, à des prospects et de pouvoir utiliser la partie analytics de l'entreprise pour vérifier si elle a atteint son objectif. Si j'envoie un mail de prospection, l'objectif c'est qui soit cliqué, ouvert, qui génère une vente. Ça, ça va nous permettre de pouvoir, comment dirais je, vérifier que le modèle génère des bons résultats et pouvoir encore une fois utiliser cette data pour le rééduquer à aller dans cette bonne trajectoire.

Monde Numérique : Quand on utilise stratégie au quotidien, on s'aperçoit aussi de son affolante banalité dans la production des réponses. C'est souvent vraiment des lieux communs, des formules toutes faites, parfois même un peu, du coup un peu ringardes. Est ce que comment vous faites pour contourner ce problème là, vous ?

Benoit Bouffard : Il y a deux aspects. Un tchat GPT étant un outil public, il a été conditionné à faire ça. C'est à dire que dès que vous lui parlez de politique, de sujets un petit peu tricky. Il va vous répondre Désolé, ce n'est pas mon travail. Donc il a été policé pour qu'on lui dise Écoute, sois le plus flatte pour ne pas répéter à des enjeux assez importants. On a pu le voir au niveau européen et mondial de ne pas répondre n'importe quoi et et pas aller dans des chemins qu'il ne faudrait pas mener. La deuxième partie, c'est toute la partie, encore une fois prompte, qui va lui permettre de pouvoir l'éduquer, l'emmener vers qu'est ce qu'on veut faire de lui ? C'est toujours la même question c'est comment lui apprendre à utiliser correctement les choses ? Si vous. Quand on a eu il n'y a pas longtemps au baccalauréat français de philosophie, je me rappelle plus de l'intellectuel qui a dit oh là là, sujet pété, il est nul, Il a eu deux sur 20 au bac de philosophie. S'il avait laissé faire, j'aurais été curieux de voir le prompteur qui était derrière. A mon avis, cette personne qui est certes très intelligente, est beaucoup plus cultivée que moi, n'a pas la connaissance de savoir comment demander HG pt. Si vous demandez hg pt de rédiger un message pour dire à votre femme Joyeux anniversaire de mariage, juste vous écrivez ça, vous allez avoir un truc très plat, très générique, extrêmement policé. Par contre, si vous commencez à donner votre connaissance, dire on s'est rencontré là, on a eu tel moment magique ici, on a eu nos enfants qui s'appelaient comme ci, comme ça. Il va commencer à faire des choses personnalisées et c'est toute la nature d'usage du pron engineering. C'est pour ça qu'il y a un nouveau métier qui est en train d'être créé. La responsable de Carrefour, on parlait beaucoup, l'équipe de Prompte engineering. Ça devient un vrai métier qui n'existait pas. On parle souvent de destruction de métiers générés par cette technologie, mais ça va aussi créer des nouveaux métiers qui n'existaient pas auparavant.

Monde Numérique : Vos clients aujourd'hui, Leighton, c'est quoi ? C'est forcément des grandes entreprises ou ça peut être également des petites structures ou des entrepôts, des PME, PMI ?

Benoit Bouffard : Pour l'instant, on est vraiment dédié sur des grands comptes pour plusieurs raisons. La première chose, c'est que le coût est assez important de pouvoir construire des modèles sur mesure. Ce n'est pas les frais de computer encore assez importants. La deuxième, c'est qu'on fait que ce qui vient. Aujourd'hui, on a la chance d'avoir des demandes, des grands comptes, donc on cherche à adresser cette clientèle là, mais on se ferme pas pouvoir descendre le curseur vers des plus petites entreprises. En revanche, ce qui est certain, c'est qu'on ne peut pas aller vers le bit ou si on veut rester sur le métier. Oui, mais pour l'instant, tu as GPT pour les petites entreprises qui n'ont pas forcément encore cette culture de la privacy, de cette problématique de sécurité ou même cette taille quand on va déployer cette technologie vont sûrement très bien le job avec avec chaque GPT. Et pour l'instant on se concentre sur les très grands comptes. On parle de boîtes qui sont dans le top 500 de CAC40 et ainsi de suite.

Monde Numérique : Et les entreprises sont prêtes à recevoir ce type d'outils.

Benoit Bouffard : Je dirais qu'on est dans une phase de découvertes fortes qui deviennent une. Les entreprises ont compris que c'était extrêmement stratégique. Après, comme toute évolution, ça va prendre un peu de temps à ce qu'ils intègrent concrètement et à long terme dans l'entreprise. Mais on voit de tout. On voit des sociétés qui sont elles, en vraiment phase de Discovery et d'autres qui quand même utilisées. On en parle de grands modèles de langages, mais il existait des plus petits modèles qui étaient déjà une une certaine porte vers cette technologie qui était utilisée par des grands groupes français déjà depuis longue date. Donc non, on voit vraiment je parle pour les sociétés françaises. Je dirais une bonne vingtaine de sociétés françaises qui sont dans les grands comptes du CAC40, qui sont vraiment en train de travailler activement dessus pour pouvoir mettre quelque chose en production dans les prochains mois.

Monde Numérique : Et ce sera pour des utilisations uniquement internes ou également externes. Vous parliez tout à l'heure des chatbots qui répondent aux clients. Est ce que demain, à la place de ces affreux chatbots qui ne savent jamais véritablement traiter nos demandes, on aura un tchat j pity ou enfin on aura un un chatbot de nouvelle génération qui saura beaucoup mieux traiter les requêtes des consommateurs.

Benoit Bouffard : Je pense qu'aujourd'hui on a des demandes qui vont à la fois en interne. Donc le chatbot, ça peut être à la fois en interne, quelqu'un qui pose des questions sur sa société ou l'externe, pour des clients, des clients. Je pense qu'il n'y a pas beaucoup de client qui décide si on interne pour limiter le risque de communication publique. Mais la technologie peut faire les deux. Il n'y a aucun problème là dessus. Les. Aujourd'hui, on vient beaucoup nous voir pour deux choses soit gain de productivité. Donc ça, ça concerne vraiment de l'interne. Comment je peux mieux classifier mes dossiers, mieux rédiger et ainsi de suite. Mais quand on parle parlant d'une fiche produit, c'est à la fois de l'interne, mais cette fiche produit in fine à la revue, sur un site internet, dans une fiche PDF, dans un magasin. Donc pour l'instant c'est très interne, mais ça ricoche très très vite sur de l'utilisation publique.

Monde Numérique : Alors je le disais, Leighton est une des rares entreprises françaises à avoir développé son propre modèle de langage. Malgré tout, on sent qu'il y a pas mal d'émulation. Aujourd'hui, il y a pas mal de concurrence qui arrive. Vous pensez que le marché va va se densifier ? Vous voyez arriver des concurrents dans votre domaine ?

Benoit Bouffard : Ce qu'on voit au delà de la concurrence directe, c'est que la notion de propriété, de modèle où les grands comptes cherchent à obtenir leur propre modèle, donc ils vont chercher des modèles open source, partir d'un modèle open source comme Falcon ou CAE. Nous avons participé au développement comme l'AMA, Facebook, mais qui est pour l'instant limité à de l'usage de recherche et pas commerciale. Donc vraiment, là, ce qu'on constate, c'est que les sociétés veulent intégrer un modèle open source chez eux pour pouvoir le reconstruire. Et ce qu'on constate en même temps, c'est que des modèles open source, on apparaît, j'allais dire tous les jours j'exagère un peu, mais très régulièrement des nouveaux modèles sur sur le marché. Donc c'est vraiment cet aspect là. Après la partie concurrence, nous on cherche vraiment à pu être uniquement vu comme un créateur de modèle, mais vraiment comme un écosystème qui permet à l'entreprise de déployer ce que vous avez beau avoir le meilleur modèle de la Terre, si vous ne savez pas l'utiliser et que vous n'avez pas toute la chaîne de valeur pour l'intégrer correctement dans votre workflow, vous allez rencontrer des difficultés pour le faire.

Monde Numérique : On sait qu'il y a quand même encore beaucoup de questionnements, voire d'inquiétude par rapport à tout ça. Et puis il y a des projets de réglementation. Comment est ce que vous voyez l'arrivée de la réglementation, notamment européenne, dans ce domaine ? Et même les déclarations des politiques français qui disent Oui, il faut développer l'IA. Mais attention, on ne peut pas aller dans tous les sens et on va tout de suite, notamment au niveau européen, mettre un certain nombre de règles très très précises, voire très strictes.

Benoit Bouffard : Mais on regarde ça avec attention. On discute assez régulièrement avec les gens concernés au niveau du gouvernement français et essayer de voir comment on peut essayer de trouver le bon équilibre entre ne pas bloquer une technologie et laisser des acteurs étrangers qui n'auront pas cette régulation et tout en effectivement trouver le bon équilibre puisque ça ne va pas. Il ne faut pas être le far west, il faut trouver le juste milieu entre sécurité et innovation et c'est toujours un petit peu compliqué à trouver. Maintenant, les déclarations d'Emmanuel Macron ont l'air d'avoir. Il a l'air d'avoir compris, en tout cas dans sa déclaration, cet enjeu et de l'avoir pris à bras le corps. À nous d'être tous les acteurs français qui sont sur le sujet, de pouvoir remonter nos notre vision du sujet pour que notre pays nous défendre au mieux au niveau de l'Europe et mette encore une fois des protections mais sans être complètement privatif et faire que demain cette technologie soit complètement liée à des acteurs étrangers.

Monde Numérique : Quel est le risque ? Quel serait le risque d'une réglementation trop stricte ?

Benoit Bouffard : Eh bien, il y a des choses qui sont un peu infaisables lorsqu'on entend beaucoup dire. Quand l'on interroge le modèle. On aimerait connaître exactement la source de la data où il a été interrogé. Quand on dit ce genre de choses, je pense qu'on n'a pas compris la technologie, comment elle est faite. Quand on entraîne un modèle, on n'est pas en train de lui dire Page Wikipédia page deux, page Wikipedia page trois on on prend toutes. C'est ce texte, ce contenu qu'on décline, qu'on découpe, qui fait qu'à la fin, c'est quasiment impossible de pouvoir ressortir. D'où vient la source de la data initiale qui a été entraînée ? Le modèle. C'est comme si je vous. Je vous demandais pourquoi ? Vous savez la signification du mot bonjour, Vous l'avez appris par votre père, votre mère à l'école. C'est un petit peu compliqué pour vous redire la source. Donc il y a cet aspect là qui qui souvent revient en disant justifiez moi comment ? Par quoi était entraîné le modèle ? Ça devient un petit peu impossible à faire techniquement si on a vraiment compris comment ça marche et je ne vois pas comment on pourra atteindre cet objectif. Sauf si on devient complètement fou et qu'on fait des modèles plus petits. Mais du coup, on sort complètement de la bataille quoi.

Monde Numérique : Quand on écoute par exemple le Français Yan Le Cun qui dirige le laboratoire faire de Facebook, il dit que dans quelques années on utilisera plus des usagi pythie et les cousin de Shaggy pity parce que on en aura fait le tour, on verra que c'est limité et on comprendra que ça ne répond pas complètement à nos besoins. Il faudra autre chose. Qu'est ce que vous en pensez ?

Benoit Bouffard : Alors je respecte beaucoup ce monsieur qui est dans l'écosystème bien avant moi et ai donc sa vision. Je peux la comprendre mais je ne comprends pas exactement où est ce qu'il veut en venir. C'est à dire qu'on est dans une phase transitoire, c'est à dire que ce qu'on a aujourd'hui, c'est la version absolue de ce qu'on aura dans dix ans, à quelle échéance il parle. Quand on a commencé le téléphone, au départ, on était avec, pour les plus anciens, les téléphones qui n'ont rien à voir avec aujourd'hui. Pour autant, on a continué à avoir un téléphone dans la poche, à s'appeler, même si aujourd'hui ça ne fait plus que s'appeler, ça fait bien d'autres choses. Disons que c'est plutôt une direction qui est en train d'arriver et de se dire que beaucoup de tâches humaines peuvent être automatisées par une technologie qui n'a jamais existé auparavant. Quelle est sa finalité derrière elle ? Elle restera la même, mais comment elle sera construite ? Oui, des choses ont évolué. Il y a une bataille en ce moment depuis plusieurs années, d'avoir le plus grand modèle possible. On se rend compte qu'on peut avoir des plus petits modèles qui consomment moins et qui arrivent à des résultats aussi probants. C'est déjà un énorme changement en échelle de quelques mois. Donc ça va très très vite. Je dirais que tous les gens qui essaient de prédire, en tout cas moi, je m'en l'interdis, vu à la vitesse que ça va, c'est très compliqué de se dire dans quatre ou cinq ans où est ce qu'on en sera sur cette technologie ?

Monde Numérique : Merci beaucoup. Benoît Bouffard, Directeur Produit marketing et médias du groupe Light On.

IA,technology,informatique,digital,cloud,innovation,technologies,b2b,numérique,Tech news,actu tech,entreprise,