🎤 Un agent IA qui prend la main sur tous vos logiciels (Jean-Luc Haurais, Delentra)
Maison Connectée17 mars 202615:59

🎤 Un agent IA qui prend la main sur tous vos logiciels (Jean-Luc Haurais, Delentra)

Et si une intelligence artificielle pouvait utiliser votre ordinateur exactement comme vous ? C’est la promesse de Delentra, une technologie capable de piloter n’importe quel logiciel — du navigateur à Photoshop — pour exécuter des tâches complexes à la place de l’utilisateur.

Interview : Jean-Luc Haurais, cofondateur et directeur de la recherche de Delentra

Punchlines

  • Delentra peut piloter tous les logiciels d’un ordinateur.

  • L’IA manipule la souris comme un humain.

  • Aucun développement n’est nécessaire pour automatiser des tâches.

  • La sécurité des données est pensée pour les entreprises.

  • Delentra exécute les actions demandées en langage naturel.

En quoi consiste l’outil que vous développez chez Delentra ?

L’idée est née d’une demande récurrente d’entreprises qui souhaitaient automatiser certaines tâches grâce à des agents IA. Nous avons constaté que chaque organisation avait des besoins différents et qu’il serait très compliqué de développer des agents spécifiques pour chaque cas.

Nous avons donc voulu créer un outil capable de répondre à toutes sortes de demandes, un peu comme un ChatGPT, mais appliqué aux actions concrètes sur un ordinateur. Delentra peut prendre la main sur le poste de l’utilisateur — avec son accord — et effectuer des tâches à sa place en manipulant les logiciels comme le ferait un humain, notamment grâce au contrôle de la souris et du clavier.

Quelle différence avec les agents proposés par OpenAI ou Anthropic ?

Aujourd’hui, les solutions proposées par ces acteurs peuvent piloter un navigateur. Mais cela reste limité à cet environnement. Delentra, lui, agit sur l’ensemble des applications disponibles sur un système d’exploitation.

Cela signifie qu’il peut utiliser des logiciels comme Photoshop, des outils de bureautique, des logiciels 3D ou encore un navigateur pour accéder à des services comme Salesforce ou Sage. L’idée est de ne pas se limiter à une seule interface, mais de pouvoir manipuler tout l’écosystème logiciel d’un ordinateur.

Concrètement, quels types de tâches peut-il réaliser ?

Delentra peut prendre en charge de nombreuses tâches répétitives. Par exemple, nous l’avons utilisé pour analyser plus d’une centaine de candidatures reçues par mail dans le cadre d’un recrutement. L’outil a récupéré les fichiers PDF, extrait les informations, puis les a transformées dans un tableau Excel normalisé.

Il peut également analyser les agendas, identifier les meilleurs candidats selon des critères définis par l’entreprise et organiser automatiquement les rendez-vous en fonction des disponibilités de chacun. Tout cela se fait en langage naturel, sans développement spécifique ni intervention d’un informaticien.

L’IA peut même manipuler des logiciels créatifs comme Photoshop ?

Oui, tout à fait. Par exemple, pour publier un post LinkedIn, Delentra peut analyser le contenu, ouvrir Photoshop pour modifier une maquette existante, ajuster les textes, enregistrer l’image dans le bon format, puis publier le contenu sur LinkedIn.

Il fonctionne comme un utilisateur humain. Il peut aussi utiliser d’autres outils d’IA, comme ChatGPT ou Gemini, pour générer du contenu supplémentaire et l’intégrer dans un projet si nécessaire.


Jean-Luc Haurais: [0:01] C'est-à-dire qu'aujourd'hui, les solutions d'OpenAI ou d'Enthropic, Jean-Luc Haurais: [0:05] effectivement, sont tout à fait capables d'aller piloter un navigateur. Mais nous, on parle d'aller piloter l'ensemble des applicatifs disponibles sur un operating system. Que ce soit Photoshop pour aller faire des opérations complexes, que ce soit des logiciels de bureautique, des logiciels de 3D. Et ça va aussi fonctionner sur un logiciel tel qu'un navigateur pour aller piloter un Sage ou un Salesforce. Monde Numérique : [0:35] Bonjour Jean-Luc Haurais. Jean-Luc Haurais: [0:37] Bonjour Jérôme Colombain. Monde Numérique : [0:38] Vous êtes cofondateur et directeur de la recherche de la société Delentra, qui a développé, alors que l'on parle beaucoup en ce moment d'agents IA, d'interactions entre l'intelligence artificielle et le monde réel, vous avez mis au point chez Delentra un outil capable, dites-vous, de prendre la main sur un ordinateur, comme le ferait un humain, pour effectuer un certain nombre de tâches. En quoi ça consiste exactement ? Jean-Luc Haurais: [1:05] Alors en fait, l'idée est venue au départ d'une demande. En fait, on s'est aperçu que de nombreux clients avec lesquels on travaillait précédemment, de nombreuses entreprises nous ont demandé régulièrement d'effectuer des développements à base d'agents agentiques, principalement sous forme de verticales. Donc chacun avait des besoins qui leur étaient bien évidemment propres. Et on s'est dit que ça allait être très compliqué de pouvoir satisfaire l'ensemble des besoins des collaborateurs d'une entreprise, sachant que chaque personne a des besoins différents à des instantés. Et on a commencé à réfléchir il y a maintenant un petit moment au développement d'une solution qui serait capable, dans l'absolu, de pouvoir répondre à l'ensemble des fonctionnalités. En fait, on est parti de l'idée d'un chat GPT. Aujourd'hui, un chat GPT, il est horizontal ou un cloud ou un produit type Mistral. On est capable de poser des questions sur n'importe quel sujet pour avoir dans l'absolu des réponses, quelle que soit la problématique posée. On s'est dit qu'il faudrait trouver, mettre en place un outil qui serait capable de pouvoir correspondre à n'importe quelle typologie de demande. Et à partir de là, on s'est dit, on va développer une solution. Jean-Luc Haurais: [2:07] Qui devraient dans l'absolu être capables de prendre la main, effectivement, comme vous disiez, sur l'ordinateur de l'utilisateur, avec son accord, bien évidemment, et dans un environnement totalement sécurisé, de façon à pouvoir effectuer des tâches qui peuvent être redondantes. Et c'est vrai qu'aujourd'hui, dès l'entrée, sa force, c'est la capacité notamment à pouvoir manipuler la souris, parce qu'aujourd'hui, une grande partie des logiciels que l'on utilise sur un ordinateur, que ce soit un Mac, un PC ou autre, s'utilise naturellement avec un trackball ou avec une souris, en complément du clavier, parce que tout a été conçu pour une interface humaine. Jean-Luc Haurais: [2:43] Bien évidemment, nous on gère bien évidemment tout ce qui va être API, tous les protocoles MCP comme tout le monde, comme des petits camarades, mais l'idée c'est de pouvoir potentiellement prendre la main et donc piloter l'ensemble des logiciels présents sur un ordinateur et de ne pas se limiter uniquement à un seul produit. Oui. Monde Numérique : [3:01] Donc, par exemple, si on compare ça à un navigateur Atlas d'OpenAI ou celui d'Enthropic, etc., qui peuvent effectuer un certain nombre d'actions déjà sur l'ordinateur, et pareil, bouger la souris, quelle différence ? Jean-Luc Haurais: [3:16] Alors, typiquement, si on devait comparer à un navigateur Atlas, le simple fait qu'on cite le navigateur démontre en fait la limitation du système. C'est-à-dire qu'aujourd'hui, les solutions d'OpenAI ou d'Enthropic, effectivement, sont tout à fait capables d'aller piloter un navigateur, mais nous, on parle d'aller piloter l'ensemble des applicatifs disponibles sur un operating system, que ce soit Photoshop pour aller faire des opérations complexes, que ce soit des logiciels de bureautique, des logiciels de 3D, et ça va aussi fonctionner sur un logiciel tel qu'un navigateur pour aller piloter un Sage ou un Salesforce. Monde Numérique : [3:51] Oui, vous sortez du navigateur, en fait. Jean-Luc Haurais: [3:53] Nous, on sort du navigateur, on fonctionne avec tous les produits, et qui dit tout produit, dit, bien évidemment, aussi le navigateur. Monde Numérique : [4:00] Bon, ça fait un peu peur, non ? Jean-Luc Haurais: [4:01] Alors, c'est vrai que ça fait un peu peur, mais tout a été conçu. Je suis d'accord, je suis d'accord. Alors déjà, bien évidemment, lorsque l'on met en place la procédure d'installation, on a la possibilité de choisir aussi les produits sur lesquels on souhaite que Jean-Luc Haurais: [4:15] dès l'entra ne puissent pas accéder et ne puissent pas piloter. Déjà, c'est le point numéro un, qui peut le plus, peut le moins. Le deuxième point important, c'est que tout va s'effectuer dans un bac à sable sécurisé, ce qui fait que, bien évidemment, le nerf de la guerre, c'est la sécurisation de l'information. Et pour parler un tout petit peu technique, mais sans trop rentrer dans les détails, bien évidemment, on va utiliser des larges langages modèles, mais on va aussi utiliser des SLM, ce qu'on appelle donc des small langages modèles, donc des petits modèles, qui vont être directement installés, encore une fois, avec l'accord de l'utilisateur, sur le poste client, et ces petits modèles vont être capables de faire une succession d'opérations sans avoir besoin de sortir cette information sur un réseau tel que l'Internet. Donc, quelque part, on va sécuriser une grande partie des datas grâce au small language model, au petit modèle, et l'autre partie va être sécurisée dans un bac à sable sur le poste client. Monde Numérique : [5:12] Et alors, pareil, autre élément de comparaison, quelle différence avec le fameux OpenCloud qui permet également d'agents, de faire plein de choses ? Jean-Luc Haurais: [5:22] Alors, OpenCloud, lui, il n'a pas été conçu au départ dans une approche B2B. C'est-à-dire que nous, notre vision, c'est surtout le marché des entreprises. Donc déjà, principalement, l'objectif, ça a été de concevoir un produit totalement sécurisé, avec des COPS, avec des bacs à sable, avec tout un tas de process Jean-Luc Haurais: [5:40] qui vont faire en sorte que le produit ne permet pas de faire fuiter des informations sensibles. OpenFlow n'a pas été conçu à la base dans cette approche-là. OpenFlow a été plus conçu pour être on va dire B2C dans un premier temps et permettre à n'importe qui, à des geeks, à des informaticiens, parce qu'il y avait quand même un petit protocole d'installation préalable. Monde Numérique : [5:59] On ne sait pas trop pourquoi il a été conçu. Jean-Luc Haurais: [6:01] Voilà, voilà, voilà. Ça part un petit peu dans le défi. Monde Numérique : [6:04] C'est un peu exploratoire. comme système. Mais c'est plein de promesses. Jean-Luc Haurais: [6:08] Ah, c'est plein, plein de promesses. Mais nous, typiquement, ce que fait OpenClaw en pilotant des logiciels, eh bien, on est tout à fait capable de le faire. Mais avec deux points différenciants. Un, on a quelque chose que OpenClaw n'a pas. C'est la main sur tous les logiciels graphiques parce qu'aujourd'hui, OpenClaw ne peut pas diriger, je ne comprends pas, on ne peut pas chasser rien, un illustrator ou un logiciel de ce type parce que si vous n'avez pas d'API ou de protocole, il ne sait pas manipuler la souris et donc il ne sait pas manipuler les logiciels sur le post-client, il va utiliser le terminal, des protocoles tels que le MCP ou des API. Et l'autre point fondamental, c'est qu'on met sur la sécurité. C'est-à-dire que nous, notre marché, c'est vraiment les entreprises. Il n'est pas question qu'on puisse ouvrir les vannes et les ports de tous les côtés. Monde Numérique : [6:49] Alors, à quoi ça sert ? À qui c'est destiné ? Et pour faire quoi ? Jean-Luc Haurais: [6:53] Alors, en fait, le marché, il est juste potentiellement énorme parce qu'aujourd'hui, n'importe quelle personne qui utilise son ordinateur tous les jours pour effectuer des tâches qui peuvent être redondantes ou chronophages va pouvoir demander à Delentra d'effectuer ses tâches à sa place. De la même manière qu'aujourd'hui, vous demandez à ChatGPT de répondre à des problématiques, en fait, Delentra, il va être capable d'exécuter, les réponses à ces questions, à tout moment où ça nécessite, bien évidemment, l'usage d'applicatifs qui seraient mis à la disposition de Delentra. Donc, en fait, ça touche potentiellement tout le monde. Et comme la communication et l'usage se fait par le langage naturel, en fait, on n'a pas de véritable barrière technologique à l'entrée, ce qui en fait un produit, facilement déployable au sein aussi bien des PME que des grandes entreprises. Monde Numérique : [7:41] Mais vous pouvez nous donner quelques exemples de tâches qui pourraient être accomplies par Delentra ? Jean-Luc Haurais: [7:47] Oui, oui. Par exemple, nous, on a demandé aujourd'hui, dans le FAS, justement, dans un cadre de recrutement, nous, on a demandé à Delentra pour d'analyser sur notre boîte mail, par exemple, tous les mails qui allaient arriver. On a reçu plus d'une centaine de mails. On a demandé d'analyser tout ça, de nous les traiter, de nous les mettre en local, sur notre serveur local, et de les formaliser, par exemple, dans un format Excel. Donc, on est passé de format PDF de différentes formes à un format Excel totalement normalisé. D'analyser sur notre Outlook et sur notre base de données les agendas de la personne chargée des ressources humaines, de sélectionner les meilleurs candidats par rapport aux critères qu'on a bien sûr définis nous-mêmes, attention, je ne dis pas que c'est l'ia qui définit les critères, on choisit nos critères, et automatiquement de faire le matching des envois de mails pour gérer les recrutements et les disponibilités des candidats en fonction de leur disponibilité et de la disponibilité chez nous, de la personne DRH qui est plutôt à mi-temps et qui est aussi en télétravail. Et tous ces types d'opérations, ça se fait sans aucun développement. C'est-à-dire qu'à aucun moment on n'a développé un agent vertical, à aucun moment on a eu besoin d'un informaticien. Tout s'est fait tout simplement en langage naturel. J'ai un exemple. Monde Numérique : [8:56] Ouais, donc pour du recrutement, en fait. Jean-Luc Haurais: [8:58] Pour du recrutement, pour la créane, on l'a demandé de faire des posts au LinkedIn. On l'a regardé comment il pouvait s'opérer. Il a commencé à travailler sur le contenu. Et puis après, l'étape la plus intéressante, c'est qu'il a dit, maintenant, je vais regarder la maquette que vous avez déjà réalisée. Je vais ouvrir Photoshop. Je vais aller modifier la maquette sous Photoshop. Je vais aller modifier les short-textes. Je vais sauvegarder l'image sous Photoshop. Et je vais choisir le JPEG parce que je sais que le PSD, ça ne marche pas bien sur LinkedIn. Donc, il va faire directement la démarche. et dit maintenant je me connecte sur votre LinkedIn et je vais pousser l'information. Monde Numérique : [9:30] Il nous demande notre avis, quand même, pour validation ? Jean-Luc Haurais: [9:33] Oui, bien sûr, à tout moment, vous avez la possibilité déjà de faire stop ou pause. Il peut vous demander notre avis, notamment quand il fait les baselines, il va dire, est-ce que vous êtes d'accord sur les slogans, sur les titres, sur les accroches ? Il va dire, non, non, oui. Et après, il me dit go, il y va. On peut, à tout moment, sécuriser, et on a bien sûr des logs qui vont permettre de voir l'ensemble des opérations qui ont été effectuées par le poste. Monde Numérique : [9:56] Donc, par exemple, il peut créer des images, mais pas comme le fait aujourd'hui ChatGPT ou Gemini en générant comme ça en sortant de nulle part il le fait comme ferait un humain vous parliez de Photoshop il. Jean-Luc Haurais: [10:09] Peut faire un réglé calque tout à fait Jérôme il le fait comme le ferait un humain avec la magnification mais comme un humain peut accéder à ChatGPT ou à Gemini il peut aussi aller sur votre compte Gemini et taper le prompt lui-même et lui demander de générer une image complémentaire qu'il pourra lui-même récupérer et intégrer dans Photoshop si nécessaire. En fait, tout le monde manipule l'ensemble des logiciels, il manipule ChatGPT, Gmini et autres. Monde Numérique : [10:37] Oui, bien sûr. Où ça en est ? Il est utilisable ou on est encore au stade de la preuve de concept ? Jean-Luc Haurais: [10:44] Alors, aujourd'hui, le POC a été finalisé. On était en version alpha il y a encore quelques semaines. On est passé en version bêta. Ça veut dire qu'aujourd'hui, effectivement, on commence à le faire circuler avec certaines personnes. On est en discussion avec des grands groupes aussi de façon à pouvoir faire des tests d'intégration au sein des entreprises, de façon à regarder un petit peu ensemble de quelle manière on pourrait aider à assister un ensemble d'utilisateurs sur différentes tâches qui sont plus ou moins répétitives. Et le produit va sortir dans sa version, on va commencer à le diffuser un petit peu plus. On va dire, dans un premier temps sur Mac, il sortira fin mars et sur PC, on sera entre mi-avril, fin avril, voilà. Monde Numérique : [11:31] Ok. Vous avez une idée du mode de commercialisation, des tarifs, etc. ? Jean-Luc Haurais: [11:36] Oui, tout à fait. Alors, concernant le mode de commercialisation, en fait, on a deux approches. Alors, effectivement, on a des approches qui vont être plutôt liées au PME, PMI, où là, on va être sous forme d'un abonnement, comme un chat GPT ou autre, sur lequel vous aurez donc un nombre de crédits, une jauge de crédit allouée, parce que comme tout le monde, on n'est pas magicien, on va payer au token par rapport au coût de production. Et puis, pour les grandes entreprises, effectivement, c'est une autre approche. Parce que là, on va regarder comment s'intégrer directement dans le système avec leurs équipes. Ça peut être des machines complètement dédiées qui vont être installées sur place avec l'infrastructure, sur lesquelles, en fait, là, ça va plus être du développement et puis des business, comme on fait d'habitude, d'intégration avec des groupes, quoi. Monde Numérique : [12:21] Derrière, vous parliez de LLM et de SLM. Jean-Luc Haurais: [12:25] SLM, Small Language Model. Monde Numérique : [12:27] Voilà. C'est quelle technologie ? Qu'est-ce que vous utilisez ? Jean-Luc Haurais: [12:31] Comme modèle derrière. Alors, aujourd'hui, par rapport au Small Language Model, ce sont des modèles que nous-mêmes finetunés. C'est-à-dire qu'on a retravaillé de façon à les adapter, tout simplement, aux besoins, pour pouvoir bien piloter la souris, bien piloter les logiciels. Monde Numérique : [12:45] Mais à partir de quoi ? Jean-Luc Haurais: [12:46] À partir de modèles open source. On a pris différents modèles. On a regardé sur des modèles Lama, on a regardé sur des modèles Queen, on a regardé tout un tas de petits modèles. Monde Numérique : [12:56] Vous avez fait un tour sur Ging Face et vous avez fait votre marché. Jean-Luc Haurais: [12:59] On a fait votre marché avec tout ce qu'il y a. Il a de quoi faire. Et puis derrière, effectivement, on a la capacité aussi d'aller choisir, bien sûr, des larges langages modèles quand c'est nécessaire. Et là, c'est un petit peu au choix de l'utilisateur. C'est-à-dire que si on prend l'exemple d'intégration dans un grand groupe, imaginons que le grand groupe dise nous on a une licence avec Anthropik ou on a des licences sur des serveurs Microsoft Azure avec ChatGPT, donc avec OpenAI, on va dire écoutez si vous voulez on utilise votre clé. Donc nous on est capable de se câbler sur un ensemble de modèles d'ailleurs on utilise différents modèles aussi bien du Cloud, du ChatGPT et autres, et y compris des très bons modèles open source de façon à pouvoir matcher quand nécessaire pour avoir les meilleurs résultats. Monde Numérique : [13:48] D'accord. Très bien. Oui, mais on imagine que, alors vous parlez des grands groupes, mais aussi les petites entreprises pour être utilisées, pour être intéressées par ça, parce que c'est par définition elles qui ont a priori moins de ressources personnelles et autres, etc. Jean-Luc Haurais: [14:06] Oui, tout à fait. Et donc, pour ces petites entreprises, en fait, on a des solutions plus accessibles, plus clés en main, où en fait, l'idée, ça va être d'installer automatiquement l'applicatif sur le poste client. Il y aura bien sûr au départ un check-up pour comprendre un petit peu la configuration, la capacité en termes de mémoire, la capacité en termes de cartes graphiques, en termes de processeurs, de façon à pouvoir allouer une configuration plus ou moins adaptée en local et à pouvoir fonctionner éventuellement plus ou moins en cloud en fonction du hardware dans lequel on est installé. Monde Numérique : [14:38] Alors, on peut dire que c'est un produit 100% français qui n'a pas d'équivalent ? Jean-Luc Haurais: [14:42] Exactement. À la date d'aujourd'hui, on est 100% français et c'est vrai qu'il n'y a pas de produits équivalents sur le marché, de disponibles, capables de faire ce que l'on fait. Monde Numérique : [14:53] Comment vous expliquez que les géants de l'IA ne se sont pas attaqués à ce type de produit, d'outil ? Jean-Luc Haurais: [14:59] Moi, je pense qu'en fait, il y a sûrement des géants de l'IA qui sont en train d'y réfléchir mais c'est comme tout en fait, ils ne peuvent pas forcément tout faire en même temps, ils ont sûrement aussi des priorités en termes de planification et j'ai été historiquement sur différents projets où j'ai eu la chance souvent d'être assez en avance on va dire, notamment sur des projets audio, sur des projets serveurs en avance par rapport aux américains donc c'est quelque chose que j'ai déjà vécu auparavant, je pense que c'est avant tout la passion l'intérêt et beaucoup de travail et quelques idées, le côté un peu créatif peut-être français, qui permet de faire des choses un petit peu différenciantes. Monde Numérique : [15:38] Merci beaucoup Jean-Luc Haurais de la société Delentra, à découvrir sur Delentra.com. Jean-Luc Haurais: [15:46] Exactement. Merci Jérôme.
innovation,informatique,technologies,tech news,High-tech,numérique,actualités,tech,actu tech,ia,Agents,