L'avenir du e-commerce passe-t-il par l'intelligence artificielle ? 🎙 Romain Lerallut, directeur du Lab IA de la société Criteo, explique comment ces nouveaux outils impactent le commerce et la publicité en ligne.
L'IA permet d'analyser une grande quantité de données - des produits aux comportements des utilisateurs - afin de mettre au point de nouveaux outils. La société française Criteo, spécialisée dans la publicité digitale, a créé il y a plusieurs années un laboratoire pour explorer et développer de nouvelles solutions. Celui-ci a notamment mis au point un système permettant d'éliminer, de manière semi-automatique, les sites de fake news du réseau publicitaire. La société explore aussi l'utilisation de l'IA générative pour un système d'essayage virtuel de vêtements.
------
Lab IA Criteo : https://ailab.criteo.com/
------
Mots-clés : intelligence artificielle, e-commerce, publicité en ligne, Criteo, données, privacy by design, retargeting, innovation technologique.
Le Lab d'intelligence artificielle de Criteo
Monde Numérique :
[0:16] Bonjour Romain Lerallut.
Romain Lerallut :
[0:17] Bonjour.
Monde Numérique :
[0:18] Vous dirigez le Lab d'intelligence artificielle de la société Criteo. Qu'est-ce que c'est exactement ?
Romain Lerallut :
[0:25] C'est un laboratoire dans lequel on fait de la recherche en intelligence artificielle, mais dans lequel on a également toute une population d'ingénieurs qui travaillent à rendre les résultats de cette recherche utilisables dans les produits de Criteo.
Monde Numérique :
[0:39] Criteo, entreprise française spécialisée dans la publicité en ligne, de quelle manière est-ce que l'IA peut venir au secours de la publicité sur internet ?
Romain Lerallut :
[0:50] Alors, Criteo, c'est une entreprise qui a été créée avant même de faire de la pub sur de l'intelligence artificielle.
On appelait ça du machine learning à l'époque et le principe, c'est de montrer aux gens des produits qui vont les intéresser.
Le business model de Criteo, c'est d'acheter des emplacements publicitaires sur les sites éditeurs, la presse, tous les gens qui vivent de la publicité et de n'être rémunéré que si l'utilisateur va cliquer sur une publicité et acheter un produit.
L'IA pour sélectionner les produits qui intéressent les utilisateurs
[1:23] Donc lorsque vous êtes un site marchand, vous avez un million de produits à afficher, à 30 millions d'internautes en France, l'intelligence artificielle c'est ça qui va nous permettre de sélectionner à l'instant T pour un utilisateur le produit qui va l'intéresser, sur lequel il va cliquer et qu'il aura, qu'il mettra dans son panier et qu'il va acheter par la suite.
Monde Numérique :
[1:42] Oui et ça c'est basé notamment, enfin vous aviez démarré surtout sur ce qu'on appelle le reciblage, le retargeting en anglais, c'est-à-dire que je regarde une fois une paire de chaussures et après j'ai beaucoup de publicité de paire de chaussures pour m'inciter à passer à l'acte et à passer à l'achat.
Alors tout cela a beaucoup progressé, évidemment, et de quelle manière aujourd'hui l'intelligence artificielle permet de faire évoluer ce principe-là ?
Romain Lerallut :
[2:09] L'intelligence artificielle, c'est vraiment quelque chose qui est en constante évolution et en constante réinvention.
Dans les années 2010-2012, il y a eu des grandes évolutions, que ce soit en termes de science, d'algorithmes, qu'en termes de puissance de calcul.
On s'est mis à faire des choses de plus en plus puissantes, en particulier avec le deep learning, qui a permis des avancées significatives en termes de précision des algorithmes.
Au début, on travaillait sur des images, puis on a travaillé sur du texte, sur la reconnaissance de la parole.
Et entre les années 2018-2019, on s'est dit chez Criteo que, a priori, toutes ces avancées technologiques pourraient bénéficier aussi aux produits de notre société.
Et donc c'est le moment où on a construit ce lab pour justement explorer tout ce que les nouveautés en IA pouvaient nous apporter.
Le lab de recherche en IA chez Criteo et les profils des chercheurs
Monde Numérique :
[3:06] Alors il y a combien de personnes qui travaillent dans ce lab et qui ont quel profil ?
Romain Lerallut :
[3:10] Alors on est une grande population, on a une trentaine de chercheurs qui ont un profil académique et elles ont des doctorats en machine learning, en intelligence artificielle.
Certains ne l'ont pas encore puisque ce sont des étudiants en thèse qu'on co-encadre avec des laboratoires et des écoles partout en France et une centaine d'ingénieurs dont le travail est d'accompagner ces chercheurs dans leur recherche et de ramener au sein de nos produits toutes les avancées technologiques qui auront été trouvées justement par ces chercheurs et par ces ingénieurs aussi qui ont des profils parfois, ils ont flirté un petit peu avec le monde de la recherche et puis sont revenus sur des profils plus ingénierie.
Monde Numérique :
[3:58] Oui, pour que toutes ces recherches débouchent sur des produits concrets, des produits réels.
Les produits concrets issus des avancées technologiques en IA
Romain Lerallut :
[4:03] Exactement. Contrairement aux très très très grosses entreprises du numérique, nous n'avons pas les moyens de nous permettre de faire de la recherche trop fondamentale.
À un moment ou à un autre, il faut que ça serve à nos produits et à nos clients.
Monde Numérique :
[4:18] Alors ça débouche sur quel type de produit ? Est-ce que vous avez des exemples ?
Romain Lerallut :
[4:21] Alors...
Les premières évolutions ont concerné les produits Criteo.
Donc vous avez parlé du Retargeting qui est notre produit historique et on l'a étendu à une notion un peu plus vaste de commerce à la performance, dans le sens où notre capacité justement à montrer des produits intéressants aux utilisateurs, on l'a étendu aux utilisateurs non pas ceux qui sont venus sur un site mais ceux qui ne sont pas encore venus sur le site.
Donc, beaucoup moins de signal, une petite aiguille dans une très, très grosse meule de foin.
Et grâce aux avancées de l'IA et aux avancées des modèles, on est capable, justement, de trouver quelles sont ces occasions d'afficher des produits pertinents aux utilisateurs.
L'utilisation de l'IA dans l'analyse des produits et des comportements des utilisateurs
[5:11] Ensuite, on s'est posé la question, au fur et à mesure que l'IA se développait, que des nouvelles choses devenaient possibles, comment est-ce que ces technologies peuvent profiter au commerce électronique, peut-être même au commerce de façon générale.
Donc on a travaillé sur l'analyse des produits, l'analyse des images, l'analyse des comportements des utilisateurs, travaillé sur également l'analyse des sites sur lesquels on affiche des publicités.
Par exemple, une chose qu'on ne veut surtout pas, c'est financer des sites de désinformation. On a travaillé sur l'analyse des sites de fake news pour s'assurer qu'on les écartait de notre inventaire d'achat.
Monde Numérique :
[5:54] C'est-à-dire que si un annonceur achète de la publicité auprès d'une agence, il ne faut pas que par l'intermédiaire de vos outils, ces publicités se retrouvent sur ce genre de site ?
Romain Lerallut :
[6:04] C'est exactement ça.
Monde Numérique :
[6:05] D'accord. Donc ça, l'IA permet de détecter le contenu des sites puisqu'évidemment on imagine qu'il n'y a pas les moyens de faire contrôler par un humain tous les sites web qui affichent de la publicité.
Romain Lerallut :
[6:20] Alors effectivement des sites web, il y en a des milliards et rien ne ressemble plus à un site de vraie news qu'un site de fake news.
Donc la difficulté ça va justement être de détecter ces sites.
Alors vous pouvez soit le faire de façon automatique, avec le risque peut-être d'écarter à tort des sites tout à fait viables.
La solution qu'on a trouvée, ça a été de faire un système semi-automatique dans lequel on trie les sites par probabilité qu'ils soient néfastes, nuisibles, et on les écarte manuellement, on valide la sélection.
Monde Numérique :
[6:55] Et vous avez quel taux de résultat, de satisfaction, d'efficacité ?
Romain Lerallut :
[7:00] Alors il y a toujours des... comment dirais-je...
Monde Numérique :
[7:04] Des ratés.
Romain Lerallut :
[7:04] Des ratés, effectivement. Je n'ai pas les chiffres en tête, mais on est passé...
C'est plus en termes d'efficacité de nos équipes de filtrage.
On est passé de quelques sites qu'ils arrivaient à filtrer par jour à plusieurs dizaines de milliers.
Monde Numérique :
[7:18] D'accord, grâce à l'IA. Donc un balayage permanent du web.
D'accord, d'accord. Autre chose ? Autre application ?
Utilisation de l'IA générative pour le commerce électronique et la publicité en ligne
Romain Lerallut :
[7:28] Alors, de façon un peu plus moderne, tout ce qui est autour de l'IA générative, donc ça, ça ouvre des possibilités assez extraordinaires.
On avait commencé nos recherches en 2019 sur ce sujet pour explorer un peu, donc ce n'était pas encore tout à fait à la mode.
Et la question c'est comment est-ce qu'on peut justement profiter de ces avancées d'IA génératives pour bénéficier au commerce électronique, à la publicité en ligne.
Un exemple de produit qu'on avait testé c'était une cabine d'essayage virtuel.
Donc vous prenez un selfie et puis dans le catalogue de vêtements de votre site de e-commerce favori, vous vous dites tiens cette chemise aboyenne justement est-ce qu'elle mirait, est-ce qu'elle mirait au teint, etc.
Donc vous cliquez et on affiche la chemise de façon correcte en respectant justement les formes du corps, en respectant les textures, etc.
Et ça vous donne une idée du look que vous auriez avec ce type de vêtement.
Par exemple vous pouvez combiner pour voir est-ce que cet ensemble là donc mettons chemise, pantalon, est-ce que c'est quelque chose qui serait qui serait intéressant.
Monde Numérique :
[8:40] Et c'est vraiment fiable le résultat parce qu'on voit ce genre de choses qui parfois est assez expérimental et approximatif comme cet essayage virtuel.
Un exemple concret : la cabine d'essayage virtuel grâce à l'IA
Romain Lerallut :
[8:49] Tout à fait. L'approche qu'on avait était particulièrement fiable en termes de respect des textures par exemple ce qui est un problème assez compliqué quand vous avez des rayures ou des imprimés comme ça des fois si on n'y prend pas garde ça va pas être respecté et ça va être au un résultat assez moche.
Donc justement les parties qui sont problématiques ça va être de faire attention à ces détails, de respecter aussi bien la coupe que la couleur et avoir une idée raisonnable du rendu final.
Monde Numérique :
[9:23] Et donc vous arrivez à rendre ce système d'essayage virtuel plus réaliste, plus fiable ?
Romain Lerallut :
[9:30] Alors ça fait partie justement des travaux qu'on a fait sur ce domaine là.
Ensuite on s'est dit ok d'accord ça ce truc là très bien bon ça marche si un de nos clients est intéressé on pourra lui vendre.
Maintenant qu'est ce qu'on peut faire d'autre justement pour trouver une utilisation assez technique.
Une partie de notre travail c'est de prendre les nouvelles techniques d'IA qui sortent et en ce moment en particulier cette année ça sort toutes les semaines.
Monde Numérique :
[9:59] 2023 c'est l'année de l'IA, ça a été l'année de l'IA.
Les techniques pour rendre un produit professionnel
Romain Lerallut :
[10:02] C'était extraordinaire. Donc voilà, toutes ces techniques qui sortent avec une utilisation plus ou moins évidente sur des vrais produits, comment est-ce qu'on se les approprie ?
À quels endroits il va y avoir des choses qui vont manquer pour en faire un véritable produit. Ce que vous disiez justement est particulièrement important.
La différence entre une image qui est sympa, qui est pas mal, où on peut faire un petit filtre Instagram, c'est mignon, c'est joli, et un véritable résultat avec un rendu professionnel, cette différence-là, elle est gigantesque.
Et c'est uniquement avec du travail, de l'effort, de la rigueur, que l'on arrive justement à faire ce dernier kilomètre qui prend tellement de temps pour aller vraiment du proto, du proof of concept, jusque vraiment le produit industriel.
Monde Numérique :
[10:53] D'où la nécessité véritablement de faire plancher des gens là-dessus, H24, dans le cadre de ce lab que vous avez monté alors.
L'importance de la pratique par rapport à la théorie
Romain Lerallut :
[11:02] Alors peut-être pas H24.
Monde Numérique :
[11:04] Oui, enfin bon, façon de parler. J'imagine qu'ils dorment aussi les chercheurs, oui.
Romain Lerallut :
[11:08] C'est préférable qu'il soit bien reposé, pour avoir les idées claires, pour avoir de la créativité.
Mais effectivement, c'est vraiment ça qui est important.
La différence entre quelque chose qui marche en théorie et quelque chose qui marche en pratique, elle est significative.
L'importance de la quantité de données pour l'IA
Monde Numérique :
[11:25] Pour faire tout ça et pour faire de l'IA, on le sait, il faut de la data, il faut des données, beaucoup de données.
On dit que vraiment la quantité de données, c'est la clé du problème.
Vous avez cette donnée ? Vous êtes en mesure de capitaliser là-dessus ?
Romain Lerallut :
[11:42] Alors effectivement, la donnée c'est l'essence de l'IA.
Alors je ne sais pas si l'essence c'est...
Monde Numérique :
[11:50] C'est très...
Romain Lerallut :
[11:53] Carburant fossile, tout ça... Il faut qu'on trouve autre chose, mais bon l'uranium c'est peut-être pas idéal comme comparaison non plus.
Monde Numérique :
[12:00] C'est le vent, l'air et la lumière de l'IA.
Romain Lerallut :
[12:05] Exactement. Donc oui, de la donnée, on en a beaucoup.
Une des chances qu'on a à Créteo, c'est d'avoir pu commencer à un moment où on était parmi les premiers arrivants sur le marché, donc on a pu commencer petit, petit ou moyen on va dire, de sorte que maintenant on a la possibilité justement d'avoir des jeux de données qui sont gigantesques.
Et au-delà de ça, on a une présence mondiale qui nous permet de disposer d'une population de tests sur lesquels on peut faire des essais d'à peu près un milliard d'individus de par le monde.
Donc ça, ça nous permet vraiment de faire des choses grandeur nature avec vraiment beaucoup de puissance justement et beaucoup de possibilités de faire des tests.
Monde Numérique :
[12:55] Mais alors, qui dit données dit attention, risque pour la vie privée, de quelle manière est-ce que vous...
Comment vous gérez cette question du respect de la vie privée ?
La gestion de la vie privée dans le traitement des données
Romain Lerallut :
[13:06] Alors, il y a plusieurs types de données sur lesquelles on va travailler.
Si on prend par exemple le cas de la cabine d'essayage virtuelle, l'essentiel des données ça va être des images de vêtements.
Le catalogue marchand de telle ou telle enseigne, ce ne sont pas des données à caractère sensible.
Non, non, exactement. Ensuite, on a également travaillé dès le début, je dirais, avec une approche qu'on appelle Privacy by Design, donc vie privée dès la conception en fait, dans laquelle on écarte de notre base de données toutes les données qu'on peut qualifier d'identifiantes, toutes les données qui sont vraiment relatives aux individus, ce sont des choses qu'on ne reçoit même pas.
Les informations dont on va disposer, c'est l'utilisateur 1234567, c'est pas qui c'est, c'est un numéro au hasard, mais qu'on va retrouver au fur et à mesure de sa navigation.
L'utilisateur 1234567 a vu tel produit, tel produit, a cliqué sur telle manière.
Et ça, c'est suffisant pour nous pour prédire quels vont être les prochains produits, quelles vont être les prochaines opportunités.
Et la combinaison de ces jeux de données, de comportement des gens lorsqu'ils vont naviguer sur un site de e-commerce et lorsqu'ils vont interagir avec nos publicités, combiné avec les données qu'on peut extraire justement des catalogues et d'autres types d'informations, c'est ça qui nous permet justement de concevoir des systèmes performants.
Monde Numérique :
[14:33] Les applications que vous décrivez, elles apportent des bénéfices chiffrés, j'imagine, à votre entreprise, à vos clients aussi ?
Romain Lerallut :
[14:42] Alors, effectivement, nous sommes une entreprise qui est basée sur la performance de nos campagnes.
Dès qu'on déploie un nouvel algorithme, une nouvelle méthode, on est capable de mesurer directement des gains de plusieurs pourcents, plusieurs dizaines de pourcents d'amélioration, d'efficacité qui vont bénéficier à nos clients, mais également aux internautes.
Lorsque la publicité est pertinente en termes de contenu, lorsqu'elle est pertinente en termes de moment, elle cesse d'être une nuisance qu'on a finalement acceptée, plus ou moins, et elle peut devenir un service d'accès, un service d'information, finalement, qui nous dit, hé, il y a tel produit là, à mon avis, il pourrait vous intéresser, voilà, regardez, cliquez, achetez, si ça passe.
Monde Numérique :
[15:31] À condition que je ne l'ai pas déjà acheté, parce que c'est un peu ça l'effet pervers du reciblage, c'est qu'une fois qu'on a acheté le produit, on continue à recevoir des tonnes de pubs sur le même genre de produit.
Romain Lerallut :
[15:41] Alors paradoxalement pas tant que ça. On a l'impression oui parce que lorsque ça arrive c'est assez flagrant, c'est très immédiatement visible.
Monde Numérique :
[15:52] Mais est-ce que vous pouvez détecter quand j'ai fait un acte d'achat et que du coup c'est plus la peine de m'envoyer de la pub là-dessus ?
Romain Lerallut :
[15:58] Alors non seulement on détecte mais justement c'est ce qu'on cherche à encourager.
C'est vraiment l'objectif pour nous.
Toute notre approche est validée lorsque l'utilisateur dit oui oui le produit que vous m'avez montré est intéressant et d'ailleurs je l'ai acheté.
Monde Numérique :
[16:13] Mais on le valide comment ? Sur les bandeaux de publicité ?
Romain Lerallut :
[16:16] Non, lorsque vous achetez le produit qu'on vous a montré, le fait de l'acheter pour vous c'est un indicateur ? C'est un signal de succès.
Après souvent ce qui se passe c'est qu'on va pas regarder juste sur un seul site, on va faire une petite comparaison et deux enseignes n'auront pas forcément envie d'échanger des informations et vont nous dire écoutez Critéo, je ne veux pas que vous partagiez avec mes concurrents le fait que j'ai fait une vente, je ne veux même pas que vous utilisiez pour l'information qui est une vente que j'ai réussie pour filtrer les campagnes que mes concurrents vont afficher.
Donc au final en fait beaucoup d'enseignes vont nous dire pourrissez la vie des internautes tant que c'est le nom de mes concurrents qui est affiché.
C'est un petit peu triste mais malheureusement c'est comme ça.
Et puis il peut y arriver tout simplement que vous voyez un produit en ligne, vous décidez de l'acheter en magasin, après réconcilier ces deux informations c'est beaucoup plus compliqué.
Monde Numérique :
[17:20] Ouais, là vous pouvez pas le faire.
Romain Lerallut :
[17:21] Non. Donc ce qu'on peut faire et ce que vous pouvez faire d'ailleurs c'est vous cliquez sur une petite croix et vous dites merci, j'ai déjà acheté ce produit.
Monde Numérique :
[17:31] Et là c'est fini, je n'aurai plus ce genre de publicité. Il faut interagir avec la publicité aujourd'hui, ce qui n'était pas possible avant, avec la télévision ou l'affichage dans le métro évidemment.
Demain, on ne pourra plus concevoir le e-commerce sans l'intelligence artificielle. Romain l'aura lu.
Romain Lerallut :
[17:49] Je pense que demain, il y a beaucoup de domaines qu'on ne pourra plus concevoir sans l'intelligence artificielle.
Le e-commerce en fait partie. mais je pense que l'IA va apporter énormément de choses dans notre société.
Monde Numérique :
[18:01] Merci Romain Lerallut, directeur du Lab d'intelligence artificielle de Criteo.