Bientôt des visioconférences doublées en temps réel ? (Debrief transat)
Maison Connectée03 juin 202407:56

Bientôt des visioconférences doublées en temps réel ? (Debrief transat)

Faire une visioconférence avec des gens qui ne parlent pas votre langue... sans même vous en rendre compte ? Ce sera bientôt possible ! (Extrait de L'HEBDO du 1er juin 2024).

La startup américaine spécialisée en intelligence artificielle Rask.ai promet pour bientôt un système de traduction automatique en temps réel avec synchronisation des lèvres des participants. Ce service repousse encore les limites du doublage assisté par IA. Toutefois, cette fonction n'est pas encore disponible. Elle risque de demander beaucoup de ressources matérielles, côté serveurs, sera sans doute onéreuse.

Retrouvez ma conversation avec Bruno Guglielminetti chaque samedi dans la rubrique "Debrief Transatlantique" de L'HEBDO.


Bruno :
[0:05] Jérôme Colombain, bonjour.

Jérôme :
[0:06] Et salut Bruno Guglielminetti, vous êtes là, cher ami.

Bruno :
[0:11] Finalement, j'y suis, oui. Avec un peu de décalage, évidemment,

Bruno :
[0:14] ça c'est l'horaire, mais bon, qu'est-ce que vous voulez ?

Jérôme :
[0:16] Alors, cette semaine, Bruno, on parle d'une innovation qui pourrait vraiment révolutionner les visioconférences. Et c'est une société que tu connais qui s'appelle RASC qui a lancé ça.

Bruno :
[0:31] Oui, RASC et AI, ce sont des gens qui sont dans le paysage de l'intelligence artificielle et du travail avec la voix et l'image depuis, ça va faire un bon deux ans que je les vois travailler là-dessus. Une boîte avec qui d'ailleurs je collabore à l'occasion, question d'être transparent. Et donc, ils arrivent aujourd'hui en nous présentant une démo. Ce n'est pas disponible sur le marché. On ne sait pas comment ça va coûter, mais c'est une démo qui nous propose de voir quelqu'un qui est en train d'avoir une conversation en vidéoconférence. En temps réel, il a droit à de la traduction. Il choisit la langue dans laquelle il veut que ses propos soient traduits. Lui, à la base, c'est en anglais. Et donc, il clique sur la langue et puis, automatiquement, tout ce qu'il dit, ça sort. Pour l'exemple, c'est en espagnol. C'est assez bluffant de voir.

Jérôme :
[1:24] C'est incroyable. C'est incroyable. La petite vidéo que tu as postée sur Twitter, ça m'a fait réagir sur X. C'est absolument hallucinant. Est-ce que, d'après toi, Bruno, c'est du vrai ou c'est du fake? Puisque, comme tu dis, ce n'est pour l'instant qu'une vidéo.

Bruno :
[1:40] Selon moi pour les connaître d'assez longtemps j'ai l'impression que c'est vrai, mais bon ils nous promettent ça c'est coming donc ça s'en vient mais j'ai l'impression que c'est ils n'ont pas la puissance machine aujourd'hui pour l'offrir en grand déploiement et d'ailleurs il faudra voir comment ça va coûter j'ai l'impression que c'est pas monsieur madame tout le monde qui va pouvoir se payer ça sauf que, il y a quelque chose qui est là et les connaissants et travaillant déjà avec leur outil qui sont déjà assez performant, je me dis que c'était une question de temps. Et d'ailleurs, c'est la réaction que je commence à avoir un peu sur X et sur LinkedIn. C'était une question de temps avant que l'intelligence artificielle nous permette

Bruno :
[2:20] de passer à de la traduction ou de l'adaptation en temps réel. Et la démo, c'est un peu ça ce qu'elle montre. Et c'est vraiment impressionnant. Et puis évidemment, après, notre imagination nous amène partout ailleurs. Mais imagine de pouvoir faire des entrevues dans la langue que tu veux, puis après d'importer ça en français. Pour tes auditeurs ou même d'avoir une conversation avec quelqu'un dont ce n'est pas du tout ta langue et de pouvoir l'entendre en français, par exemple.

Jérôme :
[2:48] Oui, il y a des applications professionnelles, pour nous, évidemment, journalistes, mais pas seulement. Dans plein d'entreprises, il y a des gens qui ont besoin de travailler ensemble, de se parler, mais qui ne sont pas dans les mêmes pays, qui ne parlent pas la même langue ou même, pourquoi pas, à titre personnel. Ça peut avoir un intérêt également.

Jérôme :
[3:06] C'est étonnant que ce soit une entreprise indépendante, enfin, qui ne fait que de l'IA qui lance ça, et que ce ne soit pas un Google ou un Microsoft. Et on se demande si un jour, ce ne sera pas tout simplement intégré dans Google et Microsoft. D'autant plus que, rappelle-toi, Microsoft avait lancé quelque chose comme ça il y a quelques années. Alors, ce n'était pas de l'audio simultané, parce que c'est très difficile à faire, mais au moins une transcription écrite.

Bruno :
[3:29] Oui, c'était la transcription sur le côté. On voyait, c'était en conférence, on voyait sur le côté. C'est déjà utilisé. Google propose la même chose. Mais quand on revient seulement il y a deux semaines, quand OpenAI a présenté son 4O et qu'il l'utilisait pour faire de la traduction d'anglais à italien pour avoir une conversation…, Tout le monde a dit « wow ». Mais là, on voit qu'il y a quelque chose qui est

Bruno :
[3:59] en train de se préparer, qui est dans les coffres, qui va nous offrir la traduction en temps réel. Alors ça, c'est… Puis c'est une question de moi. Moi, j'ai l'impression que peut-être pour la rentrée, ça sera disponible.

Bruno :
[4:10] C'est pour te dire comment les choses avancent à pas de géant et très rapidement.

Jérôme :
[4:14] À pas de géant, oui. Mais comme tu dis, ça risque de coûter assez cher parce que je crois que leur système actuel, qui n'est pas en temps réel, mais de localisation, de traduction, c'est de l'ordre de 50 euros pour 25 minutes, quelque chose comme ça.

Bruno :
[4:28] Mais ça, ça inclut à la fois la traduction, la transcription et il y a aussi la possibilité… La synchronisation labiale. Exactement, la synchronisation des lèvres, donc on a vraiment l'impression. J'ai fait parler le roi Charles III de cette façon-là.

Bruno :
[4:43] Je me suis amusé. Mark Zuckerberg aussi, alors c'est pour te montrer. Ça fonctionne très bien.

Jérôme :
[4:48] C'est vraiment… Tu t'amuses beaucoup avec les célébrités. Juste à propos de GPT-4O tu sais que moi je l'ai testé parce que la version audio n'est pas encore disponible et, c'était à l'occasion de Vivatech où j'ai eu la chance d'avoir un entretien un peu privilégié avec quelqu'un d'OpenAI Est-ce qu'on va l'entendre ? Alors j'espère bien qu'on va l'entendre prochainement, on l'entendra prochainement dans le monde numérique mais pas tout de suite Et donc ? Et donc il m'a montré sur son smartphone ce GPT-4 Et encore, on était à l'extérieur, il y avait du bruit, on était avec une mauvaise connexion, on avait juste de la 4G, etc. Et c'est bluffant. Le système répond en temps réel avec cette voix féminine qu'on a vue dans les démos, avec vraiment une impression de réalisme absolument incroyable.

Jérôme :
[5:37] Et c'est ce que tu dis, ça avance à pas de géant, cette histoire-là.

Bruno :
[5:41] Vraiment impressionnant. En tout cas, on suivra ça dans mon numérique à venir.

Bruno :
[5:45] L'autre truc, moi, que je voulais t'entendre, c'est... Je l'ai publié, j'ai fait un texte là-dessus cette semaine, mais c'était il y a 30 ans. Le groupe américain Aerosmith qui offrait, on peut dire, la première chanson qui était disponible en téléchargement, c'était gratuit.

Jérôme :
[6:01] Ah, mais moi, je ne sais pas. Moi, il y a 30 ans, j'étais un tout petit garçon.

Bruno :
[6:05] Ouais, ouais, ouais. J'ai l'impression qu'il y a 30 ans, on pouvait t'entendre sur France Info, mais en tout cas, pas.

Jérôme :
[6:11] Mais en tout cas.

Bruno :
[6:12] Ce que je sais, c'est qu'Aerosmith… Salaud. Avec sa compagnie de disques, Geffen, à l'époque, était vraiment précurseur. Ils avaient décidé de faire un coup de feu.

Jérôme :
[6:21] C'était eux qui avaient été les premiers.

Bruno :
[6:22] Oui, oui, oui. De grands groupes comme ça. Apparemment qu'un individu qui avait bidouillé quelque chose dans son salon avait mis le fichier en ligne. Mais de grands groupes, c'était la première fois. Et en faisant de la recherche, je me suis rappelé qu'au même moment, ça, ça avait été sorti au mois de juin, juillet. Et un petit peu plus tard, ils avaient aussi fait une tournée virtuelle sur CompuServe, sur Prodigy, sur AOL pour rencontrer leurs fans. Rencontrés virtuellement. C'était dans le contexte d'une session de clavardage, de chat.

Jérôme :
[6:52] Oui, c'était du chat par écrit.

Bruno :
[6:54] Oui, mais c'était quand même amusant. C'était avant Internet.

Jérôme :
[6:58] Enfin, ce n'était pas avant Internet, mais c'était avant vraiment la démocratisation d'Internet. Parce que tu parles de... Oui, 1984. C'est ce qu'on appelait les services en ligne, les réseaux en ligne.

Bruno :
[7:08] Alors que vous, vous aviez Minitel.

Jérôme :
[7:12] Nous, on avait Minitel à l'époque, exactement, qui était plus répandu, qui coûtait moins cher, mais il n'y avait pas le son ni l'image. Enfin, il n'y a pas l'image non plus sur CompuServe.

Bruno :
[7:21] Oui, bon. La messagerie rose a fait fortune, puis il n'y avait pas de...

Jérôme :
[7:24] Ah, ben oui, ça a fait la fortune et ça a créé les grands patrons du numérique d'aujourd'hui en France, chez nous. Xavier Niel, Raphaël Adjian, tous ces gens-là qui sont des anciens du Minitel. Bon, ben voilà, ça a été pour la séquence...

Bruno :
[7:38] Nostalgie.

Jérôme :
[7:39] Vieux crouton. N'est-ce pas, Bruno? Merci beaucoup pour cette plongée dans le passé.

Bruno :
[7:45] Je vais penser à ça.

Jérôme :
[7:46] Merci quand même, Bruno.

Bruno :
[7:47] Allez, salut.

innovation,numérique,informatique,technologies,tech news,High-tech,actu high-tech,traduction,