🔎 Les World Models peuvent-ils rendre les robotaxis vraiment intelligents ? (Zoom Tech)
Maison Connectée13 février 202605:38

🔎 Les World Models peuvent-ils rendre les robotaxis vraiment intelligents ? (Zoom Tech)

Les voitures autonomes actuelles ne sont pas encore capables de rouler partout sans préparation. Waymo affirme franchir une étape clé grâce aux “World Models” capables de générer des situations de conduite ultra-réalistes pour mieux affronter l’inattendu.

Pourquoi les voitures autonomes ne sont pas encore universelles

Les véhicules autonomes qui circulent aujourd’hui aux États-Unis ou en Chine sont de niveau 4. Cela signifie qu’ils fonctionnent dans des zones précises, après avoir été longuement entraînés dans ces environnements. Ils ne disposent pas encore de la capacité d’adaptation universelle d’un conducteur humain, capable de faire face à n’importe quelle situation, dans n’importe quelle ville et sous n’importe quelle météo.

Un entraînement encore trop dépendant du réel

La limite des systèmes actuels tient à leur apprentissage. Ils excellent dans des contextes qu’ils connaissent déjà, mais peuvent être pris en défaut face à des événements rares : véhicule à contresens, conditions météorologiques extrêmes, obstacle inattendu ou comportement imprévisible d’un autre usager. Pour viser le niveau 5 — l’autonomie totale — il faut élargir considérablement la palette des situations rencontrées pendant l’entraînement.

Des “World Models” pour simuler toutes les routes du monde

Waymo mise sur une approche fondée sur un modèle génératif capable de créer des environnements de conduite photoréalistes et interactifs à partir de simples vidéos en deux dimensions. Le système reconstitue des scènes en trois dimensions dans lesquelles le logiciel de conduite autonome peut évoluer comme en conditions réelles. Ce dispositif permet de générer à la demande des scénarios très variés : tempête de neige sur le Golden Gate, tornade soudaine, rue tropicale enneigée ou événements improbables comme des objets mal arrimés sur un toit de voiture, un animal sauvage surgissant sur la chaussée ou un piéton déguisé de manière insolite. L’intérêt est de confronter le système à des milliards de variations d’un même scénario, afin d’améliorer sa capacité d’adaptation.

Une étape vers le niveau 5 ?

Selon l’entreprise, cette méthode serait plus rapide, moins coûteuse et plus stable que les simulateurs traditionnels. Elle permettrait d’accélérer l’apprentissage tout en testant des situations difficiles, voire dangereuses, impossibles à reproduire facilement dans le monde réel. Reste une question centrale : un entraînement massif dans des univers simulés suffira-t-il à reproduire la souplesse de jugement d’un conducteur humain ? Car face à une situation extrême, les réactions varient d’une personne à l’autre. Les World Models représentent sans doute une avancée majeure. Mais la route vers une autonomie totale, capable de s’adapter partout et en toutes circonstances, demeure un défi technologique et éthique de premier plan.


[0:01] Comment faire pour que la voiture autonome devienne vraiment autonome ? C'est-à-dire pour qu'elle soit capable de rouler sans chauffeur en tout lieu et en toutes circonstances. Récemment, j'expliquais dans un précédent épisode de Monde Numérique, et aussi dans une petite vidéo que vous avez peut-être vu passer, que les véhicules autonomes actuels, ceux qui circulent notamment aux Etats-Unis ou en Chine, ne sont en réalité que des véhicules autonomes de niveau 4. C'est-à-dire qu'ils ont encore besoin d'avoir été entraînés pendant des mois, par exemple dans les rues de San Francisco ou de Las Vegas, pour pouvoir être exploités en toute sécurité. Ils ne sont pas de niveau 5, c'est-à-dire qu'ils ne peuvent pas être déployés n'importe où, n'importe comment, à Paris, Bombay, Beyrouth, etc. Parce qu'ils ne sont pas capables de se comporter comme des véhicules conduits par un chauffeur humain qui saura s'adapter à toutes les situations. Les véhicules autonomes n'ont pas vraiment d'intelligence qui leur permettrait de faire face à toutes sortes de cas de figure, comme une tempête de neige ou l'arrivée subite d'un animal sauvage en travers de la route ? Non, parce qu'ils n'ont jamais rencontré ce genre de situation au cours de leur entraînement. [1:08] Google, ou plutôt sa filiale Waymo, semble avoir trouvé malgré tout une solution pour rendre ces véhicules encore plus intelligents, encore plus aptes à faire face à toutes sortes de situations inattendues. Cette solution, c'est ce qu'on appelle le World Model, Un type d'intelligence artificielle qui se base sur une véritable représentation du monde afin de mieux appréhender la réalité. Waymo affirme avoir développé un World Model spécial pour entraîner ces véhicules autonomes de manière beaucoup plus fine pour leur apprendre à se confronter à toutes les situations. Le Waymo World Model, ce n'est pas exactement un World Model au sens où pourraient l'entendre des spécialistes comme Yann Le Cun par exemple. C'est plutôt une sorte d'émulation. Il s'agit d'un modèle d'IA génératif conçu pour produire des situations de conduite hyper réalistes avec des images très immersives, mais à partir de vidéos toutes simples, en 2D, provenant par exemple de dashcam, des caméras de tableau de bord dans les voitures, ou même de vidéos prises au smartphone. [2:07] Cela a permis de créer un environnement d'entraînement hyper réaliste pour les voitures. Le but, c'est de leur permettre de s'entraîner dans cet environnement de manière multimodale, comme on dit, afin d'affronter toutes les situations inattendues qui pourraient se produire sur route ouverte. Avec un tel système, le Waymo Driver, c'est-à-dire le système de pilotage automatique de Waymo, peut se confronter des milliards de fois, car on peut le faire passer plusieurs fois face à ce genre de scènes qui vont être un petit peu différentes à chaque fois, comme s'ils s'entraînaient en situation réelle, dans les rues, d'une ville, n'importe où dans le monde. [2:43] Waymo explique tout ça en détail dans un long billet de blog qui présente le système. Les chercheurs disent que, notamment, le Waymo Driver est ainsi parvenu, par exemple, à éviter un véhicule qui roulait à contresens, ce qui, évidemment, n'arrive pas tous les jours, donc il n'avait pas pu vraiment rencontrer ce cas de figure. Et d'ailleurs, de nombreuses situations ont ainsi été testées. D'abord, des conditions météo difficiles, par exemple le pont Golden Gate de San Francisco, sous la neige, ou encore une tornade, ou encore même des situations surréalistes comme la rue d'une ville tropicale bordée de palmiers. Mais couvertes de neige. Il y a aussi des événements rares qui ont été générés, comme un conducteur qui subitement quitte la route, un véhicule qui transporte des meubles mal arrimés sur le toit, ou même un éléphant ou un lion en travers de la voie, ou encore un piéton déguisé en dinosaure. Bref, les chercheurs s'en sont vraiment donnés à cœur joie. Et c'est tout l'intérêt de la chose. Alors, ils ont pu faire ça grâce au système qu'ils ont mis en place, qui s'appelle Génie 3 de Google, un modèle capable de générer ces environnements interactifs à la demande à partir de simples promptes, comme s'il parlait à Gemini, en fait. Selon Waymo, ce world model, donc construit sur Genitroi, serait le modèle généraliste le plus avancé au monde, capable de générer des environnements 3D photoréalistes, adaptés aux exigences de la conduite autonome. Ça va donc beaucoup plus loin que les entraînements dans le monde réel, ou même sur des simulateurs classiques qui ne font que reproduire les conditions de circulation les plus courantes. [4:11] Accessoirement, ce système serait beaucoup plus rapide, moins coûteux que les simulations classiques et aussi plus fiables car Waymo explique qu'en général plus une simulation dure longtemps et plus elle est difficile à calculer et surtout à maintenir stable sans perte de qualité Cette innovation semble donc marquer une étape vraiment importante pour le développement des voitures autonomes Alors on ne sait pas si ça les rendra vraiment intelligentes comme un humain on va dire pour arriver à faire des voitures de niveau 5 capables de comprendre très vite une situation nouvelle de s'adapter mais en tout cas ça élargit quand même considérablement la palette des cas de figure auxquels ces véhicules peuvent être confrontés et donc ça leur permet de s'entraîner pour mieux gérer ensuite les situations dans le monde réel. Bon, l'histoire ne dit pas si une voiture ainsi entraînée serait capable de faire mieux qu'un humain face à une situation réellement inattendue. Car au fond, chaque chauffeur en chair et en os, face à une situation extrême, réagira à sa manière. Tout le monde ne va pas se comporter pareil. Par exemple, qu'est-ce qu'on fait face à une attaque à main armée au milieu de la route ? Est-ce qu'il faut s'arrêter, foncer, etc. Dans ce genre de situation vraiment peu ordinaire, chaque humain réagit à sa façon. pas forcément toujours au mieux bien sûr alors on verra si la robotique permet d'apporter des réponses uniformes à ce genre de questionnement, mais ça c'est une autre histoire.
innovation,informatique,technologies,tech news,High-tech,numérique,actualités,tech,actu tech,Voiture autonome,