Google va radicalement faire évoluer Street View. À l’occasion de la conférence Google I/O, DeepMind a annoncé l’intégration de Street View à Project Genie, son modèle de monde capable de générer des environnements interactifs à partir de données réelles, d’images ou de simples consignes textuelles.
De la carte panoramique au simulateur urbain
L’idée est ambitieuse puisqu’il s’agit de permettre aux utilisateurs d’explorer une rue « réelle », mais dans une version à la fois modifiable et dynamique. On pourrait, par exemple, visiter un quartier de New York sous la neige, tester une rue parisienne sous la pluie ou imaginer un paysage urbain transformé par un scénario climatique extrême.

Jack Parker-Holder, chercheur chez DeepMind, résume l’intérêt du projet : « C’est vraiment puissant à la fois pour les agents, la robotique et les humains qui veulent expérimenter. » Selon le chercheur, Genie pourrait aussi aider à entraîner des robots dans des conditions particulières.
Vingt ans de Street View au service de l’IA
Un outil pour les robots, les jeux et l’éducation
Google dispose d’un atout colossal, soit plus de 280 milliards d’images Street View collectées dans 110 pays et sur sept continents. En combinant cette base visuelle avec un modèle génératif, l’entreprise veut créer des simulations ancrées dans des lieux réels.
Genie 3 est déjà utilisé dans des travaux de recherche, notamment pour créer des mondes interactifs et entraîner des systèmes autonomes. Waymo s’en sert par exemple pour tester des scénarios extrêmement rares, comme des tornades ou des rencontres improbables sur la route.
Une technologie encore expérimentale
La technologie reste toutefois expérimentale. Les environnements générés sont reconnaissables, mais encore proches du jeu vidéo plutôt que du photoréalisme. Diego Rivas, chef de produit chez DeepMind, rappelle que le niveau de précision doit encore progresser. Pour Jonathan Herbert, directeur de Google Maps, la vraie avancée tient à la continuité spatiale : lorsque l’utilisateur tourne à 360 degrés, l’IA conserve la cohérence du monde simulé. « Nous réfléchissons depuis longtemps à la manière de construire le meilleur et le plus riche modèle du monde à partir des données de Street View » déclare Herbert. « L’idée d’utiliser les données de Maps de nouvelles façons, et pour de nouveaux types de recherche en IA, fait clairement partie de nos réflexions depuis très longtemps. »