À l’ère de l’intelligence artificielle, la maîtrise des données devient un enjeu stratégique majeur pour l’Europe. Matthias De Bièvre, fondateur de Visions et président de Prometheus X, explique comment les data spaces peuvent transformer l’accès et le partage des données de manière souveraine, éthique et standardisée.
Pourquoi les données sont-elles devenues aussi cruciales aujourd’hui ?
Parce qu’elles sont à la base de tous les systèmes d’intelligence artificielle. Les modèles comme ChatGPT ou Mistral se sont entraînés sur des données publiques – Wikipédia, articles en ligne, etc. – mais pour aller plus loin, notamment dans des secteurs comme la santé ou l’éducation, il faut accéder à des données privées et protégées, qui sont aujourd’hui dispersées dans des silos. Ces données ne doivent pas être ouvertes à tous, bien sûr, mais elles doivent pouvoir être partagées de façon sécurisée et encadrée.
C’est là que les « data spaces » entrent en jeu ?
Exactement. Les data spaces, c’est un peu le réseau routier de la donnée. Ils sont issus de la stratégie européenne de la donnée, qui repose à la fois sur une base réglementaire (comme le Data Governance Act) et sur des investissements dans des infrastructures de partage. Grâce à ces espaces, on peut accéder à des données de manière standardisée, sans avoir à se connecter séparément à chaque organisation. C’est un énorme gain de temps, de coûts, et cela ouvre la voie à des IA plus éthiques, souveraines et performantes.
Peut-on vraiment rivaliser avec les géants américains grâce à ces outils ?
Pas du jour au lendemain. Aujourd’hui, 80 % des données sont encore hébergées chez Amazon, Azure ou Google. Mais les data spaces peuvent justement nous permettre de bâtir une alternative. Ils s’appuient sur des clouds souverains comme ceux d’Orange, Scaleway ou Clever Cloud. En facilitant l’accès aux données, on crée de nouveaux services d’IA hébergés localement. C’est une transition progressive, mais essentielle, et qui repose autant sur une alliance technologique que sur des choix politiques.
Matthias De Bièvre:
[0:01] Les data space, il faut les voir comme un peu le réseau routier de la donnée. Ça vient de la stratégie européenne de la donnée, qui d'une part fait des réglementations pour faciliter la circulation de ces données protégées, comme le Data Governance Act, comme le Data Act, et d'autre part investit dans ce réseau routier l'infrastructure, les data space qui permet l'échange standardisé de ces données.
Monde Numérique :
[0:30] Bonjour Matthias De Bièvre.
Matthias De Bièvre:
[0:32] Bonjour Jérôme.
Monde Numérique :
[0:33] Vous êtes fondateur et PDG de Visions, au pluriel, une entreprise spécialisée dans le traitement des données personnelles. Vous êtes également président de Prometheus X, qui est une initiative européenne pour le partage éthique et souverain des données. C'est vrai que la souveraineté, les données, on en parle beaucoup depuis plusieurs années, mais encore plus aujourd'hui, on va dire, dans un contexte plutôt tendu entre les États-Unis et l'Europe. Au fond, Matthias, pourquoi est-ce que les données numériques sont aujourd'hui à la base de tout ? En quoi est-ce aussi important ?
Matthias De Bièvre:
[1:07] Aujourd'hui, il y a, que ce soit le chat de Mistral, que ce soit le ChatGPT, Claude, etc., ils se sont entraînés sur toutes les données publiquement disponibles. Donc tous les articles, les pages web, Wikipédia, tout ce qu'on peut trouver en ligne. Et ça fait déjà une très très bonne base de connaissances qui fait que si je lui pose une question sur ce qu'est l'ADN par exemple, pouvoir me répondre et répondre à mes questions sur la base de ces données publiquement disponibles. Mais maintenant pour faire les systèmes et les services d'après, dans la santé ou dans l'éducation, il faut accéder à des données qui ne sont pas publiquement disponibles. Et qui sont généralement silotées au sein de différentes organisations. Encore heureux qu'elles ne sont pas publiquement disponibles, nos données de santé, mais ça reste pertinent de pouvoir y donner accès dans un cadre sécurisé.
Monde Numérique :
[2:02] Alors, selon vous, ça, ça passe par ce qu'on appelle les data space, c'est ça ?
Matthias De Bièvre:
[2:06] C'est ça.
Monde Numérique :
[2:07] De quoi s'agit-il ?
Matthias De Bièvre:
[2:08] Les data space, il faut les voir comme un peu le réseau routier de la donnée. Les data space, ça vient de la stratégie européenne de la donnée. Ça date quand même de 2020-2021, qui d'une part fait des réglementations pour faciliter la circulation de ces données protégées comme le Data Governance Act, comme le Data Act, et d'autre part investit dans ce réseau routier l'infrastructure, les data spaces qui permettent l'échange standardisé de ces données. Et donc au lieu de s'intégrer avec toutes les sources de données, on s'intègre une fois avec ce réseau et on peut échanger. Évidemment selon les conditions définies, etc., mais avec tout le monde qui est dans le réseau. Et donc, ça permet de drastiquement réduire le temps et le coût d'accès à toutes ces données et donc accélérer le développement de ces IA souveraines et puissantes.
Monde Numérique :
[2:58] En fait, c'est une sorte de filtrage qui attribue, en fonction des autorisations, en fonction des droits, des niveaux d'autorisation, accès à telle ou telle donnée.
Matthias De Bièvre:
[3:06] Exactement, exactement. Il faut bien comprendre que c'est exactement ça, c'est la gestion de ces autorisations et de l'accès à la donnée. Ce n'est pas un data lake, ce n'est pas un énorme entrepôt de données où on va venir mettre toutes les données.
Monde Numérique :
[3:20] Ce n'est pas open bar.
Matthias De Bièvre:
[3:21] Ce n'est ni open bar, ni data lake. Les données restent chez le fournisseur qui se connecte. Il a ce connecteur, on appelle ça, qui effectue ce filtrage. Et puis ensuite, elles sont partagées vers l'utilisateur directement. Et puis, ce n'est pas open data parce que Et du coup, il y a des conditions que chacun peut définir sur ces données.
Monde Numérique :
[3:43] Quelles sont les données auxquelles on peut donner accès facilement et les autres
Monde Numérique :
[3:49] qui sont plus sensibles ?
Matthias De Bièvre:
[3:50] Alors, il y a différentes choses. Aujourd'hui, on voit un peu des écosystèmes sectoriels qui se déploient sur la base de ce réseau Data Space. Donc, on va voir dans l'éducation et l'emploi, ça va être des données sur les notes, sur les exercices, sur ce qu'on appelle les traces d'apprentissage que les élèves ont. Et ça, ça va être utilisé pour créer par exemple des IA qui aident à réviser et génèrent des exercices personnalisés en fonction du niveau de l'élève ou vont aider la personne dans son orientation, dans sa recherche d'emploi pour l'orienter vers les bons acteurs, lui faire découvrir les bons métiers. On va avoir des écosystèmes dans le mobilité et le tourisme pour par exemple créer des IA qui vont nous aider à créer un planning de vacances, réserver l'hôtel, le train, l'avion, rebooker s'il y a des problèmes. On va avoir des choses aussi plus industrielles dans l'aérospatiale avec Airbus et d'autres qui simplifient finalement l'intégration et les échanges avec tous leurs fournisseurs et tous leurs sous-traitants. On va avoir aussi des choses qui se lancent dans la santé, où on a déjà des choses comme le Health Data Hub ou mon espace santé, mais le Data Space vient ajouter une couche d'orchestration et de simplification d'accès à ces données.
Monde Numérique :
[5:17] Les Data Space sont vraiment une solution technique qui permette d'implémenter des choix politiques. Il faut que le choix ait été fait au départ, de partager ou de ne pas partager, de partager de telle ou telle manière. Est-ce que c'est une manière selon vous, c'est un outil qui permet de rivaliser
Monde Numérique :
[5:34] avec les solutions américaines ?
Matthias De Bièvre:
[5:35] Oui, mais la réponse n'est pas si simple. Je pense que là, la situation de dépendance numérique dans laquelle on est appelle un plan de transition pour réduire cette dépendance. Et donc aujourd'hui, le fait que 80% des données sont chez Amazon et Azure et Google, c'est un fait, mais on ne va pas le changer en claquant des doigts. Cette couche Data Space, on l'opère directement sur des clouds souverains. Donc, on a des partenariats avec Orange, avec Scaleway, avec Clever Cloud, avec OutScale, pour gérer cette couche-là. Une fois que ces données sont accessibles, ça va créer des nouveaux services IA. Et ces nouveaux services IA sont eux aussi hébergés chez des clouds souverains. Et donc, on voit que grâce à ça, on permet de créer des nouvelles couches.
Matthias De Bièvre:
[6:31] Qui reposent, elles, et des nouveaux services qui reposent, eux, directement sur des clouds souverains et donc de ne pas répéter les erreurs qu'on a pu faire précédemment. Ça va permettre aussi de commencer à renforcer ces clouds souverains et de progressivement migrer certaines parties des données qui sont aujourd'hui chez Azure et AWS et les autres vers ces clouds souverains et ça permet donc de construire cette alternative, et comme je le disais, on a la solution technique, on a l'alliance des acteurs techniques pour le faire, il s'agit aussi de choix politiques, aussi bien côté privé que public, pour commencer à utiliser, à se connecter là-dessus et à développer ces nouveaux
Matthias De Bièvre:
[7:15] services IA grâce à cette nouvelle architecture.
Monde Numérique :
[7:18] Merci Matthias De Bièvre, fondateur et PDG de l'entreprise Visions et je rappelle que vous êtes également président d'une initiative européenne Prometheus X.
Matthias De Bièvre:
[7:28] C'est ça, merci beaucoup Jérôme.













