Webcleaner : une solution numérique européenne contre la pollution des données médicales

Webcleaner : une solution numérique européenne contre la pollution des données médicales

Et si la prochaine grande pollution à traiter ne venait ni de l’air ni des océans, mais des serveurs ? À l’heure où la donnée est devenue le pétrole du XXIe siècle, une startup européenne s’attaque à une pollution encore méconnue, mais aux conséquences croissantes : la suraccumulation de données médicales inutilisées, obsolètes ou redondantes. Nom de code : Webcleaner. Cette jeune pousse ambitionne de rendre le stockage médical non seulement plus léger, mais surtout plus intelligent. Zoom sur une démarche qui conjugue gouvernance des données, cybersécurité, sobriété numérique… et viabilité économique.

La donnée médicale, entre trésor et fardeau

Hôpitaux, assureurs santé, laboratoires pharmaceutiques, éditeurs de solutions e-santé : tous produisent, échangent et stockent des données médicales à un rythme exponentiel. Dossiers patients, imagerie clinique, études cliniques, objets connectés, plateformes de téléconsultation… Le secteur pèse désormais plus lourd que n’importe quel autre en matière de volumétrie de données, avec des milliards de documents enregistrés chaque année.

Mais derrière cette croissance affolante se cache un phénomène en voie de devenir problématique : l’infobésité. Car contrairement à une idée reçue, stocker n’est pas neutre. Cela consomme des ressources, énergétiques comme financières. Or, selon une étude du cabinet IDC, jusqu’à 80 % des données stockées par les organisations seraient aujourd’hui non utilisées, inexploitables ou tout simplement périmées. Un paradoxe dans un secteur qui se veut fondé sur la rationalité et l’efficacité.

C’est dans ce contexte que Webcleaner est né.

Une startup au service d’une souveraineté numérique verte

Créée en 2021 entre Paris et Barcelone, Webcleaner s’est positionnée sur un créneau résolument européen : proposer une solution de nettoyage intelligent des données sensibles, intégralement hébergée dans l’Union européenne, conforme au RGPD et peu consommatrice en infrastructures serveur.

Le concept est simple mais redoutablement efficace : grâce à une intelligence artificielle propriétaire, Webcleaner cartographie automatiquement les bases de données médicales internes d’un client (hôpital, mutuelle, startup de la medtech…), identifie les fichiers redondants, corrompus ou inutilisables, et propose un plan d’action d’optimisation avec un niveau de granularité étonnamment précis. Chaque intervention est accompagnée d’un reporting exhaustif sur les risques détectés, les sources de pollution numérique, et les économies potentielles.

“Nous voulons réconcilier gouvernance des données, performance opérationnelle et faibles émissions carbone”, résume Anaïs Lefèvre, cofondatrice et CEO de Webcleaner, ancienne data scientist spécialisée dans les secteurs de la santé et de l’environnement.

Comment ça fonctionne dans la pratique ?

La solution repose sur un diagnostic de départ déployé à distance : après un simple audit de sécurité et des droits d’accès, Webcleaner installe en quelques heures un module qui explore les environnements numériques ciblés (serveurs locaux, cloud privés, bases de données SQL, systèmes PACS d’imagerie…).

L’algorithme détecte :

  • les doublons dans les enregistrements médicaux
  • les fichiers non consultés depuis plus de 5 ans
  • les documents stockés plusieurs fois sous différents formats
  • les métadonnées sensibles mal protégées
  • des erreurs de classification ou d’étiquetage

Des simulations réalisées chez plusieurs établissements hospitaliers partenaires ont mis en évidence des taux de “données mortes” pouvant atteindre 60 % de leur volume total. Une perte de place, d’argent et de performance.

Une fois le nettoyage réalisé, la startup propose des outils de gouvernance DaaS (Data-as-a-Service) pour maintenir cet écosystème de données propre et évolutif. Ces modules incluent des alertes de saturation, des modèles prédictifs de stockage, ou encore des recommandations de structuration pour les futurs formats de données.

Un impact écologique mesurable, un ROI rapide

Le premier bénéfice est immédiat : en réduisant de plusieurs téraoctets la quantité de données stockées inutilement, les établissements partenaires observent une baisse significative de leur consommation énergétique numérique. Cela se traduit à la fois en économies financières sur les coûts de maintenance et en réduction de leur empreinte carbone.

Selon les bilans fournis par Webcleaner auprès de ses clients pilotes, les gains s’étalent entre :

  • 35 à 50 % de réduction de la facture serveur
  • 20 à 30 % de libération de l’espace de stockage
  • Jusqu’à 60 % d’abaissement des temps de recherche dans les bases patients
  • Une baisse européenne moyenne de 15 à 18 % d’émissions CO₂ liées à leur impact numérique

“On a souvent tendance à l’oublier, mais un datacenter médical consomme parfois plus qu’un bloc opératoire. Réduire la donnée c’est aussi soigner notre système de santé numérique”, affirme Anaïs Lefèvre.

Un positionnement stratégique au cœur de la régulation européenne

Outre ses promesses technologiques, Webcleaner surfe aussi intelligemment sur les vagues réglementaires européennes. Entre le RGPD, les discussions autour du European Health Data Space (EHDS), et la transversalité croissante entre souveraineté numérique et politiques climatiques, la startup coche des cases stratégiques qui attirent de plus en plus d’investisseurs éthiques.

En 2023, elle a bouclé une levée de fonds de 4,5 millions d’euros menée par le fonds Green Data Ventures et accompagnée par Bpifrance. Objectif : renforcer sa R&D, étendre son IA à des formats complexes (notamment les données non-structurées issues des wearables médicaux) et déployer commercialement sa solution sur les marchés allemand et scandinave.

Un partenariat pilote avec un important CHU en Suède est actuellement en cours, avec l’objectif d’un déploiement national progressif si les résultats sont concluants.

Entre cybersécurité et confiance patient : l’enjeu éthique

Dans le domaine médical, manipuler des données n’est jamais un acte neutre. La promesse de Webcleaner ne va donc pas sans questionnement sur l’éthique et la confidentialité. Sur ce point, la startup assure ne jamais “lire” les données de manière contextuelle ou nominative. L’ensemble du traitement est réalisé via des algorithmes anonymisés, validés par un comité d’experts externes.

De plus, la société insiste sur son engagement pour une architecture zéro copie : aucune donnée n’est transférée à l’extérieur de l’infrastructure du client. Seules les métadonnées statistiques sont partagées à des fins d’optimisation continue de l’IA.

Un label European Cybersecurity SME Star lui a d’ailleurs été décerné par l’ENISA en début d’année, renforçant sa place d’acteur crédible dans le traitement des données de santé hautement sensibles.

Quel avenir pour Webcleaner et la sobriété numérique médicale ?

Si la startup est encore jeune, son positionnement s’ancre dans une tendance de fond que peu d’acteurs du secteur de la santé peuvent se permettre d’ignorer. Avec l’essor de la médecine personnalisée, des jumeaux numériques et de l’IA clinique, la pression sur les infrastructures storage-as-a-service ne va que s’intensifier.

Dans ce contexte, proposer des solutions de régulation intelligente des flux – à l’image d’un chef d’orchestre digital capable de trier, maintenir et prioriser des données – pourrait devenir un modèle standard dans les établissements de santé. Webcleaner entend bien jouer ce rôle, tout en défendant une vision éco-responsable et souveraine de la tech médicale européenne.

Aujourd’hui, la société annonce avoir été sollicitée par plusieurs clusters hospitaliers en Belgique, à l’initiative du gouvernement fédéral désireux d’intégrer des critères environnementaux dans ses politiques numériques. Des discussions avec le programme Gaia-X sont également en cours, témoignage de la reconnaissance croissante accordée à ces “filtres à données utiles”.

Nettoyer pour mieux innover : et si l’avenir des biotechs passait par une gestion rationnelle du “bruit numérique” ? Une chose est sûre : Webcleaner n’a pas fini de faire parler d’elle.