Prix de thèse académique 2026 : Bianca Marin Moreno

À la Une, Recherche
Bianca Marin Moreno a reçu le prix de thèse académique 2026 pour ses travaux de recherche parmi les docteurs diplômés en 2025.

Intitulé de sa thèse : Apprentissage par renforcement convexe en ligne et applications aux problèmes de gestion de l'énergie

Problématique et enjeux scientifiques
L'intégration massive des énergies renouvelables intermittentes nécessite une flexibilité accrue de la demande, notamment via le pilotage d'appareils thermiques (chauffe-eau). Le défi scientifique consiste à contrôler des centaines de milliers d'agents sous des contraintes d'observation partielle pour garantir la confidentialité des données. Ce problème de décision en temps réel doit s'exécuter dans un environnement incertain et non stationnaire, où le comportement des consommateurs et la production électrique évoluent de manière imprévisible, rendant les approches de contrôle classiques inopérantes à cette échelle.
Avancées algorithmiques : convergence et robustesse
Le coeur des travaux de Bianca repose sur l'introduction de nouveaux algorithmes d'apprentissage par renforcement et d'optimisation en ligne, spécifiquement conçus pour réguler la consommation moyenne d'une vaste population d'agents vers un profil cible. Sa thèse démontre que l'application d'algorithmes d'apprentissage "No-Regret", tels que Hedge ou l'Online Mirror Descent, permet d'atteindre efficacement un équilibre de Nash dans le cadre de jeux à champ moyen (Mean Field Games). Un résultat théorique majeur prouve ainsi la convergence de la consommation agrégée vers l'objectif fixé. Pour faire face à la non-stationnarité inhérente aux comportements humains et à la production électrique, l'algorithme MetaCURL a été développé. Basé sur une stratégie d'agrégation d'experts, cet outil adapte dynamiquement le contrôle sans nécessiter de connaissance préalable sur l'amplitude des variations de l'environnement, tout en conservant une complexité algorithmique très faible.
Vers un déploiement réel : confidentialité et stabilité
Au-delà des garanties théoriques, la thèse de Bianca traite des verrous pratiques liés au déploiement sur les réseaux électriques :
  • Préservation de la vie privée : des méthodes de réduction du flux d'informations observées ont été publiées (ICML 2025) pour limiter l'intrusion du contrôleur.
  • Stabilité long terme : pour éviter les réinitialisations quotidiennes irréalistes des agents, une solution intégrant une contrainte sur la loi terminale des états a été proposée (ALT 2026), assurant une continuité opérationnelle du système.
Conclusion et perspectives
Les travaux de Bianca constituent un pont entre la théorie de l'apprentissage séquentiel et les besoins critiques de la transition énergétique. En fournissant des algorithmes robustes, scalables et respectueux de la vie privée, ses recherches posent les jalons de systèmes électriques bas carbone capables de s'auto-ajuster de manière autonome et fiable.

En octobre 2025, Bianca recevait déjà le Prix Jeunes Talents France 2025 L’Oréal-UNESCO Pour les Femmes et la Science, de la Fondation L’Oréal, en partenariat avec l’Académie des sciences et la Commission nationale française pour l’UNESCO. Parmi les 34 doctorantes et post-dosctorantes mise à l’honneur, elle s’est distinguée dans la catégorie "IA et Modélisation : anticiper et façonner l'avenir".

Mots clés : champ-moyen, apprentisage automatique, pilotage de la consommation électrique, optimisation
 
École doctorale : ED MSTII – Mathématiques, Sciences et Technologies de l'Information, Informatique 
Laboratoire d’accueil : Centre Inria de l'Université Grenoble Alpes
Entreprise d'accueil : EDF
Direction de thèse : Pierre Gaillard, Nadia Oudjane et Margaux Brégère
Mis à jour le  22 mai 2026