Phd - Temporal Graphs For Managing Digital Twins H/F - Orange
- CDD
- Orange
Les missions du poste
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité.
La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité...), les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l'innovation et de l'expertise sur les thématiques « Ambient Computing » et « Jumeaux Numériques ». Plus particulièrement, vous serez associé aux membres de l'équipe développant la plateforme de recherche Thing'in the future. Cette plateforme offre des fonctions clés pour construire des jumeaux numériques.Votre rôle est d'effectuer un travail de thèse sur : " Synthèse sémantique et compaction de graphes temporels pour Jumeaux Numériques"
Contexte global et problématique du sujet
Les jumeaux numériques (Digital Twins, DTs) génèrent des volumes massifs de données structurées en graphes spatio-temporels connectant entités physiques et logiques. Le stockage de ces historiques devient critique en termes de passage à l'échelle (milliards de noeuds). Les solutions actuelles (Neo4j, TimescaleDB) ne permettent pas de concilier sémantique riche (ontologies), temporalité explicite et multi-résolution (niveaux de détails). La problématique centrale est de concevoir un moteur de stockage capable d'ajuster automatiquement la granularité et la précision des données en fonction du contexte, tout en garantissant la traçabilité de l'information. Au sein de l'équipe, nous avons développé un système de gestion de base de données orientées graphe temporellesl : Clock-G. Il servira de socle pour développer et mettre en oeuvre les idées élaborées durant la thèse. Et pour aller plus loin, pour valider des cas d'usage, l'équipe a développé une plateforme de jumeaux numériques qui profitera d'un stockage Clock-G.
Objectif scientifique - résultats et verrous à lever
L'objectif de la thèse est de concevoir un moteur de stockage et de requêtage sémantique "auto-synthétisant". Les verrous à lever sont :
Temporalité multi-échelle : Modéliser la continuité des graphes via des flux fragmentés (type LDES).
Compaction sémantique : Fusionner des entités sémantiques dans le graph en respectant strictement les contraintes ontologiques.
Approximation contrôlée : Mesurer et borner la perte d'information induite par la condensation (via une fonction de coût dédiée).
Requêtage adaptatif : Développer le langage TQSL (Temporal Query-aware Semantic Language) pour piloter la résolution au moment de la requête.
Contributions attendues
Modèle formel de graphe sémantique temporel multi-résolution (spatio-temporel + sémantique).
Algorithmes de compaction sémantique et temporelle (lossy/lossless) inspirés des approches Graph Summarization et Temporal Rollup.
Métriques de fidélité et de "qualité d'approximation" pour quantifier la perte d'information.
Prototype de moteur de stockage et de requêtage adaptatif, intégré à une plateforme de jumeaux numériques (Thing'in ou Clock-G).
Évaluation expérimentale sur cas d'usage (réseau télécom).
Le profil recherché
Formation : Master 2 ou École d'Ingénieur en Informatique, avec une spécialisation en Bases de Données, Web Sémantique ou Science des Données.
Compétences scientifiques :
Maîtrise des technologies du Web Sémantique (RDF, OWL, SPARQL).
Connaissances en théorie des graphes et algorithmique.
Intérêt pour l'IA (Graph Neural Networks) et les systèmes distribués.
Compétences techniques : Développement Java/Python/Go, usage de bases de données NoSQL (Graphes).
Qualités personnelles : Rigueur scientifique, capacité d'abstraction, aisance rédactionnelle en français et anglais