Recherchez une offre d'emploi
Thèse Evaluation Rapide de Requêtes Sparql sur les Bases de Connaissances avec des Ontologies H/F - 75
Description du poste
- Institut Polytechnique de Paris Télécom Paris
-
Paris - 75
-
CDD
-
Publié le 20 Mars 2026
Établissement : Institut Polytechnique de Paris Télécom Paris
École doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris
Laboratoire de recherche : Laboratoire de Traitement et Communication de l'Information
Direction de la thèse : Fabian SUCHANEK ORCID 0000000171892796
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-14T23:59:59Les bases de connaissances représentent l'information sous forme de graphes étiquetés. Les données contenues dans les bases de connaissances sont souvent enrichies grâce à une ontologie, qui enrichit la donnée d'informations supplémentaires déduites à l'aide de règles logiques. Cet enrichissement facilite les requêtes pour les utilisateurs finaux et constitue le fondement de l'accès aux données basé sur l'ontologie (OBDA, Ontology-Based Data Access). Un problème majeur des systèmes OBDA tient à leur performance.
L'objectif de cette recherche doctorale est d'étudier et d'améliorer les performances des systèmes OBDA, ainsi que de développer un nouveau système hautement efficace à l'aide de trois techniques principales :
(i) Réécriture des requêtes pour tirer parti des optimisations des bases de données.
(ii) Stratégies d'indexation permettant de stocker une représentation compacte mais efficace des faits déduits de l'ontologie.
(iii) Exploitation des capacités récursives de SQL pour générer des réécritures de requêtes plus performantes.
Au cours du doctorat, l'étudiant mènera des expérimentations de benchmarking afin d'identifier de manière systématique les limites actuelles des performances des systèmes OBDA. À partir de ces observations, la recherche se concentrera sur l'adaptation des méthodes d'indexation existantes ou le développement de nouvelles approches adaptées à la réécriture de requêtes en SQL. Le résultat final sera la mise en oeuvre d'un système OBDA complet intégrant ces améliorations pour atteindre une meilleure efficacité.
Il existe deux approches principales pour l'OBDA: la première consiste à déduire tous les faits implicites à partir des faits explicites; on parle alors d'approche de matérialisation. Cette technique est lente lors du prétraitement et consomme beaucoup d'espace mémoire qui pourrait s'avérer inutile. La seconde approche consiste à réécrire la requête q en une requête q dont le résultat sur la base de connaissances est identique à celui de q sur la base de connaissances enrichie par l'ontologie. Cette technique ne nécessite aucun prétraitement, mais son temps d'exécution est généralement plus long. Des techniques hybrides, visant à combiner les avantages des deux approches, sont également à l'étude. Cependant, ces travaux négligent les travaux existants sur l'optimisation des requêtes SQL, pourtant très pertinents pour les requêtes OBDA: nos propres travaux sur l'optimisation au moment de l'exécution, par exemple, optimisent l'exécution des requêtes SQL et montrent comment ils optimisent l'évaluation des requêtes SPARQL avec chemins de propriétés. L'optimisation par index, en revanche, implique une étape de prétraitement (avant même que la requête ne soit connue), qui crée un index permettant de récupérer rapidement les faits déductibles des règles ontologiques données, sans avoir à matérialiser tous les faits implicites, ce qui serait trop coûteux. Les travaux sur les techniques d'indexation sur les graphes s'inscrivent dans un long champ de recherche et ont connu des progrès significatifs récemment, qui n'ont (peut-être étonnamment) pas été appliqués à l'analyse des données d'objets (OBDA) sur les bases de connaissances. (voir PDF pour plus de détails)
L'objectif de la thèse est de bénéficier des avancées récentes dans la recherche en bases de données pour améliorer le requêtage des bases de connaissances avec ontologies (voir PDF pour plus de détails).
Notre idée est de tirer parti des récentes avancées en matière d'évaluation efficace des requêtes SQL afin d'optimiser l'évaluation des requêtes SPARQL. À cette fin, nous allons construire un traducteur SPARQL vers SQL qui (contrairement aux travaux précédents) s'appuie sur des index spécifiquement conçus à cet effet. Ainsi, nous pourrons exploiter toutes les techniques d'optimisation développées côté SQL, tant les optimisations au moment de l'exécution des requêtes que les techniques de prétraitement. Un autre avantage de cette approche est que nous n'avons pas besoin de créer une base de triplets de connaissances à partir de zéro. Nous pouvons en effet travailler avec n'importe quel système de gestion de bases de données, ce qui garantit la pérennité de notre approche. (voir PDF pour plus de détails)
Offres similaires
Directeur des Systèmes d'Information H/F
-
Michael Page
-
Paris 17e - 75
-
CDI
-
21 Mars 2026
Responsable Adjoint Pôle Comptabilité H/F
-
Michael Page
-
Paris 11e - 75
-
CDI
-
21 Mars 2026
Stage - Chargé de Mission Cohésion et Innovation Sociale H/F
-
3F
-
Paris 13e - 75
-
Stage
-
21 Mars 2026
Déposez votre CV
Soyez visible par les entreprises qui recrutent à Paris.
Chiffres clés de l'emploi à Paris
- Taux de chomage : 9%
- Population : 2165423
- Médiane niveau de vie : 28570€/an
- Demandeurs d'emploi : 205650
- Actifs : 1177663
- Nombres d'entreprises : 490838
Sources :
Un site du réseaux :