StartseiteLänderEuropaVereinigtes Königreich (Großbritannien)Verbundprojekt: Maschinelles Lernen für die Optimierung von SPARQL-Abfragen über zentralisierte und verteilte RDF-Wissensgraphen; Teilprojekt: Maschinelles Lernen für die Optimierung von SPARQL Abfragen

Verbundprojekt: Maschinelles Lernen für die Optimierung von SPARQL-Abfragen über zentralisierte und verteilte RDF-Wissensgraphen; Teilprojekt: Maschinelles Lernen für die Optimierung von SPARQL Abfragen

Laufzeit: 01.11.2024 - 31.10.2027 Förderkennzeichen: 01QE2429B
Koordinator: Universität Paderborn - Fakultät EIM-Informatik - Lehrstuhl für Data Science

Im Projekt werden generische Ansätze auf Basis von KI und maschinellem Lernen für eine optimierte Abfrageverarbeitung über große RDF-Wissensgraphen erarbeitet, um die Entwicklung hochleistungsfähiger zentralisierter und verteilter Datenspeicherlösungen zu erleichtern. Ziel ist es, eine Reihe von W3C-standardkonformen Tools zu entwickeln, die eine optimierte SPARQL-Abfrageausführung auf zentralisierten und föderierten RDF-Wissensgraphen implementieren. Die zentralen Fragen sind: (1) Wie können die Ansätze von KI und des maschinellen Lernens für die SPARQL-Abfrageoptimierung sowohl in föderierten als auch in nicht föderierten Umgebungen genutzt werden?, (2) Wie werden Einbettungen für SPARQL-Abfragen erstellt?, (3) Welcher Ansatz des maschinellen Lernens führt zu einer besseren Abfragelaufzeitleistung? Der vorgeschlagene Ansatz nutzt maschinelles Lernen (ML), insbesondere Deep Reinforcement Learning (DRL), um die Abfrageausführungszeiten zu verbessern, indem eine optimale/nahezu optimale Verbindungsreihenfolge in Abfrageplänen ausgewählt wird. Dieser Ansatz basiert auf dem Erfolg von DRL bei der Optimierung relationaler Datenbankabfragen und seinem Potenzial, die Leistung in Triplestore-Umgebungen deutlich zu verbessern. Die wissenschaftliche Methode besteht aus folgenden Schritten: Abfragedarstellung: Umwandlung von SPARQL-Abfragen in Vektoreinbettungen, die als Eingaben für den DRL-Agenten dienen. Umgebungs- und Zustandsmodellierung: Integration von Attributen aus dem Knowledge Graph (KG) wie Größe und Kardinalität von Abfragevariablen mit den Einbettungen. Aktions- und Belohnungsdefinition: Aktionen in diesem Kontext beinhalten die Auswahl von Verknüpfungen aus dem nicht optimierten Abfrageplan. DRL-Agent-Training und Feedback: Unter Verwendung einer benutzerdefinierten GymUmgebung und Python-Bindungen für eine nahtlose Integration mit dem Triplestore verbessert der DRL-Agent seine Abfrageoptimierungsstrategie iterativ nach dem Feedback ausgeführter Aktionen.

Verbund: E! 5736 SPARQL-ML Quelle: Bundesministerium für Bildung und Forschung (BMBF) Redaktion: DLR Projektträger Länder / Organisationen: Vereinigtes Königreich (Großbritannien) Themen: Förderung Innovation

Weitere Informationen

Projektträger