StartseiteFörderungProjekteVerbundprojekt: Verteilte Suche in umfangreichen Unternehmensdaten; Teilprojekt: Keyword-Basierte Fragebeantwortung in verteilten Dateninfranstrukturen

Verbundprojekt: Verteilte Suche in umfangreichen Unternehmensdaten; Teilprojekt: Keyword-Basierte Fragebeantwortung in verteilten Dateninfranstrukturen

Laufzeit: 01.09.2015 - 31.10.2018 Förderkennzeichen: 01QE1512C
Koordinator: Universität Leipzig - Fakultät für Mathematik und Informatik - Institut für Informatik - Abt. Betriebliche Informationssysteme - Forschungsgruppe AKSW

Ziel des Vorhabens ist die Entwicklung eines Fragebeantwortungssystems für verteilte Dateninfrastrukturen. Das zu entwickelnde Rahmenwerk wird die Verteilung der Daten nutzen, um die Anzahl der abgesetzen Anfragen sowie die Anzahl der angefragten Datensätze zu minimieren und somit die Anfragelaufzeiten zu optimieren. Ferner werden Methoden der automatischen Sprachverarbeitung eingesetzt, um SPARQL Anfragen aus natürlicher Sprache zu generieren. Ziele des Teilvorhabens der Universität Leipzig sind: 1. die Erarbeitung von Verfahrung zur Auswahl von Datenquellen während der Verarbeitung von föderierten SPARQL Anfragen sowie 2. die Konzeption, Implementierung und Evaluation von Verfahren zur Generierung von hybriden SPARQL Anfragen aus Tiefenanalysen von natürlichsprachlichen Anfragen und aus Sequenzen von Schlüsselbegriffen. Arbeitsplan: Zur Umsetzung der o.g. Ziele wird die Uni Leipzig das erste Arbeitspaket zur Analyse der Anforderungen an Question Answering Systeme in Unternehmen leiten. Im Rahmen dieses Arbeitspakets sollen die Anwendungsfälle inkl. Daten und Benchmarkfragen spezifiziert werden. In AP 2 werden Algorithmen für föderierte Anfragen im Rahmen von Question Answering Systemen erarbeitet. Auf Schlüsselbegriffen basierende Anfragen werden auf sogenannte Coloured Spreading-Activation-Probleme abgebildet. Im dritten Arbeitspaket erarbeitet die Uni Leipzig Verfahren zur Erkennung von semantischen Duplikaten (d.h., Entitäten, die in den verteilten Wissensbasen unterschiedliche Namen tragen aber Referenzen auf dem selben Objekt aus der realen Welt sind; engl: entity consolidation). In Arbeitspaket 4 werden Verfahren zur Extraktion von RDF Daten aus Text erarbeitet. Hier beschäftigt sich die Universität Leipzig mit der Erweiterung des Federated Knowledge Extraction Frameworks FOX bis hin zur Einhaltung von Industrie-Standards. Arbeitspaket 5 deckt die Anwendungsfälle ab. Hier werden die entwickelten Lösungen im echten Betrieb evaluiert.

Verbund: E! 9367 DIESEL Quelle: Bundesministerium für Bildung und Forschung (BMBF) Redaktion: DLR Projektträger Länder / Organisationen: Niederlande Themen: Förderung Innovation

Weitere Informationen

Projektträger