Willkommen beim Projekt OPAL

Mit mCLOUD stellt das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) auf einer zentralen Plattform offene Daten aus seinem Geschäftsbereich zur Verfügung. Von dem damit verfolgten Open-Data-Ansatz hat bereits eine Vielfalt neuer innovativer Projekte und Unternehmen profitiert. Dieser Ausprägung des Open Data Ansatzes hat jedoch Schwächen. Dazu zählt, dass Datensätze oft als monolithisch sowie voneinander unabhängig bereitgestellt und betrachtet werden. Dies erschwert nicht nur die Suche nach Datensätzen sondern auch die Nutzung der Datensätze in innovativen, datengetriebenen Anwendungen. Das möchte OPAL ändern.

Vorhaben OPAL

Ziele des Projekts Open Data Portal Germany (OPAL) sind die Konzeption und Entwicklung eines ganzheitlichen Portals für offene Daten. Hierbei werden insbesondere offene Daten aus mCLOUD und MDM integriert. Anders als die Mehrzahl der existierenden Open-Data-Portale wird OPAL Metadaten veredeln und in 5-Star Linked Open Data transformieren. Damit wird das Portal das einfache Auffinden von Datensätzen und den einfachen Zugriff auf diese Datensätze sowohl für Menschen als auch für Software-Agenten (z.B. andere Datenportale, datengetriebene Anwendungen, etc.) sicherstellen. Zusätzlich wird OPAL die Suche auch über inhaltliche (anstatt nur Metadaten-) Facetten (wie z.B. automatisch generierte Themen, Ortsangaben und zeitliche Einschränkungen) ermöglichen.

Überblick über Schwerpunkte des Projekts OPAL: ein Crawler liefert Rohdaten über offene Daten, die anschließend extrahiert, analyisert, konvertiert und integriert werden. Nutzer können über die Suche und Apps darauf zugreifen.
Überblick über Schwerpunkte des Projekts OPAL

Alleinstellungsmerkmale von OPAL sind die 1) technische Basis in Form von Linked-Open-Data-Technologien, die es ermöglicht, einzelne derzeit unabhängige Datensätze miteinander in Verbindung zu bringen. 2) Die dafür erforderliche automatische Extraktion von Metadaten mittels maschinellem Lernen und fokussiertes Crawling ermöglichen eine umfangreichere Suche auf Inhalten und Metadaten. 3) Dies stellt auch eine Grundlage für innovative Suchfunktionalität wie z.B. Question Answering (das Beantworten natürlichsprachlicher Anfragen) dar.

Suche und weitere Anwendungsfälle

Beispielsweise lässt sich damit ermitteln, welche Datensätze Informationen zu Pollenbelastung oder Funknetzabdeckung an einem bestimmten Ort bereithalten. Diese Informationen liegen derzeit nur implizit in den Datensätzen vor. Für den Anwendungsfall der Suche nach z.B. “Leipzig” bzw. “Welche Pollenart fliegt derzeit in Leipzig” liefert mCLOUD daher noch keine Ergebnisse. Neben der im Portal integrierten Suchfunktion sollen als weitere Anwendungsfälle eine mobile App und ein Social Bot, die auf geeignete Datensätze hinweisen, umgesetzt werden. Eine enge Zusammenarbeit mit dem LIMBO-Projekt ist vorgesehen, um weitere Metadaten zu Inhalten der Datensätze, z.B. Themen und Schema-Eigenschaften, zu ermitteln.

Projektpartner

Die Universität Paderborn führt das OPAL-Projekt durch und wird durch die Data-Science-Gruppe vertreten, welche aus der AKSW-Gruppe hervorgegangen ist., Deren rund 50 wissenschaftliche Mitarbeiter etablieren unter Leitung von Prof. Dr. Axel Ngonga theoretische Ergebnisse und skalierbare Implementierungen für die Realisierung des Semantic Data Web. Besonderes Augenmerk gilt den Bereichen Wissensextraktion, Informationssuche und Wissens- und Datenintegration im Linked Data Web.

Weitere Informationen