Arbeitspakete

OPAL erforscht ein Linked-Open-Data-Portal in den folgenden Arbeitspaketen.

AP1 Anforderungsanalyse und Architektur

Ziel des ersten Arbeitspakets ist die Erfassung der Anforderungen (A1.1), die Untersuchung und initiale Analyse der Datenbestände (A1.2) und der Entwurf einer Gesamtarchitektur für OPAL (A1.3).

AP2 Datenakquisition

In Arbeitspaket 2 wird ein fokussierter Crawler entwickelt, der Informationen zu offenen Datensätzen aus Webseiten extrahiert. Teilaufgaben sind die Crawlerspezifikation (A2.1), die Umsetzung der Crawlerkomponente (A2.2), metadatenbasierte Crawlingstrategien (A2.3) sowie das Benchmarking der Crawlingkomponente (A2.4).

AP3 Datenanalyse

Das dritte Arbeitspaket entwickelt Komponenten zur Untersuchung und Gewinnung von Metadaten der in AP2 gefundenen Information. Teilaufgaben sind die Qualitätsanalyse (A3.1), semistrukturierte Metadatenextraktion (A3.2), unstrukturierte Metadatenextraktion (A3.3) sowie die Zuordnung von Themen und Schemata (A3.4).

AP4 Datenkonvertierung

Die extrahierten Metadaten werden in für Linked-Data-Anwendungen geeignete Formate konvertiert. Für die effiziente Durchsuchbarkeit werden geeignete Indexstrukturen entwickelt. Teilaufgaben sind die Vokabularspezifikation (A4.1), die Umsetzung der Konvertierungskomponente (A4.2), die Definition geeigneter Indexstrukturen (A4.3) und die Umsetzung der Indizierungskomponente (A4.4).

AP5 Datenintegration

Metadaten verschiedener Datensätze sollen automatisiert verknüpft werden, um miteinander in Relation stehende Daten zu erkennen. Damit soll OPAL es ermöglichen, dass Nutzer für komplexere Anwendungsfälle die dafür geeignete Menge an Datensätzen auffinden. Teilaufgaben sind die Datenverknüpfung (A5.1), Lernalgorithmen für Linkspezifikationen (A5.2), erweiterte Lernalgorithmen über Daten (A5.3) sowie die Lizenzintegration (A5.4).

AP6 Datenselektion

Relevante Teile eines Datensatzes lassen sich anhand von Prädikaten und Relationen sowie räumlichen Relationen auswählen, um den Umfang der übertragenen Daten möglichst zu minimieren. Teilaufgaben sind das Slicing von Linked Data (A6.1) und das Slicing von Geodaten (A6.2).

AP7 Anwendungsfälle

Die Anwendbarkeit des Linked-Data-Ansatzes zur Extraktion und Verwaltung von Metadaten offener Datensätze soll anhand der Suchfunktion als zentraler Komponente eines Datenportals sowie weiterer Demonstratoren validiert werden. Teilaufgaben sind die Entwicklung der Suchfunktionalität (A7.1), einer mobilen App (A7.2) und eines Social Bots (A7.3).

AP8 Portalentwicklung

In Arbeitspaket 8 wird das Open Data Portal Germany als erweiterbare komponentenbasierte Webanwendung entwickelt. Teilaufgaben sind die Portalinfrastruktur und das Deployment (A8.1), die Integration des Portalsystems (A8.2), die Entwicklung der Weboberfläche des Portaldemonstrators (A8.3) und die Evaluation von Portal und Anwendungen (A8.4).

AP9 Projektmanagement

Dieses Arbeitspaket beinhaltet die Koordination, Dokumentation und Überwachung der Meilensteine des Projekts, die Kommunikation mit dem Projektträger sowie die Kommunikation mit Externen aus Industrie und Forschung.