Projektziele

Das OPAL-Projekt konzipiert und entwickelt ein Linked-Open-Data-Portal mit Fokus auf öffentliche Datenquellen aus Deutschland. Dabei sollen Technologien und Vorgehensweisen, die bereits in anderen Portalen (z.B. im European Data Portal) soweit möglich wiederverwendet sowie gegebenenfalls erweitert werden. Projektziele und Schwerpunkte des Projekts OPAL sind die Erfassung und Extraktion von Daten mit dem Ziel, sie durchsuchbar und leichter nutzbar zu machen.

Teilziele

  1. In OPAL wird ein intelligenter fokussierter Crawler entwickelt. Ausgangspunkt ist eine Menge klassifizierter Daten, insbesondere der vom BMVI zur Verfügung gestellten Datensätze in mCLOUD und MDM. Damit wird der OPAL Crawler (1) ähnliche Datensätze, (2) die Lizenz dieser Datensätze sowie (3) weitere Metadaten zu den Datensätzen (z.B. Provenienz, Version, Qualität, Nutzungsmöglichkeit, etc.) aus dem Web extrahieren. Die Metadaten werden in Linked Data transformiert und integriert.
  2. Mittels Web Crawling und maschinellem Lernen zeichnet OPAL die Daten automatisch mit weiteren Metadaten aus. Mit einem Lizenzüberprüfungsmechanismus wird die Nutzbarkeit einzelner sowie integrierter Datensätze sichergestellt.
  3. Zusätzlich werden die eigentlichen Datensätze mit erweiterbaren Analysekomponenten untersucht und deren Inhalte indiziert. Damit wird die Suche in Datensätzen sowie nach verwandten Datensätzen ermöglicht. Die einfachere Nutzbarkeit der Daten wird konkret durch die verbesserte Auffindbarkeit erreicht. Die aktuelle Gartner-Studie identifiziert Smart Data Discovery als einer der aufkommenden Innovationsauslöser für moderne Unternehmen und Gesellschaften.
  4. Die durch OPAL erzielte bessere Nutzbarkeit der Daten soll innerhalb des Projekts durch mehrere Anwendungen verdeutlicht werden. Neben einer umfangreichen facettierten Suchfunktion des Portals sind weitere Demonstratoren geplant: a) eine City-App mit Hinweisen zu vorhandenen Daten am aktuellen Standort sowie b) ein Assistent in sozialen Medien (Social Bot), der auf entsprechende Fragen auf Plattformen wie Twitter oder StackOverflow entsprechende Hinweise auf offene Daten liefert. Damit führt OPAL Datenanbieter und mögliche Nutzer effektiv zusammen.

    OPAL-Schichtenarchitektur
    OPAL-Architektur