Leitlinie zur Publikation von Open Data im Geschäftsbereich des BMEL

"Daten sind das Gold des 21. Jahrhunderts." Um mit Daten für die Gesellschaft, Wissenschaft und Wirtschaft Mehrwerte generieren zu können, müssen diese in guter Qualität bereitgestellt werden und frei verfügbar sein. Für diesen Zweck wurde das Open Data Gesetz (2017 und 2021) sowie die dazugehörige Open Data Strategie der Bundesregierung (2021) verabschiedet, welche die Bundesverwaltung und dazugehörige Behörden mit wenigen Ausnahmen dazu verpflichten, erfasste Daten maschinenlesbar und offen bereitzustellen.

Wo diese Daten bereitgestellt werden, ist allerdings nicht vorgegeben. Dritte – beispielsweise die Öffentlichkeit - können sich folglich nur schwer einen Überblick darüber verschaffen, welche Daten aus welcher Einrichtung im Geschäftsbereich des BMEL wo publiziert sind. Das beeinträchtigt die Auffindbarkeit relevanter Daten.

Das vorliegende Konzept beschreibt deshalb, wie und wo offene Daten im Geschäftsbereich des BMEL publiziert werden sollen. Auf diese Weise wird neben Einheitlichkeit auch Sicherheit über pragmatische und gangbare Wege hergestellt, Datenpublikationen im Sinne des Open Data Gesetzes bereitzustellen. Das Dokument belässt explizit die Verantwortung bei den Einrichtungen, zu beurteilen, inwiefern Daten nach dem EGovG bereitgestellt werden müssen.

Ausgangslage

Im Geschäftsbereich des BMEL tragen insgesamt neun Einrichtungen nach der gesetzlichen Grundlage des § 12a EGovG zur Veröffentlichung von Daten nach Open-Data-Grundsätzen bei. Dazu zählen die Ressortforschungseinrichtungen, namentlich das Julius Kühn-Institut, das Johann Heinrich von Thünen-Institut, das Max Rubner-Institut und das Friedrich-Loeffler-Institut sowie das Bundesinstitut für Risikobewertung, das Bundesamt für Verbraucherschutz und Lebensmittelsicherheit, die Bundesanstalt für Landwirtschaft und Ernährung (BLE) und das Bundessortenamt. Hinzu kommt das Deutsche Biomasseforschungszentrum gGmbH (DBFZ), das aus eigenem Antrieb heraus die Open Data Anforderungen erfüllen möchte. Die neun Einrichtungen publizieren ihre offenen Daten auf unterschiedlichen Plattformen. Das führt dazu, dass ein strukturierter Überblick über Open Data im Geschäftsbereich des BMEL kaum möglich ist.

Grundsätzlich sind laut § 12a EGovG unbearbeitete maschinenlesbare Daten, die Behörden des Bundes zur Erfüllung von öffentlich-rechtlichen Aufgaben erhoben haben, veröffentlichungspflichtig, sofern die Voraussetzungen nach § 12a Abs. 2 erfüllt sind und die Daten nicht unter die Ausnahme nach §12a Absatz 3 EGovG fallen. Nach § 12a Absatz 4 EGovG erfolgt die Bereitstellung von diesen Daten unverzüglich nach der Erhebung, sofern der Zweck der Erhebung dadurch nicht beeinträchtigt wird, andernfalls unverzüglich nach Wegfall der Beeinträchtigung. Ist aus technischen oder sonstigen gewichtigen Gründen eine unverzügliche Bereitstellung nicht möglich, sind die Daten unverzüglich nach Wegfall dieser Gründe bereitzustellen. Daten, die für Forschungszwecke erhoben worden sind (Forschungsdaten) sind erst bereitzustellen, wenn das der Datenerhebung zugrundeliegende Forschungsvorhaben abgeschlossen und der Forschungszweck erfüllt ist. Die Metadaten von publizierten Daten müssen im nationalen Portal GovData [Das nationale Metadatenportal GovData wurde von der Bundesregierung als zentraler Einstiegspunkt zur Suche von offenen Daten der Verwaltung geschaffen, um die Auffindbarkeit der von Bund-, Länder- und Kommunalverwaltungen bereitgestellten Open Data zu erleichtern.] eingestellt werden. Für Forschungsdaten ist die Bereitstellung von Metadaten auf GovData freiwillig, sofern diese bereits über öffentlich zugängliche Netze entgeltfrei bereitgestellt werden (bspw. in öffentlich zugänglichen Repositorien), wobei das BMEL sich klar dafür ausspricht.

Grundsätzlich gilt, dass unbearbeitete maschinenlesbare Daten bereitgestellt werden müssen. Jedoch ist eine Bearbeitung von Daten zulässig, (siehe § 12a EGovG Absatz 2 Nr. 4) […] a. die der Fehlerbereinigung dient oder b. die aus rechtlichen oder aus tatsächlichen Gründen erfolgt ist und ohne die eine Veröffentlichung der Daten nicht möglich wäre […].

Allgemeines Ziel aus Sicht des BMEL ist, Daten so schnell wie möglich im Sinne der Anforderungen als Open Data öffentlich bereit zu stellen. Im Ressort des BMEL sind jedoch die einzelnen Einrichtungen, bei denen die Daten erhoben wurden, die Stellen, die am besten beurteilen können, was veröffentlichungspflichtige Rohdaten sind, wie und zu welchem Zeitpunkt diese nach den oben genannten Anforderungen veröffentlicht werden müssen. Daher liegt die Verantwortung für die Beurteilung und Umsetzung bei den Einrichtungen entsprechend der Gesetzgebung.

Dieses Dokument ist auf dem Stand von Mai 2024. Alle hier angedachten Strategien werden nicht losgelöst von der sich entwickelnden Gesamtsituation betrachtet und ggf. weiterentwickelt. Das trifft insbesondere zu auf

  • die sich entwickelnden Empfehlungen, Standards und Richtlinien zum FAIRen Datenmanagements der Nationalen Forschungsdateninfrastruktur (NFDI). Die direkte Mitwirkung einiger Forschungseinrichtungen in unterschiedlichen NFDI-Konsortien gewährleistet einen engen Austausch in diesem Bereich.
  • die momentan nur in der Phase der Konzeption befindlichen Vorhaben des Bundesarchivs zur Langzeitarchivierung von öffentlichen Daten.
  • die im Abschnitt zu Geodaten erwähnte gegenseitige Referenzierung von Metadaten zu Geodaten und dazugehörigen Metadaten zu Forschungsdaten. Hier wird eine Aktualisierung vorgenommen, sobald Empfehlungen von Katalogbetreibern, GDI-DE bzw. dem AK Metadaten (GDK) in Abstimmung mit der FITKO (govdata) vorliegen.

Strategie zur Publikation von Daten nach Open-Data-Grundsätzen

Wie in Tabelle 1 dargestellt, werden in der vorliegenden Strategie für drei grundlegende Datenkategorien Wege vorgestellt, wie Daten Open-Data konform publiziert werden können und wie gleichzeitig ein strukturierter Überblick über den offenen Datenbestand der nachgeordneten Behörden des BMEL sichergestellt werden kann. Die Mitglieder der AG FDM (Forschungsdatenmanagement) im Ressort des BMEL haben sich auf diese Wege verständigt. Darüber hinaus bringen diese Wege viele weitere positive Aspekte mit sich, wie z.B. diverse weitere Verknüpfungsmöglichkeiten der Daten zu anderen Datenplattformen. Die Wege lassen sich nach der Kategorie der jeweils bearbeiteten Daten unterscheiden:

  • Geodaten aus der Forschung und / oder der Verwaltung,
  • Forschungsdaten, die keine Geodaten sind,
  • Weitere Daten aus öffentlich-rechtlichen Aufgaben („Verwaltungsdaten“)
Mögliche Optionen für die Daten- und Metadatenpublikation:
Erhobene DatenDatenpublikationMetadaten-
publikation
Nationale
Metadatenpublikation
Geodaten aus der Forschung und / oder der Verwaltung
  • OGCOpen Geospatial Consortium, der OGC-Standard ist ein für Geodaten verwendeter Standard zur FAIRen Datenbereitstellung-basierte Webdienste
  • OGCOpen Geospatial Consortium, der OGC-Standard ist ein für Geodaten verwendeter Standard zur FAIRen Datenbereitstellung-basierter Direkt-Download
  • Vom BMEL empfohlen: Metadatenkatalog der GDI-BMEL
  • Institutseigener, öffentlicher Metadatenkatalog
Gesetzlich vorgeschrieben: GDK der GDI-DE
Für Forschungszwecke erhobene Daten (ohne Geodaten)
  • Datenrepositorium, fachspezifisch oder allgemein, bspw. Zenodo, OpenAgrar
  • ...
  • Vom BMEL empfohlen: Eintrag auf OpenAgrar
  • Metadatenkatalog des Repositoriums
  • Institutseigener, öffentlicher Metadatenkatalog
  • ...
Vom BMEL empfohlen: GovData
Weitere Daten aus öffentlich-rechtlichen Aufgaben (ohne Geodaten)
  • Homepage
  • OpenData BLE
  • OpenAgrar
  • ...
  • Vom BMEL empfohlen: OpenData BLE
  • Vom BMEL empfohlen: Eintrag auf OpenAgrar
  • Institutseigener, öffentlicher Metadatenkatalog
Gesetzlich vorgeschrieben: GovData

 

Tabelle 1: Mögliche Optionen für die Daten- und Metadatenpublikation. In fett hervorgehoben und in der Tabelle mit „Vom BMEL empfohlen“ beschrieben sind die in dieser Leitlinie empfohlenen Vorgehensweisen für das Ressort des BMEL. In fett und kursiv hervorgehoben sowie in der Tabelle mit „Gesetzlich vorgeschrieben“ beschrieben sind die gesetzlich vorgeschriebenen Veröffentlichungen. GovData ist das Metadatenportal des Bundes und im Rahmen des EGovG das gesetzlich vorgeschriebene Metadatenportal für Verwaltungsdaten. Metadaten sollen durch GovData von OpenAgrar und OpenData BLE geharvestet werden.

Geodaten aus der Forschung und aus der Verwaltung

In allen nachgeordneten Behörden im Ressort des BMEL können Geodaten existieren.  Auf Basis der europäischen INSPIRE Richtlinie (2007/2/EG) sowie dem daraus abgeleiteten Gesetz über den Zugang zu digitalen Geodaten (GeoZG) sind diese in einer Geodateninfrastruktur zu vernetzen und in einem nationalen Geoportal zu veröffentlichen. Umgesetzt ist dies mit der Geodateninfrastuktur Deutschland (GDI-DE). In dieser sind verpflichtend die INSPIRE betroffenen Geodatensätze auffindbar zu machen. Alle anderen - offenen - Geodaten können ebenso in dieser Infrastruktur, im Geoportal.de, zentral auffindbar gemacht und schließlich an GovData weitergeleitet werden.

Speziell zur Umsetzung der INSPIRE-Richtlinie werden Geodaten über Webdienste (Darstellungs- und Downloaddienst) veröffentlicht und mit ISO-Metadaten beschrieben. Metadaten werden im GDI-DE-Kontext separat zu Geodaten und zugehörigen Webdiensten erfasst, wobei diese untereinander referenziert sind.

Metadaten können über eigene Metadatenkataloge publiziert werden. Anschließend werden sie mithilfe eines Katalogdienstes (CSW-Schnittstelle) an den Geodatenkatalog (GDK) der GDI-DE weitergegeben. Die Geodateninfrastruktur des BMEL (GDI-BMEL), betrieben in der BLE, dient als Sammelstelle für Metadaten zu Geodatensätzen aus dem Geschäftsbereich. Institute und Einrichtungen haben die Möglichkeit im zugehörigen Katalog Metadaten direkt zu erfassen oder den eigenen Metadatenkatalog anzuschließen. Sie werden daraufhin zum zentralen Suchdienst, dem GDK der GDI-DE, überführt. Metadaten, die im zentralen Suchdienst ankommen, werden im Anschluss automatisiert von GovData abgerufen und in GovData.de integriert. Hierbei werden die ISO-basierten Metadaten nach einem gemeinsam abgestimmten Verfahren in das Metadatenschema DCAT-AP.de umgewandelt. Das genaue Verfahren dazu ist im GDI-DE Wiki beschrieben.

Hierbei ist zu beachten, dass Forschungsdatensätze mit Raumbezug auch unter die Kategorie der Geodaten fallen. Somit werden diese zweifach erfasst und fließen doppelt in GovData ein. Der in GovData vorliegende Metadatensatz der Forschungsdaten würde hierbei auf die wissenschaftliche Publikation verweisen und der Metadatensatz der Geodaten auf direkte Downloadmöglichkeiten oder zugehörige Darstellungs- und Downloaddienste. Beide Metadatensätze sollten sich gegenseitig referenzieren, um erkenntlich zu machen, dass es sich um denselben Datensatz in unterschiedlichen Formen handelt. Im Geodaten Metadatenschema ISO-19115 stünde hierfür das Element MD_Metadata > MD_DataIdentification > citation > CI_Citation > identifier > MD_Identifier zur Verfügung. Dieses Element wird jedoch auch für interne Prozesse der GDI-DE verwendet und ein Einpflegen der DOI Angabe könnte diese behindern. Entsprechend wird auf eine abschließende Entscheidung hierzu von den Katalogbetreibern, GDI-DE bzw. dem AK Metadaten (GDK) und der Abstimmung mit der FITKO (govdata) gewartet.

Für Forschungszwecke erhobene Daten (Forschungsdaten)

Im Bereich der Forschung ist es bereits üblich, dass Daten mit der Publikation von Forschungsergebnissen bereitgestellt werden. Die Datenbereitstellung erfolgt häufig sowohl in öffentlichen externen Fachrepositorien, öffentlichen Repositorien des eigenen Hauses, als auch in großen, universellen Repositorien (siehe Abbildung 1), wie z.B. Zenodo. Dieses Vorgehen entspricht der guten wissenschaftlichen Praxis, außerdem erfüllen die Einrichtungen damit ihre Open-Data–Verpflichtungen. Gleichzeitig ist so jedoch keine Übersicht über die publizierten Daten im Geschäftsbereich möglich. Im Geschäftsbereich des BMEL existiert außerdem das fachspezifisch kuratierte, institutionelle Repositorium OpenAgrar, auf dem ebenfalls Daten und Metadaten publiziert werden können. Um einen strukturierten Überblick über die Forschungsdaten in den Ressortforschungseinrichtungen zu ermöglichen, sollen die Metadaten von publizierten Forschungsdaten des Geschäftsbereichs des BMEL zusätzlich auf OpenAgrar bereitgestellt werden. [Eine Ausnahme bilden hier solche Forschungsdaten, für die es methodenspezifische Fachrepositorien mit eigenen Metadatenstandards gibt (bspw. DNA-Sequenzdaten oder Daten aus der Massenspektrometrie).] Ein weiterer Vorteil von Open Agar besteht darin, dass zukünftig die Metadaten der dort liegenden Forschungsdaten automatisiert zur zentralen Metadatenplattform des Bundes GovData und ggf. weiteren Datenplattformen übertragen werden können.

Weitere Daten aus öffentlich-rechtlichen Aufgaben

In Bezug auf Daten, bei denen es sich nicht um Forschungsdaten oder Geodaten handelt, die aber anderweitig zur Erfüllung öffentlich-rechtlicher Aufgaben erhoben werden, werden im Ressort des BMEL ebenfalls einheitliche Veröffentlichungswege vorgeschlagen. Diese Daten werden bereits jetzt über eigene Datenportale (bspw. auf Internetseiten der Einrichtungen) bereitgestellt (siehe Abbildung 1). Allerdings wird die gesetzliche Verpflichtung der dazugehörigen Metadatenpublikation auf GovData bisher nur ineffizient durch Eingaben per Hand erfüllt. Um diese Aufgabe zu vereinfachen, sollen die Metadaten (oder ggf. die eigentlichen Daten selbst) in Zukunft auch direkt beim Open Data Portal der BLE oder bei OpenAgrar gelistet werden bzw. direkt über die Schnittstelle aus hauseigenen Datenkatalogen eingespielt werden. Im Ressort des BMEL wird vorgeschlagen, auch die Daten und nicht nur die Metadaten auf diese Weise sowie auf weiteren gängigen Plattformen zu publizieren: So wird auch sichergestellt, dass die publizierten Daten einen PID (Persistent Identifier, wie bspw. DOI) erhalten. Im CKAN-Katalog der opendata.ble.de soll mittelfristig auch ermöglicht werden, persistente Identifier für dort primär hinterlegte Datensätze zu vergeben, um deren Auffindbarkeit zu verbessern. So lassen sich die Open Data Prozesse innerhalb der Einrichtungen effizient aufbauen. Von dem Open Data Portal der BLE sowie in Zukunft auch von OpenAgrar zieht GovData automatisiert die Metadaten. So werden die gesetzlichen Verpflichtungen eingehalten.

Erschienen am im Format Artikel