Tag 10 - Linked Data | Lerntagebuch von Jo

Am heutigen Tag geht es um Vertiefungen, Aktuelles und Künftiges: Linked Data orientierte Datenmodelle (BIBFRAME, RiC), ein Einblick in Alma und Praxisberichte.

Diese Einblicke in die Praxis waren sehr interessant. In meinem Beitrag heute werde ich mich jedoch auf die Linked Data orientierten Datenmodelle beschränken.

Aktuelle Datenmodelle für Metadaten

Wir sehen uns zwei aktuelle Metadatenformate an, welche sich momentan am etablieren sind (wobei noch nicht ganz in der Praxis angekommen, Umstellungen dauern) und in naher Zukunft wichtig sein werden: BIBFRAME und Records in Context (RiC). Das erste ist vorwiegend im Bibliotheksbereich anzusiedeln, das zweite im Archivbereich. Was beiden gemeinsam ist, sie beruhen auf Linked-Data-Prinzipien.

BIBFRAME

BIBFRAME (Bibliographic Framework) ist eine Initiative entstanden um 2011 oder 2012 im Umfeld der Library of Congress, mitbeteiligt ist auch die Deutsche Nationalbibliothek (wo sich entsprechend auch Informationen zu BIBFRAME finden). Zugleich bezeichnet BIBFRAME auch das aus der Initiative entstandene Datenformat. Das Ziel dieser Initiative war es, das mittlerweile in die Jahre gekommene Format MARC21 mit einem Modell abzulösen, welches auf die heutigen Anforderungen (Semantic Web, Linked-Data) besser passt. Mittlerweile (seit 2016) gibt es BIBFRAME bereits in der Version BIBFRAME 2.0.

BIBFRAME baut auf FRBR und RDA auf, wobei BIBFRAME nicht alle Aspekte daraus übernimmt, sondern vielmehr vereinfacht. Dies ist deutlich zu sehen am Datenmodell mit den drei Entitäten in BIBFRAME (Work, Instance, Item) wohingegen es in FRBR vier sind. Ein weiterer Unterschied liegt darin, dass in FRBR kein Datenformat dazu festgelegt ist, in BIBFRAME schon.

Das BIBFRAME Datenmodell umfasst eine Einteilung in drei Abstraktionsebenen: Work, Instance und Item. Im FRBR-Modell dagegen findet sich die Unterteilung in vier Ebenen: Work, Expression, Manifestation und Item. In BIBFRAME werden Work und Expresssion zusammengefasst in der Ebene Work.

Unter die Abstraktionsebene Work werden alle Informationen zur intellektuellen Idee eines Werks gefasst. Entsprechend wird diese Ebene weiter beschrieben mit den Entitäten agent, subject und event. Dies sind zugleich die wichtigsten Entitäten (im Modell auch beschrieben als core classes). Unter agent fallen alle Personen oder Organisationen, welche zur Entstehung des Werks beigetragen haben. Subject umfasst alles, was thematisch mit dem Werk verbunden ist, Personen, Themen, Orte, andere Werke und vieles mehr. Events schliesslich sind zum Beispiel Dinge, welche das Werk wiedergeben, wie eine Tonaufnahme eines Werks oder eine Verfilmung.
Instance bezeichnet die verschiedenen Ausgaben von etwas, also verschiedene Ausgaben in welchen ein Werk schlussendlich ganz materiell erschienen ist. Zugehörige Entitäten sind Angaben zum Format und Verlagsangaben (format, publisher).
Item schliesslich ist ein einzelnes Exemplar einer Instanz. Verknüpft damit sind beispielsweise der Barcode oder der Standort eines Items.

Modell BIBFRAME

Das BIBFRAME Datenmodell. Quelle: Library of Congress, BIBFRAME 2.0 Model.

Zur einheitlichen Beschreibung dieses Modells besteht ein BIBFRAME Vocabulary, welches eine Ontologie darstellt und entsprechend aus einem hierarchischen Aufbau besteht, mit RDF Classes (und Subclasses) und Properties (und Subproperties). (Die Ausführungen zum Modell stammen einerseits aus der BAIN-Vorlesung und dem gemeinsamen Codi, andererseits von von der Library of Congress, BIBFRAME 2.0 Model.)

BIBFRAME oder MARC21?

Doch was unterscheidet nun BIBFRAME von MARC21? Und warum soll MARC21 abgelöst werden? Dies ist im bereits erwähnten Linked-Data-Prinzip begründet, welches darauf beruht, dass eindeutige URIs vergeben werden, ein einheitliches Vokabular und eigenständige Entitäten definiert sind. Dies hat den Vorteil, dass mittels des Linked-Data-Prinzips in BIBFRAME eine Entität (z.B. ein*e Autor*in) mit anderen Entitäten (z.B. verschiedenen Werken) in Beziehung gesetzt werden kann, ohne dass dies jedesmal neu erfasst werden muss (es muss also nicht für jedes Werk ein*e Autor*in erneut aufgenommen werden). Es entsteht ein komplexes Netz an Beziehungen und Kontextwissen, welches aus einem Datenbestand herausgelesen werden kann.

MARC21 hingegen ist ein Format, welches dieses Kontextwissen nicht bietet. Ein MARC-Record steht für sich alleine und ist in sich abgeschlossen. Ein Kontext kann nur hergestellt werden, wenn ein anderer – wieder für sich selbst abgeschlossener – MARC-Record verbunden oder beigezogen wird. Das kann natürlich auch Vorteile haben und für einen Katalog reicht dies auch und war auch lange gut. Für komplexere Vorhaben hingegen reicht es nicht (mehr) aus.

Und was passiert nun mit MARC? Die Vorzüge eines Datenformats wie BIBFRAME und Linked-Data sind offensichtlich. Und doch bestehen da all die Kataloge, welche bereits gefüllt sind mit MARC-Records. An diesem Punkt kann (und wird wohl auch) Kritik geübt, denn wenn die MARC-Daten ins neue BIBFRAME-Format überführt werden – was durchaus geschieht und auch vorangetrieben wurde durch die BIBFRAME Initiative der Library of Congress – so bleibt darin doch immer der Geist von MARC irgendwo noch erhalten. Aber weshalb all die bereits vorhandenen Daten nicht nutzen? Dass dies gemacht wird, erscheint sinnvoll. Wo noch ungenutztes Potential besteht, ist bei der Nutzung der BIBFRAME-Daten in vollem Umfang dessen was sie können.

Also, MARC, geniesse deinen wohlverdienten Ruhestand. Du musst ja nicht gleich sterben, wie es Roy Tennant in seinem, ursprünglich bereits 2002 erschienenen, Artikel «MARC Must Die» provokativ formuliert hatte.

Skizze von Roboter Marc

MARC, wie ich diesen Machine-Readable-Cataloging-Roboter in einem anderen Modul für unser Lernvideo (zum Thema Katalogisieren) skizziert habe. Und dadurch irgendwo halt liebgewonnen habe, diesen stets freundlichen aber doch rätselhaft bleibenden Marc. Aber nichtsdestotrotz: Tschüss MARC.

Records in Context (RiC)

«RiC ist eigentlich genau das gleiche wie BIBFRAME, nur für die Archivwelt – Sie können eigentlich BIBFRAME durch RiC ersetzen.» In ungefähr diesen Worten setzte der Dozent zur Beschreibung von RiC an (Webexaufzeichnung von Tag 10, Zeit 01:17:01). Fairerweise sei angefügt, dass anschliessend natürlich eine Einführung in RiC erfolgte, welche dann das für RiC spezifische herausarbeitete. Aber im Grundsatz läuft es doch genau darauf hinaus - RiC funktioniert ähnlich wie BIBFRAME: Linked-Data-Prinzip und Beziehungen zwischen Entitäten - und RiC wird dadurch die Archivwelt umkrempeln, da der neue Ansatz eine ganz andere Herangehensweise darstellt, als dies in Archiven traditionellerweise geschieht.