Da wir in der letzten Vorlesung nicht mit allem durchgekommen sind, greifen wir zunächst nochmals die Archivsysteme auf und kommen anschliessend mit Repository-Software für Publikation und Forschungsdaten zu einem neuen Thema.

Fortsetzung ArchivesSpace

Die folgenden Ausführungen zum Vorgehen in ArchivesSpace brachte einige Erkenntnis in Ergänzung zu der am vorherigen Tag versuchten Übung.

Wichtige Begriffe zur Bedienung in ArchivesSpaces:

  • Accession: Dokumentiert den Erwerbungsprozess, also woher etwas kommt. Dies enthält häufig vertrauliche Angaben, weswegen diese oft nicht öffentlich (public) gemacht werden. Die Beschreibung der Accession ist also eher Hintergrundinformation. Sie ist wichtig aufzunehmen und steht beim Vorgang auch am Anfang, aber es ist nicht direkt relevant für die Beschreibung der Ressourcen.
  • Resource: Dies ist die oberste Ebene der Verzeichnisstufen von ISAD(G); in ArchivesSpaces wird also nur eine Ressource angelegt.
  • Archival Object: Diese werden an die Ressource angehängt und bezeichnen alle weiteren Verzeichnungsstufen: Bestand (fonds), Serie (series), Akte (file), Einzelstück (item). Angehängt werden sie via add child (zu finden unter Ressource, Edit-Modus). (Überhaupt finden sich auch andere Dinge erst im Edit-Modus, es lohnt sich also jeweils dort mal zu schauen.)

Das grobe Vorgehen in ArchivesSpace ist also wie folgt:

  1. Accession anlegen
  2. Rescource anlegen
  3. die Objects an Resource hängen

Import, Export und zwei Übungen dazu

ArchivesSpace bietet die Möglichkeit Daten über eine OAI-PMH-Schnittstelle zu übertragen (mögliche Formate sind EAD, MARCXML, CSV).

Übung Import mit EAD

Es klappte nicht bei allen Files, so kam bei einem diese Fehlermeldung:

Screenshot Fehlermeldung Import Data

Bei einem anderen File scheint es zu funktionieren, wie dieser Screenshot zeigt:

Screenshot Import Job Completed

Den Export habe ich nicht hinbekommen.

Fazit aus der Übung: Es kann schon beim Import zu Fehlern kommen, z.B. wenn Pflichtfelder nicht ausgefüllt worden waren. Auch mit den Standards ist der Datenaustausch nicht so einfach und immer wieder mit Problemen verbunden. Um den Export sauber hinzubekommen, können die Daten vorher geprüft und validiert werden.

Marktüberblick Archivsysteme

Nebst ArchivesSpace (v.a. in den USA verwendet, mit grosser Community) gibt es noch weitere Archivsysteme, wie z.B. Atom (Access to Memory) – eine Open-Source-Lösung, oder auch kommerzielle Produkte, wobei in der Schweiz vorwiegend scope.Archiv sowie CMISTAR eingesetzt werden.

Repository-Software für Publikationen und Forschungsdaten

Im Zusammenhang mit Repository-Software sind drei grosse Bereiche zu unterscheiden:

  • Publikationen
  • Forschungsdaten
  • Forschungsinformation

Klassischerweise wurde Repository-Software im Zusammenhang mit Publikationen eingesetzt. Heute gibt es Repositories und Software für alle drei Bereiche, wobei sich manche Programme auf einen Bereich spezialisiert haben. So gibt es Repository-Software, mit dem Fokus auf Publikationen oder andere, die sich auf Forschungsdaten konzentrieren.

Momentan als Best Practice gilt Zenodo. Dies ist ein Open-Acces-Repository, welches beides kann: Publikationen und Forschungsdaten. Zenodo wird vom CERN betrieben.

Eine andere Software ist DSpace. Wir werden uns in dieser Vorlesung DSpace ansehen, weil DSpace für alle drei Bereiche verwendet werden kann: Publikationen, Forschungsdaten und Forschungsinformation. Ein Beispiel, wo DSpace verwendet wird, ist die Technische Universität Hamburg mit TORE (TUHH Open Research).

Doch zuvor eine kurze aber umso wichtigere Begriffsklärung.

Wichtige Begriffe

  • Open Access: Zugang zu Publikationen; Open Access ist zu einer ganzen Bewegung geworden wobei der Begriff Open-Access-Repositorien wichtig ist.
  • Open Data: Forschungsdaten (welche dann Grundlage der Publikation sind).
  • Forschungsinformation: Das sind Daten und Informationen über Forschende, die Finanzierung der Forschung, Patente. Diese Daten werden gesammelt, um zu erfassen was geforscht wird und wie dies finanziert wird. Dies geht auch ins Thema der Wissenschaftsfreiheit hinein und dies wiederum in die Ethik.
  • Open Source übrigens bedeutet offener Quellcode von Software.
  • Und was ist eigentlich ein Repository? Eine kurze Suchanfrage liefert gleich als ersten Treffer eine gut fassbare Definition. Gemäss open-access.net sind Repositorien Dokumentenserver zur Archivierung und Zugänglichmachung von wissenschaftlichen Materialien.

DSpace in Anwendung

DSpace haben wir nicht installiert, sondern anhand einer Demo, welche frei zugänglich ist angesehen. Mit der Übung war ich doch etwas überfordert und sie hat nicht so ganz funktioniert. Hier aber ein Ausschnitt, wie das in DSpace so aussieht (in DSpace 6; bald wird jedoch DSpace 7 erscheinen):

Oberfläche zur Beschreibung von Items in DSpace

Auch wenn die Übung bei mir zu keinem verwertbaren Ergebnis geführt hat (wir hätten eine Sub-Community anlegen sollen und darin eine Collection, daraufhin ein Dokument in der Collection einreichen, dies reviewen und dann veröffentlichen), zumindest habe ich es versucht und dennoch einen Einblick in die Benutzeroberfläche erhalten.

Marktüberblick Repository-Software

Zum Abschluss des heutigen Tages haben wir einen Blick in den Markt von Repository-Software geworfen. OpenDOAR (Open Directory of Open Access Repositories) führt Statistiken, welche den Verbreitungsgrad von den verschiedenen Systemen zeigen. Interessant ist, dass alle weit verbreitete Repository-Softwares auch selbst Open-Source sind.

Weltweit zeigt es sich, dass DSpace klar den grössten Anteil einnimmt.

Kuchendiagramm eingesetzte Repository-Software weltweit

Repository-Software weltweit. Quelle: OpenDOAR.

Für die Schweiz zeigt sich ein etwas anderes Bild, hier dominieren Invenio und E-Prints, erst dann folgt DSpace.

Kuchendiagramm eingesetzte Repository-Software Schweiz

Repository-Plattformen in der Schweiz. Quelle: OpenDOAR.