16. März 2022 : 10:55 - 11:20
Peter Eisner (TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften)
Veranstaltungsraum: Camp 5
Auf den ersten Blick scheint die Verarbeitung von e-Journals in digitalen Archiven ein einfacher
Prozess zu sein. Die Daten werden als Dateien geliefert und dem Ingest in das Langzeitarchivierungssystem
zugeführt. Dort finden automatische Überprüfungen, z. B. der Dateiformate statt.
Gegebenfalls kommt es zu Fehlermeldungen und weitere Aktionen werden notwendig.
Der Prozess sagt jedoch nichts darüber aus, ob die gelieferten Journals überhaupt vollständig sind.
Die Frage der Vollständigkeit muss im Rahmen der Pre-Ingest-Analyse behandelt werden. Wenn
möglich können so Unstimmigkeiten mit dem Datenlieferanten vor der Archivierung geklärt werden.
Oft handelt es sich bei e-Journals um große Datenlieferungen, die aufgrund ihres Umfangs nicht
manuell überprüft werden können. Selbst wenn sie von einem einzigen Publisher geliefert wurden,
stammen sie nicht selten aus unterschiedlichen Systemen oder Workflows. Die Daten sind heterogen,
die Wahrscheinlichkeit für das Auftreten von Unstimmigkeiten oder Fehlern wächst mit der
Datenmenge.
In diesem Kontext stellen sich Fragen zum Konzept der Vollständigkeit bei e-Journals: Wie lässt
sich das Fehlen von etwas Feststellen? Was ist der Maßstab der Beurteilung von Vollständigkeit?
Was können Methoden der Überprüfung prinzipiell leisten? Absolute Gewissheit oder nur erhöhte
Plausibilität?
Der Vortrag stellt skriptbasierte Überprüfungsansätze vor, die in der Praxis auf Datenbestände der
Publisher Wiley (DEAL-Vereinbarung) und Hindawi (Open Access Journals) angewendet wurden.