Das Projekt E-Pflicht Baden-Württemberg (2018 – 2020)
Zusammenfassung
Am 2. März 2007 wurde das baden-württembergische Pflichtexemplargesetz novelliert und die rechtliche Möglichkeit geschaffen, elektronische Pflichtexemplare zu sammeln. Damit war Baden-Württemberg Vorreiter in Deutschland. Die Anwendung beschränkte sich aber zunächst auf die BOA-Plattform (baden-württembergisches Online-Archiv), auf der von den Landesbibliotheken frei zugängliche elektronische Dokumente und Webseiten abgelegt wurden. Die Sammlung verlegerischer Netzpublikationen sollte nun in einer eigenen Umgebung realisiert werden: im Mai 2018 startete das Projekt E-Pflicht Baden-Württemberg mit finanzieller Unterstützung durch das Ministerium für Wissenschaft und Kunst. Es ist in der zweijährigen Projektlaufzeit gelungen, ein System zur Ablieferung von E-Books, zu deren automatischem Ingest, zur Verbindung mit den zugehörigen Metadaten in der Verbunddatenbank des K10plus, zur Langzeitarchivierung und zur Nutzung und Präsentation inhouse zu entwickeln und auch in Produktion zu setzen. Über dieses System konnten bereits mehr als 60.000 E-Books in den Formaten PDF und EPUB angenommen und erfolgreich verarbeitet werden, darunter die Titel der meisten größeren Verlage des Bundeslandes.
Summary
On 2 March 2007 the state of Baden-Württemberg‘s law on legal deposit was amended to include the legal possibility and mandate of collecting online publications. Baden-Württemberg was the first of the federal states in Germany to extend their legal deposit requirement to online publications. For some time, however, the implementation was limited to the BOA platform (Baden-Württemberg online archive), on which only freely accessible electronic documents and websites were archived by the two legal deposit libraries of Baden-Württemberg. In a second step the collection of commercially available e-books of publishing houses was to be realized by developing a technical system for automated procedures. To this end, the E-Pflicht Baden-Württemberg project was launched in May 2018 with financial support from the Ministry of Science and Art of Baden-Württemberg. During the two-year project period, a system was successfully developed and put into action for the delivery of e-books, for their automatic processing, for linking them with the corresponding metadata in the K10plus union catalogue, for digital preservation and for providing access at the premises of the libraries. More than 60,000 e-books in PDF and EPUB format have already been accepted and successfully processed via this system, including the publications of most of the Baden Württemberg‘s larger publishing houses.
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung 4.0 International.
1. Einleitung
„Die Katastrophe des Brandes der Herzogin Anna Amalia Bibliothek in Weimar und der Einsturz des Kölner Stadtarchivs haben gezeigt, wie schmerzlich es ist, wenn wertvolle historische Bücher und Dokumente unwiederbringlich verloren gehen und dadurch große Lücken in unser kulturelles Gedächtnis gerissen werden.“ Diese Worte schrieb der Staatssekretär Bernd Neumann in einem Grußwort an die Koordinierungsstelle für die Erhaltung des schriftlichen Kulturguts (KEK).1
Das Kulturgut liegt in jüngerer Zeit immer häufiger in digitaler Form vor („born-digital“)2 und auch in diesem Bereich gibt es bereits erste größere Verluste, u.a. durch Entzug digitaler Nutzungsrechte (DRM) für E-Books seitens der Unternehmen Microsoft und Amazon.3 Digitale Medien, darunter insbesondere E-Books und E-Journals, werden in den allermeisten Fällen über die Plattformen der Verlage und Informationsanbieter angeboten, selbst wenn Bibliotheken diese in ihrem Bestand nachweisen. So haben Bibliotheken und private Nutzer*innen im Falle der Umstrukturierung und Geschäftsaufgabe von Informationsanbietern bzw. Verlagen das Nachsehen, obwohl es Versuche gibt, mit Diensten wie Portico oder LOCKSS Selbstarchivierung zu betreiben und für den Ernstfall vorzusorgen.4
In Deutschland produzierte Online-Medien unterliegen aber Bestimmungen zur Pflichtabgabe, die auf Bundesebene durch das Gesetz über die Deutsche Nationalbibliothek5 und auf Länderebene durch entsprechende Gesetze und Regelungen abgesichert sind.6 Seit 2006 hat die Deutsche Nationalbibliothek7 und seit 2007 haben die beiden Landesbibliotheken Baden-Württembergs die Aufgabe, neben den gedruckten Ausgaben und den elektronischen Ausgaben von Medienwerken auf Datenträgern auch die (verlegerischen) Netzpublikationen zu sammeln.8 Das duale Prinzip des Sammelns auf nationaler und regionaler Ebene gewährleistet den Schutz des Kulturguts durch Redundanz bei der Datenhaltung und ermöglicht den Einblick in die Werke sowohl in den Lesesälen der DNB in Frankfurt und Leipzig als auch in räumlicher Nähe zum Sitz des Verlags in der zuständigen Landesbibliothek.9
Da es sich bei der Abgabe nicht-physischer Publikationen nicht um eine sachenrechtliche Übereignung, sondern um eine nach dem Urheberrecht geregelte Vervielfältigung handelt, sind bei der Archivierung und öffentlichen Zugänglichmachung durch die Landesbibliotheken die Verwertungsrechte der Urheber berührt.10 Eine Realisierung des elektronischen Pflichtexemplars für verlegerische Netzpublikationen ist folglich nur in einem eng gesteckten organisatorisch-technischen Rahmen möglich.11
2. Das Projekt E-Pflicht Baden-Württemberg12
Bei der Umsetzung der Ablieferung elektronischer Pflichtexemplare wurde aus Gründen der Praktikabilität mit den E-Books begonnen. Das baden-württembergische Gesetz über die Ablieferung von Pflichtexemplaren sieht, in Analogie zu Druckwerken, für E-Books eine Ablieferungspflicht vor, wobei das Ablieferungsverfahren derzeit nicht definiert ist. Es erwies sich als klug, solche Verfahren zu wählen, die den Verlagen bereits bekannt sind bzw. durch sie bereits genutzt werden. Das war mit den von der Deutschen Nationalbibliothek definierten Standards13 der Fall.
Baden-Württemberg verfügt über eine lebendige und vielfältige Verlagslandschaft, in der neben einigen Großverlagen vor allem zahlreiche mittelständische und kleine Verlage zu Hause sind. Seit Jahren hat die Zahl der Verlage, die nicht nur gedruckte Bücher, sondern auch E-Books anbieten, beständig zugenommen. Die Anforderungen an ein System zur Ablieferung von E-Books, zu deren automatischem Ingest und, soweit möglich, automatischer Anreicherung mit K10plus-Metadaten, zur Archivierung und zur Nutzung inhouse und extern waren dementsprechend hoch gesteckt.
Die Sammlung elektronischer Publikationen wurde in Baden-Württemberg bereits im Vorfeld der Gesetzesnovellierung von 2007 zwischen den drei Projektpartnern Badische Landesbibliothek (BLB), Württembergische Landesbibliothek (WLB) und Bibliotheksservice-Zentrum (BSZ) abgestimmt und gemeinsam projektiert. So konnte schon 2004 ein baden-württembergisches Online-Archiv (BOA)14 präsentiert werden, das die Sammlung vieler freier Netzpublikationen ermöglichte, sowie die Archivierung von Websites.15 Die Abstimmung zur Sammlung verlegerischer Netzpublikationen unter den späteren Projektbeteiligten startete im Januar 2012. Seither wurden in einer gemeinsamen Arbeitsgruppe laufend technisch-organisatorische Lösungen sondiert, getestet und evaluiert.16 Das Bibliotheksservice-Zentrum erarbeitete bis zum Mai 2014 eine erste Projektskizze, erstellte eine Neufassung davon bis zum November 2015 und hat schließlich das Leistungsprofil für die dann erfolgte Umsetzung im Dezember 2016 abgeschlossen. Das nachfolgend beschriebene Projekt wurde im Februar 2017 beim Ministerium für Wissenschaft und Kunst beantragt und mit dessen Unterstützung im Staatshaushaltsplan 2018/2019 etatisiert.
Das Projekt begann im Mai 2018 mit einer Kick-Off-Veranstaltung an der Badischen Landesbibliothek. Die strategischen Entscheidungen im Projekt wurden durch einen Lenkungsausschuss, bestehend aus den Direktor*innen der drei beteiligten Einrichtungen, getroffen, für die operative Steuerung waren ein Projektausschuss und ein Projektleiter, besetzt aus den drei Autor*innen dieser Publikation, verantwortlich. Daneben waren ein Programmierer am BSZ in Vollzeit und weitere Bibliothekarinnen an den beiden Landesbibliotheken und am BSZ mit Zeitanteilen für das Projekt tätig.
Das Projekt wurde für den Zeitraum von zwei Jahren in vier halbjährige Phasen unterteilt, an deren Ende definierte Meilensteine erreicht werden sollten, die vom Lenkungsausschuss begutachtet und bewertet wurden. Die Projektkommunikation bestand aus vierteljährlichen Präsenztreffen der Projektmitarbeiter mit dem Projektausschuss, aus 14-tägigen Telefonkonferenzen der gleichen Runde und aus dem ständigen Austausch via E-Mail und Telefon. Daneben wurden Projektfortschritte, erreichte Zwischenziele, Arbeitsanleitungen und Besprechungsprotokolle in einem eigenen Bereich im Wiki des BSZ festgehalten, sodass zum Ende des Projekts im April 2020 eine vollständige Projektdokumentation vorlag.
3. Die Systemarchitektur der E-Book-Verarbeitung
Da parallel eine Pflicht zur Ablieferung an die Deutsche Nationalbibliothek besteht, deren Konventionen und Verfahren die Verlage realisieren müssen, war es sinnvoll, sich an diese Vorgaben anzulehnen.17 Maßstabsetzend ist das sogenannte Hotfolder-Verfahren, bei dem Metadaten und Publikation in einem Container auf einen SFTP-Account (Secure File Transfer Protocol) abgelegt werden. Für sporadische Ablieferungen, z.B. von kleineren Organisationen, Vereinen, Self-Publishern, etc. ist es sinnvoll, Möglichkeiten des Transfers per Webformular anzubieten. Zusätzlich müssen E-Books verarbeitet werden können, die per E-Mail-Attachment abgeliefert werden. Wesentlich ist, dass alle Varianten eine homogene Grundlage für nachfolgende Ingest- und Archivierungsprozesse darstellen.
Grundsatz im Projekt war, auf vorhandenen Komponenten aufzubauen. Diese Planung konnte eingelöst werden, indem der Verwaltungsdatenbank die auch in anderen Produkten des BSZ zum Einsatz kommende Softwaresuite SWBtrafo zugrunde gelegt wurde. SWBtrafo bildet den Rahmen für etliche Datenverarbeitungssysteme, z.B. von Museumsdaten oder Daten aus Repositorien. Das Gesamtframework wird im BSZ gepflegt. SWBtrafo ist gekennzeichnet durch Modularität und Wiederverwendbarkeit. Die Verarbeitung einer Ablieferung setzt sich aus einer Folge voneinander unabhängiger Software-Komponenten (Pipelines XSLT/Java) zusammen, die jeweils bestimmte Arbeitsschritte ausführen. Bereits vorhandene Komponenten konnten integriert werden, neu entwickelte Komponenten können auch an anderer Stelle eingesetzt werden. Wo Funktionalität nicht im Projekt entwickelt, sondern auf vorhandene Open-Source-Bibliotheken zurückgegriffen wurde, beispielsweise für die Validierung von PDF- und EPUB-Dateien, wurden diese in unabhängigen Komponenten gekapselt. So kann auf sich ändernde oder zusätzliche Anforderungen in der Zukunft durch Austausch oder Ergänzung einzelner Komponenten reagiert werden.
Die Verwaltungsdatenbank ermöglicht die Organisation aller am Ablieferungsprozess beteiligten Personen und Einrichtungen, die Steuerung der Ablieferungsprozesse und die Verzeichnung und Zuordnung der abgelieferten Publikationen innerhalb des E-Pflicht-Systems und der verbundenen Systeme: SFTP-Server (bzw. Webformular, OAI-PMH18), LSDF (Large Scale Data Facility des KIT Karlsruhe),19 E-Book-Pool,20 K10plus, Publikationsserver auf OPUS 4 (Online Publikationsverbund der Universität Stuttgart),21 Digitales Langzeitarchiv Rosetta22.
Die vier grundlegenden Bereiche sind die Ablieferung, der (Katalog-)Nachweis, die (Langzeit-)Archivierung und die Nutzung der Pflichtmedien (Abb. 1).
4. Organisation der Ablieferungsprozesse
Der Ablieferung selbst (Abb. 2) geht die Absprache zwischen Landesbibliothek und ablieferungspflichtigem Verlag über die Ablieferung und das gewählte Verfahren (Hotfolder/SFTP, OAI-PMH, Webformular, E-Mail) voraus, besonders auch bezüglich eventueller Backfiles. Mehr als 90 Prozent der Ablieferungen wurden bisher über das Hotfolder-Verfahren (SFTP) mit ONIX-Metadaten in das System eingeliefert.
Die Landesbibliotheken halten die Daten des Ablieferungspflichtigen, seines Dienstleisters und beteiligter Personen in der Verwaltungsdatenbank fest, richten die Ablieferungskonten ein und beauftragen das BSZ mit der Erstellung der entsprechenden SFTP-Konten. Falls noch Verlagssigel für künftige Produktkennzeichen in E-Book-Pool und Verbunddatenbank K10plus zu beantragen sind, erfolgt dies gleichzeitig. Der produktiven Ablieferung gehen die nötigen Tests voraus. Diese entsprechen schon dem künftigen Verfahren – es werden aber nur geringe Mengen verarbeitet, sodass auftretende Fehler leichter erkannt werden und zeitnah Rückmeldung an den Ablieferer erfolgen kann.
Ein täglicher Job überwacht das SFTP-Konto auf eingegangene Ablieferungen und startet die Verarbeitung mit der Übertragung an das LSDF als Speicherinstanz, Bildung einer UUID (Universally Unique Identifier, er dient der Identifikation der einzelnen Ablieferung innerhalb des E-Pflicht Systems) und einer Eingangsprüfung. Sie bewertet die Validität der Container-Datei (ZIP) und ihrer Struktur, der darin enthaltenen Dateien der Publikation (PDF, EPUB) und der Metadaten-Datei (ONIX) samt des Vorhandenseins der obligatorischen Inhalte.
Je nach Ergebnis wird der Ablieferung ein Status zugewiesen: „Ok“, „Info“, „Error“ führen zur Annahme, „Fatal“, „Empty“, „Dublett“ zur Ablehnung. Die Prüfungsergebnisse werden für die künftige Dokumentation festgehalten. Die Ablieferungen werden den Landesbibliotheken in einer wöchentlichen Zusammenstellung mitgeteilt, können aber auch jederzeit in der Verwaltungsdatenbank recherchiert werden.
Abgelehnte Publikationen mit Status „Fatal“ werden von den Landesbibliotheken beim Ablieferer in den allermeisten Fällen reklamiert. Bei Container-Dateien mit dem Status „Empty“ handelt es sich oft um Metadatenupdates – diese müssen, ebenso wie Container-Dateien mit dem Status „Dublett“, nicht reklamiert werden. Angenommene Publikationen werden neben der Verwaltungsdatenbank auf dem Publikationsserver OPUS eingetragen, erhalten eine URN als persistenten Identifier und stehen dann den Landesbibliotheken zur internen Einsichtnahme und Prüfung zur Verfügung.
Monatlich werden die zu den angenommenen Publikationen gehörenden Metadaten im ONIX-Format automatisiert an den E-Book-Pool übertragen. Dafür wird in die ONIX-Dateien eingegriffen - die URL auf das Verkaufsangebot des Verlags wird entfernt, die lieferantenspezifischen Paketkennzeichen, URN, URL zur Nutzung des Pflichtexemplars und Angaben zu Bestandsschutzmaßnahmen werden eingetragen. Auf der Basis der Produktkennzeichen „bestellen“ die Landesbibliotheken die Ablieferungen im E-Book-Managementtool des BSZ zur Exemplarsatzbildung für die Pakete und ihre Titelaufnahmen.23 Die Titelaufnahmen des E-Book-Pools werden monatlich an die Verbunddatenbank des K10plus geliefert. Dabei werden aufgrund der Bestellung des Pakets die zugehörigen Exemplarsätze gebildet.
Sowohl nach Übernahme der ONIX-Daten in den E-Book-Pool als auch bei der Übertragung in die Verbunddatenbank des K10plus ermittelt die Verwaltungsdatenbank jeweils die PPN24 und hält sie fest. Die Ermittlung der PPN im E-Book-Pool führt zur Freigabe der Publikation in OPUS und zur Registrierung der URN bei der DNB, so dass die Publikation via OPUS zur Nutzung in den Lesesälen der Landesbibliotheken jederzeit aufrufbar ist. Die Ermittlung der PPN in der Verbunddatenbank des K10plus führt zur Freigabe der Publikation für die Übertragung an das digitale Langzeitarchiv Rosetta.
Die Verwaltungsdatenbank protokolliert die Ergebnisse der Eingangsprüfung, berechnet – soweit nicht vorhanden – eine Prüfsumme bzw. vergleicht mit einer mitgelieferten. Im Zug der Verarbeitung entstehende, wesentliche Identifier zur „Intellektuellen Einheit“ (UUID, URN, OPUS-ID, ID in E-Book-Pool und K10plus) werden zusammengetragen und mit den technischen, bibliografischen und administrativen Metadaten in einer METS-Datei25 durch die Verwaltungsdatenbank zusammengefasst. Mit der METS-Datei werden die Dateien zum Informationsobjekt (Datei(en) der Publikation selbst, originale Metadatendatei, Metadatendatei aus K10plus) in einem Container als Übergabepaket an das digitale Langzeitarchiv durch die Pipelines der Verwaltungsdatenbank transferiert. Die Übergabe wird in der Verwaltungsdatenbank mit der Identifikationsnummer des Übergabepakets (SIP-ID)26 und der Verfahrens-Identnummer im digitalen Langzeitarchiv (Deposit Activity ID) protokolliert. Im digitalen Langzeitarchiv selbst wird nochmals aufgrund der in ihm zur Verfügung stehenden Werkzeuge das Übergabepaket geprüft und anschließend, bei Erfüllung der Vorgaben, im permanenten Speicher archiviert (Abb. 3). Bei Auffälligkeiten wird es zur Begutachtung und Nachbearbeitung im Rahmen des digitalen Langzeitarchivs zur Verfügung gestellt. Auf dem Archivobjekt durchgeführte Prozesse werden laufend durch das digitale Langzeitarchiv im Archivpaket protokolliert. Migrationen der archivierten E-Books werden derzeit nicht durchgeführt.
Begleitend erfolgt die Zählung für statistische Zwecke, so dass jederzeit eine verlags- und zeitspezifische Analyse über die Zahl der Ablieferungen und ihres jeweiligen Status möglich ist. Daraus können auch die Zahlen für die Deutsche Bibliotheksstatistik erzeugt werden.
Alternativ zur Abgabe via Hotfolder/SFTP ist auch das Hochladen der Publikation durch den Ablieferer mit Hilfe eines Webformulars (Abb. 4) möglich – nach Anlegen eines entsprechenden Ablieferungskontos. Dabei ist die Validierung der Volltext-Dateien bereits integriert. Nicht valide Formate (aktuell: alle Formate außer PDF und EPUB) führen zur sofortigen Ablehnung der Ablieferung. Für Publikationen, die ausnahmsweise als Ablieferung per E-Mail-Anhang angenommen werden, wird zur Verarbeitung ein internes Katalogformular verwendet. Dem automatischen SFTP- und Webformularverfahren ist gemeinsam, dass in der Verwaltungsdatenbank ein immer gleich strukturiertes Paket aufgebaut wird, das nach den gleichen Regeln in den gleichen Pipelines (XSLT/Java) bearbeitet wird.
Auch das Harvesten von Publikationen mit OAI ist möglich und wird derzeit bei einem Ablieferer produktiv umgesetzt. Die erhaltene Metadaten-Datei im Format XMetaDissPlus wird mit einem Konverter nach ONIX migriert und dann zusammen mit dem geharvesteten Volltext nach dem bereits beschriebenem Verfahren verarbeitet.
Die Bewertung der gelieferten PDF- und EPUB-Dateien folgt den einschlägigen Standards (JHOVE und EPUBCheck), ist aber angesichts der laufenden Weiterentwicklung und Komplexität nur eingeschränkt aussagekräftig: Die Fehlertoleranz der PDF- und EPUB-Viewer ermöglicht die nach Augenschein absolut korrekte Anzeige von Dateien, die das Analysetool als fehlerbehaftet bewertet. Sofern davon ausgegangen wird, dass die Viewer auch künftig mit diesen Konformitätsfehlern umgehen können, ist hinsichtlich der Nutzbarkeit nicht mit weiteren Einschränkungen zu rechnen. Für die digitale Langzeitarchivierung wäre eine Formatmigration nach PDF/A das Mittel der Wahl, was aber im Projektzeitraum weder geplant noch durchführbar war.
Die Bereitstellung zur Nutzung erfolgt über die breit eingeführte Repositoriumssoftware OPUS. Sie bietet die Möglichkeit, verschiedene Zugriffsarten einzustellen. Als erste im Projekt zu realisierende Nutzungsbedingung wurde vereinbart „Nutzung nur in den Räumen der Landesbibliotheken, an festen Geräten, Verantwortung für die Gerätebereitstellung liegt jeweils bei der Landesbibliothek.“ Dies bedeutet die Bereitstellung eines Leseplatzes, der keine Speichermöglichkeit (USB-Buchse) bietet, über den kein freies Surfen im Internet möglich ist und in dem auch die Druckfunktion einer Überwachung unterliegt. Die Viewer-Software ist auf dem Rechner installiert (Adobe Acrobat für PDF, Okular für EPUB). Gleichzeitig ist die OPUS-Installation zur Benutzung nur für diese Rechner in den Räumen der Landesbibliotheken freigeschaltet; der Transfer vom Server zum Arbeitsplatz erfolgt über das HTTPS-Protokoll. Eine digitale Kopie darf durch den Bibliotheksnutzer nicht hergestellt werden, ein Ausdruck von Teilen des Werks ist unter Einhaltung der urheberrechtlichen Bestimmungen möglich.
Die PDF- und EPUB-Dateien der Publikationen können über den in der Titelaufnahme enthaltenen Link aufgerufen werden. Der gesetzlich bestimmte Schutz der Publikationen ist jederzeit gewährleistet. Erfolgt ein Aufruf eines der abgelieferten E-Books von anderen Geräten als den speziellen Arbeitsplätzen der E-Pflicht, erhält der Nutzer den Hinweis, dass die Publikation nur am betreffenden und gekennzeichneten Rechner verfügbar ist. Für indizierte Literatur (FSK18) ist noch ein weiterer Schutzmechanismus verabredet und implementiert, um zu verhindern, dass Minderjährige darauf zugreifen können.
Mit Hilfe der freien Webanalyse-Software AWStats erstellt das BSZ eine laufende, monatlich und jährlich kumulierende Erhebung über die Nutzung an den E-Pflicht-Rechnern, spezifisch für beide Landesbibliotheken. Ermittelbar sind sämtliche Nutzungszahlen, die für die hausinternen Analysen und die Anforderungen der Deutschen Bibliotheksstatistik benötigt werden, unter Einhaltung der datenschutzrechtlichen Vorgaben.
5. Inhalte
Die ersten Testlieferungen erfolgten im Herbst 2018. Sie wurden erfolgreich verarbeitet, so dass die Annahme mit Bewertung, Prüfung, URN-Bildung und Darstellung in OPUS Mitte Januar 2019 produktiv eröffnet werden konnte. Die beiden Landesbibliotheken bemühten sich im Rahmen des Projekts um eine möglichst vollständige Erfassung größerer und mittelgroßer Verlage. Mit der Verhandlung über die aktuellen Inhalte wurde auch immer gleich um Belieferung mit den Backfiles zurück bis zum Jahr 2007 gebeten. Dies hatte in den allermeisten Fällen Erfolg.
Viele Verlage arbeiten für die Auslieferung ihrer Produkte an Bibliotheken und den Endkunden mit Servicepartnern zusammen (Bsp. in Abb. 5, Ablieferung der Titel des Verlags Haufe-Lexware durch die Bookwire GmbH). In diesen Fällen mussten in einem zweistufigen Prozess zunächst die Verhandlungen über die Inhalte mit den Verlagen geführt werden und anschließend die technischen Aspekte der Belieferung mit dem Serviceunternehmer geklärt werden. Da einige Serviceunternehmer von mehreren Verlagen in Anspruch genommen werden, konnte die Abklärung der technischen Bedingungen teilweise gebündelt erfolgen.
Die Schätzung der insgesamt verfügbaren E-Books im Baden-Württembergischen Pflichtgebiet seit Gültigkeit der Pflichtabgaberegelung für die digitalen Inhalte belief sich zu Beginn des Projekts auf „etwas über 100.000 Titel“. Im Rahmen der Projektlaufzeit konnten mehr als 60.000 Titel angenommen und verarbeitet werden, weitere 10.000 gelieferte Titel wurden abgelehnt. In vielen Fällen handelte es sich dabei um Dubletten zu bereits erhaltenen Lieferungen oder um Metadaten-Updates ohne Volltext. Nur selten waren es Titellieferungen, die nicht der Formatvorgabe entsprachen oder bei denen der Volltext DRM-Schutz unterlag – in diesen Fällen wurde um Neulieferung gebeten. Es wurden über einhundert Verlage und weitere Produzenten von E-Books kontaktiert, bei sechzig davon wurde bereits der Status eines produktiven Ablieferers erreicht. Die nach Ende des Projekts noch hinzukommenden Ablieferer werden zahlreich sein, jedoch werden sie jeweils nur eine geringe Menge an E-Books beisteuern.
In der Ablieferungsstatstik finden sich folglich bekannte Verlage Baden-Württembergs auf den ersten Positionen (Cover-Bilder einiger Pflicht-E-Books siehe: Abb. 6): Springer, Nomos, Pabel-Moewig, Wiley-VCH, Beltz, Kohlhammer, KIT Scientific Publishing, Herder, Mair Dumont, Haufe-Lexware, Panini, Klett-Cotta, Franckh-Kosmos, Eugen Ulmer, Philipp Reclam jun., Narr Francke Attempto, Schäffer-Poeschel, Franz Steiner, SCM, dpunkt.verlag, Mohr-Siebeck, Cross Cult, dp Digital Publishers. Hinzu kommen namhafte Imprints und Tochterverlage der Genannten, z.B. Springer Spektrum, Springer Vieweg, Ergon, Tectum, Kreuz, Karl Alber, O‘Reilly. Einige weitere größere Verlage sind noch nicht in Produktion, haben aber schon eine Lieferung angekündigt.
6. Ausblick
Es bestand der Wunsch, die Vollständigkeit der Pflichtablieferung von E-Books – analog zu den Verfahren bei der physischen Pflicht – mit den Ablieferungen an die Deutsche Nationalbibliothek überprüfen zu können. Dazu musste das von der Württembergischen Landesbibliothek entwickelte elektronische Medienauswertesystem (eMAS, vormals Anawülasis)28 erweitert werden. Die entsprechende Software-Anpassung konnte noch aus den Sachmitteln des Projekts E-Pflicht Baden-Württemberg in Auftrag gegeben werden. Das dabei entstandene neue Bearbeitungs-Modul ermöglicht nun einen Abgleich der in der Reihe O der Deutschen Nationalbibliothek verzeichneten Netzpublikationen mit den bereits eingegangenen Ablieferungen im Katalog und im Anschluss eine Analyse der Netzpublikationen nach Zeitraum, Verlag und weiteren Parametern. Die Prüfung der Ablieferung von E-Books auf Vollständigkeit erfolgt ab dem Produktionsjahr 2020. Die betreffenden Geschäftsgänge werden derzeit entwickelt. Fehlende Titel müssen künftig angefordert und auch gemahnt werden.
Die Zahl der bisher von den baden-württembergischen Landesbibliotheken in Kooperation mit dem BSZ archivierten E-Books zeigt, dass die Etablierung automatischer Prozesse nach dem Vorbild der Deutschen Nationalbibliothek erfolgreich ist. Zugleich gewährleistet die Verwendung von etablierten Software-Komponenten beim BSZ die Nachhaltigkeit des Systems und der darin archivierten Daten. Trotz allem muss man sich auf lange Sicht Gedanken über die Interpretierbarkeit der Inhalte machen – insbesondere da die E-Books neben Text eine Vielzahl von Graphiken, Bildern oder multimedialen Inhalten enthalten. Im Langzeitarchivierungssystem Rosetta können solche Sachverhalte adressiert, aber nicht gelöst werden. Dies müsste bei Bedarf durch eine formatspezifische Migration erfolgen bzw. durch Emulation der Software-Umgebung, die zur Zeit der Entstehung des E-Books installiert war.29
Im Anschluss an das hier beschriebene Projekt zur Etablierung eines Systems für die Ablieferung, Verarbeitung und Archivierung von Pflicht-E-Books wird nun in einem weiteren Projekt das Verfahren auf die Annahme von E-Journals und deren Teilen erweitert werden.
Literaturverzeichnis
–Block, Barbara; Kühn, Roswitha: E-Book-Metadaten Pool und E-Book-Management Tool. Ein Kooperationsprojekt von BSZ und VZG, in: Bibliotheksdienst, 51(8), 2017, S. 664-674. Online: <https://doi.org/10.1515/bd-2017-0072>.
–Dannehl, Wiebke; Geisler, Felix; Wolf, Stefan: E-Pflicht Baden-Württemberg. Pflichtablieferung von E-Books, in: WLBforum, 22(1), 2020, S. 28-30. Online: <https://www.wlb-stuttgart.de/fileadmin/user_upload/die_wlb/WLB-Forum/WLBforum_2020_1_WEB.pdf>, Stand: 31.07.2020.
–Dannehl, Wiebke; Johannsen, Jochen; Schütt-Hohenstein, Angelika: Baden-Württemberg, in: Bibliotheksdienst, 47(8-9), 2013, S. 597-604. Online: <https://doi.org/10.1515/bd-2013-0064>.
–Diebel, Cornelia: Netzpublikationen. Sammlung, Archivierung und Bereitstellung in der Deutschen Nationalbibliothek, in: Dialog mit Bibliotheken, 27(1), 2015, S. 24-30. Online: <http://d-nb.info/1077223617/34>.
–Geisler, Felix; Dannehl, Wiebke; Keitel, Christian; Wolf, Stefan: Zum Stand der Webarchivierung in Baden-Württemberg, in: Bibliotheksdienst 51(6), 2017, S. 481–489. Online: <https://doi.org/10.1515/bd-2017-0051>.
–Heckmann, Jörn; Weber, Marc-Philipp: Elektronische Netzpublikationen im Lichte des Gesetzes über die Deutsche Nationalbibliothek (DNBG), in: AfP. Zeitschrift für Medien- und Kommunikationsrecht, 3, 2008, S. 269-276.
–Jendral, Lars: Die elektronische Pflicht in den Bundesländern, in: Bibliotheksdienst, 47(8-9), 2013, S. 592-596. Online: <https://doi.org/10.1515/bd-2013-0063>.
–Johannsen, Jochen; Wolf, Stefan: E-Books als Pflichtexemplare. Die Realisierung in Baden-Württemberg. Vortragsfolien vom 104. Bibliothekartag am 27.05.2015 in Nürnberg. Online: <https://nbn-resolving.org/urn:nbn:de:0290-opus4-19471>.
–Klimpel, Paul; Euler, Ellen (Hrsg.): Der Vergangenheit eine Zukunft. Kulturelles Erbe in der digitalen Welt. Eine Publikation der Deutschen Digitalen Bibliothek. Berlin 2015. Online: <https://irights-media.de/webbooks/dervergangenheiteinezukunft/>, Stand: 31.07.2020.
–Lubetzki, Nathalie; Steinke, Tobias: EMiL. Emulation von Kulturgut, in: Dialog mit Bibliotheken 29(1), 2017, S. 20-24. Online: <https://d-nb.info/1127755471/34>.
–Meier, Konrad; Wehrle, Dennis; Schlitter, Nico: Ein Konzept zum Aufbau eines föderierten, dezentralen Speichersystems im Hochschulumfeld, in: 6. DFN-Forum Kommunikationstechnologien, GI, 217, 2013, S. 11-20. Online: <http://subs.emis.de/LNI/Proceedings/Proceedings217/11.pdf>, Stand: 31.07.2020.
–Neumann, Bernd: Grußwort. Koordinierungsstelle für die Erhaltung des schriftlichen Kulturguts. Online: <http://kek-spk.de/ueber-uns/grussworte/>, Stand: 31.07.2020.
–Oberfell, Jörg; Thalhofer, Anja: Mit der Wühlmaus „Anawülasis“ unterwegs. Das neue Auswertesystem der WLB für Titeldaten, in: WLBforum, 20(1), 2018, S. 7-19. Online: <https://www.wlb-stuttgart.de/fileadmin/user_upload/die_wlb/WLB-Forum/WLBforum_2018_1_WEB.pdf>, Stand: 31.07.2020.
–Oberfell, Jörg; Thalhofer, Anja: Die Wühlmaus wühlt weiter..., in: WLBforum, 21(1), 2019, S. 7-17. Online: <https://www.wlb-stuttgart.de/fileadmin/user_upload/die_wlb/WLB-Forum/WLBforum_2019_1_WEB.pdf>, Stand: 31.07.2020.
–Rechert, Klaus; Espenschied, Dragan; Valizada, Isgandar; Liebetraut, Thomas; Russler, Nick; von Suchodoletz, Dirk: An Architecture for Community-based Curation and Presentation of Complex Digital Objects, in: ICADL 2013. Digital Libraries – Social Media and Community Networks. 2013, S. 103-112. Online: <http://doi.org/10.1007/978-3-319-03599-4_12>.
–Schäffler, Hildegard; Seadle, Michael; Weber, Karl-Heinz: Dauerhafter Zugriff auf digitale Publikationen. Das DFG-Projekt NatHosting, in: o-bib. Das Offene Bibliotheksjournal / Herausgeber VDB, 2(4), 2015, S. 279-284. Online: <https://doi.org/10.5282/o-bib/2015H4S279-284>.
–Schwidder, Jens: OPUS 4 Entwicklung. Stand zum Bibliothekartag 2018. Berlin 2018. Online: <https://nbn-resolving.org/urn:nbn:de:0290-opus4-157952>.
–Sommer, Dorothea: Landesbibliotheken heute. Chancen und Herausforderungen, in: Zeitschrift für Bibliothekswesen und Bibliographie, 64(6), 2017, S. 315-321. Online: <http://doi.org/10.3196/186429501764615>.
–Steinhauer, Eric W.: Pflichtablieferung von Netzpublikationen. Urheberrechtliche Probleme im Zusammenhang mit der Ablieferungspflicht von Netzpublikationen an die Deutsche Nationalbibliothek, in: Kommunikation & Recht, 161(3), 2009, S. 161-166. Online: <http://online.ruw.de/suche/kur/Pflichtablieferung-von-Netzpublikationen-11b35a7e5cca2792373127d03bcdd938/>, Stand: 31.07.2020.
–Steinhauer, Eric W.: Die Sammlung, Bewahrung und Verwaltung von Netzpublikationen durch Pflichtexemplarbibliotheken in Deutschland. Probleme und Lösungen mit Blick auf die Gesetzgebung der Länder und des Bundes, in: Bibliotheksdienst, 49(12), 2015, S. 1101-1113. Online: <https://doi.org/10.1515/bd-2015-0133>.
–Steinhauer, Eric W.: 10 Jahre Pflichtablieferung von Netzpublikationen. Eine Baustelle wird besichtigt, in: Dialog mit Bibliotheken, 28(2), 2016, S. 31-36. Online: <https://d-nb.info/1115818023/34>.
–Wiesenmüller, Heidrun: Langzeitarchivierung von Online-Publikationen an Regionalbibliotheken. Das Projekt ‚Baden-Württembergisches Online-Archiv‘ (BOA), in: Bibliotheksdienst 38(4), 2004, S. 471–479. Online: <https://doi.org/10.1515/bd.2004.38.4.471>.
1 Neumann, Bernd: Grußwort, in: Koordinierungsstelle für die Erhaltung des schriftlichen Kulturguts. Ein Überblick über die Anfangsphase der KEK und die ersten Modellprojekte von 2010 bis 2012, 2012, S. 1. Online: <https://www.kek-spk.de/sites/default/files/2019-08/FINAL_KEK_Booklet_Inhalt.pdf>, Stand: 31.07.2020.
2 Klimpel, Paul; Euler, Ellen (Hrsg.): Der Vergangenheit eine Zukunft. Kulturelles Erbe in der digitalen Welt ; eine Publikation der Deutschen Digitalen Bibliothek. Berlin 2015. Online: <https://irights-media.de/webbooks/dervergangenheiteinezukunft/>, Stand: 31.07.2020.
3 Microsoft Store: eBooks ab Juli nicht mehr verfügbar, 30.06.2019. Online: <https://www.heise.de/newsticker/meldung/Microsoft-Store-eBooks-ab-Juli-nicht-mehr-verfuegbar-4457997.html>, Stand: 31.07.2020; Alle E-Books werden gelöscht, 02.07.2019. Online: <https://www.boersenblatt.net/2019-07-02-artikel-alle_e-books_werden_geloescht-microsoft_store_beerdigt_e-book-geschaeft.1685590.html>, Stand: 31.07.2020.
4 Schäffler, Hildegard; Seadle, Michael; Weber, Karl-Heinz: Dauerhafter Zugriff auf digitale Publikationen. Das DFG-Projekt NatHosting, in: o-bib. Das Offene Bibliotheksjournal / Herausgeber VDB, 2(4), 2015, S. 279-284. Online: <https://doi.org/10.5282/o-bib/2015H4S279-284>.
5 Gesetz über die Deutsche Nationalbibliothek. Online: <https://www.gesetze-im-internet.de/dnbg/BJNR133800006.html>, Stand: 31.07.2020.
6 Jendral, Lars: Die elektronische Pflicht in den Bundesländern, in: Bibliotheksdienst, 47(8-9), 2013, S. 592-596. Online: <https://doi.org/10.1515/bd-2013-0063>.
7 Heckmann, Jörn; Weber, Marc-Philipp: Elektronische Netzpublikationen im Lichte des Gesetzes über die Deutsche Nationalbibliothek (DNBG), in: AfP. Zeitschrift für Medien- und Kommunikationsrecht, 3, 2008, S. 269-276.
8 Dannehl, Wiebke; Johannsen, Jochen; Schütt-Hohenstein, Angelika: Baden-Württemberg, in: Bibliotheksdienst, 47(8-9), 2013, S. 597-604. Online: <https://doi.org/10.1515/bd-2013-0064>.
9 Sommer, Dorothea: Landesbibliotheken heute. Chancen und Herausforderungen, in: Zeitschrift für Bibliothekswesen und Bibliographie, 64(6), 2017, S. 315-321. Online: <http://doi.org/10.3196/186429501764615>; Steinhauer, Eric W.: Die Sammlung, Bewahrung und Verwaltung von Netzpublikationen durch Pflichtexemplarbibliotheken in Deutschland. Probleme und Lösungen mit Blick auf die Gesetzgebung der Länder und des Bundes, in: Bibliotheksdienst, 49(12), 2015, S. 1101-1113. Online: <https://doi.org/10.1515/bd-2015-0133>.
10 Steinhauer, Eric W.: Pflichtablieferung von Netzpublikationen. Urheberrechtliche Probleme im Zusammenhang mit der Ablieferungspflicht von Netzpublikationen an die Deutsche Nationalbibliothek, in: Kommunikation & Recht, 161(3), 2009, S. 161-166. Online: <http://online.ruw.de/suche/kur/Pflichtablieferung-von-Netzpublikationen-11b35a7e5cca2792373127d03bcdd938/>, Stand: 31.07.2020.
11 Steinhauer, Eric W.: 10 Jahre Pflichtablieferung von Netzpublikationen. Eine Baustelle wird besichtigt, in: Dialog mit Bibliotheken, 28(2), 2016, S. 31-36. Online: <https://d-nb.info/1115818023/34>.
12 Dannehl, Wiebke; Geisler, Felix; Wolf, Stefan: E-Pflicht Baden-Württemberg. Pflichtablieferung von E-Books, in: WLBforum, 22(1), 2020, S. 28-30. Online: <https://www.wlb-stuttgart.de/fileadmin/user_upload/die_wlb/WLB-Forum/WLBforum_2020_1_WEB.pdf>, Stand: 31.07.2020.
13 Spezifikation von Transferpaketen und deren Übertragung an die Deutsche Nationalbibliothek mittels eines Hotfolders. Online: <https://d-nb.info/1027296637/34>.
14 Wiesenmüller, Heidrun: Langzeitarchivierung von Online-Publikationen an Regionalbibliotheken. Das Projekt‚Baden-Württembergisches Online-Archiv‘ (BOA), in: Bibliotheksdienst 38(4), 2004, S. 471–479. Online: <https://doi.org/10.1515/bd.2004.38.4.471>.
15 Geisler, Felix; Dannehl, Wiebke; Keitel, Christian; Wolf, Stefan: Zum Stand der Webarchivierung in Baden-Württemberg, in: Bibliotheksdienst 51(6), 2017, S. 481–489. Online: <https://doi.org/10.1515/bd-2017-0051>.
16 Johannsen, Jochen; Wolf, Stefan: E-Books als Pflichtexemplare. Die Realisierung in Baden-Württemberg : Vortragsfolien vom 104. Bibliothekartag am 27.05.2015 in Nürnberg. Online: <https://nbn-resolving.org/urn:nbn:de:0290-opus4-19471>.
17 Diebel, Cornelia: Netzpublikationen. Sammlung Archivierung und Bereitstellung in der Deutschen Nationalbibliothek, in: Dialog mit Bibliotheken, 27(1), 2015, S. 24-30. Online: <http://d-nb.info/1077223617/34>.
18 Open Archives Initiative Protocol for Metadata Harvesting. Online: <http://www.openarchives.org/pmh/>, Stand: 31.07.2020.
19 Meier, Konrad; Wehrle, Dennis; Schlitter, Nico: Ein Konzept zum Aufbau eines föderierten, dezentralen Speichersystems im Hochschulumfeld, in: 6. DFN-Forum Kommunikationstechnologien, GI, 217, 2013, S. 11-20. Online: <http://subs.emis.de/LNI/Proceedings/Proceedings217/11.pdf>, Stand: 31.07.2020.
20 Block, Barbara; Kühn, Roswitha: E-Book-Metadaten Pool und E-Book-Management Tool. Ein Kooperationsprojekt von BSZ und VZG, in: Bibliotheksdienst, 51(8), 2017, S. 664-674. Online: <https://doi.org/10.1515/bd-2017-0072>. E-Book-Pool und E-Book-Management-Tool sind die maßgeblichen Werkzeuge für automatisierte Massenimporte in die Verbunddatenbank des K10plus.
21 Schwidder, Jens: OPUS 4 Entwicklung. Stand zum Bibliothekartag 2018. Berlin 2018. Online: <https://nbn-resolving.org/urn:nbn:de:0290-opus4-157952>.
22 Das digitale Langzeitarchiv wurde im Rahmen des Landesprojekts bwDataBib (2017-2019) aufgebaut. In Zusammenarbeit der Projektbeteiligten, besonders an BSZ und BLB sowie dem Zentrum für Datenverarbeitung an der Universität Tübingen konnten die entsprechenden Dokumentationen und Spezifikationen erarbeitet werden. Nach ihrer Bestätigung wurden die Verarbeitungs- und Übergabeverfahren in der Verwaltungsdatenbank entwickelt, getestet und nach Aufbau der Test- und Produktionsinstanz des digitalen Langzeitarchivs in Betrieb genommen. Als Archivsystem kommt das lizenzpflichtige Produkt Rosetta der Firma Ex Libris zum Einsatz. Im Rahmen der Evaluation verschiedener Systeme durch das bwDataBib-Projekt hatte sich ergeben, „dass Rosetta für die Langzeitarchivierung der gesetzlich vorgesehenen Pflichtablieferung elektronischer Publikationen das am besten geeignete System darstellt“.
23 Zur Funktionsweise des E-Book-Managementtools siehe: Fußnote 20.
24 PPN=Pica Production Number, die Unique Identification Number im Verbund K10plus.
25 The Library of Congress: Metadata Encoding & Transition Standard. Online: <http://www.loc.gov/standards/mets/>, Stand: 31.07.2020.
26 Zur Definition des SIP (OAIS Submission Information Package) siehe: ISO 14721:2012, Space data and information transfer systems — Open archival information system (OAIS) — Reference model. Online: <https://www.iso.org/obp/ui/#iso:std:iso:14721:ed-2:v1:en>.
27 Mit freundlicher Genehmigung der Verlage: Beltz, Weinheim / Pabel-Moewig, Rastatt (Illustration: Arndt Drechsler) / Wiley-VCH, Weinheim / Klett-Cotta, Stuttgart / Eugen Ulmer, Stuttgart / Nomos, Baden-Baden.
28 Oberfell, Jörg; Thalhofer, Anja: Mit der Wühlmaus „Anawülasis“ unterwegs. Das neue Auswertesystem der WLB für Titeldaten, in: WLBforum, 20(1), 2018, S. 7-19. Online: <https://www.wlb-stuttgart.de/fileadmin/user_upload/die_wlb/WLB-Forum/WLBforum_2018_1_WEB.pdf>, Stand: 31.07.2020; Oberfell, Jörg; Thalhofer, Anja: Die Wühlmaus wühlt weiter..., in: WLBforum, 21(1), 2019, S. 7-17. Online: <https://www.wlb-stuttgart.de/fileadmin/user_upload/die_wlb/WLB-Forum/WLBforum_2019_1_WEB.pdf>, Stand: 31.07.2020.
29 Rechert, Klaus; Espenschied, Dragan; Valizada, Isgandar; Liebetraut, Thomas; Russler, Nick; von Suchodoletz, Dirk: An Architecture for Community-based Curation and Presentation of Complex Digital Objects, in: ICADL 2013. Digital Libraries. Social Media and Community Networks. 2013, S. 103-112. Online: <http://doi.org/10.1007/978-3-319-03599-4_12>; Lubetzki, Nathalie; Steinke, Tobias: EMiL. Emulation von Kulturgut, in: Dialog mit Bibliotheken 29(1), 2017, S. 20-24. Online: <https://d-nb.info/1127755471/34>.