5. Workshop Computerunterstützte Inhaltserschließung
Bericht und thematischer Überblick zu den Beiträgen
Der 5. Workshop Computerunterstützte Inhaltserschließung wurde von der Universitätsbibliothek Stuttgart, der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz (SBB-PK) und der Eurospider Information Technology AG in Zusammenarbeit mit dem Bibliotheksservicezentrum Baden-Württemberg (BSZ) und der Deutschen Nationalbibliothek (DNB) am 10. und 11. November 2021 als Videokonferenz organisiert. Das Programm und die Präsentationen sind auf der Website des Workshops verfügbar.1
Überblick über den Stand der Inhaltserschließung in den Bibliotheksverbünden
Der erste Teil der Tagung befasste sich zunächst mit der Dokumentation des Ist-Zustands inhaltlicher Erschließung in den deutschsprachigen Bibliotheksverbünden – darin eingeschlossen die aktuellen Entwicklungen und Planungen sowie Ausblicke auf angestrebte Zukunftsszenarien. Die Erschließungspraxis der folgenden Verbünde wurden diesbezüglich informativ vorgestellt: der Österreichische Bibliothekenverbund (OBV), der Fachinformationsverbund Internationale Beziehungen und Länderkunde (FIV), das Hessische Bibliotheksinformationssystem (hebis), der Bibliotheksverbund Bayern (BVB) und der kooperative Bibliotheksverbund Berlin-Brandenburg (KOBV) sowie der K10plus, der gemeinsame Katalog des Südwestdeutschen Bibliotheksverbunds (SWB) und des Gemeinsamen Bibliotheksverbunds (GBV). Die präsentierten Zahlen zum Ausmaß inhaltlicher Erschließung in den einzelnen Verbünden wurden auf unterschiedliche Weise erhoben – beispielsweise durch Umfragen bei den teilnehmenden Verbundbibliotheken oder durch Datenanalysen in den zentralen Katalogen.
So berichtete der OBV (Präsentation Christoph Steiner, ÖNB Wien) von einem Umfrageergebnis, wonach etwa 80 % der Verbundteilnehmer verbal inhaltlich nach RSWK (unter Verwendung der GND) erschließen, allerdings sich nur ein Viertel der Bibliotheken aktiv an der Normdatenarbeit, d.h. am Einbringen von Neuansetzungen in die GND, beteiligt. 95 % übernehmen klassifikatorische Erschließung und 70 % sind über die etablierte Fremddatenübernahme bzw. iterative Kataloganreicherung durch Verbundprojekte hinaus auch an automatischer Datengenerierung interessiert. Von den rund 14,5 Mio. Datensätzen entfallen rund 3 Mio. auf unselbständige Literatur, E-Ressourcen und Retroprojekte, die nur in geringem Umfang inhaltlich erschlossen werden. Von den restlichen sind bis zu 70 % entweder verbal (59,4 %) und/oder klassifikatorisch (34,7 %) erschlossen. Aktuell erleichtert der sogenannte Digitale Assistent (DA-32) der Fa. Eurospider die inhaltliche Erschließungsarbeit im OBV. Dabei handelt es sich um ein halbautomatisches Vorschlagstool, das sowohl die konsequente, aber eben auch qualitätssichernde, selektive Nutzung von Fremddaten als auch die unkomplizierte Vergabe von Normdaten (GND und Klassifikationen, z.B. RVK3) ermöglicht und extrem performant ist. Komplementär zur verbalen Erschließung werden im Verbund folgende Klassifikationen aktiv verwendet: Regensburger Verbundklassifikation (RVK), Basisklassifikation (BK), Dewey-Dezimalklassifikation (DDC), Mathematics Subject Classfication (MSc), National Library of Medicine Classification (NLM) und OBV-Fachgruppen (dabei handelt es sich um eine grobe Einteilung in fast 60 fachspezifische Bereiche, um die Neuzugänge statistisch erfassen zu können). Zusätzlich werden auch Gattungsbegriffe für Belletristik, Kinder- und Jugendliteratur vergeben.4 Forschungsdaten werden gesondert – über universitäre Plattformen – verwaltet und rudimentär inhaltlich erschlossen. Schulungen werden von den Gremien des OBV (Zentralredaktion Sacherschließung, Level 1-Redaktion für die GND), aber auch durch Lokalredaktionen an konkreten Bibliotheken sowie im Universitätslehrgang Library Information Studies an der Universität Wien5, der Österreichischen Nationalbibliothek6, der Universität Graz7 und der Universität Innsbruck8 und in diversen Fortbildungsprogrammen9 durchgeführt.
Der FIV (Präsentation Susanne Baron, FIV / Stiftung Wissenschaft und Politik) sieht sich als Dokumentationseinrichtung und erschließt daher seine rund 1 Mio. Daten inhaltlich vollständig – es sind dies Aufsätze (61 %), also unselbständige Literatur, aber auch Monografien und Websites (36 %, darunter vielfach auch graue Literatur). Das Konzept zur Inhaltserschließung stützt sich auf das Vokabular der GND, aber auch auf einen eigenen FIV-Thesaurus bzw. eine eigene FIV-Klassifikation.
hebis (Präsentation Johannes Graupe, UB Frankfurt) arbeitet derzeit an einem neuen integrierten Tool zur Sacherschließung namens hebis-SET, dessen Release Anfang 2022 starten soll. Bereits 2019 wurde eine Reihe von einschlägigen Verfahren evaluiert: der DA-3 und FRED (beide von der Firma Eurospider), Annif (Finnische Nationalbibliothek), Ariadne (OCLC) und intelligentCapture (Firma AGI). Aus einer Umfrage ergab sich, dass 77 % der Bibliotheken verbale inhaltliche Erschließung betreiben, weitere 11 % zumindest klassifikatorisch erschließen und nur 12 % gar keine Inhaltserschließung praktizieren. An erster Stelle steht der Einsatz der RVK, gefolgt von verbaler Sacherschließung unter Verwendung der GND und – kontinuierlich abfallend – einigen lokalen Systemen und sonstigen Klassifikationen. Während die RVK nur von wenigen Power-Usern angewendet wird, ist die Erschließung mit der GND an vielen Bibliotheken verbreitet, wenn sie auch zahlenmäßig weniger häufig praktiziert wird. Schulungen zur inhaltlichen Erschließung erfolgen durch einzelne (nicht näher spezifizierte) Bibliotheken und die Verbundzentrale.
Laut Ergebnis einer Umfrage im BVB/KOBV (Präsentation Werner Holbach, BSB München) erschließen über 85 % der Bibliotheken klassifikatorisch – fast 40 % der klassifikatorischen Erschließungen entfallen auf die RVK, etwa 48 % auf diverse Haussystematiken, der Rest auf die DDC und andere Systematiken. Rund 76 % der Bibliotheken praktizieren verbale Sacherschließung. Fast 66 % erschließen verbal mit Schlagwortfolgen oder Einzelschlagwörtern nach RSWK/GND; in geringem Ausmaß werden auch hauseigene Schlagwortsysteme verwendet. Eine Datenanalyse ergab folgendes Bild: Von den etwas mehr als 25 Mio. Titeldatensätzen im B3Kat sind rund 40 % nach RSWK/GND erschlossen und 49 % weisen eine klassifikatorische Inhaltserschließung auf (bei 31 % mit RVK).
Äußerst interessant ist ein Anreicherungsprojekt von Sacherschließungsdaten im B3Kat mittels Culturegraph: Nach Bildung von Werk-Clustern – also der Zusammenführung der Metadaten sämtlicher Manifestationen bzw. Expressionen eines Werks gemäß dem FRBR-Modell – wurden die bereits vorhandenen Schlagwortfolgen, Einzelschlagwörter und Formangaben sowie RVK-Notationen untereinander abgeglichen und die Titeldatensätze angereichert – unter Einbeziehung sowohl der B3Kat-Daten als auch der Daten anderer Verbünde. Als Ergebnis konnten 2,2 Mio. Datensätze mit Schlagwörtern bzw. Schlagwortfolgen (insgesamt 4,1 Mio. Schlagwörter), aber auch Formangaben (900.000) angereichert werden. Fast eine halbe Mio. E-Books (465.000) profitierten ebenfalls von diesem Abgleich. Der DA-3 wurde bereits getestet und als nützliches Tool beurteilt – vor allem für Kolleg*innen, die nicht ausschließlich mit Sacherschließung befasst sind. Für die übrigen scheinen die Aleph-Funktionalitäten in Kombination mit den bewährten Tools Karlsruher Virtueller Katalog (KVK)10 und Malibu11 einstweilen ausreichend zu sein. Die Einführung eines neuen Verbundsystems ist für 2022 geplant und die Lizenzierung des DA-3 nicht ausgeschlossen.
Mit fast 74 Mio. Titeldatensätzen hat der K10plus (Präsentation Armin Kühn, BSZ, und Uma Balakrishnan, VZG des GBV) ein Potenzial für Kataloganreicherung, das sich allein aus der Genese seiner Entstehung aus SWB und GBV ergibt. 30 % der Titeldatensätze sind verbal (RSWK/GND), 29 % klassifikatorisch inhaltlich erschlossen. In absteigender Reihenfolge sind dabei DDC, BK und RVK vertreten. Dazu kommen Schlagwörter aus dem Standard-Thesaurus Wirtschaft (STW), Library of Congress Subject Headings (LCSH) und einige weitere Systeme – darunter auch die Inhaltserschließung des FIV (s.o.), der seit Mai 2021 Mitglied im K10Plus ist. Wichtigstes Tool (halb-)automatischer inhaltlicher Erschließung ist der DA-3 mit 20 teilnehmenden und einigen noch testenden Bibliotheken.
In einem wichtigen Projekt, das etwa 300.000 Titel betraf (weitere sollen folgen), wurden Titeldatensätze mit BK-Notationen angereichert, die überwiegend aus einem Mapping von BK und RVK im Rahmen von coli-conc12 resultieren.13 Weitere Anreicherungen von Sacherschließungsinformationen durch Abgleich von Parallelausgaben, aber auch Anreicherungen aus Culturegraph-Bündeln (vergleichbar mit dem Projekt des BVB, s.o.) sind für die Zukunft geplant. Diese Vorhaben sind vielleicht richtungsweisend auch für andere Verbünde, um zunächst aus den Eigendaten zusätzliche Inhaltserschließung zu generieren und damit die Inhaltserschließungssituation der Kataloge zu optimieren, bevor die Zukunft automatischer Inhaltserschließung mit KI-Projekten beginnen kann.14
Intelligente Verzahnung von intellektueller und maschineller Erschließung
Im Mittelpunkt des zweiten Teils der Tagung standen konkrete Beispiele für eine Verbindung von intellektueller und maschineller Erschließung, die entweder schon praktiziert werden oder in naher Zukunft realisiert werden sollen. Der Zürcher Informationstechnologe Martin Braschler eröffnete die Session mit einem Vorschlag, der auf methodischer Basis von Expert*innen professionell durchgeführten Inhaltserschließung ein alternatives Modell gegenüberzustellen, das trotz geringerer Ressourcen zu einer besseren Retrievaleffektivität führen könnte. Hierzu soll eine sogenanntes Research Canvas (d.h. eine „Forschungsleinwand“) gebildet werden, um eine Verbindung zwischen der Erzeugung von Schlagwörtern und ihrer Nutzung für Suchprozesse zu schaffen. Dabei sollen die von Studierenden bei der Suche verwendeten Wörter bzw. Wortfolgen als freie Schlagwörter genutzt werden, um daraus Konzepte abzuleiten, die für neue Suchen genutzt werden können. Am Ende soll eine Gegenüberstellung der so erzielten Retrievalergebnisse mit denen aus der gezielten Verwendung kontrollierter Vokabulare stehen. Das spannend anmutende Projekt befindet sich in der Planungsphase, eine konkrete Durchführung steht noch aus.
Florian Betz, Fachreferent in der Abteilung Inhaltserschließung an der DNB, informierte über das Projekt GND-mul der DNB, das sich mit Crosskonkordanzen (CK) zur GND beschäftigt. An der DNB wurden seit 1997 mehrere Projekte realisiert, in denen Crosskonkordanzen das Zentrum bildeten bzw. eine wichtige Rolle spielten, z.B. STW-SWD, CARMEN, KoMoHe und MACS.15 Auf diese Weise entstanden große Bestände an Mappings zwischen GND-Schlagwörtern und Schlagwörtern anderer Normdateien und Thesauri (LCSH, RAMEAU, STW, TheSoz, MeSH, AGROVOC). Grundlage all dieser Projekte war die Erkenntnis, dass Crosskonkordanzen die Heterogenität unterschiedlicher Erschließungssysteme überbrücken und als nützliche Instrumente sowohl der Indexierung als auch der Recherche eingesetzt werden können. So wertvoll das bisher erstellte Material auch ist, besteht doch im Hinblick auf die mögliche Nutzung noch erheblicher Verbesserungsbedarf. Das neue Projekt GND-mul, das im April 2021 begonnen wurde und bis September 2022 abgeschlossen werden soll, zielt deshalb darauf ab, die vorhandenen Crosskonkordanz-Daten in die Struktur und Organisation der GND nachhaltig zu integrieren, sie als eigenständige Terminologieprodukte über den Linked Data Service der DNB auszuliefern und ihre Sichtbarkeit und Nachnutzbarkeit zu erhöhen. Unabhängig vom Projekt sind bereits jetzt viele Mappings in die Vorschlagskomponente des DA-3 eingebunden und können so für die Erschließung von Dokumenten genutzt werden.
Der DA-3 spielte auch eine wichtige Rolle in den sich anschließenden Vorträgen, die den Charakter von Werkstattberichten hatten, insofern sie über bereits erprobte Prozesse der Verzahnung von intellektueller und maschineller Erschließung berichteten. Zunächst informierte Elisabeth Mödden, Leiterin des Referats „Automatische Erschließungsverfahren, Netzpublikationen (AEN)“, über den aktuellen Stand der maschinellen Erschließung in der DNB. Hier verfolgt man weiter das Ziel, intellektuelle und maschinelle Erschließung schrittweise und immer intelligenter miteinander zu verzahnen. Bisher kommen maschinelle Verfahren vorwiegend bei den Reihen B (Monografien und Periodika außerhalb des Verlagsbuchhandels), H (Hochschulschriften) und O (Online-Publikationen) zum Einsatz. Hier war ein Systemwechsel zwingend nötig geworden, weil die Erschließungssoftware DNB-AEP* von der Firma Averbis nicht mehr weiter betrieben wird und nur noch für einen Zeitraum von drei Jahren genutzt werden kann. Die DNB will diesem Problem durch die Entwicklung einer modular aufgebauten Erschließungsmaschine (Ema) begegnen, die 2022 realisiert werden soll. Dabei soll das an der Finnischen Nationalbibliothek entwickelte Toolkit Annif16 zum Einsatz kommen, das mittlerweile ausführlich getestet wurde und dabei vielversprechende Ergebnisse liefern konnte. An der DNB ist man deshalb optimistisch, dass das Spektrum der maschinellen Erschließung sehr bald deutlich erweitert werden könnte. Insbesondere ist geplant, bald wissenschaftliche Zeitschriften auf Artikelebene zu erschließen.
Im Anschluss daran stellte Helga Karg, Fachreferentin für Rechtswissenschaften der Abteilung Inhaltserschließung der DNB, ausführlich dar, wie die maschinell ermittelten GND-Schlagwörter als Vorschläge in den digitalen Assistenten DA-3 übernommen werden. Viele Dokumente erreichen die DNB sowohl in gedruckter als auch in elektronischer Form. Immer häufiger kommt es vor, dass die Online-Publikation bereits die maschinelle Erschließung durchlaufen hat, bevor die Druckausgabe intellektuell bearbeitet wurde. In diesen Fällen kann die maschinelle Erschließung der Online-Publikation als Grundlage für die intellektuelle Erschließung der Druckausgabe dienen. Schlagwörter, die dem Titeldatensatz einer Online-Publikation maschinell zugewiesen werden, sind im Iltis-System der DNB in Pica-Feld 5540 abgelegt. In Unterfeldern werden der Prozess, die Herkunft und ein Konfidenzwert erfasst. Zusätzlich stehen Unterfelder für eine intellektelle Relevanzbewertung zur Verfügung, die für stichprobenartige Qualitätskontrollen durch die Fachreferent*innen genutzt werden. Im DA-3 werden die maschinell erzeugten Schlagwörter neben den übrigen Fremddaten sowie den Erschließungsdaten der Verbünde nach ihrer Herkunft gelabelt angezeigt. Die Anzeige von Vorschlägen kann individuell angepasst werden. Die zur Erschließung der Ressource einschlägigen Schlagwörter können komfortabel per Klick in das Erschließungsfenster übertragen werden.
Anna Kasprzik, die Leiterin der Automatisierung der Sacherschließung (AutoSE) an der ZBW – Leibniz-Informationszentrum Wirtschaft, informierte anschließend über die Entwicklung der Abteilung und die Anzeige der erzielten Resultate im DA-3. Die automatisierte Inhaltserschließung hat an der ZBW eine lange Tradition, wurde aber erst 2019 zur Daueraufgabe erklärt. Während zunächst ein auf nachgeschalteten Regeln basierender sogenannter Fusion-Ansatz die Grundlage der Arbeit bildete,17 setzt man seit 2019 – wie die DNB – auf Annif, auch wegen des mit diesem Tool verbundenen Anspruchs einer niederschwelligen Einsetzbarkeit. Die ZBW ergänzt Annif durch eine Reihe zusätzlicher Maßnahmen wie etwa eine separat durchgeführte Hyperparameteroptimierung, eine Kombination von State-of-the-art-Algorithmen sowie Ansätzen für eine automatisierte Qualitätskontrolle. Die Erschließung wird vollzogen, indem die EconBiz-Datenbasis stündlich auf neue Publikationen überprüft wird, die sofort maschinell verschlagwortet werden. Allerdings finden dabei nur englische Publikationen Berücksichtigung. Diese werden auf Basis des Titels und, sofern vorhanden, der Autoren-Keywords erschlossen. Die Vorschläge werden in einem Speicher abgelegt, wo sie sich der DA-3 über die API abholen kann, wenn die Publikation abgerufen wird und die entsprechende Vorschlagsquelle ausgewählt ist. Während Daten, die in die EconBiz-Datenbank zurückgespielt werden, weiteren Regeln zur Qualitätssicherung unterworfen werden, wird auf diese Sicherungsmaßnahmen bei den im DA-3 abgelegten Daten, die ja ohnehin einen Vorschlagscharakter haben, bewusst verzichtet.
Der letzte Beitrag des Vortragsteils war – ähnlich wie der Vortrag von Martin Braschler – weniger auf die aktuelle praktische Verwendung von Daten als auf zukünftige Erweiterungen der Datennutzung ausgerichtet. Sybille Hermann und Dorothea Iglezakis von der UB Stuttgart informierten über die Erschließung von Forschungsdaten im Datenrepositorium DaRUS der Universität Stuttgart. DaRUS basiert auf der OpenSource Software DataVerse und soll Anwender*innen im universitären Bereich die Möglichkeit eröffnen, eigene Daten-Sammlungen mit spezifischen Suchkriterien und Beschreibungsmöglichkeiten zu pflegen. Die Datensätze werden so beschrieben, dass sie leicht auffindbar und unkompliziert zu teilen sind. Sie müssen nicht publiziert werden, können aber – mit einer DOI versehen – der Öffentlichkeit zur Verfügung gestellt werden. DaRUS entspricht somit den für Forschungsdaten formulierten FAIR-Prinzipien, die durch die vier Kriterien Auffindbarkeit („findable“), Zugänglichkeit („accessible“), Interoperabilität („interoperable“) und Wiederverwendbarkeit („re-usable“) charakterisiert sind.
In der anschließenden Diskussion der Referate zog Regine Beckmann von der Staatsbibliothek zu Berlin ein Resümee der Tagung. Die am ersten Tag vorgenommene Bestandsaufnahme der Erschließungsarbeit in Verbünden und Institutionen habe bemerkenswerte Ergebnisse zutage gebracht: Der Anteil der kooperativen Sacherschließung an der Gesamterschließung sei erstaunlich hoch und erfolge überwiegend im Routinebetrieb. Leider bestünden noch immer viele Desiderate, z.B. bei der Erschließung von E-Book-Paketen und Zeitschriftenaufsätzen. Viele Bibliotheken erschlössen die gleichen Medien, weshalb es viele Überlappungen und Doppelarbeit gäbe. Nötig sei eine nationale Erschließungsstrategie. Die Referate des zweiten Tages hätten große Fortschritte bei der Entwicklung der Erschließungsverfahren erkennen lassen. Dabei habe sich gezeigt, dass der DA-3 eine wichtige Schnittstelle ist, mit dem man die Resultate dieser Erschließungsverfahren weiterentwickeln könne.
Treffen der DA-3-Anwender*innen
Mit dieser Erkenntnis war ein nahtloser Übergang zum Treffen der DA-3-Anwender*innen geschaffen, das – wie in den Vorgängerveranstaltungen – den Schlussteil der Tagung bildete. Eurospider-Chef Peter Schäuble fasste zu Beginn die wesentlichen Erweiterungen seit dem letzten Treffen im November 2020 zusammen, die zum Teil bereits in einzelnen Vorträgen erwähnt worden waren: die Integration der Daten aus der automatischen Erschließung der ZBW und der aus dem Fachinformationsverbund FIV sowie die Einbindung der SWISS Library Plattform. Ferner wurden die Daten der von der Biblioteca Nacional de España gepflegten Schlagwortnormdatei EMBNE (Encabezamientos de materia de la Biblioteca Nacional de España) in den DA-3 eingespielt, was Heike Carstensen von der SUB Hamburg in einem kurzen instruktiven Vortrag näher erläuterte.
Laut Peter Schäuble ist die Exportkontrolle seit dem letzten Treffen im Vorjahr deutlich verbessert worden. Das System verfüge außerdem über eine hohe Ausfallsicherheit. Das Monitoring- und Alarmsystem sei erweitert worden. Bisher seien nur in zwei Fällen Erschließungsdaten verloren gegangen, was angesichts der vieltausendfachen Datennutzung im DA-3 ein sehr geringer Anteil sei. Die Nutzung des DA-3 habe sich gegenüber dem Vorjahr deutlich gesteigert. Gérard Milmeister von Eurospider wies auf Probleme beim Datenimport hin, die sich beispielhaft an den Daten der National Library of Medicine Classification (NLM) aufzeigen lassen. Die Daten der NLM seien derzeit nur auf einer Website gespeichert und müssten daher relativ aufwändig in eine Form gebracht werden, die strukturiert und exakt sei. Es sei sehr sinnvoll, wenn die Betreiber von NLM und andere Anbieter dazu gebracht werden könnten, alle relevanten Daten als XML-Files strukturiert zur Verfügung zu stellen. In diesem Zusammenhang wies Peter Schäuble darauf hin, dass die zuvor im Kontext mit Forschungsdaten erwähnten FAIR-Prinzipien auch auf Erschließungssysteme Anwendung finden sollten. Als Manko der Arbeit mit dem DA-3 wurde erwähnt, dass innerhalb des Tools keine nachträglichen Korrekturen möglich sind, sondern diese nur in den Katalogen des jeweiligen Bibliothekssystems umgesetzt werden können.
Ein vergleichsweise geringfügiges Problem ist dagegen die Darstellung der RVK, die verbessert werden könnte, indem die Notation zukünftig vor der Klassenbenennung positioniert würde. Ferner wurde vorgeschlagen, das zur Signaturbildung genutzte Tool CutterJo der UB Eichstätt-Ingolstadt in den DA-3 zu integrieren. Außerdem wurde angeregt, methodisch korrekte Usability-Tests mit dem DA-3 durchzuführen, was bisher noch nicht geschehen sei. Keine eindeutige Antwort gab es auf die Frage nach den Kosten für die Nutzung des DA-3, da diese sich je nach Anwender unterschiedlich gestalten. Hier existieren unterschiedliche Verrechnungsmodelle, die mit den einzelnen Verbünden abgestimmt sind. Gegen Ende der Veranstaltung stellte Regine Beckmann den Entwurf für eine gemeinsame DA-3-Website inklusive Logo vor. Voraussichtlich Anfang 2022 wird die Website online abrufbar sein.
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung 4.0 International.
1 5. Workshop Computerunterstützte Inhaltserschließung, <https://wiki.dnb.de/pages/viewpage.action?pageId=217540739>, Stand: 05.02.2022.
2 Zum DA-3 vgl. Beckmann, Regine; Hinrichs, Imma; Janßen, Melanie u.a.: Der Digitale Assistent DA-3. Eine Plattform für die Inhaltserschließung, in: o-bib 6 (3), 2019, S. 1–20. Online: <https://doi.org/10.5282/o-bib/2019H3S1-20>.
3 Vgl. RVK als Normdatei, <https://rvk.uni-regensburg.de/aktuelles/laufende-projekte/145-rvk-als-normdatei>, Stand: 05.02.2022.
4 Vgl. dazu die Informationen im Wiki des OBV: Feld 655 Gattungsbegriffe für Belletristik, Kinder- und Jugendliteratur, <https://wiki.obvsg.at/Katalogisierungshandbuch/Kategorienuebersicht6554SE>, Stand: 05.02.2022.
5 Universität Wien: Universitätslehrgang Library and Information Studies, <https://bibliothek.univie.ac.at/ulg/>, Stand: 05.02.2022.
6 Österreichische Nationalbibliothek: Universitätslehrgang – Kurzinformation, <https://www.onb.ac.at/bibliothek/ausbildung/universitaetslehrgang>, Stand: 05.02.2022.
7 Universität Graz: Universitätslehrgang Library and Information Studies, <https://ub.uni-graz.at/de/ueber-uns/aus-und-fortbildungen/universitaetslehrgang/>, Stand: 05.02.2022.
8 Universität Innsbruck: Library and Information Studies – Grundlehrgang, <https://www.uibk.ac.at/weiterbildung/ulg/library-studies_gl/index.html.de>, Stand: 05.02.2022.
9 Z.B. 4L – Lifelong Learning for Librarians, <https://www.bibliotheksausbildung.at/4L/>, Stand: 05.02.2022.
10 Karlsruher Virtueller Katalog, <https://kvk.bibliothek.kit.edu/>, Stand: 05.02.2022.
11 malibu – Mannheim library utilities, <https://data.bib.uni-mannheim.de/malibu/>, Stand: 05.02.2022.
12 GBV: coli-conc, <https://coli-conc.gbv.de/>, Stand: 05.02.2022. Zum Mapping-Tool Cocoda vgl. Balakrishnan, Uma: DFG-Projekt coli-conc. Das Mapping Tool „Cocoda“, in: o-bib 3 (1), 2016, S. 11–16. Online: <https://doi.org/10.5282/o-bib/2016H1S11-16>.
13 Ein ähnliches Konkordanz-Projekt wurde 2014 auch im OBV durchgeführt mit dem Ergebnis von über einer halben Mio. angereicherten Titeldatensätzen, vgl. Plößnig, Veronika; Steiner, Christoph: Klassifikationen. Konkordanzen, Anreicherungsprojekte und RVK-Datenkorrekturen im Österreichischen Bibliothekenverbund (Folienpräsentation), <https://rvk.uni-regensburg.de/images/stories/Conf2014/ppt%20plnig_steiner-rvk-bk-12-11-2014.pdf>, hier Folien 11–21, Stand: 05.02.2022.
14 Vgl. dazu die Beiträge der Online-Fachtagung 2021 im Rahmen des Netzwerks maschinelle Verfahren in der Erschließung vom 18./19.11.2021, <https://wiki.dnb.de/display/FNMVE/Fachtagung+2021>, Stand: 05.02.2022.
15 Zum Mapping des Standard-Thesaurus Wirtschaft (STW) auf die Schlagwortnormdatei (SWD) vgl. ZBW: Standard-Thesaurus Wirtschaft (STW): Mapping zu Schlagwortnormdatei (SWD), <https://zbw.eu/stw/version/8.10/mapping/gnd/about.de.html>, Stand: 05.02.2022; zu CARMEN (Content Analysis, Retrieval and Metadata: Effective Networking) vgl. Tappenbeck, Inka; Wessel, Carola: CARMEN, in: Bibliotheksdienst 35 (5), 2001, S. 566–572; zum Projekt „Competence Center Modeling and Treatment of Semantic Heterogeneity“ (KoMoHe) vgl. Mayr, Philipp; Petras, Vivien: Building a terminology network for search: the KoMoHe project, in: Greenberg, Jane; Klas, Wolfgang (Hg.): Metadata for semantic and social applications. Proceedings of the International Conference on Dublin Core and Metadata Applications, 22–26 September 2008, Göttingen 2008, S. 177–182. Online: <https://nbn-resolving.org/urn:nbn:de:0168-ssoar-463874>; zu MACS vgl. Clavel-Merrin, Genevieve: MACS (Multilingual Access to Subjects). A virtual authority file across languages, in: Cataloging & classification quarterly 39 (1–2), 2004, S. 323–330.
16 National Library of Finland: Annif. Tool automated subject indexing and classification, <https://annif.org/>, Stand: 05.02.2022.
17 Vgl. ZBW: Automatisierung der Erschließung mit Methoden der künstlichen Intelligenz, <https://www.zbw.eu/de/ueber-uns/arbeitsschwerpunkte/automatisierung-der-erschliessung>, Stand: 05.02.2022.