Die Session „Forschungsdaten in den Fachdisziplinen“ auf dem Bremer Bibliothekartag
Ein Bericht
Die Veranstaltung „Forschungsdaten in den Fachdisziplinen” im Themenkreis 6 „Forschungsdaten und forschungsnahe Dienstleistungen“ des 109. Bibliothekartags fand am 18. Juni 2021 statt. Es war eine große Freude, sie digital moderieren zu dürfen. 175 Teilnehmende waren auf der Veranstaltungsplattform bei dieser Session dabei und auch die Technik spielte mit. So konnten die drei Referent*innen mit den Teilnehmenden zum fachspezifischen Forschungsdatenmanagement zusammengebracht werden. Auf Twitter gab es die einschlägigen Hashtags #bibtag21, #OpenScience und #Forschungsdatenmanagement, mit einigen Tweets zum interaktiven Austausch, über die Plattform des Bibliothekartags hinweg.
In wissenschaftlichen Bibliotheken ist es schon lange zu einer wichtigen Aufgabe geworden, die Forschenden aller Institute und Fachbereiche, so wie es den Erfordernissen der einzelnen Disziplinen am besten entspricht, zu unterstützen. Aufgrund der Heterogenität der Forschungsdaten und Forschungsmethoden mit seinen unterschiedlichen Forschungswerkzeugen („Tools“) ist der Umgang mit Forschungsdaten für die einzelnen Fächerkulturen immer ganz unterschiedlich. Die Vortragenden der Session, die sich über die generischen Dienste hinausgehend zu fachspezifischen forschungsnahen Dienstleistungen im Forschungsdatenmanagement (FDM) äußern sollten, waren drei Expert*innen, die sich in ihrem Alltag mit dem Forschungsdatenmanagement beschäftigen. So sprachen Harald Kaluza (Deutsches Institut für Erwachsenenbildung Bonn),1 Martin Walk (Technische Universität Berlin) und Susanne Blumesberger (Universität Wien)2 zu den folgenden Themen:
- Domain-Data-Protokolle für die empirische Bildungsforschung (“DDP-Bildung”): Unterstützung bei der Erstellung von FAIR Data
- aviDa, Entwicklung einer Forschungsdateninfrastruktur für audio-visuelle Daten der Qualitativen Sozialforschung
- Forschungsdaten in den Geisteswissenschaften - Bereits selbstverständlich oder doch noch etwas exotisch?
In allen drei Vorträgen setzte das disziplinspezifische Forschungsdatenmanagement am „Data Life Cycle“ an. Konkrete Handlungsfelder beziehen sich dabei auf Standards, Interoperabilität und Nachhaltigkeit der Forschungsprojekte bzw. der wissenschaftlichen Arbeiten, immer im Kontext der FAIR-Prinzipien. Mit Blick auf die in den Vorträgen behandelten drei Segmente Bildungsforschung, qualitative Sozialforschung und Geisteswissenschaften beschäftigte sich die Session mit der Frage, wie anderen bestmöglich die Forschungsdaten im Sinne von FAIR zur Verfügung gestellt werden könnten. Der erste Vortrag wird in diesem Bericht ausführlicher dargestellt, die beiden anderen nur knapp, da sie mit ausformulierten Fassungen in diesem Tagungsband vertreten sind.
Harald Kaluza ist Mitarbeiter der Bibliothek des Deutschen Instituts für Erwachsenenbildung (DIE). Er ist dort Referent für Forschungsinfrastrukturen und für das Forschungsdatenmanagement sowie für das Metadatenmanagement tätig. Der Verbund Forschungsdaten Bildung für die Erziehungswissenschaften bietet bereits erste disziplinspezifische Lösungen an, die auch weiterentwickelt werden. Die Empfehlungen der DFG-Fachkollegien sowie die Task Areas der NFDI3 aus den disziplinspezifischen Konsortien spielen dafür eine wichtige Rolle. In allen Fachdisziplinen gibt es aktuell verstärkt Diskussionen zu eigenen Forschungsdatenveröffentlichungen („Data Publications“), die auch durch die Leitlinien des DFG-Kodex von 2019 ausgelöst wurden.
Das in den wissenschaftlichen Bibliotheken mit dem Forschungsdatenmanagement beauftragten Personal begleitet die Forschungsprojekte, wie in allen drei Vorträgen deutlich wurde, unter anderem hinsichtlich der Nutzung von neuen Infrastrukturen. Außerdem ist es ganz wichtig, dass Bibliotheken, soweit es ihre Ressourcen zulassen, Forschende darin schulen, wie die entwickelten Forschungswerkzeuge und Infrastrukturen wie z.B. DDP-Bildung oder das im zweiten Vortrag vorgestellte aviDa für audiovisuelle Daten funktionieren – und zwar möglichst im „hands-on“-Verfahren. Standardprotokolle sind öffentliche, anpassbare und referenzierbare Protokolle, die technisch in einer Open-Source-Lösung für das Datenmanagement in der Bildungsforschung entwickelt wurden. Sie unterstützen beim Schreiben von Forschungsförderanträgen durch Angaben von Beschreibungen zur Datenqualität, Datenaufbereitung und Organisation der Arbeit im Kontext der FAIR-Prinzipien und Open Science. Die wichtige Rolle der aus der Arbeit der Entwickler resultierenden Use-Cases wurde im ersten Beitrag von Harald Kaluza deutlich, als er demonstrierte, wie es ist, wenn Anbietende und Nutzende von Infrastrukturen zusammengebracht werden, das Werkzeug anwenden und es gemeinsam verbessern können. Seit 2019 arbeitet Kaluza für das Projekt “Domain-Data-Protokolle für die empirische Bildungsforschung“ (Verbundprojekt DDP-Bildung).4 Mit den erstellten Muster-Standardprotokollen kann letztendlich eine Qualitätssicherung von Forschungsdaten stattfinden, denn öffentliche, anpassbare und referenzierbare Protokolle für das Datenmanagement in der Bildungsforschung sollen Ergebnisse des Projektes DDP-Bildung sein. Die Qualität der Forschungsdaten, ihre Aufbereitung, Dokumentation, Organisation sowie der Umgang mit rechtlichen Anforderungen und die FAIR-Prinzipien stehen für das Projekt DDP-Bildung im Mittelpunkt. Technisch sollen des Weiteren bald Protokolle mit dem Datenmanagementplan-Werkzeug Research Data Management Organizer (RDMO)5 erfolgen können. Projektpartner des Deutschen Instituts für Erwachsenenbildung, Leibniz-Zentrum für Lebenslanges Lernen (DIE) für “Domain-Data-Protokolle“ sind:
- Deutsches Institut für Wirtschaftsforschung (DIW) / Soziooekonomisches Panel (SOEP)
- Deutsches Jugendinstitut (DJI)
- Deutsches Zentrum für Hochschul- und Wissenschaftsforschung (DZHW)
- Institut zur Qualitätsentwicklung im Bildungswesen - Wissenschaftliche Einrichtung der Länder an der Humboldt Universität zu Berlin (IQB)
- Leibniz-Institut für Astrophysik Potsdam (AIP)
- Leibniz-Institut für Bildungsforschung und Bildungsinformation (DIPF)
- Leibniz-Institut für Bildungsverläufe (LIfBi)
- Leibniz-Institut für Psychologie (ZPID)
- Qualiservice, Universität Bremen
- Zentrum für Lehrerbildung und Bildungsforschung (ZeLB), Universität Potsdam
Die Ausgangslage zum Projekt DDP und der aktuelle Stand wurden beim Bibliothekartag geschildert. Dabei wurde die Domäne Bildungsforschung vorgestellt und näher erläutert, was ein Domain Data Protocol ist, welche Elemente es besitzt und wie es technisch umgesetzt werden kann. Auf der ersten Präsentationsfolie wurde ein leicht verwirrter Wissenschaftler gezeigt, der sich mit den Drittmittelgebern, den Fachgesellschaften und mit den Anforderungen an Reproduzierbarkeit, Nachnutzung, dem Schreiben eines Datenmanagementplans (DMP), FAIRen Daten und der Transparenz konfrontiert sieht. Für ihn ist in der Bildungsforschung eine große Bandbreite an Forschungsdatentypen in unterschiedlichen Dateiformaten, beispielsweise Texte, Video und Audio, Bilder vorhanden. Informationen darüber soll er in Datenmanagementplänen notieren und anpassen, denn ein Datenmanagementplan, z.B. mit RDMO, strukturiert den Umgang mit Forschungsdaten. Darin kann der Wissenschaftler seinen Umgang mit den Daten beschreiben. Die DDP-Protokolle helfen sehr gut, weil sie schon vorgefertigte Antwortoptionen der Fragen in der Bildungsforschung vorstellen. Der Unterschied zu den herkömmlichen Datenmanagementplänen mit RDMO ist bei DDP also, dass Wissenschaftler*innen hier Anwendungsfälle sehen, an denen sie sich orientieren können. „Beim DDP muss man eine typische Fragerunde über sich ergehen lassen“, so der Referent. Die Protokolle fragen nach allen Aspekten des FDM von der Generierung, methodischen Vorgehensweisen bis hin zur Datenpublikation und wie der Forschende für sein Projekt dabei verfahren wird. Bei der Frage nach der Forschungsmethodik können einfach vordefinierte Antworten angekreuzt werden, eine Mehrfachnennung ist außerdem möglich, z.B. in einer Frage danach, wie die Daten erhoben werden, zum Beispiel Paper & Pencil, computergestützt (offline), per Telefon, online, qualitative Befragungen (Interviews) und Experimente.
Im Research Data Management Organiser (RDMO) wird also eine eigene DDP-App umgesetzt. Sehen die Forschungsförderer, dass sich das Projekt nach den DDP-Vorgaben richtet, so können sie davon ausgehen, dass die entsprechenden Anforderungen an das FDM anhand der FAIR-Kriterien gewährleistet sind (Stichwort: Datenqualität). Auch ein „Data Ingest“ in ein geeignetes Repositorium kann mit DDP beschleunigt werden, da die Einhaltung der FAIR-Kriterien leicht zu überprüfen ist. Es gab im Anschluss an diesen spannenden Vortrag eine Frage nach der rechtlichen Beratung: Im Projekt ist diese durch Fachanwält*innen gewährleistet. Später sollen die Rechtsthemen im Datenmanagement, im Sinne der Nachhaltigkeit, an den Verbund „Forschungsdaten Bildung“ angebunden sein, so lautete die Antwort. Im Chat wurde angemerkt, dass die Forschenden tatsächlich nach Mustern suchen, an denen sie sich orientieren können, Vorlagen, usw. Dies bestätigt den Ansatz aus dem Projekt DDP.
Im zweiten Beitrag stellte Martin Walk von der Universitätsbibliothek der Technischen Universität Berlin, das Projekt und gleichnamige Forschungsdatenzentrum aviDa,6 die Entwicklung einer Forschungsdateninfrastruktur für audiovisuelle Daten der qualitativen Sozialforschung, vor. Er hatte den Vortrag zusammen mit Ulrike Golas7 eingereicht. Darin erklären sie, dass das Projekt aviDa in seiner ersten Phase die Entwicklung einer Forschungsdateninfrastruktur für die digitale Sicherung und Nachnutzung audio-visueller Forschungsdaten beinhaltet. Die im DSpace-Repositorium „DepositOnce“der TU Berlin gespeicherten Forschungsdaten werden aus dem ethnografischen Feld heraus generiert, z.B. aus Feldaufenthalten wie Sportevents (Daten aus dem Videostreaming). Nach der Folienpräsentation wurden in der Diskussionsrunde technische Fragen zum Zugriff gestellt. So richtet sich das Projekt nach den nestor-Standards der digitalen Langzeitarchivierung.
„Forschungsdatenmanagement in den Geisteswissenschaften - Bereits selbstverständlich oder doch etwas exotisch?“, lautete schließlich der dritte Titel, ein Vortrag der Germanistin Susanne Blumesberger, die seit 2007 an der Universität Wien und der Universitätsbibliothek Wien im Bereich Forschungsdatenmanagement tätig ist. Forschende in den Geisteswissenschaften, die zu ihr in die Beratung kommen, fragen sie häufig nach den folgenden Informationen zum Umgang mit Forschungsdaten für eine Publikation und nach Beschreibungen von Daten und Metadaten.
Neben der Informationsversorgung mit wissenschaftlich relevanter Literatur und Fachinformationen bietet die Universitätsbibliothek Wien deshalb vielfältige, neue forschungsnahe Dienste, wobei das FDM dabei nur ein Teil des gesamten Serviceportfolios8 darstellt – neben anderen Diensten wie Bibliometrie, Doktorandenworkshops, Digitalisierungsservices, Vergabe von DOIs sowie Beratung zu Open Access, um nur einige zu nennen. Eine Strategie für ein aktives FDM an der Universität Wien, gerade für die Geisteswissenschaften, ist die Netzwerkbindung, d.h. nutzbare Synergien lokaler, regionaler und globaler Akteure im Forschungsdatenmanagement durch Best Practices weiter zu entwickeln, um dabei Doppelarbeit und Parallelentwicklungen zu vermeiden.
Ein wichtiges Ergebnis der Session war, dass die wissenschaftlichen Bibliotheken neben den generischen Angeboten zum Forschungsdatenmanagement immer auch zu zusätzlichen, fachspezifischen Services vermitteln können müssen. Dabei können unterschiedliche Werkzeuge für einzelne Fächer zum Einsatz kommen, wie eben das Werkzeug DDP-Bildung oder die Forschungsdateninfrastruktur aviDA. Die Fachdisizplinen, wie die Bildungsforschung oder die Geisteswissenschaften, haben jeweils ganz unterschiedliche Anforderungen an das Forschungsdatenmanagement mit ihren heterogenen, disziplinspezifischen Datenformaten. Dabei gilt es für die audiovisuellen Daten aus dem Feld die bestmöglichen Forschungsdateninfrastrukturen für die qualitative Sozialforschung und Videokorpora bereitzustellen, um die Videographien teilen zu können und sie auch anderen Forschenden zugänglich zu machen.
Die Session beim Bibliothekartag hat außerdem gezeigt, dass die entwickelten Angebote und Lösungen für die drei Disziplinen und darüber hinaus, immer darauf abzielen, Forschungsdaten im Sinne von Open Science für die Nachnutzung zu öffnen, sofern es datenschutzrechtlich und ethisch möglich ist. Für Wissenschaftler*innen ist es immer sehr hilfreich, wenn sie Muster zur Orientierung haben, sei es im Bereich der Datenmanagementpläne, Repositorien oder in Form von Use Cases, um aus den bereits gemachten Erfahrungen lernen zu können. Eine einzige „all-round“-Standardlösung für das generische Forschungsdatenmanagement gibt es nicht, wie wir hier gesehen haben und wird es auch nie geben, aber Werkzeuge aus einer Disziplin, die in Projekten entstehen, können interdiziplinär angepasst und in Folgeprojekten weiterentwickelt und schließlich verstetigt werden.
3 Task areas sind einzelne Aufgabenbereiche in den NFDI Konsortien, so wie Datenzugang, Standards für Datenproduzierende und Datennutzende und technische Aufgaben.
4 Weitere Informationen zum Projekt unter <https://ddp-bildung.org/>, Stand: 15.09.2021.
5 RDMO unterstützt durch generische oder individuelle Fragenkataloge die Forschungsplanung und den Forschungsprozess strukturiert: https://rdmorganiser.github.io/.
6 Informationen zum Projekt unter <https://www.soziologie.uni-bayreuth.de/de/bereiche/kultur-und-religionssoziologie/forschung/aviDa/index.html>, Stand: 15.09.2021.
8 Überblick unter <https://bibliothek.univie.ac.at/forschungsunterstuetzung/>, Stand: 15.09.2021.