Digitalisierung der Forschung – Forschungsdaten im Fokus
Seit Kurzem muss jedes Forschungsprojekt einen Datenmanagement-Plan vorlegen. Dies bedingt neue Jobs und den Aufbau verschiedener Infrastrukturen zur Verwaltung und Erhaltung von Forschungsdaten. Institutionen müssen die Wissenschaftlerinnen und Wissenschaftler bei der systematischen Erfassung von Daten unterstützen und ihnen auch einen einfachen und schnellen Zugang zu vorhandenen Daten ermöglichen.
Text: Niklaus Stettler / Bild: kursiv, Research Data Netherlands (Quelle)
Im März dieses Jahres hat der Schweizerische Nationalfonds eine Weisung erlassen, wonach künftig jedes Forschungsprojekt einen Datamanagement-Plan vorlegen muss. Damit setzt der Nationalfonds eine Massnahme um, die in anderen Ländern bereits seit einigen Jahren in Kraft ist.
Warum diese Auflage, die von vielen Forschenden nur als zusätzlicher administrativer Aufwand wahrgenommen wird? Verschiedene Gründe sprechen dafür, einen sorgfältigeren und systematischeren Umgang mit Forschungsdaten einzufordern.
Erwähnt sei zuerst der finanzielle Aspekt. Daten zu erheben ist meist mit grossem Aufwand verbunden. Viele Daten haben das Potenzial für eine Sekundärnutzung. Werden die Daten aber nicht sorgfältig verwaltet, entfällt diese Möglichkeit und es müssen erneut Daten erhoben werden. In verschiedenen wissenschaftlichen Disziplinen ist die Nachnutzung von Forschungsdaten längst etabliert. Zu erwähnen sind hier insbesondere naturwissenschaftliche Disziplinen wie die Astronomie oder die Biodiversitätsforschung. Aber auch in den Sozialwissenschaften gibt es eine lange Tradition, auf Daten älterer Projekte zurückzugreifen. Deutlich anders stellt sich die Situation z. B. in den Geisteswissenschaften dar. Werden Daten systematisch verwaltet, wird auch in diesen Wissenschaften eine Nachnutzung von Daten möglich, was die Forschung befruchtet und zugleich Mittel einspart.
Für die Forschungsförderungsinstitutionen wichtig ist auch der Qualitätssicherungsaspekt. Immer wieder wird publik, dass Forschende Daten manipuliert haben. Die Versuchung, Daten zu schönen, ist aufgrund des immensen Publikationsdrucks, unter dem die Forschenden stehen, gross. Forschungsförderungsinstitutionen wie der Nationalfonds haben allen Grund, qualitätssichernde Massnahmen einzufordern.
Lange haben dazu die etablierten Peer-Review-Verfahren durchaus ausgereicht. Doch je aufwändiger die Erhebung von Daten wird, desto schwieriger ist es, die Forschungsresultate auch wirklich zu überprüfen. Ja, in der Realität ist es oftmals nicht mehr möglich, ein Forschungsresultat zu reproduzieren. Letztlich wird dadurch die Glaubwürdigkeit der Forschung selbst in Frage gestellt. Zumindest in gewissem Masse kann dem entgegengewirkt werden, wenn die Daten vorliegen. So gelingt es zwar nicht, die Datenproduktion zu verifizieren, doch immerhin wird überprüfbar, ob der Auswertungsprozess nachvollziehbar ist.
Der zweite Grund, warum die Publikation der Daten je länger desto öfter eingefordert wird, ist finanzieller Natur.
Forschungsdaten als Gegenstand des Swissuniversities-Programms «Wissenschaftliche Information»
Lange Zeit wurde die Verwaltung der Forschungsdaten weitgehend den forschenden Institutionen überlassen. Wo Nachnutzungen etabliert sind, haben sich institutionelle oder disziplinäre Datenzentren herausgebildet. Erwähnt seien beispielsweise das Datenzentrum der ETH, dasjenige des Biozentrums der Universität Basel oder FORS, das Schweizer Kompetenzzentrum Sozialwissenschaften. Trotzdem muss konstatiert werden, dass Forschungsdaten grossmehrheitlich eher verloren gehen denn erhalten werden. Um diesem Missstand zu begegnen, hat die Rektorenkonferenz der Schweizer Hochschulen, Swissuniversities, im Programm «Wissenschaftliche Information» den Forschungsdaten einige Aufmerksamkeit gewidmet. Gleich mehrere Projekte widmen sich dem Aufbau einer Infrastruktur zur Verwaltung und Erhaltung der Daten.
Zu Ergänzung dieser Infrastrukturprojekte hat das Schweizerische Institut für Informationswissenschaft (SII) zusammen mit Kolleginnen und Kollegen der HEG (Genf) das Projekt «Train2Dacar», ein Schulungsprogramm für Forschungsdatenmanagerinnen und -manager, lanciert. In Basismodulen haben wir Informationsfachleute in den Bereich Datenmanagement eingeführt. Auf Wunsch der Programmleitung haben wir zudem spezielle Aufbaumodule zu geisteswissenschaftlichen Daten angeboten. Zudem haben wir einen Kurs für Personen entwickelt, die in ihren Institutionen ein eigenes Schulungsangebot aufbauen wollen. Mehr als 200 Interessierte haben an den Kursen teilgenommen. Aufbereitet zu eLearning-Einheiten, stellen wir die Inhalte auch weiteren Interessierten zur Verfügung: www.researchdatamanagement.ch.
Den vorläufigen Abschluss unseres Projekts bildete ein Symposium in Zürich, in dessen Rahmen wir unsere eLearning-Einheiten vorgestellt haben. Ein Data Librarian, eine Datenkuratorin, ein Data Archivist, ein Datenmanager, ein Data Scientist und ein Datenjournalist vermittelten zudem Einblicke in ihre Tätigkeiten.
Sowohl in den Kursen als auch anlässlich des Symposiums und der Projektpräsentation an der Research-Data-Alliance-Tagung in Berlin und den Digital Humanities Days in Bern entwickelten sich rege Diskussionen, die verdeutlichten, dass die Etablierung des Forschungsdatenmanagements einen wesentlichen Schritt zur digitalen Transformation der Forschungsorganisation darstellt.
Digitale Transformation in der Forschung
Im Grunde sind wir mit einem «harmlosen» Projekt gestartet. Nicht viel mehr wollten wir, als Interessierten zu vermitteln, warum Forschungsdaten erhalten, verwaltet und zur Verfügung gestellt werden sollten. Unsere Überzeugung war es zu Beginn noch, dass dies eine «kleine» Zusatzaufgabe z. B. für Hochschulbibliotheken sein könnte, die neben Dokumenten (Bücher und wissenschaftliche Papers) auch Datensätze verfügbar halten könnten.
Im Laufe der Kurse haben wir uns mit zahlreichen Datenmanagerinnen und Datenmanagern im In- und Ausland ausgetauscht. Je länger desto deutlicher wurde dabei, dass die Erhaltung der Daten völlig neue Formen der Zusammenarbeit zwischen dem Informationsdienstleister (der Bibliothek, dem künftigen Datenzentrum) und den Forschenden bedingt. Nur im intensiven Austausch mit den Forschenden wird es gelingen, die Daten so zu bewirtschaften, dass diese für Interessierte auch wieder aufgefunden und verarbeitet werden können.
Es müssen sich Institutionen herausbilden, welche die Wissenschaftlerinnen und Wissenschaftler bei der systematischen Erfassung der Daten unterstützen – genauso, wie sie ihnen einen einfachen und schnellen Zugang zu vorhandenen Daten ermöglichen müssen. Im europäischen Kontext experimentieren bereits zahlreiche Institutionen mit dieser neuen Rolle. So bietet z. B. Textgrid, ein Datenzentrum für die Digital Humanities in Deutschland, verschiedene Tools zur Unterstützung des Forschungsprozesses an. FORS dagegen hält ein Tool zur Erstanalyse von Datenbeständen bereit und ermöglicht so einen relativ raschen Zugang, um abzuklären, ob sich ein Datensatz für die Nachnutzung eignet.
Die beiden Beispiele zeigen deutlich: Nebst der Archivierungsmöglichkeit für ihre Daten benötigen die Forschenden Tools, um diese Daten anderen zur Verfügung zu stellen oder um fremde Daten zu nutzen. Wer welchen Part im komplexen Prozess des Forschungsdatenmanagements übernehmen soll, ist noch keineswegs geklärt. Institutionen wie Hochschulbibliotheken und -archive müssen sich positionieren. Vielleicht bilden sich aber auch eigenständige Datenzentren heraus, die Teile dieser Aufgaben übernehmen.
Sollen die Daten erhalten und zur Verfügung gestellt werden, werden auch neue Berufe entstehen. Ein Data Librarian wird sich der anspruchsvollen Aufgabe widmen, Datensätze so zu beschreiben, dass sie wieder auffindbar werden. Eine Datenkuratorin dagegen bereitet die Daten so auf, dass sie für eine Nachnutzung – vielleicht heute, vielleicht erst in 50 Jahren – geeignet sind. Der Datenwissenschaftler spezialisiert sich auf die Auswertung der Daten im wissenschaftlichen Kontext, während die Datenjournalistin deren Aufbereitung für eine breitere Öffentlichkeit vornehmen wird. Viele neue Jobs entstehen so, und es werden sich möglicherweise ganz neue Institutionen herausbilden. Die bestehenden Institutionen müssen auf die neuen Herausforderungen ebenso reagieren wie die Ausbildungsstätten. Die Stärkung der Datenkompetenz unserer Absolventinnen und Absolventen ist uns daher am SII ein grosses Anliegen.
Mit dem Projekt «Train2Dacar» ist uns ein erster Schritt gelungen. Viele Teilnehmende haben dabei eine «Lust auf Daten» entwickelt.
Beitrag von
Professor für Archivwissenschaft und Records Management, Leiter, Schweizerisches Institut für Informationswissenschaft (SII)