[:de]Warum Forschungsdaten ein Thema für wissenschaftliche Bibliotheken sind[:en]Why research data is a matter for academic libraries[:]
[:de]Forschungsrelevante Informationen und Ergebnisse wissenschaftlichen Arbeitens zu sammeln, zugänglich zu machen und zu bewahren – das sind seit jeher Aufgaben wissenschaftlicher Bibliotheken. Im Mittelpunkt stehen dabei seit langem formale Publikationen wie Zeitschriftenartikel oder Monographien. Diese werden ergänzt durch Dokumente und Quellen, die als Teil von Nachlässen in Bibliotheken gelangen und ursprünglich nicht publiziert wurden.
Obwohl Zeitschriften und Monographien seit Jahren intensiv digital genutzt werden, klingt das ein wenig nach endlos langen Regalen mit aufgereihten Büchern und Archivschränken, die selten einen Nutzenden sehen. Oder haben Sie jetzt gerade an Innovation gedacht? Und doch: Im direkten Zusammenhang mit diesen klassischen Aufgaben entstehen neue und neuartige Anforderungen. So verlangt der Erhalt digitaler Forschungsdaten nach Lösungen, die u. a. aus technischer Sicht innovativ in Ausrichtung und Umsetzung sind. Mit einer Reihe von Blogbeiträgen möchten wir daher anhand der Erfahrungen der ETH-Bibliothek Einblick in die Welt des digitalen Datenerhalts geben. Besondere Aufmerksamkeit gilt dabei digitalen Forschungsdaten die an Hochschulen anfallen. Den Anfang macht dieser Beitrag mit einer generellen Standortbestimmung.
In den vergangenen Jahren ist das Bewusstsein stetig gewachsen, dass der öffentlich zugängliche Forschungsoutput nur einen Teil der wissenschaftlichen Tätigkeit abbildet. Er ist sozusagen die Spitze eines Eisbergs aus wissenschaftlich verdichteter Information und beschreibt das gewonnene Wissen. Gleichzeitig bleiben riesige Mengen an Rohdaten oder in unterschiedlicher Art und Weise bearbeitete Daten meist unsichtbar, aus denen die publizierten wissenschaftlichen Erkenntnisse gezogen wurden.
Abbildung 1: Schematische Darstellung der Informationsverdichtung im Forschungsprozess
Die Verdichtung von Rohdaten hin zur „lesbaren“ Publikation war und ist ein grundlegender Faktor in der wissenschaftlichen Kommunikation. Im Zuge der digitalen Transformation nimmt die technologische Durchdringung wissenschaftlicher Prozesse jedoch stetig zu. Die Reduktion auf wenige Textseiten wird daher von Forschenden zunehmend als Einschränkung empfunden, und zwar sowohl in ihrer Rolle als Autorinnen und Autoren als auch in ihrer Rolle als Lesende, die wissenschaftliche Veröffentlichungen rezipieren. Denn durch die technischen Möglichkeiten digitale Datenmengen zu sammeln und nach Bedarf auszutauschen, bietet sich die Chance, publizierte Resultate transparenter zu dokumentieren und nachvollziehbarer zu machen. Das wiederum begünstigt institutionsübergreifende, wissenschaftliche Forschungsprozesse.
Transparenz und Nachvollziehbarkeit sind keine neue Forderungen. Sie sind Grundpfeiler der wissenschaftlichen Arbeitsweise, die per definitionem überprüfbar sein muss. Verändert haben sich vor allem die Menge und die Bedeutung digitaler Daten. Die Rohdaten müssen zumindest für eine gewisse Zeit greifbar bleiben – so sehen es z. B. seit Jahren auch die Richtlinien der ETH Zürich für die gute wissenschaftliche Praxis vor. Es liegt jedoch nahe, einen Schritt weiter zu gehen. Denn die einmal gemessenen oder erhobenen Daten langfristig verfügbar zu machen, ermöglicht eine spätere Nachnutzung bei der Beantwortung neuer Fragestellungen oder auch die zusätzliche Auswertung mit neuen, vielleicht effektiveren Methoden.
Abbildung 2: Vereinfachte schematische Darstellung des Lebenszyklus‘ digitaler Forschungsdaten
Beide Aspekte – Nachvollziehbarkeit und Nachnutzung – sind darüber hinaus Anforderungen, die Forschungsförderinstitutionen verstärkt an die Verantwortlichen der von ihnen unterstützten Forschungsvorhaben stellen. Hochschulen und Forschungseinrichtungen unterstützen dieses Anliegen ebenfalls. Wissenschaftlerinnen und Wissenschaftler sind daher mit höheren Erwartungen konfrontiert, die sie sinnvoll beantworten müssen. Diese Erwartungen sind zum Teil wissenschaftlicher Natur, etwa wenn Forschungsdaten von den Forschenden selbst so beschrieben und dokumentiert werden müssen, dass eine wissenschaftlich seriöse Nachnutzung möglich wird. Es fallen aber auch in grösserem Umfang Aufgaben an, die von Forschenden zwar durchaus bewältigt werden können, deren Erfüllung aber in den meisten Fällen zu Lasten ihres „Kerngeschäfts“ in Forschung und Lehre geht.
Es ist daher Aufgabe von Infrastruktureinrichtungen für Forschung und Lehre, Wissenschaftlerinnen und Wissenschaftler von diesen Aufgaben zu entlasten oder sie zumindest bei der Erfüllung zu unterstützen. Die Entscheidung darüber, welche Daten für welche Zeiträume aufbewahrt werden sollen, muss dabei innerhalb gesetzlicher Grenzen oder innerhalb des von den Richtlinien der jeweiligen Institution gesteckten Rahmens bei den Forschenden bleiben.
Welche Rolle können Bibliotheken in diesem erweiterten Verständnis von wissenschaftlicher Information, also beim Umgang mit Forschungsdaten, konkret übernehmen? Dieser Frage wird ein späterer Beitrag im Innovationsblog nachgehen.
Autor: Matthias Töwe
Dieses Werk unterliegt einer Creative Commons Attribution-ShareAlike 4.0 International Public License.
[:en]Collecting, storing and providing research-relevant information and the fruits of academic work – these have always been tasks for academic libraries. Formal publications such as journal papers or monographs have long played a central role here, supplemented by documents and sources that enter libraries as part of personal papers and were not originally published.
Although digital journals and monographs have been used intensively for years, this still conjures up images of endlessly long shelves with row upon row of books and archive cases that users seldom get to see. Or did innovation immediately spring to mind? Sure enough, these classical tasks directly give rise to new and novel demands. The curation of digital research data, for instance, calls for solutions that, from a technical perspective, are innovative in terms of their orientation and realisation. We would therefore like to provide a glimpse into the world of digital curation with a series of blog entries based on ETH-Bibliothek’s experiences. In doing so, we especially focus on digital research data that is generated at universities. This article gets the ball rolling with a general stocktake.
In recent years, there has been greater awareness that the publicly accessible research output only constitutes one aspect of academic activity. It is effectively the tip of an iceberg composed of scientifically condensed information and describes the knowledge gained. At the same time, vast quantities of raw data or data that has been processed in different ways and from which the scientific findings published were derived mostly remain hidden.
Figure 1: illustration of the information density in the research process
Boiling raw data down to a “readable” publication was – and still is – a crucial factor in scientific communication. In the course of the digital transformation, however, the technological penetration of scientific processes has constantly been on the rise. Researchers therefore increasingly perceive the reduction to few text pages as a constraint – in both their roles as authors and readers who receive academic publications. After all, thanks to the technical possibilities of collecting volumes of digital data and exchanging it as required, there is an opportunity to document published results more transparently and render them more comprehensible. This, in turn, facilitates cross-institutional, academic research processes.
As demands, transparency and comprehensibility are nothing new. They are cornerstones of academic practice, which by definition needs to be verifiable. The amount and significance of digital data has especially changed. Raw data needs to remain tangible for a certain time at least – as stipulated by ETH Zurich’s guidelines for good scientific practice. However, it seems logical to go one step further. After all, making the data – once measured or recorded – available in the long term facilitates its subsequent re-use when it comes to answering new questions or even the additional utilisation of new, perhaps more effective methods.
Figure 2: simplified illustration of the lifecycle of digital research data
Moreover, both aspects – comprehensibility and re-use – are requirements that research-funding institutions increasingly place on those responsible from the research projects they back. Universities and research facilities also champion this cause. Scientists are thus confronted with greater expectations, which they have to respond to fittingly. These expectations are partly of a scientific nature, such as when research data has to be described and documented by the researchers themselves in such a way as to enable its serious academic re-use. To a greater extent, however, tasks also emerge that researchers are more than capable of performing, but usually at the expense of their “core business” in research and teaching.
It is therefore the responsibility of infrastructural facilities for research and teaching to relieve scientists of these duties or at least help perform them. The decision as to which data should be retained for how long must remain with the researchers, albeit within the legal boundaries or the framework laid down in the guidelines of the individual institution.
What specific role can libraries assume in this broader understanding of academic information, i.e. in handling research data? A subsequent entry on the innovation blog will examine this question.
Author: Matthias Töwe
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International Public License.
[:]