[:de]docuteam packer: einfaches Tool für die Wissenschaft [:en]docuteam packer: simple tool for science [:]

[:de]Das Tool docuteam packer unterstützt Forschende dabei, ihre Dateien einfach zu strukturieren und mit Metadaten zu versehen. Dadurch wird eine automatische Übergabe an das ETH Data Archive ermöglicht. Insgesamt gibt es an der ETH Zürich drei Wege, um Daten im ETH Data Archive zu archivieren:

  1. Einmaliger Upload
    Am einfachsten ist der einmalige Upload über ein Webformular, der zum Beispiel für die Veröffentlichung von “Supplementary Material” zu einer Publikation genutzt werden kann. Auch wenn in diesem Fall ein Paket mit mehreren Dateien geladen wird, kann nur dem Gesamtpaket eine Beschreibung mit Metadaten zugeordnet werden.
  2. Regelmässiger Upload oder grössere Datenmengen
    Für die regelmässige Ablieferung von ähnlich strukturierten Daten oder überhaupt von grösseren Datenmengen eignet sich eine so genannte Submission Application. Sie führt weitgehend automatisch vorhandene Metadaten und Dateien aus bestehenden Quellen zusammen und übergibt sie in einer geeigneten Struktur an das ETH Data Archive. Da ein gewisser Entwicklungs- und Anpassungsaufwand für die Schnittstelle nötig ist und bereits Metadaten vorliegen müssen, eignet sich diese Methode vor allem für regelmässige oder Massenprozesse.
  3. Strukturiertes Sammeln von Daten im docuteam packer für die spätere Archivierung
    Zwischen den beiden zuerst genannten Methoden gibt es eine Lücke, die der docuteam packer schliesst: Zu einer Dissertation werden z.B. Daten über mehrere Jahre gesammelt und im Idealfall frühzeitig dokumentiert. In der Regel wird die Datensammlung aber erst am Ende der Arbeit abgeschlossen und gemäss den Vorgaben der Forschungsgruppe archiviert. Das Tool docuteam packer unterstützt diesen Prozess als Viewer und Editor.

Das Tool docuteam packer

Der docuteam packer ist eine Java-Anwendung, die von den Anwendern ohne Installation lokal ausgeführt werden kann. Die Anwendung erlaubt den Import von Ordnerstrukturen vom eigenen Dateisystem sowie den manuellen Aufbau von Strukturen aus Dateien und Ordnern. Auch ist es möglich, z.B. innerhalb einer Forschungsgruppe ein Template vorzugeben, in dem Doktorierende ihre Dateien erfassen und strukturieren können.

oberflaeche_docuteam-packer_k

Abbildung 1: Oberfläche des docuteam packer im Überblick

ordnerstruktur

Abbildung 2: Ausschnitt aus einer Ordnerstruktur im docuteam packer

Auf jeder Ebene können Metadaten eingetragen werden, das heisst Dateien und Ordner können beschrieben werden. Um diesen Prozess zu unterstützen, können Angaben, die für alle Elemente gelten sollen, auch von der obersten Stufe auf alle Inhaltsobjekte vererbt werden. Zusätzlich werden die Dateinamen in die Metadaten übernommen.

medadatenfenster

Abbildung 3: Ausschnitt Metadatenfenster im docuteam packer

Eine besonders hilfreiche Funktion ist die automatische Reservierung von Digital Object Identifiern (DOI) bereits bei der Datenerfassung. Diese sind zwar naturgemäss noch nicht aktiviert, solange Daten nur lokal gespeichert sind. Die späteren DOI sind den Forschenden aber so bereits bekannt und können beispielsweise in einem Manuskript zitiert werden.

Sobald Forschende im docuteam packer die Ablieferung eines kompletten Pakets oder von Teilen davon an das ETH Data Archive auslösen, wird ein Paket aus Metadaten und Dateien gebildet und für die Archivierung aufbereitet. In der Folge werden DOI beim internationalen Konsortium DataCite registriert und damit aktiv.

doi-url

Abbildung 4: Eingabe einer DOI-URL in einer Browser Adressleiste

files-im-eth-datad-archive

Abbildung 5: Zugriff auf Files im ETH Data Archive. Die Files wurden in diesem Fall direkt via DOI-URL aufgefunden.

Ziel der Erfassung im docuteam packer ist die spätere Archivierung im ETH Data Archive. Metadaten werden unter anderem im Wissensportal der ETH-Bibliothek sichtbar und über weitere Kanäle international gestreut, unter anderem auch über den Data Citation Index von Web of Science sowie über DataCite.

medaten_aufnahme

Abbildung 6: Metadaten-Aufnahme der Forschungsdaten im Wissensportal der ETH Bibliothek Zürich

Kommt der docuteam packer für mich in Frage?

Der docuteam packer wird für MacOS und Windows unterstützt und kann grundsätzlich auch unter Linux genutzt werden. Er wird bei Bedarf gezielt für eine Forschungsgruppe konfiguriert und ausgeliefert.

Das Arbeiten mit dem docuteam packer funktioniert am besten mit Datenpaketen mit einer Grösse von bis zu 2 GB. Die Handhabung und Installation der Anwendung gestalten sich in der Regel sehr einfach. Wir werden in diesem Blog in Kürze ein anschauliches Beispiel vorstellen, wie eine Forschungsgruppe ihr eigenes Datenarchiv mit Hilfe des docuteam packer in das ETH Data Archive überführt.

Weitere Angaben zur Verwendung des docuteam packer finden Sie auf der Website der Fachstelle Digitaler Datenerhalt.


Dieses Werk unterliegt einer Creative Commons Attribution-ShareAlike 4.0 International Public License.

CC-BY-SA[:en]The tool docuteam packer helps researchers structure their files in a straightforward way and provide them with metadata, which enables them to be transferred automatically to the ETH Data Archive. At ETH Zurich, there are three ways to archive data in the ETH Data Archive:

  1. One-off upload
    The easiest is the one-off upload via a web form, which can be used to publish supplementary material on a publication, for instance. Even if a package containing several files is loaded, a description with metadata can only be assigned to the entire package.
  2. Regular upload or larger quantities of data
    A so-called “submission application” is just the ticket for the regular delivery of similarly structured or even larger quantities of data. It combines available metadata and files largely automatically and transfers them to the ETH Data Archive in a suitable structure. As developing and adjusting the interface takes a certain amount of effort and metadata needs to be available beforehand, this method is primarily suitable for regular or mass processes.
  3. Structured collection of data in docuteam packer for subsequent archiving
    There is a gap between the first two methods mentioned which the docuteam packer plugs: data on a dissertation, for instance, is collected over several years and ideally documented early on. However, the data acquisition is not usually completed until the end of the project and archived in accordance with the standards of the research group. The docuteam packer tool supports this process as a viewer and editor.

The docuteam packer tool

docuteam packer is a Java application which users can implement locally without any installation. The application enables file structures to be imported from the user’s own file system and structures comprising files and folders to be established manually. It is also possible to predetermine a template within a research group, for instance, in which doctoral students can create and structure their files.

oberflaeche_docuteam-packer_k

Figure 1: docuteam packer interface at a glance

ordnerstruktur

Figure 2: Extract from a folder structure in docuteam packer

Metadata can be entered, i.e. files and folders described, at any level. In order to support this process, information meant to apply to all elements can be passed down from the top level to all content objects. The file names can also be adopted in the metadata.

medadatenfenster

Figure 3: Extract from the metadata window in docuteam packer

One particularly helpful function is the automatic reservation of digital object identifiers (DOI) during data acquisition. Although these are naturally not yet activated as long as data is only saved locally, the subsequent DOIs are already known to researchers and can be cited in a manuscript, for instance.

As soon as researchers trigger the delivery of a partial or complete package to the ETH Data Archive in docuteam packer, a package of metadata and files is formed and prepared for archiving. DOIs are subsequently registered with the international consortium DataCite and thus become active.

doi-url

Figure 4: Entry of a DOI-URL in a browser address bar

files-im-eth-datad-archive

Figure 5: Accessing files in the ETH Data Archive. In this instance, the files were found directly via the DOI-URL.

The aim of recording in docuteam packer is the subsequent archiving in the ETH Data Archive. Metadata is displayed on ETH-Bibliothek’s Knowledge Portal and disseminated internationally via other channels, including the Data Citation Index by Web of Science and via DataCite.

medaten_aufnahme

Figure 6: Recording metadata on research data on ETH-Bibliothek’s Knowledge Portal

Is docuteam packer an option for me?

docuteam packer is supported by MacOS and Windows and can basically be used on Linux, too. If need be, it can be configured and delivered specifically for a research group.

Working with docuteam packer works best with a size of up to 2 GB. The application is normally very straightforward to handle and install. We will shortly present a vivid example of how a research group can transfer its own data archive to the ETH Data Archive with the aid of docuteam packer in this blog.

Further information on using the docuteam packer is available on the website of the specialist Digital Curation office.


This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International Public License.

CC-BY-SA[:]