Home | english  | Impressum | Sitemap | KIT
Foto
Ansprechpartner
Felix Bach
Steinbuch Centre for Computing (SCC)

bachTou2∂kit edu

bwDataArchive - Archivierung von Forschungsdaten

Der Dienst bwDataArchive ermöglicht eine langfristige Archivierung wissenschaftlicher Daten für Wissenschaftler an Universitäten und öffentlichen Forschungseinrichtungen und bildet die technische Infrastruktur für den Archivstandort Baden-Württemberg.
Interior of StorageTek tape library at NERSC (2),  Foto: Wikimedia Commons, Derrick Coetzee

Der Dienst bwDataArchive

Der Landesdienst bwDataArchive bietet Nutzern Zugang zu einer technischen Infrastruktur zur langfristigen Datenarchivierung, die insbesondere für Universitäten und öffentliche Forschungseinrichtungen aus Baden-Württemberg zur Verfügung gestellt wird. Die Datenarchivierung erfolgt am Karlsruher Institut für Technologie (KIT) und umfasst eine verlässliche Speicherung auch großer Datenbestände für einen Zeitraum von zehn oder mehr Jahren. Der Dienst ermöglicht eine qualifizierte Umsetzung der Empfehlungen der Deutschen Forschungsgemeinschaft (DFG) zur Sicherung und Aufbewahrung von Forschungsdaten.

Motivation

Daten von wissenschaftlichen Experimenten, von Messungen, Analysen und Simulationen sollen langfristig aufbewahrt werden. Der Erhalt dieser digitalen Daten ist nicht nur aus rechtlichen Gründen wichtig, sondern auch aufgrund der historischen Werte der Daten, ihres möglichen zukünftigen wissenschaftlichen Werts und der Nachvollziehbarkeit der Forschung. Am Steinbuch Centre for Computing (SCC) des KIT wird die Menge dieser Daten in den kommenden Jahren stark ansteigen, unter anderem aufgrund der Rolle des KIT als Archivstandort für Baden-Württemberg. Innerhalb des vom Ministerium für Wissenschaft, Forschung und Kunst (MWK) in Baden-Württemberg geförderten Landesprojekts „bwDataArchiv“ (als Projektname ohne 'e') baut das SCC seine technische Infrastruktur für die langfristige Archivierung wissenschaftlicher Daten aus Forschungseinrichtungen und Bibliotheken, sowie anfallende Daten von Großrechnern wie des Höchstleistungsrechenzentrums Stuttgart (HLRS) weiter aus. Im Rahmen des Projekts bwDataArchiv wurden Technologien entwickelt, die eine strukturierte, verlässliche und sichere Langzeitspeicherung von mehr als einem Exabyte bis 2020 ermöglichen. Als begleitende Maßnahme werden im Rahmen des Projekts bwDIM - Data In Motion - Möglichkeiten zur effizienten Anbindung aufsetzender Dienste untersucht und prototypisch realisiert.

Der Dienst bwDataArchive adressiert unter anderem die folgenden Fragestellungen:

  • Wie vereinfacht man den Prozess der Datenarchivierung auch für IT-ferne wissenschaftliche Fachbereiche?
  • Welche sicherheitsrelevanten Aspekte spielen bei der Langzeitspeicherung eine Rolle?
  • Wie kann die Datenintegrität effizient in Archiven von hunderten Petabytes sichergestellt werden? 

Förderung und Kooperationen

Das bwDataArchiv-Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg gefördert und arbeitet eng mit den DFG-Projekten RADAR, dem Landesprojekt bwDataDiss, im Rahmen des Helmholtz-Projekts LSDMA mit verschiedenen wissenschaftlichen Communities sowie den internationalen Projekten EUDAT, Human Brain Project (HBP) und dem World Wide LHC Computing Grid (WLCG) zusammen.