Probleme von digitaler Langzeitarchivierung

verschiedene physische Speichermedien
Quelle: Pixabay

Digitale Langzeitarchivierung – Was ist das eigentlich?

Wie der Name schon sagt, geht es bei der digitalen Langzeitarchivierung darum, dass digitale Daten langfristig erhalten werden.
Im privaten Umfeld handelt es sich dabei häufig um Erinnerungen in Form von Fotos und Videos oder auch Musik.
Im Wissenschaftlichen Kontext sind alle Forschungsdaten und Arbeitsprozesse relevant, die digital dokumentiert sind.

Wo liegen die Probleme?

Wir kennen es alle: der Computer schlägt und so lange das Update auf die nächste Stufe des Betriebssystems vor, bis wir es nicht mehr wegklicken können und es zwangsläufig herunterladen müssen. Nach dem Update kann es passieren, dass sich auf einmal alte Dateien nicht mehr öffnen lassen, da das neue Betriebssysteme das Dateiformat nicht mehr unterstützt. Danach ist es dann notwendig, die Datei aufwendig umzuwandeln, damit der Zugriff wieder möglich ist. Genauso sieht es bei CD-ROMS aus. Was vor gut 30 Jahren noch der neuste Stand der Technik war, ist heute vollkommen überholt und häufig scheitert es schon daran, dass die meisten Computer kein CD-Laufwerk mehr haben. Weiterhin werden viele Datenträger im Laufe der Zeit beschädigt oder sind schlicht nicht mehr lesbar.
Die technischen Möglichkeiten der Technik verändern sich so schnell, dass das Hauptproblem der digitalen Langzeitarchivierung darin liegt, dass alle digitalen Inhalte möglichst zugänglich und abrufbar bleiben.

Private digitale Langzeitarchivierung

Die Seite meindigitalesArchiv des Kompetenznetzwerk nestor ist einer der besten Anlaufpunkte, um sich darüber zu informieren, wie die eigenen privaten Daten dauerhaft gesichert werden können.
Anhand von fiktiven Fallbeispielen werden verschiedenste Situationen geschildert, in denen es notwendig sein kann, die eigenen digitalen Daten zu ordnen und speichern. Das fängt beim simplen speichern von Bildern und der Übertragung von Smartphone-Inhalten an, geht aber auch weiter über Familienforschung und die Regelung von digitalen Nachlässen.

verschiedene mobile Endgeräte einer Privatperson
Quelle: Pixabay

Wissenschaftliche digitale Langzeitarchivierung

Im Wissenschaftlichen Kontext, wenn es um Forschungsdaten geht, gibt es zwei Hauptstragtegien, wie die Daten erhalten werden: Migration und Emulation.
Die Migration beschriebt die Übertragung von Daten in die jeweils aktuellen Dateiformate umgewandelt und auf aktuelle Speichermedien übertragen werden. Dieser Prozess ist zeitaufwendig und und fehleranfällig, da auch alle Metadaten korrekt übertragen werden müssen, denn ohne den Kontext der Metadaten werden die Inhaltsdaten nahezu wertlos.
Bei der Emulation werden veraltete Hard- und / oder Softwareumgebungen in einem modernen System simuliert, sodass alte Programme und Dateien weiterhin verwendet werden können, ohne dass sie übertragen werden müssen.

Podcast-Tipp

Fazit

Die digitale Langzeitarchivierung ist deshalb so wichtig, weil sich der Stand der Technik kontinuierlich weiterentwickelt. Daten, die heute problemlos zugänglich sind, können in einigen Jahren unlesbar sein. Davon betroffen sind sowohl private Erinnerungen in digitaler Form, als auch wissenschaftliche Forschungsdaten.
Letztlich ist es notwendig, eine Archivierungsstrategie zu haben, um digitale Inhalte dauerhaft zugänglich zu halten und den drohenden Datenverlust zu vermeiden.


„Der Wert mancher Sache besteht darin, dass wir sie verloren haben.“

– Otto Weiß , Wiener Musiker und Feuilletonist

Quellen

Kompetenznetzwerk nestor
meindigitalesArchiv.de
https://www.aphorismen.de/zitat/192599
https://open.spotify.com/show/14BEfgbOu1HN28odE0ur1v
https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/langzeitarchivierung/

Die Rolle von Big Data in der digitalen Archivierung

Entdecke, wie Big Data in der digitalen Archivierung die langfristige Speicherung großer Datenmengen beeinflusst und welche Technologien dabei zum Einsatz kommen.

Name: Maha Abbas, Matrikelnummer 1757867 , Veröffentlichung: Ja

Name: Wladimir Mylnikov, Matrikelnummer 1757948 , Veröffentlichung: Ja

Big Data in der digitalen Archivierung gewinnt zunehmend an Bedeutung, da täglich immense Datenmengen entstehen, die es zu bewahren gilt. Diese Daten enthalten wertvolle historische, wissenschaftliche und kulturelle Informationen. Doch wie können wir sicherstellen, dass diese Informationen für zukünftige Generationen erhalten bleiben?

Big Data

Big Data bezeichnet große Datenmengen, die oft in Echtzeit generiert werden und zu komplex für traditionelle Verarbeitungsmethoden sind. Dazu gehören strukturierte Daten (z. B. Datenbanken) und unstrukturierte Inhalte (wie Videos, Bilder, Text). Archive müssen diese Daten nicht nur speichern, sondern auch durchsuchbar machen. Daher ermöglicht die Integration von Big-Data-Technologien in Archive, Informationen aus unterschiedlichen Quellen zusammenzuführen und dadurch eine umfassendere Datengrundlage zu schaffen, wie z. B. in Projekten der National Archives oder des Bayerischen Staatsarchivs

explainity GmbH

Die Archivierung großer Datenmengen stellt einige Herausforderungen dar. Im Folgenden werden die wichtigsten beschrieben:

1. Speicherkapazität und Kosten

Wachsende Datenmengen erfordern skalierbare Speicherlösungen, was die Kosten für die benötigte Infrastruktur erheblich erhöhen kann. Unternehmen und Institutionen müssen in leistungsfähige Speichertechnologien investieren, um den stetig steigenden Bedarf zu decken.

2. Technologische Obsoleszenz

Schnelle Veränderungen bei Software und Datenformaten können die Lesbarkeit alter Daten gefährden. Archive müssen ständig sicherstellen, dass ihre Daten in aktuellen und kompatiblen Formaten vorliegen, um langfristig zugänglich zu bleiben. Dies erfordert regelmäßige Updates und Migrationen von Daten.

3. Datenmanagement

Die Pflege und Zuordnung von Metadaten zu großen Datenmengen ist aufwendig und erfordert erhebliche Ressourcen. Metadaten sind essenziell, um die Daten zu katalogisieren und durchsuchbar zu machen. Ohne ein effektives Datenmanagement können Informationen verloren gehen oder nur schwer wiederauffindbar sein.

4. Datenschutz und Compliance

Langfristige Archivierung kann oft mit Datenschutzvorschriften wie der DSGVO kollidieren. Die Archivierung großer Datenmengen muss stets im Einklang mit Datenschutzrichtlinien und gesetzlichen Vorgaben stehen. Es ist wichtig, personenbezogene Daten zu schützen und Zugriffsrechte klar zu definieren.

Um diesen Herausforderungen zu begegnen, kommen verschiedene moderne Technologien zum Einsatz:

  • Cloud-Speicher: Diese ermöglichen eine flexible und skalierbare Speicherung großer Datenmengen. Anbieter wie AWS oder Google Cloud bieten hierfür leistungsfähige Lösungen.
  • Datenbanken: NoSQL und Hadoop sind speziell für die Verarbeitung und Speicherung großer, unstrukturierter Datenmengen konzipiert und erleichtern deren Verwaltung.
  • KI und Machine Learning: Diese Technologien automatisieren die Kategorisierung und Bereinigung von Daten, sodass Archive effizienter arbeiten können. Beispielsweise nutzt das Digitale Archiv Bayern standardisierte Prozesse, um Datenqualität und Zugänglichkeit zu verbessern

Der Einsatz von Big-Data-Technologien in der Archivierung bietet auch viele Vorteile:

Erweiterte Analyse: Big Data ermöglicht es, aus großen Datenmengen neue Erkenntnisse zu gewinnen, indem Muster und Trends erkannt werden, die sonst verborgen bleiben würden.

Historische Forschung: Verknüpfte Datenquellen schaffen eine fundierte Basis für Forschung und Geschichtsschreibung, indem verschiedene Datenarten integriert werden, um ein umfassenderes Bild der Vergangenheit zu zeichnen.

Zukunftssicherung: Künstliche Intelligenz (KI) kann archivierungswürdige Daten identifizieren und priorisieren, um sicherzustellen, dass wichtige Informationen für zukünftige Generationen erhalten bleiben.

Big Data in der digitalen Archivierung ermöglicht die langfristige Speicherung und Analyse großer Datenmengen. Mit innovativen Technologien und strategischen Ansätzen können Archive nicht nur Datenmengen bewältigen, sondern auch neue Forschungsperspektiven eröffnen. Die langfristige Herausforderung bleibt jedoch die Balance zwischen Datenmanagement und technologischem Fortschritt.

Digital data analysis