MMT-Logo
Sitemap | English

Belegarbeit

Vergleich von Dokumentenformaten für die Langzeitarchivierung

Aufgabenstellung

Das beste elektronische Archiv ist wertlos, wenn veraltete Datenformate (und Medien) nicht mehr gelesen und dargestellt werden können. Langzeitarchive müssen deshalb die kontinuierli-che Migration der Daten in aktuelle Formate (formaterhaltend) oder aber die Emulation der An-wendungssoftware zur Interpretation der Formate und Präsentation der Inhalte unterstützen. Den Dokumentenformaten und ihrer Standardisierung kommt insbesondere bei Langzeitarchi-ven eine zentrale Rolle zu. Zumal die Dokumente verschiedenste Medienobjekte - wie Bilder, Graphiken, Anwendungsdaten (Excel-Sheets), usw. - enthalten können. Auch die Formate der integrierten Medienobjekte müssen standardisiert und zukünftig (auch in > 20 Jahren) interpre-tiert werden können. Aktuell gibt es sowohl herstellerspezifische Lösungen wie auch Bestrebungen der Standardisie-rung von Formaten für die Langzeitarchivierung. Als wichtigstes Beispiel ist eine spezielle Vari-ante des PDF-Formates (PDF/A, z. Zt. eine Untermenge der PDF-Version 1.4) zu nennen. Dabei werden noch externe multimediale (Audio, Video) und aktiven (z.B. Java-Script) Dokumen-teninhalte, als auch Verschlüsselung ausgeschlossen. PDF/A ist in einer ersten Version als ISO 19005-1:2005 spezifiziert.
In dieser Arbeit soll zunächst, ausgehend von einer kompakter Darstellung

Als ein prominenter Ansatz ist dann das PDF/A-Format auf die Erfüllung der herausgestellten Kriterien zu analysieren bzw. sind dessen Einschränkungen darzustellen. Es ist weiterhin zu untersuchen, durch welche Metadaten und Werkzeuge (zum Lesen, Schreiben, Analysieren und Recherche) dieses Format bereits unterstützt wird, d.h. welche APIs mit welcher Mächtigkeit zur Verfügung gestellt werden und / oder welche OpenSource-Lösungen vorhanden sind. Ein weiterer Schwerpunkt der Arbeit besteht darin, zu untersuchen und zu beschreiben, welche anderen Ansätze, z.B. im Bereich digitaler Bibliotheken es in Forschung, Industrie und Standardisierung es aktuell gibt und welche Vor- und Nachteile diese für die Langzeitarchivierung von einfachen, multimedialen, aktiven wie auch komplexen Dokumenten von Unternehmen haben. Für ausgewählte Verfahren ist zu untersuchen, inwieweit Indexierung, Verschlüsselungstechni-ken, Kompressionsverfahren und Digital Rights Management Methoden unterstützt werden können. In Abstimmung mit dem Industriepartner ist aufbauend auf dem theoretischen Gerüst eine Migrationsstrategie (Format / Medienmigration) für ein Archivsystem für kleine und mittelständische Unternehmen zu entwickeln und die hierfür erforderliche Software in Form einer Grobspe-zifikation zu konzipieren.

Weitere Informationen

Autor(en): PersonMarcus Schramm
Laufzeit: 15.11.2006 - 15.08.2007
Verantwortlicher HSL: PersonProf. Dr.-Ing. Klaus Meißner
Betreuer: PersonDipl.-Medieninf. Matthias Lenz
Institut, Lehrstuhl: SMT, Multimediatechnik
Zugehörige Projekte: INSEMA
Zugehörige Partner: Point Software & Systems GmbH