MMT-Logo
Sitemap | English

Diplomarbeit

Langzeitarchivierung von Office Dokumenten

Aufgabenstellung

Das beste elektronische Dokumentenarchiv ist wertlos, wenn „veraltete" Daten- und Medien-Formate nicht mehr gelesen und dargestellt werden können. Langzeitarchive für multimediale Dokumente müssen deshalb die Migration der Dateiinhalte in aktuelle Formate (formaterhaltend) aber auch die Emulation der Anwendungssoftware zur Interpretation der Formate und Präsentation der Inhalte langfristig unterstützen. Den Dokumentenformaten und ihrer Standardisierung kommt deshalb bei Langzeitarchiven eine zentrale Rolle zu. Zumal Dokumente verschiedenste Medienobjekte - wie Bilder, Graphiken, Anwendungsdaten, usw. - enthalten können. Auch die Formate der integrierten Medienobjekte müssen standardisiert und zukünftig (auch in > 15 Jahren) interpretiert und präsentiert werden können. Aktuell gibt es sowohl herstellerspezifische Lösungen als auch Bestrebungen der Standardisierung von Formaten für die Langzeitarchivierung. Beispiele entsprechender Formate für Office-Dokumente sind eine spezielle Variante des PDF-Formats (PDF/A, ISO19005-1) als auch das Open Document Format (ODF, ISO 26300).

Ausgehend von der Belegarbeit von Herrn M. Schramm soll zunächst untersucht werden, welche Dokumentenformate gängige Langzeitarchive für industrielle Anwendungen unterstützen und welche Bestrebungen es gibt, entsprechende Standards zu setzen, beispielsweise durch die SNIA oder vergleichbare Organisationen. Dann sollen unter Einbeziehung der Vorstellungen des Industriepartners Anforderungen an die Konzeption eines Langzeitarchivs aufgestellt werden, die die zuvor ermittelten gängigen Langzeitdokumentenformate berücksichtigen. Dabei gilt es zu betrachten, ob und wie gängige Dokumentenformate, z. B. DOCX, XSLX, in die jeweiligen für die Langzeitarchivierung geeigneten Formate konvertiert werden können und welche Einschränkungen bzw. Veränderungen mit der Konvertierung verbunden sind. Dies soll z. B. die Übertragung von Metadaten der Originaldokumente mit berücksichtigen. Im Einzelnen sind folgende Teilaufgaben zu lösen: *         Darstellung des Standes der Forschung und Technik (aktuelle Softwareprodukte) auf dem Gebiet der Langzeitarchivierung von Office-Dokumenten *         Analyse und Vergleich verschiedener LZA-Formate und Darstellung deren Vor- und Nachteile *         Formulierung der Anforderungen an ein geeignetes Langzeit-Archivierungssystem zur Verwaltung von Office-Dokumenten *         Umsetzung der Anforderungen in einer technischen Konzeption und Spezifikation wesentlicher Funktionen eines solchen Langzeit-Archivsystems *         Verifikation des Konzepts, falls zeitlich möglich an Hand der prototypischen Realisierung ausgewählter Komponenten     

Weitere Informationen

Autor(en): PersonAnnegret Czaska
Laufzeit: 01.12.2012 - 31.05.2013
Verantwortlicher HSL: PersonProf. Dr.-Ing. Klaus Meißner
Betreuer: PersonDipl.-Medieninf. Ronny Fritzsche
Institut, Lehrstuhl: SMT, Multimediatechnik
Zugehörige Projekte: HSM
Zugehörige Partner: Point Software & Systems GmbH