Sprache hinzufügen, allgemein lesbar
wie ein herkömmliches Buch, archiviert und haltbar über mehrere hundert
Jahre.
Bislang gewährleistet noch keine dieser vorgestellten Möglichkeiten alle
Anforderungen, die von einer Langzeitarchivierung erwartet werden. Bis auf den ›Digital
Rosetta Stone‹, der allerdings noch nicht entwickelt ist, und beim holografischen
Massenspeicher handelt es sich eher um mittelfristige Lösungen. Als positiv erweist sich
die Tatsache, dass inzwischen hinsichtlich der Formate auf Standards gesetzt
wird.41
Hierbei geht es zumeist um strukturelle Informationen, die in standardisierten Markup-Sprachen
kodiert werden wie SGML, HTML oder XML.
|
Standardisierte Grundformate können auch beim Wechsel einer Hardwarekonfiguration
stabil bleiben. Damit wäre zumindest schon ein erster Schritt zur Überwindung der
Unterschiedlichkeit verschiedener Formate und somit auch in Hinblick auf die
Langzeitarchivierung gewährleistet.
15.6. XML als Universalstandard
In diesem Kapitel wird nun auf die Entwicklung der eXtensible Markup Language
(XML) eingegangen. Sie ist gerade für die vorliegende Arbeit von hervorgehobener
Bedeutung.
Im Zuge der rasanten Entwicklung des World Wide Web wurde zu Beginn der
Neunziger Jahre die Hypertext Markup Language (HTML) auf der Basis der
Standard Generalized Markup Language (SGML) entwickelt. HTML ist eine
Auszeichnungssprache, die speziell für Web-Dokumente geschaffen wurde. Durch die sehr
limitierte Menge an Auszeichnungen, auch Tags genannt, ist HTML auf der einen Seite
sehr einfach zu erlernen, auf der anderen Seite aber nicht erweiterbar und somit relativ
unflexibel. Des Weiteren wird durch die Tags nicht die Struktur eines Dokumentes
(Struktur-orientiertes Markup) sondern lediglich das Format (Layout-orientiertes Markup)
beschrieben.42
Ähnlich verhält es sich mit dem Microsoft-Produkt Word, obwohl es dort inzwischen auch
Möglichkeiten zur Strukturbeschreibung gibt. Die Analogie zu XML (Struktur-orientiertes Markup)
ist hier die Textverarbeitung LATEX (vgl. dazu Kapitel 8).
|
Bei einem Layout-orientierten Markup werden Formatierungsanweisungen direkt
eingegeben und beeinflussen so auch unmittelbar das Aussehen eines Dokumentes.
Da der Autor selbst für das Layout zuständig ist, werden oft typografische
Prinzipien verletzt und Inkonsistenzen treten auf. Zudem eignet sich eine solche
Struktur nicht für Konvertierungen, für eine Suche, für die Verwaltung von
Dokumenten und für eine Qualitätssicherung. Folglich sind HTML-Dokumente
auch nur eingeschränkt wiederverwendbar, wenn es um zusätzliche oder weitere
Outputmöglichkeiten geht. So eignen sich HTML-Dokumente nicht, um neben
der Darstellung im Web automatisch eine Print- oder CD-ROM-Version zu
generieren.
Bei einem Struktur-orientierten Markup, wie es dagegen bei XML der Fall ist, werden
Struktur und Formatierung voneinander getrennt. Die Auszeichnung wird auf
inhaltlicher Ebene vollzogen und beschreibt die Funktion des ausgezeichneten
Textbereiches. Die Formatierung, die dann im Nachhinein vorgenommen wird, ist in
gewisser Weise als Konvertierung zu betrachten. Hier hat der Autor eines Textes |