Metadaten (digitale)
Metadaten sind Daten, die eine strukturierte Beschreibung der essentiellen Eigenschaften eines Informationsobjekts ergeben. Mit ihrer Hilfe können Informationsressourcen erschlossen und auffindbar gemacht werden. Metadaten können sowohl für digitale als auch analoge Informationsobjekte gebildet werden.
Explikation
Metadaten erleichtern die Verwaltung und Auffindbarkeit von Informationsobjekten wie z. B. digitalisierte Handschriften (Faksimiles). Zusätzlich treten im Bereich der digitalen Archivierung bzw. Digitalisierung weitere Bereiche wie die Integrität des Objekts und Authentizität der Darstellung in den Fokus.
Die Beschreibung des Inhalts und Kontextes von Daten erhöht ihre Nutzbarkeit. Eine Webseite kann z. B. Informationen darüber enthalten, in welcher Sprache sie verfasst ist und welche Werkzeuge benutzt wurden, um sie zu erstellen. Ein digitales Bild kann Metadaten darüber enthalten, wie groß das Bild ist, welche Farbtiefe und welche Auflösung es besitzt und wann es erstellt wurde. Die Metadaten zu einem Text können Auskunft über seine Länge und den Autor geben, das Erscheinungsdatum und eine kurze Zusammenfassung des Inhalts enthalten.
Generell können fünf verschiedene Arten von Metadaten unterschieden werden:
- Deskriptive Metadaten (Informationen, die zur Erschließung und Identifikation eines Objekts dienen),
- Administrative Metadaten (Informationen, die zur Verwaltung eines Objekts benötigt werden),
- Erhaltungsmetadaten (Informationen, die Prozesse dokumentieren, die zur Erhaltung des Objekts unternommen wurden, beispielsweise die Migration einer Datei oder die Entsäuerung eines Buches),
- Technische Metadaten (Informationen über Datenformate, benötigte Hard- und Software, Größe der Datei, Integrität etc.),
- Benutzungsmetadaten (Informationen über die Benutzung des Objekts, z. B., ob es Teil einer Ausstellung war oder in welcher Form es von wem benutzt werden darf)(1),
- Strukturmetadaten (Informationen, die das Navigieren im Objekt ermöglichen, z. B. die Konkordanz zwischen dem Dateinamen des Digitalisats und der Seitenreferenzierung)(2),
Dabei werden nicht alle Kategorien für jedes Objekt benötigt und manche Angaben mögen zwei Kategorien zugeordnet werden können. Trotzdem bietet die Auflistung einen guten Überblick, welche Metadaten potenziell für jedes Objekt erfasst werden können.
Struktur
Zur Erfassung von Metadaten wird in der Regel ein klar definiertes Vokabular verwendet. Dieses wird durch ein Metadatenschema vorgegeben, das festlegt, wie die Metadaten strukturiert sein müssen und welchen Regeln sie gehorchen. Ein Metadatenschema wiederum kann in verschiedenen Auszeichnungs- oder Programmiersprachen ausgedrückt werden. Am häufigsten sind RNG und XML. Das Schema kann zur Validierung der Metadaten verwendet werden. Metadaten sind hierarchisch strukturiert, wobei verschiedene Metadatenschemata verschiedene Granularität aufweisen können.
Metadatenstandards
Theoretisch ist es möglich, die für ein Objekt zu erfassenden Angaben in einem selbst formulierten Metadatenschema unterzubringen, das genau auf die Bedürfnisse und Anforderungen der Aufgabe zugeschnitten ist.
Hier greift jedoch ein wichtiger Grundsatz der Metadatenerstellung: Wann immer möglich auf bereits existierende Standards zurückzugreifen. Diese Standards mögen nicht immer bis ins letzte Detail den gestellten Anforderungen entsprechen, doch meistens lässt sich ein Kernsatz an Elementen definieren, der allen Anwendungsfällen gemein ist. Die Anwendung von bereits existierenden Standards ist in der Regel einfacher zu realisieren und erhöht die Interoperabilität.(3)
Durch die Verwendung von verbreiteten Metadatenstandards werden die erfassten Angaben austauschbar und nachnutzbar, was sowohl dem Archiv als auch anderen Institutionen zu Gute kommt.
Alle Standards sind in ihrem jeweiligen Bereich sehr universell formuliert, so dass potenziell Angaben zu vielen digitalen wie analogen Objekten erfasst werden können. Dies führt auch dazu, dass für einen konkreten Anwendungszweck unter Umständen gar nicht alle zur Verfügung stehenden Felder und Auswahlmöglichkeiten benötigt werden. Deshalb ist es empfehlenswert, die verwendeten Standards, die angewendeten Elemente und deren Belegungsmöglichkeiten genau zu spezifizieren und zu dokumentieren. Dies geschieht in der Regel durch die Erstellung eines Application Profiles. Die Idee zur Entwicklung von Application Profiles zur Dokumentation von projekt- oder fallbezogenen Festlegungen entstand bereits im Jahr 2000 in der Dublin Core Metadata Initiative(4). Diese definieren ein Application Profile als die Idee, Dublin Core gemeinsam mit anderen, spezialisierten Vokabularen zu nutzen, um den speziellen, anwendungsbezogenen Anforderungen gerecht zu werden(5). Heutzutage ist es üblich, Application Profiles für diverse Anwendungszwecke zu entwickeln. So unterhält die British Library z. B. ein Application Profile für E-Journals(6). In jedem Fall ist ein Application Profile anwendungs- und institutionsspezifisch, stützt sich aber gleichzeitig auf verbreitete, schon definierte Standards. Formell ist jede Art der Dokumentation geeignet, z. B. in Text- oder Tabellenform.
Speicherung von Metadaten
Metadaten können entweder direkt im Objekt, das sie beschreiben, gespeichert werden oder extern als eigenständige Datei.
Zur Speicherung im Objekt muss das Objekt in digitaler Form vorliegen. Handelt es sich z. B. um das Digitalisat einer Handschrift, so werden diese in den meisten Fällen im TIF-Format abgespeichert, um eine möglichst langfristige Archivierung zu gewährleisten. Das TIF-Format unterstützt, ebenso wie das gängige Bildformat JPEG, den IPTC-IIM-Metadatenstandard. Hierzu werden in einem speziell dafür vorgesehenen Bereich im Header der Datei die Metadaten gespeichert. Dies hat den Vorteil, dass die Metadaten untrennbar mit dem Objekt selbst verbunden sind und sich eine Änderung des Objekts idealerweise direkt auf die Metadaten auswirkt. Allerdings sind bei dieser Methode die Metadaten einer Objektsammlung verteilt gespeichert, sodass kein schneller Zugriff möglich ist.
Eine externe Speicherung hingegen ermöglicht eine effiziente Suche und Verwaltung. Dabei werden die Metadaten als externe Datei, z. B. im XML oder HTML-Format gespeichert. Wichtig dabei ist, dass die Metadaten eindeutig dem beschriebenen Objekt zugeordnet werden können. Dies geschieht durch Identifier. Bei der externen Speicherung von Metadaten ist der Aufwand zur Pflege der Daten jedoch höher als bei der internen Speicherung, da Objekte und Metadaten getrennt gepflegt werden müssen.
Metadaten bei digitalen Fotografien und Digitalisaten
Bei digitalen Bildern werden die Metadaten in der Regel direkt in die Datei geschrieben. Sie enthalten Hinweise zum Urheber, dem Copyright, der Kamera, mit der das Bild erstellt wurde und welche Einstellungen dabei verwendet wurden. Technische Metadaten werden dabei von der Kamera selbst in die Datei geschrieben, andere Metadaten, wie z. B. Schlagwörter, müssen manuell ergänzt werden.
Im Bereich der digitalen Fotografie sind unter anderem folgende Standards verbreitet:
- IPTC Information Interchange Model IIM (International Press Telecommunications Council),
- XMP - Extensible Metadata Platform (ISO-Standard)
- Exif - Exchangeable image file format (Camera & Imaging Products Association)
Metadaten im Bibliotheks- und Archivbereich
Im Bibliotheks- und Archivbereich ist die Bereitstellung eines Katalogs zur Auffindbarkeit der archivierten Ressourcen ein essentielles Ziel der Metadatenerhebung. Eine Erschließung findet dabei nicht nur auf bibliographischer Ebene, sondern auch inhaltlich statt.
Wichtige Metadatenstandards in diesem Bereich sind:
- METS - Metadata Encoding & Transmission Standard« (Library of Congress)(7)
- MODS - Metadata Object Description Schema (Library of Congress)(8)
- Dublin Core (DCMI Usage Board)
Im Bereich der Handschriftendigitalisierung wird der de facto Standard TEI - Text Encoding Initiative(9) - verwendet, der Möglichkeiten zur formellen und inhaltlichen Textauszeichnung bietet.
Metadaten im Bereich der Langzeitarchivierung digitaler Daten
Nach der Übernahme oder Generierung der Daten liegt in einem digitalen Archiv ein Datenpaket vor, das meist nur über die Metadaten verfügt, welche das jeweilige Betriebssystem üblicherweise für digitale Daten zur Verfügung stellt, zum Beispiel das letzte Bearbeitungsdatum, die Größe und die Dateinamenserweiterung. Diese Angaben genügen nicht, um eine langfristige Archivierung und Verfügbarkeit digitaler Objekte zu gewährleisten, denn sie sind relativ unzuverlässig und unzureichend, um eine Zugänglichkeit der Daten auch nach zwanzig, fünfzig oder gar hundert Jahren zu gewährleisten. So lässt z. B. die Dateinamenserweiterung kaum einen Rückschluss auf das tatsächlich vorliegende Dateiformat zu und so lassen sich nur unzureichende Schlüsse über die zum Öffnen benötigte Hard- und Software daraus ziehen. Zum Zweck der Erschließung und Dokumentation wird deshalb dem Datenpaket ein Metadaten-Satz beigegeben, der ausführliche, verifizierte Angaben enthält, z. B. über die benötigte Hard- und Software, eine genaue Angabe des Dateiformats und die Herkunft der Datei.
Metadatenstandard in diesem Bereich ist PREMIS - Preservation Metadata: Implementation Strategies (Library of Congress)(10).
siehe auch
Referenzen