Page 10 - Robert Charlier: Goethe als Übersetzer (Preprint; 2009)
P. 10
Robert Charlier: Goethe als Übersetzer
Aufführung. Drittens verstehen sich auch viele der zahlreichen
Marginalkommentare, Stichwortnotate, Exzerpte, Schemata und Entwürfe Goethes,
die sich auf eine gleich- oder fremdsprachige Textquelle beziehen, als
Bearbeitungen von Quellentexten im weiteren Sinne.
Lexikografische Datentypologie
Der Betrachtung der digitalen Möglichkeiten für den Aufbau einer kumulativen
Quellenbibliothek von Goethes Übersetzungs- und Bearbeitungsvorlagen geht im
Folgenden der Blick auf die spezifische Datenstruktur in der elektronischen
Redaktion eines Autorenwörterbuchs voraus. Innerhalb des lexikografischen
Arbeitsprozesses sind drei Datentypen zu unterscheiden. Bei den Quellentextdaten
handelt es sich um die (zitierfähigen) elektronischen Werkausgaben, die für den
Primärtextimport benötigt, allerdings aus lizenzrechtlichen Gründen nur lokal
genutzt werden, z. B. Goethes Werke auf CD-ROM von Chadwyck-Healey 12 als
SGML-Datenbank und Der junge Goethe in seiner Zeit auf CD-ROM im TEI-
Standard. 13 Hinzu kommt elektronisch erschlossene Sekundärliteratur, darunter
anspruchsvolle Retrodigitalisate der Berliner Akademiebibliothek. Die Arbeitsdaten
bestehen aus umfangreichen Datensammlungen wie der laufend aktualisierten
Gesamtwortliste sowie diversen Titel-, Siglen- und Abkürzungslisten bzw.
Konkordanzen. Die faksimilierten Übersetzungs- und Bearbeitungsvorlagen liegen
wiederum als Image-Digitalisate in einschlägigen Bildformaten vor. Lokale und
Online-Quellen liefern so das Rohmaterial für die lexikografische Arbeit, zumeist als
Textfile im ASCII-, Rich-Text- oder PDF-Format. Auch die Datenbankimporte von
CD-ROM oder der Synonymen-Datenbank (auf der Basis von MS Access) liegen
nur in einfachen Textformaten vor. Quellen- und Arbeitsdaten fließen unmittelbar in
den Wörterbuchartikel ein und bilden die vorläufigen Ergebnisdaten. Zunächst auf
geringem Strukturierungsniveau diversifiziert und archiviert, dienen diese prospektiv
digitalisierten Wörterbuchartikel der weiteren Referenzierung. Die lexikografischen
Datentypen lassen sich also je nach Strukturierungsgrad wie folgt zusammenfassen:
1. Quellentextdaten, z. B. unstrukturierte Textdaten aus dem CD-ROM-Import;
2. Arbeitsdaten, z. B. extensiv strukturierte Abkürzungs- und Namenslisten zur
Auflösung von Textsiglen; und 3. Ergebnisdaten, z. B. die mit einem logisch-
semantisch Tagset ausgezeichneten Wörterbuchartikel.
8