Page 10 - Robert Charlier: Goethe als Übersetzer (Preprint; 2009)
P. 10

Robert Charlier: Goethe als Übersetzer






                        Aufführung.   Drittens  verstehen    sich   auch    viele  der    zahlreichen

                        Marginalkommentare, Stichwortnotate, Exzerpte, Schemata und Entwürfe Goethes,
                        die sich auf eine gleich- oder fremdsprachige Textquelle beziehen, als
                        Bearbeitungen von Quellentexten im weiteren Sinne.


                                                Lexikografische Datentypologie

                        Der Betrachtung der digitalen Möglichkeiten für den Aufbau einer kumulativen

                        Quellenbibliothek von Goethes Übersetzungs- und Bearbeitungsvorlagen geht im
                        Folgenden der Blick auf die spezifische Datenstruktur in der elektronischen
                        Redaktion eines Autorenwörterbuchs voraus. Innerhalb des lexikografischen

                        Arbeitsprozesses sind drei Datentypen zu unterscheiden. Bei den Quellentextdaten
                        handelt es sich um die (zitierfähigen) elektronischen Werkausgaben, die für den
                        Primärtextimport benötigt, allerdings aus lizenzrechtlichen Gründen nur lokal
                        genutzt werden, z. B. Goethes Werke auf CD-ROM    von Chadwyck-Healey  12  als
                        SGML-Datenbank und Der junge Goethe in seiner Zeit     auf  CD-ROM   im  TEI-

                        Standard. 13  Hinzu kommt elektronisch erschlossene Sekundärliteratur, darunter
                        anspruchsvolle Retrodigitalisate der Berliner Akademiebibliothek. Die Arbeitsdaten
                        bestehen aus umfangreichen Datensammlungen wie der laufend aktualisierten

                        Gesamtwortliste sowie diversen Titel-, Siglen- und Abkürzungslisten bzw.
                        Konkordanzen. Die faksimilierten Übersetzungs- und Bearbeitungsvorlagen liegen
                        wiederum als Image-Digitalisate in einschlägigen Bildformaten vor. Lokale und
                        Online-Quellen liefern so das Rohmaterial für die lexikografische Arbeit, zumeist als
                        Textfile im ASCII-, Rich-Text- oder PDF-Format. Auch die Datenbankimporte von

                        CD-ROM oder der Synonymen-Datenbank (auf der Basis von MS Access) liegen
                        nur in einfachen Textformaten vor. Quellen- und Arbeitsdaten fließen unmittelbar in
                        den Wörterbuchartikel ein und bilden die vorläufigen Ergebnisdaten. Zunächst auf

                        geringem Strukturierungsniveau diversifiziert und archiviert, dienen diese prospektiv
                        digitalisierten Wörterbuchartikel der weiteren Referenzierung. Die lexikografischen
                        Datentypen lassen sich also je nach Strukturierungsgrad wie folgt zusammenfassen:
                        1. Quellentextdaten, z. B. unstrukturierte Textdaten aus dem CD-ROM-Import;
                        2. Arbeitsdaten, z. B. extensiv strukturierte Abkürzungs- und Namenslisten zur

                        Auflösung von Textsiglen; und 3. Ergebnisdaten, z. B. die mit einem logisch-
                        semantisch Tagset ausgezeichneten Wörterbuchartikel.



                                                             8
   5   6   7   8   9   10   11   12   13   14   15