Fremdsprachiger Text

ediarum.BASIS

Unter „fremdsprachigem Text“ sind Texte (bzw. Textteile) zu verstehen, die entweder von der im Korpus normalerweise vorkommenden Sprache oder einer als Standard definierten Sprache abweichen. Dabei kann es sich um einzelne Wörter, längere Textpassagen oder ganze Texte (Briefe o. ä.) handeln. Der Sprachwechsel bzw. die Sprache eines Textes sollte stets ausgezeichnet werden; dadurch wird sowohl die Verwendung von externen Webservices, wie dem „Cascaded Analysis Broker“ des Deutschen Textarchivs, als auch die Nachnutzung der edierten Texte in linguistischen Korpora erleichtert.

Zu unterscheiden ist die Auszeichnung fremdsprachigen Textes von der Auszeichnung eines Schriftwechsels, mit dem ersterer häufiger einhergeht. Beispielsweise wurden deutschsprachige Briefe der ersten Hälfte des 19. Jahrhunderts häufig in deutscher Schrift verfasst. Verwendete der Schreiber ein Fremdwort, wurde dies in lateinischer Schrift wiedergegeben.

edition humboldt digital

Als Standardsprache ist in den meisten Fällen Deutsch vorgegeben. Abweichungen auf Satz- oder Satzteil-Ebene bzw. in Wortfolgen werden in der jeweiligen Sprache ausgezeichnet:

Alexander von Humboldt an Carl Sigismund Kunth. Potsdam, 9. Dezember 1849, Bl. 1r/1v
    <p>Auszug aus einem Schreiben
       <lb/>Sir William Hooker’s […]</p>
     <p><foreign xml:lang="eng">In the matter of Mr. Hannemann,
       <lb/>your Excellency will see at once that Humboldt’s testi<g ref="#typoHyphen"/>
       <lb break="no"/>mony is a host in itself
       <lb/>and therefore I shall „stretch
       <lb/>a point“ to make an opening
       <lb/>for him in the spring […].</foreign></p>
     <p>Wenn auch Hooker erst <lb/>[…]</p>
Alexander von Humboldt an Carl Sigismund Kunth. Potsdam, 9. Dezember 1849, Bl. 1r/1v – Webansicht (Lesetext)

In rein französischsprachigen Texten wird Französisch als Standard angenommen und der Wechsel zum Deutschen als Fremdsprache ausgezeichnet:

Alexander von Humboldt: Isle de Cube. Antilles en général, Bl. 129r

[…] Elle est très charactérisée 
 <lb/>par le <foreign xml:lang="deu">ebene Bruch ins flachmuschlige übergehend, röthlichweiß, dünn
 <lb break="no"/>schiefrig</foreign> identique a celle de Pappenheim surtout à las Lomas de
 <lb/>Camoa […]
Alexander von Humboldt: Isle de Cube. Antilles en général, Bl. 129r – Webansicht (Lesetext)

Nicht ausgezeichnet wird der Sprachwechsel in folgenden Fällen:
  • auf Wortebene und bei Eigennamen
  • auf Briefumschlägen
  • bei lateinischen, griechischen oder sonstigen fremdsprachigen (Fach-)Begriffen (Oftmals finden sich auch eingedeutschte Termini wie bspw. Rosaceae = Rosaceen.)

Kodierung

Einzelne fremdsprachige Wörter und Textstellen werden mit in einem <foreign>-Element ausgezeichnet werden. Im Attribut @xml:lang wird ein Kürzel der jeweiligen Fremdsprache angegeben:

Fremdsprache Wert für @xml:lang
Griechisch grc
Latein lat
Hebräisch heb
Deutsch deu
Französisch fra
Englisch eng
Russisch rus
Spanisch spa
Das <lb/>2te und 3te <foreign xml:lang="spa">vela</foreign> Rufen machte sichtbar weniger Eindruk.

Darüber hinaus kann das Attribut @xml:lang sowohl auf Ebene der üblichen Textstrukturen (z. B. Absätze) gesetzt werden als auch für gesamte Dokumente (dann im Wurzelelement TEI).