Listen

ediarum.BASE

Listenartige Textstrukturen in der Vorlage werden als solche erfasst und ausgezeichnet.

edition humboldt digital

Auf Grundlage des semantischen Gehalts sowie des Schriftbildes der Vorlage wird festgelegt, ob eine Textstelle als Liste oder (implizite) Tabelle (siehe Tabellen) erfasst wird.

Eine Liste, deren Zeilen keine oder kaum Aufteilung ihrer Inhalte aufweisen, wird als Liste (<list>) ausgezeichnet, die einzelne Einträge (<item>) und ggf. auch einen Title (<head>) enthält. Die in Listen und Tabellen häufig verwendeten Unterführungszeichen (auch Wiederholungszeichen genannt) werden einheitlich als Geviertstrich transkribiert. Es liegt im Ermessen der einzelnen BearbeiterInnen, Unterführungszeichen zudem explizit zu normalisieren. Die normalisierten Varianten sind hierbei die Zahlen oder Wörter, die das Unterführungszeichen repräsentiert.

Alexander von Humboldt; Carl Sigismund Kunth: F – Énumération des Plantes de la Province de Quito, Bl. 3a-r


Das folgende Kodierbeispiel berücksichtigt keine weiteren Textphänomene:

<list>
    <head>Regio frigida de 1600–2460 t</head>
    <item>Polypodium tenuifolium Tunguragua I 9. (1658 t.)</item>
    <item>Gleichenia revoluta Quito 1560 t.</item>
    <item>Lycopodium crassum Antisana 2218 t</item>
    <item>Carex pichinchensis 2100 t.</item>
    <item>Aristida bromoides 1600 t</item>
    <item>Aegopogon cenchroides 1800 t.</item>
    <item>Deyeuxia rigida 2200 t</item>
    <item>Bromus lanatus 2180 t</item>
    <item>Festuca andicola 1790 t</item>
    <item> — quadridentata 1600 t</item>
    <item> — dasyantha 2260 t</item>
    <item>Poa mulalensis 1600 t</item>
    <item>Melica scabra 1850 t</item>
    <item>dactyloides 2208 t</item>
    <item>Ischaemum hispidum 2100. t</item>
    <item>Luzula alopecurus 2100 t</item>
    <item>Alstroemeria glaucescens 1840 t</item>
    <item>Moraea chimborazensis chimboracensis 1640 t</item>
    <item>Sisyrinchium pusillum 1500 t</item>
    <item>Ophrys paleacea 1662 t</item>
    <item>Lomatia obliqua 1600 t</item>
    <item>Oxybaphus glabrifolius 1680 t</item>
    […]
</list>
Alexander von Humboldt; Carl Sigismund Kunth: F – Énumération des Plantes de la Province de Quito, Bl. 3a-r - Webansicht

Grenzfälle

Der folgende Ausschnitt aus den Amerikanischen Reisetagebüchern zeigt einen Grenzfall. Es handelt sich um eine Auflistung verschiedener Flussbreiten des Río Apure, Río Negro sowie des Orinoco. Humboldts Aufzeichnung ist jedoch so gering strukturiert, dass eine Auszeichnung als Tabelle formell nicht sinnvoll umzusetzen oder zumindest „überkodiert“ wäre.

Alexander von Humboldt: Tagebücher der Amerikanischen Reise III, Bl. 70r


Das folgende Kodierbeispiel berücksichtigt nicht die Streichungen.

<list>
  <item>Le Rio Apure près de S. Fernando 206 t.</item>
  <item>Le Rio Negro près de S. Carlos 292 t.</item>
  <item>Orinoco à la bocca Apure 1905 t. <lb/>mais quand le Capucin 
  est islado = 10750 mètres.</item>
  <item>Orinoco près du Baraguan 889 t.</item>
  <item>Orinoco près de urbano 2674 t. <lb/>jusqu’au delà de l’Isle de 
  Urba<g ref="#typoHyphen"/><lb break="no"/>na et de I. vieja de Montica.</item>
</list>

Beinhalten Listenpunkte hingegen Text oder Zahlen, die in Spalten strukturiert werden können und sich in dieser Form über mehrere Zeilen wiederholen, wird die Vorlage als <table/> ausgezeichnet (siehe Tabellen). Die Auflistung von ortsspezifischen Messwerten beispielsweise entspricht semantisch mehr einer strukturierten Tabelle als der einer auf Zeilenebene gering strukturierten Auflistung (wie oben). Bei der Entscheidung zwischen <list/> und <table/> hat also die Semantik eines Textes ein höheres Gewicht als der Befund des Schriftbildes.

Im folgenden Beispiel wird zwischen Fließtext und zwei jeweils vierzeiligen und dreispaltigen Tabellen unterschieden:

Alexander von Humboldt: Tagebücher der Amerikanischen Reise III, Bl. 17v


Kodierung

Listen in der Vorlage werden mit dem Element <list> ausgezeichnet. Die einzelnen Punkte bzw. Zeilen werden jeweils in einem Element <item> transkribiert. Eine eventuell vorhandene Nummerierung (auch mit Buchstaben) wird nicht eigens ausgezeichnet, sondern innerhalb des Elements <item> einfach transkribiert.