Listen

ediarum.BASIS

Listenartige Textstrukturen in der Vorlage werden als solche erfasst und ausgezeichnet.

edition humboldt digital

Auf Grundlage des semantischen Gehalts sowie des Schriftbildes der Vorlage wird festgelegt, ob eine Textstelle als Liste oder (implizite) Tabelle (siehe Tabellen) erfasst wird.

Eine Liste, deren Zeilen keine oder kaum Aufteilung ihrer Inhalte enthalten, wird als Liste (<list>) ausgezeichnet, die einzelne Einträge (<item>) und ggf. auch einen Title (<head>) enthält. Die in Listen und Tabellen häufig verwendeten Unterführungszeichen (auch Wiederholungszeichen genannt) werden einheitlich als Geviertstrich transkribiert. Es liegt Im Ermessen der einzelnen BearbeiterInnen, Unterführungszeichen zudem explizit zu normalisieren. Die normalisierten Varianten sind hierbei die Zahlen oder Wörter, die das Unterführungszeichen repräsentiert.

Dokument (TS1) „F – Énumération des Plantes de la Province de Quito“, 3a-r

(Das folgende Kodierbeispiel berücksichtigt nicht die Streichungen.)

Das folgende Beispiel zeigt einen Grenzfall. Es handelt sich um eine Auflistung verschiedener Flussbreiten des Río Apure, Río Negro sowie des Orinoco. Humboldts Aufzeichnung ist jedoch so gering strukturiert, dass eine Auszeichnung als Tabelle strukturell nicht sinnvoll umzusetzen oder zumindest „überkodiert“ wäre.

Alexander von Humboldt: Tagebücher der Amerikanischen Reise III, Bl. 70r

(Das folgende Kodierbeispiel berücksichtigt nicht die Streichungen.)

Beinhalten Listenpunkte Text oder Zahlen, die in Spalten strukturiert werden können und sich in dieser Form über mehrere Zeilen wiederholen, wird die Vorlage als <table/> ausgezeichnet (siehe Tabellen). Die Auflistung von ortsspezifischen Messwerten beispielsweise entspricht semantisch mehr einer strukturierten Tabelle als der einer auf Zeilenebene gering strukturierten Auflistung (wie oben). Bei der Entscheidung zwischen <list/> und <table/> hat also die Semantik eines Textes ein höheres Gewicht als der Befund des Schriftbildes.

Im folgenden Beispiel wird zwischen Fließtext und zwei jeweils vierzeiligen und dreispaltigen Tabellen unterschieden:

Alexander von Humboldt: Tagebücher der Amerikanischen Reise III, Bl. 17v

Kodierung

Listen in der Vorlage werden mit dem Element <list> ausgezeichnet. Die einzelnen Punkte bzw. Zeilen werden jeweils in einem Element <item> transkribiert. Eine eventuell vorhandene Nummerierung (auch mit Buchstaben) wird nicht eigens ausgezeichnet, sondern innerhalb des Elements <item> einfach transkribiert.