Software

Die Publikation edition humboldt digital wird von der Erfassung bis hin zur Publikation in ediarum erstellt. Die digitale Arbeitsumgebung ediarum ist eine von der DH-Initiative TELOTA seit 2012 entwickelte Lösung, die es den Wissenschaftlern erlaubt, Transkriptionen von Manuskripten in TEI-konformem XML zu bearbeiten, mit einem Text- und Sachapparat zu versehen und anschließend im Druck und im Web zu veröffentlichen. Dabei besteht ediarum aus mehreren Softwarekomponenten, die zur Erarbeitung einer digitalen Edition entsprechend angepasst wurden: Zur Eingabe und Bearbeitung der Daten wird eine eigens angepasste Version des oXygen XML Author benutzt. Die Speicherung der Daten erfolgt in der freien XML-Datenbank existdb. Diese dient gleichzeitig – zusammen mit dem Webserver Jetty – auch als Basis der digitalen Edition, die mit XQuery, XSLT und XPath realisiert wurde. Zur Anzeige der Faksimiles wird die am MPI für Wissenschaftsgeschichte entwickelte Software digilib eingesetzt.

Daten(-modell)

Historische Quellen

Die Metadaten und Texte der zu edierenden Schriften (Reisetagebücher, Dokumente und Briefe) werden nach den Richtlinien der Text Encoding Initiative (TEI) kodiert. Dabei wird weitgehend das Basisformat des Deutschen Textarchivs (DTABf) verwendet, dass u.a. im Rahmen dieses Editionsvorhabens für die Kodierung von handschriftlichen Texten erweitert wurde. Für einige wenige projektspezifische Belange wurden Ergänzungen und Erweiterungen zum Tagset vorgenommen, die konform zu den TEI-Richtlinien sind. Diese Erweiterung betrifft insbesondere projektspezifische Anforderungen, die sich durch das Material ergeben, wie z.B. die Auszeichnung von Maßangaben. Alle Personen-, Orts- und Institutionsnamen sowie Literaturangaben in den Quellentexten (und ihren Metadaten) werden mit ihren jeweiligen Registereinträgen verknüpft.

Begleittexte

Alle weiteren Texte, wie z.B. die einführenden Forschungsbeiträge zum Tagebuch-Fragment „Isle de Cube. Antilles en général“, wurden ebenfalls in TEI-XML gemäß dem Basisformat des Deutschen Textarchivs erfasst.

Register

Die Register zu Personen, Orten und Institutionen werden in TEI-XML bearbeitet und vorgehalten. Jeder Eintrag verfügt über eine eigene, eindeutige und permanente Identifizierungsnummer. Er soll darüber hinaus aber mit einer oder ggf. mehreren IDs aus den entsprechenden Normdateien versehen werden (sofern ein Eintrag in der Normdatei existiert), um eine projektübergreifende Identifizierung der Personen, Orte etc. zu ermöglichen. Zusätzlich zu den Basisdaten eines Eintrags wird außerdem eine Kurzbeschreibung vorgehalten. Darüber hinaus wurden im Rahmen des Projekts die Registerangaben von 25 zwischen 1973 und 2016 veröffentlichten Editionen (Briefe, Dokumente, Tagebuch-Exzerpte) der Alexander von Humboldt-Forschung retrodigitalisiert und zusätzlich bereitgestellt. Die Registerinformationen der gedruckten Editionen sind Teil der zunächst im Akademie-Verlag und schließlich bei De Gruyter veröffentlichten Reihe Beiträge zur Alexander von Humboldt-Forschung, herausgegeben von der Alexander-von-Humboldt-Forschungsstelle (1970–2014) der BBAW. Verknüpfungen zu anderen Registereinträgen und den edierten Materialien werden automatisiert aus der Datenbank ausgelesen.

Bibliographie

Die Bibliographie der Edition wird in der Literaturverwaltungssoftware Zotero gepflegt. Die öffentlich einsehbare Zotero-Gruppe ermöglicht die kollaborative Pflege der Daten und kann von allen Interessierten abgerufen werden– auch in verschiedenen Zitierstilen und Exportformaten.

Verwendete Daten & Webservices

Für die digitale Edition wurden an mehreren Stellen Daten aus Drittprojekten nachgenutzt bzw. externe Webservices verwendet.

Cascaded Analysis Broker des Deutschen Textarchiv (DTA::CAB)

Die normale Suche kann um eine Funktion erweitert werden, die auch historische Schreibweisen und andere Wortformen findet. Zu diesem Zweck werden die edierten Texte mit Hilfe des Webservices DTA::CAB linguistisch analysiert und annotiert. Dabei werden u.a. auch alle Wörter lemmatisiert, so dass auf Basis dieses Lemma gesucht werden kann. Der DTA::CAB wird im Rahmen des Deutschen Textarchivs von Bryan Jurish entwickelt. Für weitere Informationen siehe die Dokumentation oder B. Jurish: Finite-state Canonicalization Techniques for Historical German. PhD thesis, Universität Potsdam, 2012. URN urn:nbn:de:kobv:517-opus-55789.

Humboldts Schriften im Deutschen Textarchiv

Im Deutschen Textarchiv sind etwa 170 Schriften Alexander von Humboldts TEI-XML-kodiert im Volltext verfügbar. In der Chronologie wurde eine Funktion implementiert, die die Titeldaten dieser Schriften mit anzeigt bzw. durchsucht. Dafür wird die vom Deutschen Textarchiv bereitgestellte D* OpenSearch API verwendet. Dadurch ist es auch möglich, die Anzahl der Treffer (falls ein Suchbegriff verwendet) mit anzugeben und direkt auf die Trefferliste zu verlinken.

Digitalisate Bibliographie auf avhumboldt.de

Im Rahmen des Portals avhumboldt.de wird unter der Leitung von Tobias Kraft seit 2009 eine Digitalisate-Bibliographie der selbständig erschienenen Schriften Alexander von Humboldts bereitgestellt. Die Daten dieser Bibliographie wurden in XML konvertiert und in die Datenbank der edition humboldt digital integriert, um in der Chronologie angezeigt werden zu können.

correspSearch

Der Webservice correspSearch aggregiert maschinenlesbare Briefverzeichnisse von gedruckten oder digitalen Briefeditionen und macht sie zentral recherchierbar. Darüber hinaus bietet er eine Schnittstelle an, die es ermöglicht, diese Daten auch automatisiert abzufragen und in eigenen Programmen nach zu nutzen. Da Humboldts Korrespondenz nicht in einer Gesamtausgabe erscheint, sind die in correspSearch aggregierten Daten zu Briefen an und von Alexander von Humboldt für die Forschung sehr nützlich. In edition humboldt digital werden diese Daten über die API von correspSearch an zwei Stellen abgefragt: zum einen in der Chronologie (bei entsprechender Aktivierung dieser Option), zum anderen in der Einzelansicht eines Briefes unter „Briefnetz erkunden“. Dort werden Briefe von und an Alexander Humboldt aus anderen Editionen abgefragt, um sichtbar zu machen, mit welchen anderen Korrespondenzpartner Humboldt im jeweiligen Zeitraum noch Kontakt hatte. Darüber hinaus wird auch angezeigt, welche Briefe der jeweilige Korrespondenzpartner im entsprechenden Zeitraum empfangen und versendet hat. Auf diese Weise soll der „erweiterte Korrespondenzkontext“ des Briefnetzes sichtbar gemacht werden.

GeoNames & OpenStreetMap

Die im Register verzeichneten Orte und Institutionsstandorte sind in der Regel mit einer ID der freien geographischen Datenbank GeoNames versehen. Dadurch können die Orte projektübergreifend identifiziert werden, was die Nachnutzung der Daten erheblich vereinfacht. Darüber hinaus werden anhand der GeoNames-ID Koordinaten bezogen, auf deren Basis mit Hilfe des freien Kartendienstes OpenStreetMap eine entsprechende Karte bei den Orts- und Institutionseinträgen angezeigt werden kann.

Gemeinsame Normdatei & BEACON

Anhand der in den Registereinträgen notierten ID, die in der Regel der Gemeinsamen Normdatei (GND) entnommen wird, können weitere Daten über den Web Service „Entity Facts“ der GND bezogen werden. Derzeit werden dadurch vor allem die Beziehungen zwischen Personen im Register angezeigt.

Anhand der GND-ID ist es außerdem möglich weitere Editionen, Lexika und Projekte zu verlinken, die im Themenbereich der edition humboldt digital relevant sind. Dafür werden die jeweiligen BEACON-Schnittstellen dieser Projekte genutzt.

Lizenzierung & API

Die edition humboldt digital nutzt nicht nur externe Daten und Webservices nach, sondern stellt ihre Daten wiederrum unter der freien Creative Commons-Lizenz CC-BY-SA 4.0 über eine Schnittstelle zur Verfügung. Desweiteren werden die Metadaten über mehrere Schnittstellen (OAI-PMH, CMIF und BEACON) angeboten. Mehr Informationen zur API

Langzeitverfügbarkeit und Permalinks

Die in edition humboldt digital bereitgestellten Texte und Daten sind mit Permalinks versehen, die auf die jeweilige Version referenzieren, z.B.: http://edition-humboldt.de/v1/H0002656. Alle Versionen werden von der BBAW zum Abruf vorgehalten. Darüber hinaus sind die einzelnen Texte und Datensätze auch mit einer kanonischen URL versehen, die stets auf die aktuellste Version weiterleitet. Dabei entfällt einfach der Versionshinweis im Pfad, z.B. http://edition-humboldt.de/H0002656.