Zum Inhalt
Fakultät für Informatik
Projektgruppe "HistWeb"

Projektgruppe "HistWeb" reicht Abschlussbericht ein

Detail view of a single newspaper page © PG HistWeb​/​TU Dortmund

Studierende der Projektgruppe "HistWeb" haben ihre Arbeit an einer interaktiven Website zur Analyse und Verwaltung historischer Zeitungsarchive erfolgreich abgeschlossen.

Masterstudenten der TU Dortmund haben in der Projektgruppe HistWeb im vergangenen Jahr eine Plattform zur Analyse historischer Zeitungen entwickelt. Die Plattform ermöglicht es Informationen aus der Vielzahl an Zeitungsartikeln der letzten Jahrhunderte zu gewinnen, die zumeist nur in Form von digitalen Scans vorhanden sind und nicht von klassischen Suchmaschinen verarbeitet werden. Dadurch ist es einfacher möglich, Ereignisse der Vergangenheit wiederzuentdecken, die zuletzt durch die große Menge an Daten und die anspruchsvoll zu lesende Frakturschrift unzugänglich blieben. Die webbasierte Plattform verfügt neben einer vollautomatischen Textextraktion aus den gescannten Dokumenten auch über Funktionen, die die Suche erleichtern, wie dem automatischen Erkennen von wichtigen Begriffen, Wordclouds für einen schnellen Überblick sowie einer natürlichsprachlichen und einer erweiterten Suchfunktion.