Zum Inhalt
Fakultät für Informatik
Forschung

Dokumentenanalyse


Color highlighted word search results © Leonard Rothacker​/​TU Dortmund
Example of named entity extraction © Oliver Tüselmann​/​TU Dortmund

Die digitale Konvertierung von Dokumenten (Bücher, Formulare, alte Archive, Korrespondenz usw.) ist eine weltweite Bestrebung. Unser Ziel ist es, erstklassige Lösungen im Bereich der Bildverarbeitung anzubieten und zu entwickeln, um diesen Digitalisierungsprozess zu unterstützen. Während moderne Verfahren in der Regel auf maschinellem Lernen und damit auf einer beträchtlichen Menge von Trainingsdaten beruhen, liegt ein Forschungsschwerpunkt der Arbeitsgruppe darauf, den Datenbedarf von Dokumentenanalysemodellen zu verringern. Durch die Nutzung von Techniken wie transfer-, teil- oder schwach-überwachten Lernen wird die Anwendung von Modellen des machinellen Lernens einfacher und erfordert im besten Fall keine manuell annotierten Daten. Zudem liegt ein weiterer Schwerpunkt auf der Entwicklung und Erforschung von automatisierten, semantischen Analyseverfahren für handschriftliche Dokumentenbilder.