Zwei Beiträge bei ICDAR 2026 angenommen

Zwei Beiträge bei ICDAR 2026 angenommen
Wir freuen uns, bekannt geben zu können, dass zwei Beiträge unserer Gruppe bei der 20th International Conference on Document Analysis and Recognition (ICDAR 2026), die in Wien, Österreich, stattfinden wird, angenommen wurden.
Der erste Beitrag, "Recent Advances in Information Extraction from Historical Archival Records", beschäftigt sich mit der Extraktion von Informationen aus historischen Antragsformularen für die Pflege und Instandhaltung des Zweiten Weltkriegs. Aufbauend auf früheren Arbeiten zum CM/1-Datensatz werden in diesem Beitrag Bildsprachmodelle wie PaliGemma und Donut unter extremer Annotationsknappheit untersucht, einschließlich Einstellungen mit nur 1% der verfügbaren Beschriftungen. Die Arbeit untersucht das feldübergreifende Vortraining und die Erzeugung synthetischer Dokumente als Strategien für das Lernen mit wenigen Daten und stellt CM/1v2 vor, einen erweiterten Datensatz mit zusätzlichen annotierten Feldern wie Nationalität, Geburtsort und Religion.
Das zweite Papier, "Writer Retrieval at Scale", stellt FormWR vor, einen groß angelegten Benchmark für die Suche nach Schriftstellern mit fast 400.000 Seiten, die fast 100.000 Schriftstellern zugeordnet sind. Der Beitrag stellt außerdem eine durchgängig überwachte Suchmethode mit einem neuartigen lernfähigen Aggregationsmodul, X-VLAD, vor. Nach einem Vortraining auf handschriftzentrierten Feldern und einer Feinabstimmung auf ganzseitigen Bildern erreicht die Methode neue Spitzenergebnisse im HisFragIR20-Benchmark mit 97,9 % Top-1-Genauigkeit und 78,8 % mAP.
Zusammen liefern die beiden Arbeiten neue Datensätze, Methoden und Auswertungen für die Analyse historischer Dokumente, die sowohl die strukturierte Informationsextraktion als auch die Suche nach Schriftstellern in großem Maßstab abdecken.
![[Translate to English:] [Translate to English:]](/storages/zentraler_bilderpool/_processed_/4/b/csm_Ku__nstliche_Intelligenz_Pixabay_7559331fd1.jpg)
![[Translate to English:] [Translate to English:]](/storages/zentraler_bilderpool/_processed_/3/a/csm_Arbeitsplatz-Laptop-Notizbuch_02_ea47030ac6.jpg)
![[Translate to English:] [Translate to English:]](/storages/patrec-cs/_processed_/7/f/csm_lecture_41ff85494b.png)

![[Translate to English:] [Translate to English:]](/storages/zentraler_bilderpool/_processed_/3/9/csm_Kopfbild_Campus_Nord_Panorama_a5a67a943b.jpg)