Zum Inhalt
Fakultät für Informatik
Fachprojekt

Computervision


Informationen

Die Veranstaltung wird in Präsenz stattfinden.

Zeiten: Donnerstag, 14:15 - 17:15 Uhr
Ort: OH16, U08

Die Veranstaltung wird in Präsenz stattfinden und gegebenenfalls online Elemente enthalten.

Zeiten: Dienstags 14:15 - 17:45 Uhr (ab 04.04.2023)
Ort: OH16, U08

Inhalt

Das Forschungsgebiet der Computer Vision beschäftigt sich mit der Nachbildung der visuellen Perzeption des Menschen durch Rechner. Insbesondere sollen Aufgaben wie Erkennung oder Objekt Detektion bis hin zur Interpretation komplexer Szenen mit möglichst wenigen Einschränkungen gelöst werden.

In diesem Fachprojekt sollen die Studierenden anhand verschiedener Datensätze zunächst klassische Ansätze, basierend auf heuristischen Merkmalen, für Erkennungs- und Retrieval-Aufgaben realisieren. Anschließend sollen dieselben Problemstellungen mit Hilfe künstlicher neuronaler Netze und Deep Learnings bearbeitet werden.

Bag-of-Features Repräsentation zur Bildklassifikation. Das Konzept der Bag-of-Features Repräsentation erlaubt es Bilder auf Basis typischer visueller Merkmale in einem Vektorraum zu repräsentieren. Hierzu werden zunächst sogenannte Bilddeskriptoren anhand eines regulären Gitters berechnet. Das Clustern dieser resultiert in der Identifikation typischer Ausprägung, welche als "Visual Vocabulary" die Grundlage der zu erstellenden Repäsentation bilden. Im Anwendungsfall werden zunächst wieder Bilddeskriptoren für ein Bild berechnet und diese auf ihre ähnlichsten visuellen Wörter im "Visual Vocabulary" abgebildet. Abschließend können Frequenzen der auftretenden Merkmale in einem Histogramm zusammengefasst werden. Diese mächtige Bildrepräsentation findet in vielen Klassifikationsmodellen Anwendung.
Im Bereich der Computer Vision fand in den letzten Jahren ein fundamentaler Paradigmenwechsel statt. Während klassische Methoden Merkmalsextraktion und Klassifikation trennen, bieten Neuronale Faltungsnetze die Möglichkeit beide Schritte in einem Framework zu vereinen. Dies macht sie aktuell zu den weit verbreitetsten und erfolgreichsten Modellen für eine Vielzahl an Aufgaben.

Praktische Arbeit während des Fachprojekts:

Die praktischen Aufgaben sollen mit Python als Programmiersprache sowie NumPy und SciPy als Python Bibliotheken umgesetzt werden.
Die Sprache Python bietet eine Fülle von funktionalen und objektorientierten Konzepten, die sich in diesem Zusammenhang eignen.
Darüber hinaus stehen mit SciPy (Scientific Python) für wissenschaftliche und NumPy (Numeric Python) für numerische Berechnungen zwei Python-Programmierbibliotheken  zur Verfügung. Zur Implementierung von künstlichen neuronalen Netzen wird das Framework PyTorch verwendet.

 

Inhalt und Gliederung des Fachprojekts:

Nach einer Einführungsphase gliedert sich das Fachprojekt in zwei Teile. Im ersten Teil bearbeiten die Studierenden grundlegende Aufgaben aus den oben beschriebenen ausgewählten Bereichen der Computer Vision. Im zweiten Teil führen die Studierenden in Kleingruppen verschiedene Aspekte der vorher absolvierten Aufgaben zusammen, um komplexere Probleme zu lösen und sich ebenfalls mit der Anwendung auf „echten“ (selbst aufgezeichneten) Daten auseinanderzusetzen. Die Ergebnisse dieser Projektphase werden anschließend in einer Abschlusspräsentation vorgestellt.