Jump label

Service navigation

Main navigation

You are here:

Main content

Fachprojekt Computervision

Aktuelles

Aufgrund der aktuellen Situation steht noch nicht fest, ob die Veranstaltung online oder in Präsenz stattfinden wird.

Allgemeine Informationen

Zeiten: Donnerstags 14:15 - 17:45 Uhr
Ort: tbd.

 

Inhalt

Das Fachprojekt:

Das Forschungsgebiet der Computer Vision beschäftigt sich mit der Nachbildung der visuellen Perzeption des Menschen durch Rechner. Insbesondere sollen Aufgaben wie Erkennung oder Objekt Detektion bis hin zur Interpretation komplexer Szenen mit möglichst wenigen Einschränkungen gelöst werden.

In diesem Fachprojekt sollen die Studierenden anhand verschiedener Datensätze zunächst klassische Ansätze, basierend auf heuristischen Merkmalen, für Erkennungs- und Retrieval-Aufgaben realisieren. Anschließend sollen dieselben Problemstellungen mit Hilfe künstlicher neuronaler Netze und Deep Learnings bearbeitet werden:

Image

Abbildung 1: Bag-of-Feature Repräsentation zu Bildklassifikation. Das Konzept der Bag-of-Feature Repräsentation erlaubt es Bilder auf Basis typischer visueller Merkmale in einem Vektorraum zu repräsentieren. Hierzu werden zunächst sogenannte Bilddeskriptoren anhand eines regulären Gitters berechnet. Das Clustern dieser resultiert in der Identifikation typischer Ausprägung, welche als "Visual Vocabulary" die Grundlage der zu erstellenden Repäsentation bilden. Im Anwendungsfall werden zunächst wieder Bilddeskriptoren für ein Bild berechnet und diese auf ihre ähnlichsten visuellen Wörter im "Visual Vocabulary" abgebildet. Abschließend können Frequenzen der auftretenden Merkmale in einem Histogramm zusammengefasst werden. Diese mächtige Bildrepräsentation findet in vielen Klassifikationsmodellen Anwendung.

Image

Abbildung 2: Im Bereich der Computer Vision fand in den letzten Jahren ein fundamentaler Paradigmenwechsel statt. Während klassische Methoden Merkmalsextraktion und Klassifikation trennen, bieten Neuronale Faltungsnetze die Möglichkeit beide Schritte in einem Framework zu vereinen. Dies macht sie aktuell zu den weit verbreitetsten und erfolgreichsten Modellen für eine Vielzahl an Aufgaben.

Praktische Arbeit während des Fachprojekts:

Die praktischen Aufgaben sollen mit Python als Programmiersprache sowie NumPy und SciPy als Python Bibliotheken umgesetzt werden.
Die Sprache Python bietet eine Fülle von funktionalen und objektorientierten Konzepten, die sich in diesem Zusammenhang eignen.
Darüber hinaus stehen mit SciPy (Scientific Python) für wissenschaftliche und NumPy (Numeric Python) für numerische Berechnungen zwei Python-Programmierbibliotheken  zur Verfügung. Zur Implementierung von künstlichen neuronalen Netzen wird das Framework PyTorch verwendet.

Inhalt und Gliederung des Fachprojekts:

Nach einer Einführungsphase gliedert sich das Fachprojekt in zwei Teile. Im ersten Teil bearbeiten die Studierenden grundlegende Aufgaben aus den oben beschriebenen ausgewählten Bereichen der Computer Vision. Im zweiten Teil führen die Studierenden in Kleingruppen verschiedene Aspekte der vorher absolvierten Aufgaben zusammen, um komplexere Probleme zu lösen und sich ebenfalls mit der Anwendung auf „echten“ (selbst aufgezeichneten) Daten auseinanderzusetzen. Die Ergebnisse dieser Projektphase werden anschließend in einer Abschlusspräsentation vorgestellt.

 

Nützliche Links

Python Tutorial: Python-KursTutorialspoint

Numpy Tutorial: Python-Kurs, Tutorialspoint

Scipy Tutorial: SciPy-Doc

Matplotlib Tutorial: PyplotPython-Kurs

PySide Turorial: PythonCentral, Tutorialspoint (für PyQt. weitgehend ähnliche API)



Sub content

Contact

Kai Brandenbusch, M.Sc.
Tel.: 0231 755-6330
kai.brandenbusch(at)tu-dortmund.de