Maschinelle Lernmethoden zur Generierung von Themenmodellen in technischen Planungsunterlagen im Verkehrswasserbau

Text Mining, Topic Modeling, Machine Learning, Wasserbau

Masterarbeit

Im Prozess des Planens, Bauens und Betreibens von Objekten der wasserbaulichen Infrastruktur fällt bei den zuständigen Behörden eine große und variantenreiche Anzahl an Dokumenten an. Hierarchische Ablagesysteme versehen mit Metadaten reichen häufig nicht aus um die Dokumente gezielt zu durchsuchen. Forschungsgegenstand sind daher maschinelle Lernverfahren, die auf Basis des gegebenen Dokumentenbestands neue Ordnungssysteme generieren und die bestehenden Dokumente darin eingliedern können.

Die Wasserstraßen- und Schifffahrtsverwaltung des Bundes verantwortet eine Vielzahl technischer Unterlagen in ihrem Archivsystem. Diese umfassen die Entwurfsaufstellung gemäß VV-WSV 2107, welche sich über den gesamten Planungszyklus von der Grundlagenermittlung bis zur Ausführungsplanung erstreckt. Hierbei fallen technische Berechnungen, Formulare sowie Bild- und Plangut an. Die Ablage erfolgt objektbezogen unter Angabe verschiedener beschreibender Attribute durch den Sachbearbeiter. Von Interesse sind nun Verfahren, die auf Basis des der angegebenen Texte in den Dokumenten automatisiert Themenmodelle generieren, um mit diesen die Dokumente zuzuordnen. Da eine menschliche Interpretierbarkeit und graduelle Steuerbarkeit der gefundenen Themenmodelle gewünscht ist, sollen in der Arbeit verschiedene Textmining-Methoden recherchiert und miteinander verglichen werden, die sich dem Semi-supervised learning zuordnen lassen. Eine ausführliche Validierung anhand wasserbaulicher Dokumente ist vorgesehen.

Betreuer
André Hoffmann, M.Sc.

Voraussetzungen
Kenntnisse in objektorientierter Programmierung, nach Möglichkeit Vorkenntnisse in Python

Beginn
Ab sofort

Weitere Informationen
BAW – Digitalisierung im Verkehrswasserbau