Internally funded project
Acronym: SIML
Start date : 01.08.2018
Within the project SIML (Schema Inference and Machine Learning), methods of topological data analysis and unsupervised learning are combined, applied and further developed in order to derive a conceptual schema from unstructured, multivariant data.
Im Rahmen des Projekts SIML (Schemainferenz und
maschinelles Lernen) sollen aus unstrukturierten und semi-strukturierten Daten Informationen gewonnen werden, aus denen ein partielles konzeptuelles Schema abgeleitet werden kann. Methoden der topologischen Datenanalyse (TDA) werden in Kombination mit maschinellen Lernverfahren eingesetzt um dies weitestgehend zu automatisieren. Die Untersuchung von topologischen Merkmalen bietet eine Möglichkeit Informationen über Daten zu gewinnen, die als qualitativ verstanden werden. Insbesondere interessieren wir uns für eine stabile, persistente Form von natürlichen Daten bei der Verwendung von unüberwachten Lernverfahren. Als Kernkonzept sollen funktionale Abhängigkeiten nach der Aufbereitung der Daten untersucht werden, mit deren Hilfe anschließend ein geeignetes Schema definiert werden kann. Dabei gibt es Parallelen und Unterschiede für Zeitreihen bzw. persistente Daten, die ebenfalls herausgearbeitet werden sollen.
Motivation des Projekts ist der Nachweis, dass Schemata eine natürliche geometrische Struktur in Form eines Simplizialkomplexes aufweisen, die mittels topologischer Methoden untersucht bzw. sichtbar gemacht werden kann.