Internally funded project
Acronym: OCEAN
Start date : 01.11.2013
Mehr und mehr Unternehmen sammeln möglichst alle anfallenden Daten in sogenannten "Data Lakes". Obwohl die Daten damit prinzipiell für beliebige Analysen zur Verfügung stehen, bleibt es dennoch unerlässlich für die Analyse, ein Verständnis für die Bedeutung und die Verknüpfungsoptionen der Daten zu entwickeln. Analysten, die diese Arbeit bereits geleistet haben, formulieren Anfragen, in denen solches Wissen implizit enthalten ist. Wenn dieses Wissen jedoch nicht mit anderen geteilt wird, bleiben mögliche Synergien ungenutzt und das Verständnis der Daten im "Data Lake" wird erschwert. Wir extrahieren automatisiert Teile dieses Wissens aus analytischen Anfragen, um es in aufbereiteter Form für nachfolgende Analysen nutzen zu können. Datenanalysten werden dadurch schneller auf relevante Datenquellen aufmerksam und die Datenintegration wird erleichtert.
Mehr und mehr Unternehmen sammeln möglichst alle anfallenden Daten in sogenannten "Data Lakes". Obwohl die Daten damit prinzipiell für beliebige Analysen zur Verfügung stehen, bleibt es dennoch unerlässlich für die Analyse, ein Verständnis für die Bedeutung und die Verknüpfungsoptionen der Daten zu entwickeln. Analysten, die diese Arbeit bereits geleistet haben, formulieren Anfragen, in denen solches Wissen implizit enthalten ist. Wenn dieses Wissen jedoch nicht mit anderen geteilt wird, bleiben mögliche Synergien ungenutzt und das Verständnis der Daten im "Data Lake" wird erschwert. Wir extrahieren automatisiert Teile dieses Wissens aus analytischen Anfragen, um es in aufbereiteter Form für nachfolgende Analysen nutzen zu können. Datenanalysten werden dadurch schneller auf relevante Datenquellen aufmerksam und die Datenintegration wird erleichtert.