Der Forschungsschwerpunkt „Ontology-guided MEdical Data Analysis” (kurz OMEDA) umfasst (Ontologie-basierte) generische Softwaresysteme zur Erfassung, Validierung und Verarbeitung von komplexen medizinischen Forschungsdaten sowie Medical Data Analytics im weitesten Sinne.

Domain-Expert: Vorrangiges Ziel ist dabei nicht die Entwicklung von neuen Analysealgorithmen, sondern vielmehr die Fragestellung, wie man es Domänen-ExpertInnen (medizinische ForscherInnen, klinische Prozess-AnalytikerInnen, QM-ManagerInnen, …), die in der Regel keine IT und Data-Analytics-ExpertInnen sind, erlaubt, Wissen aus ihren Daten zu extrahieren. Es werden sowohl Prozessmodelle (Process of Knowledge Discovery in Databases – KDD) betrachtet und erweitert als auch auf technischer Ebene Algorithmen und Methoden dahingehend untersucht und erweitert, um durch Domänen-ExpertInnen einfach aber auch sicher eingesetzt werden zu können.

Ontology-Guided: Inhaltlich wird hauptsächlich auf technischer Ebene im Bereich der statistischen Analyseverfahren und entsprechende Ontologie-gesteuerter User-Guidance, sowie im mathematischen Bereich der Ontologie-gestützten Abstandsberechnung von komplex strukturierten Daten gearbeitet.

Medical Data Analysis: Hier entstehen Konzepte im Kontext von innovationsgetriebener Medizin und Mensch-Maschine Symbiose durch den Einsatz von Ontologien zur Wissensgewinnung aus großen komplex strukturierten heterogenen Datenmengen („Doctor-in-the-Loop“). Der Hauptaspekt liegt hier sowohl in der Vor- und Aufbereitung von medizinischen Daten als auch in der sicheren Anwendung und Interpretation durch medizinische ForscherInnen.

Das Ziel des Konzepts „Doctor-in-the-Loop“ ist es, Domänenwissen der medizinischen ExpertInnen während des Analyseprozesses einfließen zu lassen (z.B. über interaktives Machine Learning oder Domänen-Ontologien) und die Ergebnisse sofort wieder an die Domänen-ExpertInnen zurückzuliefern, die dieses Wissen korrekt interpretieren und in ihren Wissenspool eingliedern können. Dabei wird v.a. auf Techniken wie Visual Analytics gesetzt. Zusammenhänge und Unterschiede in den Daten können visuell schneller und einfacher erfasst werden als über komplexe, numerische Resultate. Als Basis von Clustering Algorithmen dienen Metriken und Abstandsmaße mit der Intention, eine aussagekräftige Repräsentation der Daten zu generieren. Die Basis dafür liegt in der sauberen Aufbereitung und Validierung der gesammelten Daten, um sowohl mit einer guten Auswahl an Features (Feature generation) als auch der überprüften Voraussetzungen hinsichtlich Daten und angewandten Methoden verlässliche Analyseergebnisse zu erhalten.