Innovationsportal

« Forschungslandschaft: Projekte

Medical Mining mit überwachten und halbüberwachten Methoden

Projektbearbeiter:
M.Sc. Tommy Hielscher
Finanzierung:
Haushalt;
Klassifizierungsmodelle werden in einer Vielzahl von Anwendungen eingesetzt, um Objekte automatisch einer von mehreren vordefinierten Kategorien zuzuordnen. Im Zusammenhang mit Medical Mining können die Objekte Patienten oder Studienteilnehmer sein, und das Zielergebnis kann eine untersuchte Krankheit oder Störung sein. Hier werden die Objekte oft durch mehrdimensionale Merkmalsvektoren dargestellt, und Klassifizierungsmodelle werden durch das Lernen von Assoziationen zwischen Merkmalen und dem medizinischen Ergebnis aus einer Menge von Objekten, bei denen das Ergebnis bekannt ist, induziert. In realen medizinischen Bereichen können die Objekte jedoch komplex sein und sich im Laufe der Zeit ändern, da sie durch verschiedene unterschiedlich skalierte Merkmale und Hintergrunddaten mit zusätzlichen Informationen beschrieben werden. Um hier qualitativ hochwertige Klassifizierungsmodelle zu erstellen, müssen relevante Dimensionen in Bezug auf die Klassenvariable identifiziert werden, indem Methoden eingesetzt werden, die den Anforderungen solcher Objekte gerecht werden und gleichzeitig das verfügbare Hintergrundwissen berücksichtigen.
In unserer Arbeit verwenden wir beschriftete Daten, Beschränkungen der Objektähnlichkeit und historische Aufzeichnungen von Patienten/Studienteilnehmern, um relevante explizite und implizite Dimensionen zu identifizieren, die für medizinische Ergebnisse relevant sind. Wir argumentieren, dass die derzeitigen Methoden für diese Aufgabe nicht in jeder Hinsicht geeignet sind und daher neue Ansätze erforderlich sind:

Sich entwickelnde Objekte werden während ihrer Entwicklung mehrfach beobachtet. Traditionelle Algorithmen, die relevante Dimensionen mit Hilfe von gelabelten Trainingsdaten identifizieren, können nicht angewendet werden. Wir erweitern daher klassische Methoden der Merkmalsauswahl, um mit sich entwickelnden Objekten umzugehen.

Die ausschließliche Berücksichtigung von markierten Daten zur Ermittlung relevanter Dimensionen ist nicht immer praktikabel. Solche Daten sind möglicherweise nicht oder nur in geringen Mengen vorhanden, und die Berücksichtigung zusätzlicher Hintergrundinformationen über die untersuchten Objekte kann die Ergebnisse verbessern. Wir entwickeln daher Methoden, die Einschränkungen bezüglich der Ähnlichkeit von Objekten verwenden, um die Notwendigkeit von gelabelten Trainingsdaten zu ersetzen und objektgruppenspezifische relevante Dimensionen zu finden.

Die Entwicklung von Objekten, die durch ihre Mehrfachbeobachtungen beschrieben wird, kann implizit Dimensionen enthalten, die für die vorliegende Klassifizierungsaufgabe relevant sind. Das Weglassen dieser Dimensionen kann die Qualität des resultierenden Klassifikationsmodells erheblich beeinträchtigen. Wir entwickeln daher Strategien zur Ableitung von Dimensionen aus der Entwicklung eines Objekts und entwickeln eine Methode zur Erkennung und Kodierung relevanter Entwicklungsmuster.

Kontakt

weitere Projekte

Die Daten werden geladen ...