Grad-CAM angewandt auf verschiedene OCT-Bilder (Bildquelle: Rama Hasan)

Informatik trifft auf Augenheilkunde – Untersuchung der Wirksamkeit von vortrainierten Netzwerken auf OCT-Datensätzen

Datum: 06.10.2020 Text: Falk Schmidsberger und Isabelle Kuxdorf-Dixon

Beispiele von OCT Bilddaten

(Bildquelle: Medizinisches Augenzentrum Freiburg)

In den letzten Jahren wurden künstliche neuronale Netze (KNNs) ein leistungsfähiges Werkzeug zur Lösung verschiedener Aufgaben in Bereichen wie natürlicher Sprachverarbeitung, Spracherkennung, Computer Vision sowie semantischer Segmentierung oder Objekterkennung. Der Erfolg wurde in erster Linie durch tiefe KNNs erreicht. Die Tiefe des Netzes macht es robuster und ermöglicht die Extraktion von Unterscheidungsmerkmalen auf mehreren Abstraktionsebenen. Die Ersterstellung eines tiefen KNNs erfordert eine riesige Menge an annotierten Trainingsdaten, was im Bereich der medizinischen Bildklassifizierung und -erkennung eine große Herausforderung darstellt, da es in vielen Anwendungsfällen nicht einfach ist, diese Daten zu erhalten. Zusätzlich werden für das zeitaufwendige Training der KNNs umfangreiche Rechen- und Speicherressourcen benötigt. Um dieses Problem zu umgehen, werden schon vortrainierte KNNs benutzt, die auf einem großen Datensatz natürlicher Bilder (nicht medizinisch) über Hunderte von Stunden auf leistungsstarken GPUs trainiert wurden. So können sie als Ausgangspunkt für ein neues Training dienen, um ähnliche Probleme zu lösen, ohne dass das Netzwerk wieder von Grund auf neu trainiert wird. Hierbei werden insbesondere die bereits ausgebildeten Faltungs-Schichten durch Feinabstimmung und Transfer-Lernen optimiert, um den neuen Problemen gerecht zu werden.

Die Arbeit von Rama Hasan (M.Sc.), Dipl.-Inf. Holger Langner, Prof. Dr. Marc Ritter und Prof. Dr. Maximilian Eibl untersucht die Effektivität der Anwendung von vortrainierten (Naturbild-)Modellen auf gezielt ausgewählte fremde Domänen, um deren Grad der Übertragbarkeit zu bestimmen. Hierzu werden zwei vortrainierte KNNs und ein speziell neu erstelltes KNN in der Domäne der OCT (Optische Kohärenz Tomographie) Bilder miteinander verglichen. Für ein besseres Verständnis der, für die KNNs wichtigen Bildmerkmale, wird die Crad-CAM Visualisierung verwendet.

Das gesamte Paper, das auf der Konferenz: „Actual Problems of System and Software Engineering (APSSE 2019)“ in Moskau veröffentlicht wurde, findest du zum weiter lesen unter: https://www.researchgate.net/publication/338406014