24.05.2022 - Beijing Institute of Technology

Maschinelles Lernen reduziert Arbeitsaufwand bei der Zellzählung zur Krankheitsdiagnose radikal

Der Einsatz des maschinellen Lernens zur Durchführung von Blutzellzählungen für die Krankheitsdiagnose anstelle von teuren und oft weniger genauen Zellanalysemaschinen war jedoch sehr arbeitsintensiv, da für das Training des maschinellen Lernmodells eine enorme Menge an manuellen Anmerkungen durch Menschen erforderlich ist. Forscher der Benihang-Universität haben jedoch eine neue Trainingsmethode entwickelt, die einen Großteil dieser Tätigkeit automatisiert.

Ihr neues Trainingsverfahren wird in einem Artikel beschrieben, der am 9. April in der Zeitschrift Cyborg and Bionic Systems veröffentlicht wurde.

Die Anzahl und die Art der Zellen im Blut spielen oft eine entscheidende Rolle bei der Diagnose von Krankheiten, aber die Zellanalysetechniken, die üblicherweise für die Zählung von Blutzellen verwendet werden - dazu gehören der Nachweis und die Messung der physikalischen und chemischen Eigenschaften von in Flüssigkeit suspendierten Zellen - sind teuer und erfordern komplexe Vorbereitungen. Noch schlimmer ist, dass die Genauigkeit der Zellanalysegeräte nur etwa 90 Prozent beträgt, da verschiedene Einflüsse wie Temperatur, pH-Wert, Spannung und Magnetfeld die Geräte verwirren können.

Um die Genauigkeit zu verbessern, die Komplexität zu verringern und die Kosten zu senken, wurde in letzter Zeit viel über Alternativen geforscht, nämlich über den Einsatz von Computerprogrammen zur "Segmentierung" von Fotos des Blutes, die mit einer an ein Mikroskop angeschlossenen Hochauflösungskamera aufgenommen wurden. Bei der Segmentierung werden Algorithmen eingesetzt, die Pixel für Pixel markieren, was auf einem Foto zu sehen ist, in diesem Fall, welche Teile des Bildes Zellen sind und welche nicht - im Wesentlichen wird die Anzahl der Zellen in einem Bild gezählt.

Bei Bildern, in denen nur ein einziger Zelltyp vorkommt, erreichen solche Methoden ein annehmbares Maß an Genauigkeit, doch bei Bildern mit mehreren Zelltypen schneiden sie schlecht ab. Um dieses Problem zu lösen, haben sich die Forscher in den letzten Jahren den Faltungsneuronalen Netzen (CNN) zugewandt - einer Art des maschinellen Lernens, die die Verbindungsstruktur des menschlichen visuellen Kortex widerspiegelt.

Damit das CNN diese Aufgabe erfüllen kann, muss es zunächst "trainiert" werden, um zu verstehen, was eine Zelle ist und was nicht, und zwar auf vielen Tausenden von Bildern von Zellen, die von Menschen manuell beschriftet wurden. Wenn ihm dann ein neues, nicht beschriftetes Bild vorgelegt wird, erkennt es die Zellen darin und kann sie zählen.

"Eine solche manuelle Kennzeichnung ist jedoch mühsam und teuer, selbst wenn sie mit Hilfe von Experten durchgeführt wird", so Guangdong Zhan, Mitautor der Studie und Professor am Fachbereich Maschinenbau und Automatisierung der Beihang-Universität, "was den Zweck einer Alternative zunichte macht, die einfacher und billiger sein soll als Zellanalysatoren".

Daher entwickelten die Forscher der Beihang University ein neues Schema für das Training des CNN, in diesem Fall U-Net, ein voll gefaltetes Netzwerksegmentierungsmodell, das seit seiner Entwicklung im Jahr 2015 in der medizinischen Bildsegmentierung weit verbreitet ist.

Bei dem neuen Trainingsschema wird das CNN zunächst auf einem Satz von vielen Tausend Bildern mit nur einem Zelltyp (aus dem Blut von Mäusen) trainiert.

Diese einzelligen Bilder werden automatisch durch konventionelle Algorithmen "vorverarbeitet", die das Rauschen in den Bildern reduzieren, ihre Qualität verbessern und die Konturen von Objekten im Bild erkennen. Anschließend führen sie eine adaptive Bildsegmentierung durch. Dieser Algorithmus berechnet die verschiedenen Graustufen in einem Schwarz-Weiß-Bild, und wenn ein Teil des Bildes jenseits eines bestimmten Schwellenwerts für die Graustufen liegt, segmentiert der Algorithmus diesen Teil als eigenständiges Objekt. Das Besondere an diesem Verfahren ist, dass es die Segmentierung nicht nach einem festen Grauwert vornimmt, sondern nach den lokalen Merkmalen des Bildes.

Nachdem das U-Net-Modell mit dem Trainingsset für Einzelzelltypen trainiert wurde, wird das Modell anhand eines kleinen Satzes von manuell beschrifteten Bildern mit mehreren Zelltypen feinabgestimmt. Im Vergleich dazu bleibt ein gewisses Maß an manueller Beschriftung übrig, und die Anzahl der Bilder, die von Menschen beschriftet werden müssen, sinkt von zuvor mehreren Tausend auf nur 600.

Um ihr Trainingsschema zu testen, verwendeten die Forscher zunächst ein herkömmliches Zellanalysegerät für dieselben Mausblutproben, um eine unabhängige Zellzählung durchzuführen, mit der sie ihren neuen Ansatz vergleichen konnten. Sie fanden heraus, dass die Genauigkeit ihres Trainingsschemas bei der Segmentierung von Bildern mit mehreren Zelltypen 94,85 Prozent betrug, was dem Niveau entspricht, das beim Training mit manuell beschrifteten Bildern mit mehreren Zelltypen erreicht wurde.

Die Technik kann auch auf fortgeschrittenere Modelle angewendet werden, um komplexere Segmentierungsprobleme zu berücksichtigen.

Da die neue Trainingstechnik immer noch ein gewisses Maß an manueller Beschriftung erfordert, hoffen die Forscher, einen vollautomatischen Algorithmus für die Beschriftung und das Training von Modellen zu entwickeln.

Hinweis: Dieser Artikel wurde mit einem Computersystem ohne menschlichen Eingriff übersetzt. LUMITOS bietet diese automatischen Übersetzungen an, um eine größere Bandbreite an aktuellen Nachrichten zu präsentieren. Da dieser Artikel mit automatischer Übersetzung übersetzt wurde, ist es möglich, dass er Fehler im Vokabular, in der Syntax oder in der Grammatik enthält. Den ursprünglichen Artikel in Englisch finden Sie hier.

Beijing Institute of Technology

News weiterempfehlen PDF Ansicht / Drucken

Teilen bei

Fakten, Hintergründe, Dossiers
  • maschinelles Lernen
  • Zellzählung
  • Zellanalyse