Wie künstliche Intelligenz die Proteinerkennung verbessern kann

Grafische Darstellung
Durch eine Kombination aus hochmoderner Mikroskoptechnologie im iSCAT und mehreren maschinellen Lernverfahren setzt das Team von MPL und FAU die Grenzen der optischen Sensorik weiter fort. (Grafik: Mahyar Dahmardeh)

Forscher von MPL und FAU kombinieren Mikroskopiemethode mit KI

Kleine Proteine spielen eine entscheidende Rolle bei der Regulierung von Immunreaktionen, Entzündungen und neurodegenerativen Erkrankungen. Um sie besser aufzuspüren und zu untersuchen, haben Wissenschaftler des Max-Planck-Instituts für die Physik des Lichts und der FAU eine der effektivsten Mikroskopiemethoden, iSCAT, mit künstlicher Intelligenz kombiniert. Biologische Moleküle wie Proteine sind zentrale Bestandteile aller lebenden Systeme und bestimmen alle physiologischen Reaktionen bei Gesundheit und Krankheit. Vor allem viele kleine Proteine spielen eine entscheidende Rolle bei der Regulierung von Immunreaktionen, Entzündungen und neurodegenerativen Erkrankungen. Schnelle und nicht-invasive Methoden zum Nachweis von Proteinen können uns daher helfen, Verbesserungen in den Bereichen Krankheitsdiagnose und Arzneimittelentwicklung zu erzielen.

Bei den herkömmlichen Methoden zum Nachweis von Proteinen wird das Protein mit einer fluoreszierenden oder radioaktiven Markierung versehen, um es aufzuspüren und nachzuweisen. Diese Methoden haben sich jedoch als recht kostspielig und zeitaufwändig erwiesen. Noch problematischer ist die Tatsache, dass diese Markierungen die Funktion des untersuchten Proteins verändern können, was die gewonnenen Daten unzuverlässig macht. Da das wissenschaftliche Interesse an den Funktionen von Proteinen in den letzten Jahren zugenommen hat, ist auch das Interesse an markierungsfreien Nachweisverfahren gestiegen. Eine dieser Methoden, die heute weithin als eine der effektivsten und empfindlichsten markierungsfreien und Echtzeit-Protein-Nachweistechniken angesehen wird, ist die interferometrische Streuungsmikroskopie (iSCAT).

iSCAT basiert auf dem empfindlichen Nachweis von Licht, das von einzelnen Proteinen durch Interferometrie gestreut wird. Wenn einzelne Proteine aus einem Puffer auf ein Deckglas sedimentieren, gibt der winzige Schatten des Proteins, der auf eine Kamera geworfen wird, Aufschluss über seine Größe und Masse. Daher wird die Methode auch als Massenphotometrie bezeichnet. Eine Kombination aus technischen Rauschquellen und speckleartigen Hintergrundschwankungen hat jedoch bisher die Empfindlichkeit der iSCAT-Detektion auf Proteine mit einer Größe von mehr als 40 KDa beschränkt.

Mit AI die Grenzen der Mikroskopie verschieben

Um die Empfindlichkeit von iSCAT noch weiter zu steigern, hat ein Team des MPL um den Geschäftsführer Vahid Sandoghdar, bestehend aus dem Elektroingenieur Mahyar Dahmardeh, dem Informatiker Houman Mirzaalian und dem Physikalischen Chemiker Hisham Mazal, in Zusammenarbeit mit Harald Köstler von der FAU zwei maschinelle Lernverfahren eingesetzt, um Proteine mit einer Größe von nur 10 kDa oder weniger zu erkennen.

In einer in Nature Methods veröffentlichten Arbeit zeigten sie, wie sie den iForest-Algorithmus in Kombination mit der FastDVDnet-Technik einsetzen können, um dieses Ergebnis zu erzielen. Bei beiden Verfahren handelt es sich um so genanntes unüberwachtes maschinelles Lernen, was bedeutet, dass sie nicht erst auf einem markierten Datensatz trainiert werden müssen. Unüberwachtes maschinelles Lernen ist in der Mikroskopie sehr wünschenswert, da es die Identifizierung von Mustern und Beziehungen in großen Datensätzen ermöglicht, ohne das zugrundeliegende Bildgebungsmodell zu kennen. Dies ist besonders wichtig, wenn die Erkennungsgrenze am Rande des Rauschpegels liegt und es an markierten Daten zum Trainieren des Netzwerks mangelt.

FastDVDnet ist eine fortschrittliche Bildentrauschungstechnik, die mit Hilfe von tiefen neuronalen Netzen das Rauschen aus Mikroskopiebildern entfernt. Es ist für die parallele Verarbeitung optimiert, so dass es sehr große Datensätze in relativ kurzer Zeit verarbeiten kann. In diesem Fall verwendeten die Forscher FastDVDnet, um iSCAT-Bilder von Proteinen aus den aufgezeichneten Videosequenzen zu identifizieren. Die von FastDVDnet extrahierten räumlich-zeitlichen Merkmale wurden dann von iForest zum Clustern der iSCAT-Daten verwendet. Der unüberwachte maschinelle Lernalgorithmus Isolation Forest (iForest) wird häufig für die Erkennung von Anomalien verwendet.

Er eignet sich besonders gut für die Mikroskopie, da er hochdimensionale Daten mit einer großen Anzahl von Merkmalen verarbeiten kann, was zu genaueren und umfassenderen Ergebnissen führt. Dies ist besonders nützlich bei der Analyse von Mikroskopiedaten, bei denen die Erkennung seltener oder anormaler Merkmale wichtig ist. Die iForest-Anomalieerkennung kann zum Beispiel verwendet werden, um das Vorhandensein seltener Strukturen innerhalb eines biologischen Gewebes zu erkennen oder um Zellen mit ungewöhnlicher Morphologie zu identifizieren. Dieser Algorithmus kann dabei helfen, seltene oder ungewöhnliche Merkmale zu identifizieren, die bei herkömmlichen Analysemethoden leicht übersehen werden könnten.

Professor Vahid Sandoghdar erinnert sich an die harte Arbeit seines Teams, freut sich aber auch schon auf die nächste Herausforderung: „Seit unserem ersten Bericht über die markierungsfreie Detektion kleiner Proteine in Nature Communications im Jahr 2014 haben wir einen langen Weg zurückgelegt. Wir sind entschlossen, die Nachweisgrenze weiter zu verschieben, indem wir sowohl die physikalischen Messmethoden verbessern als auch anspruchsvollere maschinelle Lernalgorithmen entwickeln. Es gibt wirklich keinen grundlegenden Grund, warum wir nicht in der Lage sein sollten, Moleküle unter 1 kDa zu erkennen, was dem Gewicht eines einzigen Lipidmoleküls nahe kommt.“

Weitere Informationen:

Originalpublikation: Dahmardeh, M., Mirzaalian Dastjerdi, H., Mazal, H. et al. Self-supervised machine learning pushes the sensitivity limit in label-free detection of single proteins below 10 kDa. Nat Methods 20, 442–447 (2023). https://doi.org/10.1038/s41592-023-01778-2

Kontakt:
Mahyar Dahmardeh
mahyar.dahmardeh@mpl.mpg.de

Prof. Dr. Vahid Sandoghdar
Lehrstuhl für Experimentalphysik
vahid.sandoghdar@mpl.mpg.de