Direkt zum Seiteninhalt springen

Data Science

Ein Periodensystem für Zellen

Fabian Theis ist Direktor des Instituts für Computational Biology am Helmholtz Zentrum München. Bild: Helmholtz Zentrum München/Dr. Anna Sacher

Künstliche Intelligenz revolutioniert derzeit die Wissenschaft. So lässt sich jetzt zum Beispiel die Genaktivität abertausender Einzelzellen analysieren. Fabian Theis vom Helmholtz-Zentrum München will das nutzen, um Krankheiten besser zu verstehen und Ordnung in die Vielfalt der Zellen zu bringen.

Schützende Haut, filternde Nieren, Sauerstoff tankendes Lungengewebe: Die verschiedensten, hochspezialisierten Arten von Körperzellen entwickeln sich aus einer einzigen befruchteten Eizelle. Sie alle tragen das gleiche Erbgut, unterscheiden sich aber darin, welche der zehntausenden von Genen sie aktivieren. Ist ein Gen aktiv, wird eine molekulare Abschrift davon erstellt, das Transkript. Die Gesamtheit aller Transkripte wird als das Transkriptom einer Zelle bezeichnet. Nieren-, Lungen oder Hautzellen, aber auch verschiedene Entwicklungsstadien dieser Zelltypen, besitzen jeweils ein charakteristisches Transkriptom. Fabian Theis, Direktor des Instituts für Computational Biology am Helmholtz Zentrum München und Professor für Mathematik an der Technischen Universität München, hat sich unter anderem  darauf spezialisiert, computergestützte Methoden zur Transkriptomanalyse  zu entwickeln. 

Obstsalat statt Smoothie

Bis vor kurzem brauchte man für eine solche Analyse hunderttausende von Zellen. Das Ergebnis war immer ein Durchschnitt aus den Zuständen aller Zellen in der untersuchten Menge. Moderne Sequenzierungstechniken ermöglichen heutzutage die Entschlüsselung des Transkriptoms einer einzelnen Zelle. Theis hat dafür einen Vergleich aus der Küche: “Statt eines Smoothies aus verschiedenen Obstsorten betrachten wir jetzt einen wohlsortierten Obstsalat”, erklärt er. Je detaillierter die Untersuchung, desto präziser fällt das Bild aus, das die Forschenden sich vom untersuchten Zustand machen können. Umso umfangreicher und komplexer sind allerdings auch die auszuwertenden Datenmengen, die bei jedem Experiment anfallen. Die Analyse hunderttausend einzelner Zellen ergibt nun hunderttausend Datensätze, während es beim „Zell - Smoothie“ nur ein einziger war.  Diese ‘Big Data’ sind herkömmlichen statistischen Methoden kaum noch auszuwerten. 

Hier kommt die KI ins Spiel. Erste Ideen, künstliche Intelligenz zu entwickeln gab es bereits vor rund 70 Jahren. In den 1980er Jahren wurden dann Ansätze des maschinellen Lernens (ML) bedeutend: Algorithmen, die anhand bestehender Daten eigenständig lernen. Bekannt ist das Beispiel von Software, die anhand abertausender Katzenbilder lernt, eine Katze zu erkennen. Parallel zu den sprunghaften technologischen Entwicklungen in den Lebenswissenschaften wurden in den 2010er Jahren neuronale Netze populär, bekannt als ‘Deep Learning’. Diese Methoden eignen sich besonders gut für die Untersuchung komplexer Daten mit vielen voneinander abhängigen Parametern. Mit den wachsenden Bergen an Big Data, leistungsfähigerer Hardware und neuen Algorithmen entfalteten sie nun ihre ganze Wirkkraft - auch in der Wissenschaft.

Auf dem Weg zum Human Cell Atlas

Theis entwickelt neuronale Netze, die in den unsortierten Datenbergen aus Transkriptomanalysen Muster dynamischer Abläufe erkennen. Selbst vielen seiner Kollegen fällt es schwer, sich die vielschichtige Architektur dieser Software vorzustellen. Den promovierten Biophysiker und Informatiker dagegen fasziniert sie nicht weniger als das molekulare Innenleben einer Zelle. “Mithilfe dieser Algorithmen können wir riesige, unstrukturierte Menge von statischen Momentaufnahmen nutzen, um dynamische Entwicklungsprozesse zu verstehen”, erläutert er. “Wir trainieren die Software mit den experimentellen Daten, sie erkennt Muster darin und wir können eine Vorhersage über die zugrundeliegenden Abläufe ableiten.” Theis und seine Kollegen haben auf diese Weise schon Blut- oder Darmzellen untersucht und konnten Modelle der Entwicklung verschiedener Zelltypen entwerfen, die dann experimentell überprüft werden. Ihre Algorithmen eignen sich zudem auch, Bilddateien zu untersuchen und so zum Beispiel Krankheitsverläufe anhand medizinischer Aufnahmen zu erkennen. 

Theis erklärt die Möglichkeiten, die sich in der Wissenschaft dank der neuen Tools eröffnen. Als Grundlage für ein umfassendes Verständnis von Entwicklungsprozessen im Körper tragen er und hunderte Wissenschaftler derzeit weltweit ihre Ergebnisse verschiedenster Untersuchungen zusammen. Ziel der “Human Cell Atlas” Initiative ist es, einen Atlas aller menschlichen Zellen zu erstellen. Vergleichbar dem Periodensystem der chemischen Elemente soll er sämtliche Zelltypen und ihre Charakteristika umfassen, die im menschlichen Körper vorkommen. Zudem arbeitet er darauf hin, Erkenntnisse aus Untersuchungen an Modellen auf den Menschen zu übertragen - mithilfe der Vorhersagen seiner Algorithmen. Umwelt- oder Ernährungseinflüsse auf die Zellentwicklung könnten etwa an Mäusen untersucht werden, um medizinisch relevante Fragen für den Menschen zu beantworten.

Fabian Theis' Horizons-Vortrag (Länge ~ 14 Minuten):

Leser:innenkommentare