Ob Einzeller oder Vielzeller, die Lebensfunktionen in der Zelle basieren auf winzig kleinen Grundbausteinen, den Proteinen. Wie einzelne Proteine genau aussehen, wird in der Strukturbiologie erforscht. Dort werden die 3-D-Strukturen von Proteinen sichtbar gemacht und aus ihrem Aufbau zelluläre Funktionen und Wirkmechanismen abgeleitet. Mit dem lernfähigen KI-System AlphaFold 2.0 hat die Strukturbiologie nun neue Unterstützung.
Ein Beitrag von Dr. Larissa Mühlenbeck, Deutsches Jungforschernetzwerk – juFORUM e.V.
Für die Entstehung eines Proteins muss zunächst die genetische Information (DNA) in eine Sequenz von Aminosäuren übersetzt werden, die dann in einem komplizierten Faltungsprozess eine bestimmte 3-D-Struktur annimmt. Dabei ist die Anzahl der theoretisch möglichen Varianten einer Proteinstruktur immens, und die bei Molekül-Dynamik-Simulationen verwendeten Kraftfelder sind zu ungenau, um die Faltungsmöglichkeiten zu berechnen. Quantenmechanische Rechnungen hingegen, die alle Atome berücksichtigen, wären für die Bestimmung der 3-D-Strukturen zu rechenaufwendig. Zudem spielen oft weitere Faktoren wie Faltungshelfer (Chaperone) und die physiologischen Bedingungen eine wichtige Rolle. Zwar sind heute etwa 180.000 experimentell bestimmte Proteinstrukturen in der Proteindatenbank hinterlegt, doch stehen diesen mehr als 200 Millionen in lebenden Organismen bekannte Proteine gegenüber. Dabei könnte eine bessere Kenntnis der Proteinstrukturen unser Wissen über menschliche Krankheiten sowie die medizinischen Möglichkeiten grundlegend verändern.
AlphaFold: Künstliche Intelligenz (KI) für die Strukturbiologie
Weitere Informationen
DeepMind
Ewen Callaway: ‚It will change everything‘: DeepMind’s AI makes gigantic leap in solving protein structures
(Nature 2020)
Jumper et al.: Highly accurate protein structure prediction with AlphaFold (Nature 2020)
Aufmerksamkeit erregten die Forscher der Google-Tochter „DeepMind“ bereits mit ihren KI-Systemen AlphaGo und AlphaZero. Nun folgte das lernfähige KI-System AlphaFold 2.0, mit dem sie den Wettbewerb CASP14 (Critical Assessment of Protein Structure Prediction) im Jahr 2020 gewannen. Dieser Wettbewerb dient dem Vergleich aktueller Berechnungsmethoden zur Vorhersage von Proteinstrukturen, wobei Forschergruppen Aminosäuresequenzen von Proteinen vorgelegt werden, deren Strukturen experimentell zwar bereits bestimmt sind, die jedoch noch nicht veröffentlicht wurden. Diese Proteinstrukturen sollen die Teilnehmer mit ihren Rechenmodellen vorhersagen. Bei AlphaFold 2.0 handelt es sich um ein neuronales Netzwerk, das mithilfe von experimentell bestimmten und in der Proteindatenbank hinterlegten 3-D-Strukturen gelernt hat, Gesetzmäßigkeiten in der Proteinfaltung zu erkennen und anzuwenden. So konnte es von 100 zu lösenden Proteinen immerhin 70 3-D-Strukturen präzise abbilden. Um die Genauigkeit der Vorhersage zu bewerten, nutzt der CASP-Wettbewerb den Global Distance Test-Wert (GDT). Hierbei erreichte AlphaFold 2.0 im Durchschnitt bahnbrechende 92,4 von möglichen 100 Punkten. Da es die Eingabedaten unter Einbeziehung multipler Sequenzvergleiche, evolutionär verwandter Sequenzen sowie physikalischer und geometrischer Restriktionen verarbeitet, kann es sehr komplexe Zusammenhänge erkennen und Proteinfaltungen präziser vorhersagen als seine Vorgänger.
Medizinische Relevanz künstlicher Intelligenz
Wie genau AlphaFold diese beeindruckenden Berechnungen zur Entschlüsselung des „Protein-Origamis“ durchführt, wissen auch die programmierenden Forscher nicht ganz genau. Zudem bleiben die Fragen, wie Proteine mit kleinen Molekülen oder DNA interagieren und größere Komplexe bilden, vorerst offen. Doch besteht die Hoffnung, dass AlphaFold 2.0 und seine Nachfolger durch ihre Vorhersagen neue Möglichkeiten in der Grundlagenforschung und Medizin eröffnen. Denn die Generierung von 3-D-Modellen für Zielproteine würde eine personalisierte molekulare Medizin in greifbare Nähe rücken. Zukünftig könnten dann vielleicht sogar Wirkstoffe und Therapien passgenau für einzelne Patienten entwickelt werden.
