29.07.2021 - European Molecular Biology Laboratory (EMBL)

DeepMind und EMBL veröffentlichen die vollständigste Datenbank mit vorhergesagten 3D-Strukturen menschlicher Proteine

Die Partner nutzen AlphaFold, das KI-System, um der wissenschaftlichen Gemeinschaft mehr als 350 000 Proteinstrukturvorhersagen, einschließlich des gesamten menschlichen Proteoms, zur Verfügung zu stellen

DeepMind kündigte seine Partnerschaft mit dem Europäischen Laboratorium für Molekularbiologie (EMBL), Europas Vorzeigelaboratorium für Biowissenschaften, an, um die bisher vollständigste und genaueste Datenbank mit vorhergesagten Proteinstrukturmodellen für das menschliche Proteom zu erstellen. Diese wird alle rund 20 000 Proteine abdecken, die vom menschlichen Genom exprimiert werden, und die Daten werden der wissenschaftlichen Gemeinschaft frei und offen zugänglich sein. Die Datenbank und das System der künstlichen Intelligenz bieten Strukturbiologen leistungsstarke neue Werkzeuge zur Untersuchung der dreidimensionalen Struktur eines Proteins und stellen eine Fundgrube von Daten dar, die künftige Fortschritte ermöglichen und eine neue Ära der KI-gestützten Biologie einläuten könnten.

Die Anerkennung von AlphaFold im Dezember 2020 durch die Organisatoren des CASP-Benchmarks (Critical Assessment of protein Structure Prediction) als Lösung für die 50 Jahre alte große Herausforderung der Proteinstrukturvorhersage war ein erstaunlicher Durchbruch für das Fachgebiet. Die AlphaFold-Proteinstrukturdatenbank baut auf dieser Innovation und den Entdeckungen von Generationen von Wissenschaftlern auf, von den frühen Pionieren der Proteinbildgebung und -kristallografie bis zu den Tausenden von Vorhersagespezialisten und Strukturbiologen, die seither jahrelang mit Proteinen experimentiert haben. Die Datenbank erweitert das gesammelte Wissen über Proteinstrukturen dramatisch und verdoppelt die Zahl der hochpräzisen menschlichen Proteinstrukturen, die den Forschern zur Verfügung stehen, mehr als. Ein besseres Verständnis dieser Bausteine des Lebens, die jedem biologischen Prozess in jedem Lebewesen zugrunde liegen, wird es Forschern in einer Vielzahl von Bereichen ermöglichen, ihre Arbeit zu beschleunigen.

Letzte Woche wurden die Methodik hinter der neuesten, hoch innovativen Version von AlphaFold, dem hochentwickelten KI-System, das im Dezember letzten Jahres angekündigt wurde und diese Strukturvorhersagen ermöglicht, und sein Open-Source-Code in Nature veröffentlicht. Die heutige Ankündigung fällt mit einer zweiten Nature-Veröffentlichung zusammen, die das umfassendste Bild der Proteine liefert, aus denen das menschliche Proteom besteht, sowie mit der Veröffentlichung von 20 weiteren Organismen, die für die biologische Forschung wichtig sind.

"Unser Ziel bei DeepMind war es immer, künstliche Intelligenz zu entwickeln und sie dann als Werkzeug zu nutzen, um das Tempo der wissenschaftlichen Entdeckungen selbst zu beschleunigen und damit unser Verständnis der Welt um uns herum zu verbessern", sagte DeepMind-Gründer und CEO Demis Hassabis, PhD. "Wir haben AlphaFold verwendet, um das vollständigste und genaueste Bild des menschlichen Proteoms zu erstellen. Wir glauben, dass dies der bedeutendste Beitrag ist, den die KI bisher zum wissenschaftlichen Fortschritt geleistet hat, und ein großartiges Beispiel dafür ist, welchen Nutzen die KI der Gesellschaft bringen kann."

AlphaFold hilft Wissenschaftlern bereits bei der Beschleunigung von Entdeckungen

Die Fähigkeit, die Form eines Proteins rechnerisch aus seiner Aminosäuresequenz vorherzusagen - anstatt sie durch jahrelange, mühsame und oft kostspielige Techniken experimentell zu bestimmen - hilft den Wissenschaftlern bereits jetzt, in Monaten zu erreichen, was früher Jahre dauerte.

"Die AlphaFold-Datenbank ist ein perfektes Beispiel für den positiven Kreislauf der offenen Wissenschaft", sagte EMBL-Generaldirektorin Edith Heard. "AlphaFold wurde mit Daten aus öffentlichen Ressourcen trainiert, die von der wissenschaftlichen Gemeinschaft aufgebaut wurden. Die offene und freie Weitergabe von AlphaFold-Vorhersagen wird es Forschern überall ermöglichen, neue Erkenntnisse zu gewinnen und Entdeckungen voranzutreiben. Ich glaube, dass AlphaFold wirklich eine Revolution für die Biowissenschaften darstellt, so wie es die Genomik vor einigen Jahrzehnten war, und ich bin sehr stolz darauf, dass EMBL DeepMind dabei helfen konnte, den offenen Zugang zu dieser bemerkenswerten Ressource zu ermöglichen."

AlphaFold wird bereits von Partnern wie der Drugs for Neglected Diseases Initiative (DNDi) genutzt, die damit ihre Forschung nach lebensrettenden Heilmitteln für Krankheiten vorantreibt, von denen die ärmeren Teile der Welt unverhältnismäßig stark betroffen sind, und das Centre for Enzyme Innovation (CEI) nutzt AlphaFold, um schnellere Enzyme für das Recycling einiger unserer umweltschädlichsten Einwegkunststoffe zu entwickeln. Für Wissenschaftler, die auf die experimentelle Bestimmung von Proteinstrukturen angewiesen sind, haben die Vorhersagen von AlphaFold dazu beigetragen, ihre Forschung zu beschleunigen. Ein Team an der University of Colorado Boulder beispielsweise nutzt die Vorhersagen von AlphaFold vielversprechend zur Untersuchung von Antibiotikaresistenzen, während eine Gruppe an der University of California San Francisco die Vorhersagen nutzt, um ihr Verständnis der Biologie von SARS-CoV-2 zu verbessern.

Die AlphaFold-Datenbank für Proteinstrukturen

Die AlphaFold-Proteinstrukturdatenbank* basiert auf zahlreichen Beiträgen der internationalen wissenschaftlichen Gemeinschaft sowie auf den hochentwickelten algorithmischen Innovationen von AlphaFold und der jahrzehntelangen Erfahrung von EMBL-EBI bei der gemeinsamen Nutzung der weltweiten biologischen Daten. DeepMind und das Europäische Institut für Bioinformatik (EMBL-EBI) stellen den Zugang zu den Vorhersagen von AlphaFold zur Verfügung, damit andere das System als Werkzeug nutzen können, um die Forschung zu ermöglichen und zu beschleunigen und völlig neue Wege der wissenschaftlichen Entdeckung zu eröffnen.

"Dies wird einer der wichtigsten Datensätze seit der Kartierung des menschlichen Genoms sein", sagte der stellvertretende EMBL-Generaldirektor und EMBL-EBI-Direktor Ewan Birney. "Indem wir die AlphaFold-Vorhersagen der internationalen wissenschaftlichen Gemeinschaft zugänglich machen, eröffnen sich so viele neue Forschungsmöglichkeiten, von vernachlässigten Krankheiten bis hin zu neuen Enzymen für die Biotechnologie und alles dazwischen. Dies ist ein großartiges neues wissenschaftliches Instrument, das die bestehenden Technologien ergänzt und es uns ermöglichen wird, die Grenzen unseres Verständnisses der Welt zu erweitern."

Neben dem menschlichen Proteom enthält die Datenbank zum Start ~350 000 Strukturen von 20 biologisch bedeutenden Organismen wie E. coli, Fruchtfliege, Maus, Zebrafisch, Malariaparasit und Tuberkulosebakterien. Die Erforschung dieser Organismen war Gegenstand unzähliger Forschungsarbeiten und zahlreicher bedeutender Durchbrüche. Diese Strukturen werden es Forschern in den verschiedensten Bereichen - von den Neurowissenschaften bis zur Medizin - ermöglichen, ihre Arbeit zu beschleunigen.

Die Zukunft von AlphaFold

Die Datenbank und das System werden regelmäßig aktualisiert, da wir weiterhin in zukünftige Verbesserungen von AlphaFold investieren. In den kommenden Monaten planen wir, die Abdeckung auf fast alle sequenzierten Proteine, die der Wissenschaft bekannt sind, zu erweitern - über 100 Millionen Strukturen, die den Großteil der UniProt-Referenzdatenbank abdecken.

Um mehr zu erfahren, lesen Sie bitte die Nature-Papiere, die unsere vollständige Methode und das menschliche Proteom beschreiben*, und lesen Sie die Anmerkungen der Autoren*. Sehen Sie sich den Open-Source-Code von AlphaFold an, wenn Sie sich die Funktionsweise des Systems ansehen möchten, und das Colab notebook*, um einzelne Sequenzen auszuführen. Um die Strukturen zu erforschen, besuchen Sie die EMBL-EBI-Datenbank*, die für alle offen und kostenlos ist.

European Molecular Biology Laboratory (EMBL)

News weiterempfehlen PDF Ansicht / Drucken

Teilen bei

Fakten, Hintergründe, Dossiers
  • Proteinstruktur
  • Enzyme
  • Proteine
Mehr über European Molecular Biology Laboratory