OpenBioML - biotechnologia i DNA
OpenBioML - biotechnologia i DNA, źródło: Pixabay

Meta i AI przewidują istnienie 600 milionów białek w formach życia, których… jeszcze nie znamy

Naukowcy z firmy Meta, czyli firmy macierzystej Facebooka i Instagrama, dzięki sztucznej inteligencji przewidzieli strukturę ponad 600 milionów białek. To nie pierwsza taka technologia, ale dotychczas najszybsza.

Kształt białka – po co naukowcy chcą go znać?

Białko to jeden z najistotniejszych elementów budulcowych. Białka składają się z aminokwasów w postaci długich i krętych łańcuchów. Łańcuchy te łączą się, dzięki czemu możliwe jest uzyskanie białka o trójwymiarowym kształcie. Dzięki poznaniu tych kształtów możliwe jest określenie jego funkcji.

Zazwyczaj do stwierdzenia kształtu danego białka stosuje się krystalografię rentgenowską. Działa ona w oparciu o obserwacje wysokoenergetycznej wiązki światła oraz jej załamań zachodzących wokół badanych białek. Choć metoda ta działa i została użyta do odkrycia ponad 100 tysięcy różnych struktur białkowych w ciągu wielu lat, okazuje się też dość czasochłonna.

Zastosowanie sztucznej inteligencji w poznaniu kształtu białek

Dzięki zastosowaniu komputerowych modeli opartych o działanie sztucznej inteligencji, naukowcy firmy Meta postanowili rozwiązać problem powolnego i długotrwałego procesu krystalografii rentgenowskiej. Autorzy projektu postanowili użyć do tego celu projektu ESMFold. Zastosowanie tej metody umożliwia odtwarzanie struktur białkowych w 3D. Wyniki tej pracy zostały zebrane w atlasie metagenomicznym ESM.

„Atlas metagenomiczny ESM umożliwi naukowcom wyszukiwanie i analizę struktur białek metagenomicznych w skali setek milionów białek. Może to pomóc naukowcom w identyfikacji struktur, które nie zostały wcześniej scharakteryzowane, poszukiwaniu odległych relacji ewolucyjnych i odkrywaniu nowych białek, które mogą być przydatne w medycynie i innych zastosowaniach.”

Zespół badawczy META
Atlas kształtu białek
Atlas kształtu białek (źródło: ESMatlas)

Zastosowań tego odkrycia może być wiele. Dzięki zasobowi w postaci tak obszernego atlasu możliwe będzie tworzenie szybciej i łatwiej nowych leków, a także charakteryzowanie i poznanie nowych i nieznanych funkcji drobnoustrojów.

Program ESMFold nie jest pierwszym, który jest w stanie przewidywać kształt białka, jednak jest zdecydowanie szybszy od poprzednika AlphaFold od firmy DeepMind, należącej do Google.

W ramach testów do bazy danych wprowadzono dane DNA pobrane z różnych miejsc, dzięki czemu naukowcom udało się przewidzieć strukturę ponad 617 milionów białek. W porównaniu do AlphaFold, to ponad o 400 milionów większy zasób danych.