Naukowcy z firmy Meta, czyli firmy macierzystej Facebooka i Instagrama, dzięki sztucznej inteligencji przewidzieli strukturę ponad 600 milionów białek. To nie pierwsza taka technologia, ale dotychczas najszybsza.
Kształt białka – po co naukowcy chcą go znać?
Białko to jeden z najistotniejszych elementów budulcowych. Białka składają się z aminokwasów w postaci długich i krętych łańcuchów. Łańcuchy te łączą się, dzięki czemu możliwe jest uzyskanie białka o trójwymiarowym kształcie. Dzięki poznaniu tych kształtów możliwe jest określenie jego funkcji.
Zazwyczaj do stwierdzenia kształtu danego białka stosuje się krystalografię rentgenowską. Działa ona w oparciu o obserwacje wysokoenergetycznej wiązki światła oraz jej załamań zachodzących wokół badanych białek. Choć metoda ta działa i została użyta do odkrycia ponad 100 tysięcy różnych struktur białkowych w ciągu wielu lat, okazuje się też dość czasochłonna.
Zastosowanie sztucznej inteligencji w poznaniu kształtu białek
Dzięki zastosowaniu komputerowych modeli opartych o działanie sztucznej inteligencji, naukowcy firmy Meta postanowili rozwiązać problem powolnego i długotrwałego procesu krystalografii rentgenowskiej. Autorzy projektu postanowili użyć do tego celu projektu ESMFold. Zastosowanie tej metody umożliwia odtwarzanie struktur białkowych w 3D. Wyniki tej pracy zostały zebrane w atlasie metagenomicznym ESM.
„Atlas metagenomiczny ESM umożliwi naukowcom wyszukiwanie i analizę struktur białek metagenomicznych w skali setek milionów białek. Może to pomóc naukowcom w identyfikacji struktur, które nie zostały wcześniej scharakteryzowane, poszukiwaniu odległych relacji ewolucyjnych i odkrywaniu nowych białek, które mogą być przydatne w medycynie i innych zastosowaniach.”
Zespół badawczy META
Zastosowań tego odkrycia może być wiele. Dzięki zasobowi w postaci tak obszernego atlasu możliwe będzie tworzenie szybciej i łatwiej nowych leków, a także charakteryzowanie i poznanie nowych i nieznanych funkcji drobnoustrojów.
Program ESMFold nie jest pierwszym, który jest w stanie przewidywać kształt białka, jednak jest zdecydowanie szybszy od poprzednika AlphaFold od firmy DeepMind, należącej do Google.
W ramach testów do bazy danych wprowadzono dane DNA pobrane z różnych miejsc, dzięki czemu naukowcom udało się przewidzieć strukturę ponad 617 milionów białek. W porównaniu do AlphaFold, to ponad o 400 milionów większy zasób danych.