Создана компактная система ИИ для генерации белковых молекул

Это приближает ученых в поиске новых ферментов в лабораториях, где нет доступа к ресурсам суперкомпьютеров

МОСКВА, 4 сентября. /ТАСС/. Исследователи из России и Германии создали очень компактную систему искусственного интеллекта для генерации молекул не существующих в природе белков, которая не уступает в этом отношении более сложным нейросетям и при этом в 100 раз компактнее этих больших ИИ-моделей. Об этом сообщила пресс-служба Института искусственного интеллекта AIRI.

"Наша модель способна напрямую генерировать белковые последовательности, которые никогда не встречались в природе, но точно соответствуют заданным исследователем критериям - например, определенной трехмерной укладке или функциональным свойствам", - пояснил ведущий научный сотрудник Центра ИИ-разработки новых лекарственных препаратов AIRI Павел Страшнов, чьи слова приводит пресс-служба института.

Как отмечается в сообщении, в последние годы ученые активно разрабатывают системы ИИ, способные как определять трехмерную структуру белковых молекул по последовательности составляющих их аминокислот, или же генерировать новые цепочки пептидов, не существующие в природе. За разработку одной из подобных систем, AlphaFold, в прошлом году была вручена Нобелевская премия по химии.

По словам ученых, существующие алгоритмы для генерации белков собирают их двумя путями - последовательно соединяя аминокислоты, подобно тому, как работают большие языковые модели с текстами, или же генерируя всю молекулу сразу, по аналогии с тем, как работают так называемые дискретные диффузионные модели. Оба подхода требуют огромного объема данных для обучения и больших размеров моделей, что ограничивает их применение и разработку.

Специалисты разработали более простую и эффективную альтернативу для этих подходов, опираясь на другой математический принцип, так называемую непрерывную Гауссову диффузию, которая активно используется в нейросетях для генерации изображений, постепенно удаляющих "шум" с вырабатываемой картинки. В процессе ее разработки исследователи обучили созданную ими систему ИИ понимать, как устроена вся "Вселенная белков", и достоверно ее имитировать.

Новый подход, как показали его проверки на двух популярных наборах данных SwissProt и AFDBv4-90, не уступает в качестве генерации белковых молекул более сложным передовым системам ИИ, но при этом он использует в своей работе не миллиарды, а всего 35 млн параметров. В перспективе, это позволит использовать его для проведения экспериментов и поиска новых, не существующих в природе полезных белков и ферментов в лабораториях, где нет доступа к большим данным и ресурсам мощных суперкомпьютеров.

Данные о правообладателе фото и видеоматериалов взяты с сайта «Наука - ТАСС», подробнее в Условиях использования