Фото: freepik
Исследователи из Института искусственного интеллекта AIRI совместно с Constructor University в Германии представили новую систему под названием DiMA. Этот искусственный интеллект предназначен для создания новых белковых молекул, которые могут найти применение в фармацевтической отрасли. В основе DiMA лежит технология латентной диффузии, обеспечивающая высокую эффективность и компактность модели.
DiMA обладает способностью генерировать уникальные белковые последовательности, которые не встречаются в природе, и адаптировать их под конкретные задачи. Это особенно важно для разработки лекарств, требующих белков с особыми характеристиками.
Белок представляет собой линейную цепочку аминокислот, свернутую в специфическую пространственную структуру, определяющую его функциональные свойства. Ранее для генерации белковых последовательностей использовались языковые модели, которые могли создавать последовательности либо поэтапно, либо сразу. Однако эти методы требовали значительного объема вычислительных ресурсов и большого количества данных.
Особенностью DiMA является использование метода непрерывной Гауссовой диффузии. Сначала модель обучалась создавать биологически корректные белковые последовательности, не имеющие аналогов в природе. Затем она была дополнительно обучена для генерации белков с заданными параметрами, такими как определенная трехмерная структура или принадлежность к конкретному семейству белков.
Этот подход позволяет создавать белковые структуры, которые не существуют в природе, но при этом соответствуют требованиям исследователей. Это расширяет возможности для изучения структурных вариаций белков и предоставляет новые инструменты для биологических и медицинских исследований.
Результаты этой работы были представлены на Международной конференции по машинному обучению (ICML) в 2025 году, пишет источник.