Фото: magnific.com / автор: freepik
Исследователи из подразделения американской технологической корпорации IBM, занимающегося разработками в области искусственного интеллекта (ИИ) и биомедицины, а также из ряда академических и индустриальных центров США и Израиля представили мультимодальную ИИ-модель Mammal для задач разработки лекарств. Система объединяет данные о белках, антителах, малых молекулах и экспрессии генов и, по данным авторов, показывает более высокую точность по сравнению с рядом специализированных моделей при прогнозировании токсичности препаратов, взаимодействия молекул и проектировании антител. Работа опубликована в журнале Drug Discovery.
Модель была предварительно обучена на 2 млрд образцов из шести открытых биомедицинских наборов данных, включая UniProt, PubChem, ZINC, STRING и CELLxGENE. Архитектура поддерживает задачи классификации, регрессии и генерации, что позволяет использовать ее на разных этапах разработки препаратов – от поиска терапевтических мишеней и прогнозирования токсичности до проектирования антител и оценки связывания препаратов с белками.
Для оценки эффективности исследователи протестировали Mammal на 11 бенчмарках, охватывающих разные этапы разработки лекарств. В девяти задачах модель показала лучший результат по сравнению с ранее опубликованными специализированными системами, а еще в двух – сопоставимый уровень качества.
В задаче прогнозирования проникновения препаратов через гематоэнцефалический барьер точность модели достигла 95,7%, а в тесте ClinTox, связанном с оценкой токсичности и вероятности одобрения препаратов, – 98,6%. В задаче аннотации типов клеток улучшение F1-метрики составило 7,5% по сравнению с предыдущими моделями.
Отдельно исследователи проверили способность Mammal прогнозировать чувствительность опухолевых клеток к лекарствам. Для этого использовались профили экспрессии генов и данные о структуре молекул. В тестировании на четырех препаратах, отсутствовавших в обучающей выборке, модель правильно воспроизвела порядок их активности, который затем подтвердился в лабораторных экспериментах.
Авторы также протестировали систему на задачах проектирования антител, в частности, при восстановлении участков, отвечающих за связывание с антигенами. Для наиболее вариабельного участка точность предсказания аминокислотной последовательности оказалась на 19% выше по сравнению с предыдущими моделями.
Дополнительно исследователи сравнили Mammal с AlphaFold 3 в задаче различения связывающих и несвязывающих антител и нанотел. В ряде тестов Mammal показала более высокую точность, особенно для сложных белковых мишеней с неупорядоченными участками структуры. Авторы связывают это с тем, что структурные модели хуже работают с гибкими и частично неструктурированными белками.
Отдельное внимание в работе уделено возможности использования модели в генеративных задачах. Архитектура поддерживает как анализ данных, так и генерацию новых последовательностей, включая проектирование антител и моделирование молекулярных взаимодействий. Разработчики считают, что это может сократить объем дорогостоящих лабораторных тестов на ранних этапах разработки препаратов.
Авторы подчеркивают, что модель не заменяет экспериментальную проверку, однако может использоваться как инструмент предварительного отбора и ранжирования кандидатов для дальнейших исследований. По их оценке, подобные системы способны ускорить поиск новых препаратов и снизить затраты на доклинические этапы разработки.
Ранее крупные фармкомпании уже объявляли о расширении использования ИИ в разработке препаратов и генетических технологий. Так, американская Eli Lilly в апреле 2026 года заключила соглашение со стартапом Profluent для создания систем точного редактирования ДНК с помощью генеративных ИИ-моделей. Компании планируют разрабатывать программируемые рекомбиназы – ферменты для адресного встраивания участков ДНК в геном. До этого Eli Lilly также расширила сотрудничество с Insilico Medicine в области ИИ-разработки лекарств.
Подписывайтесь на наши каналы в MAX: Vademecum и Vademecum Live