Сотрудникилаборатории анализа данных физики высоких энергий(ЛАДФВЭ) Томского госуниверситета в рамках пятинедельного курса обучили несколько десятков человек – студентов и исследователей из разных городов России. Слушатели осваивали полный жизненный цикл решения прикладных задач ML – от анализа данных до защиты решения – в условиях, имитирующих работу реальной Data Science‑команды.
– Задача этого курса – разрушить барьер между академическими знаниями и реальными задачами. Часто учащиеся блестяще знают формулы, но теряются перед реальной практикой, – говорит один из организаторов обучения, старший научный сотрудник ЛАДФВЭ ТГУИван Конов. – Наша цель – дать участникам курса безопасную среду для первого опыта, где ошибки – это не повод для оценки, а шаг к экспертности, и где поддержка команды помогает преодолеть страх перед сложной задачей.

Курс строился таким образом, чтобы не ограничиваться теорией. Большой упор делался на командную работу, практическую направленность и владение инструментами Python (Pandas, Sklearn), применимыми в маркетинге, науке и других сферах.
Обучение проходило по ключевым темам: жизненный цикл машинного обучения и виды задач, первичный и разведочный анализ данных (EDA), визуализация, линейные модели и их обучение, метрики качества и способы улучшения модели.
Слушатели пришли на курс, чтобы получить дополнительные профессиональные компетенции. Так, один из слушателей, ранее работавший 1C‑разработчиком, сказал, что ищет новое направление развития, поскольку ему не очень интересна его прежняя специализация.
– На курсе были не только молодые специалисты, но и люди, уже состоявшиеся в профессии. Например, пришла целая команда из Института оптики атмосферы им. В.Е. Зуева СО РАН, – рассказывает младший научный сотрудник ЛАДФВЭ ТГУУльяна Ларионова. – Знания и навыки в области машинного обучения позволяют исследователям значительно расширить круг решаемых задач.
Как отмечают разработчики курса, его польза еще и в том, что настоящее развитие происходит в сообществе. Курс формирует вокруг конкретной задачи живое комьюнити энтузиастов. В одиночку сложно пройти путь от новичка до исследователя, но в процессе общения, обмена мыслями, обучение превращается в общее дело, где успех каждого приближает успех всей команды.
Участники курса могли проходить его очно на базе лаборатории или дистанционно. Второй вариант подошел иногородним слушателям, в том числе из очень отдаленных от Томска городов, таких как Улан-Удэ.
Всем участникам были вручены сертификаты. Впоследствии желающие всегда могут получить информационную поддержку от преподавателей.
Добавим, что лаборатория анализа данных физики высоких энергий ТГУ была создана при поддержке мегагранта Правительства РФ. Лаборатория специализируется на создании методов обработки и интерпретации больших объемов данных, получаемых в исследованиях уровня мегасайенс в области физике высоких энергий. Основные направления работы: машинное обучение, статистический анализ, построение конвейеров предобработки и визуализации, оптимизация алгоритмов для выделения физических сигналов на фоне шума.
ЛАДФВЭ ТГУ тесно сотрудничает с экспериментальными группами и вычислительными центрами, внедряет открытые программные решения и практики, обеспечивающие воспроизводимость исследований.
Помимо научной деятельности, проводятся практико‑ориентированные курсы и практикумы для студентов и молодых ученых, готовятся специалисты, способные применять методы анализа данных в науке и индустрии. В 2024 году на базе лаборатории стартовала первая в России программа бакалавриата по подготовке физиков-айтишников для российских проектов уровня мегасайенс – таких как суперколлайдер NICA, источник синхротронного излучения СКИФ и других.