На пленарной дискуссии Клуба 4CIO «Цена своей LLM» Марат Мухарьямов, управляющий партнер, co-founder Группы IT-компаний Lad, дал рекомендации по эффективному внедрению искусственного интеллекта.
По его словам, 2026 год станет переломным: главной метрикой успеха станет возврат инвестиций (ROI). Компании окончательно перейдут от экспериментов к полноценным внедрениям ИИ-решений для конкретных бизнес-задач с измеримым экономическим эффектом.
Три слоя стоимости: что включает Total Cost of Ownership
Чтобы правильно оценить стоимость владения корпоративным ИИ (Total Cost of Ownership), нужно рассматривать три уровня архитектуры:
- Ассистенты и приложения. Это финальный продукт — специализированные ИИ-помощники для руководителей, техподдержки или HR, которые решают конкретные задачи.
- Платформа управления. Операционная система для ИИ. Она обеспечивает оркестрацию, безопасность, мониторинг и управление моделями и данными.
- Железо + LLM. Вычислительная инфраструктура (серверы, GPU) и сами большие языковые модели.
Ошибка в выборе на любом из этих уровней может привести к существенному увеличению затрат.
Сегодня, согласно данным аналитиков, значительная часть корпоративных ИИ-проектов не достигает поставленных целей. Чат-боты без интеграции с бизнес-процессами, ИИ-аналитика без конкретных KPI, автоматизация процессов без учета человеческого фактора — только часть примеров неуспешных кейсов. Объединяет все эти примеры отсутствие четко поставленной бизнес-задачи.
Марат Мухарьямов поделился результатами исследования, проведенного экспертами команды GPTZATOR.
Рейтинг сценариев применения корпоративного ИИ показывает: наиболее успешны проекты с ориентиром на конкретные операционные улучшения с интеграцией с корпоративными данными. Например, интеграция ассистента специалиста техподдержки пользователей способна сэкономить до 1040 рабочих часов в год, ассистент HR-менеджера — 520, ассистента бизнес-аналитика — 624 часа. Для бизнеса это означает необходимость заранее определять результаты планируемого внедрения и ориентироваться на конкретную бизнес-проблему. Каждый проект должен показывать конкретную финансовую отдачу и измеримые бизнес-результаты.
Как выбрать железо и модель: ключевые факторы
Выбор вычислительной платформы и LLM — решение, которое определяет эффективность системы на годы вперед. При этом ориентироваться только на максимальную производительность — значит гарантированно переплатить.
Ключевые факторы выбора:
Нагрузка. Количество пользователей, частота запросов, пиковые нагрузки.
Требования к модели. Размер, специализация, поддержка языков.
Бюджет. Соотношение капитальных и операционных расходов.
Безопасность. Возможность локального развертывания, соответствие стандартам.
В ходе выступления Марат Мухарьямов поделился результатами комплексного тестирования ИИ-платформы для бизнеса GPTZATOR на базе 2-х видеокарт NVIDIA A100 80ГГб. Оно показало реальные возможности и ограничения современного оборудования для корпоративных ИИ-решений.
Как видно из графика, заявленные производителем LLM метрики практически не достигаются. Сервер с 2 картами NVIDIA A100 80ГГб позволяет обрабатывать в среднем до 60 одновременных обращений пользователей с приемлемой производительностью.
Таким образом, в проектах внедрения важно проводить нагрузочное тестирование и выбирать сервера с учетом множества факторов: количество пользователей и интенсивность работы, качество данных, требования к бизнес-логике, размерность и контекстное окно LLM.
Правильный выбор вычислительной платформы может снизить операционные расходы на 40–60% без потери производительности.
Гибридная архитектура: лучшее из двух миров
Одним из главных трендов, по опыту клиентских проектов компании, становится гибридный подход. Приведя примеры возможных сценариев внедрения корпоративного ИИ, Марат Мухарьямов отметил, что бизнес предпочитает комбинировать безопасность on-premise и удобство облачного SaaS: платформа управления и данные остаются в закрытом контуре заказчика (on-premise или доверенный ЦОД), а сами LLM арендуются по токенам у облачных провайдеров.
Это позволяет получить высокий уровень безопасности для критичных данных и при этом использовать самые современные и мощные модели, оплачивая только фактическое потребление.
Управление рисками: что может пойти не так
Марат Мухарьямов особо подчеркнул, что понимание и своевременное снижение рисков — ключевой элемент успешного внедрения ИИ. Он отметил, что такие угрозы, как стремительное устаревание технологий, ужесточение регуляторных требований и рост киберугроз с использованием ИИ требуют проактивного подхода и четко прописанных мер по митигации. Для ответов на эти вызовы он предложил комплексный подход: модульную архитектуру для гибкой адаптации к новым технологиям, изначальное соблюдение высоких стандартов безопасности для соответствия будущим нормативам и многоуровневую систему защиты с изоляцией данных — все это в совокупности обеспечивает устойчивость и эффективность цифровой трансформации
Главный вывод: ROI прежде всего
Успешное внедрение ИИ требует баланса между технологиями, безопасностью и стоимостью. Главное правило — начинать с четкого понимания бизнес-цели. В выступлении Марат Мухарьямов предложил ряд рекомендаций, основываясь на опыте интеграционных кейсов, которые ведет компания с крупными клиентами из различных отраслей:
Фокус на ROI и TOC. Каждое решение должно иметь четкое экономическое обоснование. Необходимо считать не только прямые затраты, но и скрытые расходы на интеграцию, обучение и поддержку.
ИИ в контуре бывает разным. Выбирайте архитектуру, соответствующую вашим требованиям безопасности и масштабирования.
Баланс ИБ и ROI. Контролируйте критически важные данные и используйте облачные ресурсы для масштабирования.
Он призвал компании начинать с пилотных проектов, тщательно измерять их результаты и последовательно масштабировать только те решения, которые доказали свою эффективность. Именно такой целенаправленный подход позволит внедрять ИИ в ключевые процессы и получать максимальную пользу от его применения.
О компании
GPTZATOR – платформа ИИ для бизнеса. Решение позволяет создавать и внедрять ИИ-ассистентов в широкий круг ИТ-систем компании без необходимости обучения больших языковых моделей и доработки существующих решений.
О системе
Project Lad – российская ИИ-система для управления на данных. Включает смарт-график календарно-сетевого планирования, управление финансами и ресурсами, прогнозирование и аналитику на основе реальных данных. ИИ-ассистент отвечает на вопросы, собирает отчеты и помогает принимать решения.
Группа IT-компаний Lad объединяет ИТ-компании, занимающиеся собственной продуктовой разработкой, дистрибуцией и системной интеграцией российских ИТ-решений. На рынке РФ более 30 лет.