Разработчики больших языковых моделей пророчат универсальный интеллект, но пока коммерческие LLM чаще попадают в заголовки новостей не из-за прорывных возможностей, а найденных багов. И пока одни пользователи восхищаются способностью нейросетей генерировать тексты, другие сомневаются, решают ли они хоть какие-то задачи.
Большие модели действуют как живой эксперимент: сначала их обучают, и только потом изучают, чему они научились. В то же время маленькие, но менее известные ИИ-инструменты уже решают практические задачи — например, сокращают рутину в обработке документов, анализируют фото со спутника и помогают анализировать рентгеновские снимки.
Почему в науке об ИИ все чаще сначала запускают гипотезу, а потом придумывают к ней теорию? Можно ли для нейросетей выработать свой ГОСТ, как для мостов или двигателей? И зачем вообще человечеству «универсальный интеллект», если малые модели уже делают все, что нужно бизнесу и пользователям? Обсуждают Андрей Коняев и Евгений Глухов, главный ИИ-архитектор в Гринатоме, в новом выпуске «Нестандартной модели».
Еще из подкаста узнаете, как устроена гонка больших моделей, что общего у нейросетей с стиховедением — и почему разработчики сами не до конца знают, чему научили свои системы.
Следующие выпуски «Нестандартной модели» ждите на YouTube и на канале N + 1 в VK Видео — подкаст будет выходить каждую неделю.
Реклама: Частное Учреждение «Центр Коммуникаций», ИНН 9705152344, Erid:2W5zFJSXgfA