Петербургские ученые разработали инструмент для улучшения поисковых систем и ИИ-ассистентов
Исследователи из ИТМО создали библиотеку для обработки данных DocuMentor, чтобы точнее анализировать и извлекать иерархическую структуру документов. Программа работает на основе большой языковой модели для оптического распознавания текста и определяет расположение элементов в PDF-файле с точностью до 98%. С помощью инструмента можно сделать документы машиночитаемыми и использовать их для создания эффективных систем поиска или чатов-ассистентов в крупных компаниях. Систему планируют использовать в проекте Министерства строительства и жилищно-коммунального хозяйства России для построения...
Copyright information of photo and video materials was taken from the website «ComNews.ru. News of digital transformation» , more details in our Terms of Use