Разработка мобильных приложений: новости и статьи — 02.09

Китайский технологический гигант Tencent открыл исходный код двух специализированных моделей перевода, заявив, что они превосходят известные инструменты, такие как Google Translate, в международных бенчмарках.

На WMT2025, крупном семинаре, где исследовательские группы сравнивают системы перевода, новые модели Tencent Hunyuan MT 7B и Hunyuan MT Chimera 7B заняли первые места в 30 из 31 протестированных языковых пар. Семинар по машинному переводу (WMT) — одно из ведущих мероприятий по оценке моделей перевода.

Обе модели поддерживают двусторонний перевод на 33 языка, включая такие широко распространённые, как китайский, английский и японский, а также менее распространённые в цифровом формате языки, как чешский, маратхи, эстонский и исландский. Tencent заявляет, что основное внимание уделяется переводу между мандаринским диалектом китайского языка и языками национальных меньшинств в Китае. Модели могут переводить в обоих направлениях между китайским и казахским, уйгурским, монгольским и тибетским языками.

Технический отчёт Tencent показывает, что модели Hunyuan превосходят существующие системы в прямых сравнениях. По сравнению с Google Translate результаты улучшились на 15–65% в зависимости от направления перевода и критериев оценки. Фирменные системы искусственного интеллекта, такие как GPT-4.1, Claude 4 Sonnet и Gemini 2.5 Pro, также не оправдали ожиданий в большинстве тестов.

Обладая 7 миллиардами параметров, эти модели значительно компактнее многих базовых моделей в своём классе, поэтому требуют меньше вычислительной мощности и могут работать на более слабом оборудовании. Тесты показывают, что они по-прежнему не уступают или даже превосходят более крупные системы по производительности. В частности, они превосходят серию Tower Plus (до 72 миллиардов параметров) на 10–58%.

В прямых сравнительных тестах с ключевыми языковыми парами обе модели Hunyuan показали явный прирост. По сравнению с Gemini 2.5 Pro они показали примерно на 4,7% более высокий результат. При тестировании со специализированными моделями перевода улучшения составили от 55 до 110%.

Модели доступны с открытым исходным кодом на Hugging Face, кроме того Tencent опубликовала исходный код на GitHub.

Данные о правообладателе фото и видеоматериалов взяты с сайта «AppTractor», подробнее в Условиях использования