Как лучшие предложения,
хвост не застрялИскусственный интеллект особенно хорошо работает при решении языковых задач. Мета — владелец Facebook, Instagram и WhatsApp — хорошо это знает: во вторник (22) компания выпустила модель под названием Seamless M4T, которая способна переводить и расшифровывать почти 100 языков.
Цель (Изображение: Витор Падуа/)
Бесшовный M4T работает с текстом и языком с различными возможностями:
- распознавание речи почти на 100 языках;
- перевод речи в текст почти для 100 языков ввода и вывода;
- речевой перевод почти для 100 входных и 36 выходных языков;
- текстовый перевод почти на 100 языков;
- перевод текста в речь почти для 100 языков ввода и 35 языков вывода.
Для создания модели Meta утверждает, что собрала десятки миллиардов письменных предложений и 4 миллиона часов речей, общедоступных в сети.
на сайт АксиосПако Гусман, исследователь из Meta, говорит, что Seamless M4T не использует промежуточные шаблоны и даже допускает изменения языка в середине предложения.
«Это позволяет ему лучше работать с группами населения, которые естественным образом ежедневно смешивают языки», — комментирует Гусман.
Новый шаблон Meta недоступен для использования кем-либо. Он был выпущен под лицензией Creative Commons для некоммерческого использования. Исследователи и разработчики смогут использовать эту технологию в своей работе.
Это не первый случай, когда Meta разрабатывает модели искусственного интеллекта для работы с переводом.
В 2022 году компания запустила программу No Language Left Behind для текстового перевода. Он смог перевести 200 языков.
Затем появился универсальный переводчик речи, который работал как с речевым вводом, так и с выводом.
Бесшовный M4T основан на платформе массовой многоязычной речи Meta для распознавания речи, идентификации языка и синтеза речи для более чем 1100 языков.
Среди конкурентов Google работает над универсальной моделью речи — инициативой, позволяющей понимать 1000 наиболее распространенных языков в мире.
Mozilla возглавляет проект Common Voice — коллекцию голосов с разных языков — для обучения алгоритмов распознавания речи.
С информацией: Meta, Axios, TechCrunch, Reuters.
GoogleInstagramИскусственный интеллектMetaSeamless M4TWhatsAppMozilla Foundation