Ссылки для упрощенного доступа

В онлайн-переводчике Google появилось несколько языков Поволжья


Сервис позволяет переводить с удмуртского, башкирского, чувашского и марийского на русский и другие языки.

Сервис Google Translate объявил о крупнейшем с момента основания обновлении набора языков, доступных для машинного перевода. За один день в переводчике появилось 110 новых языков, включая некоторые языки коренных народов Поволжья и других народов России — удмуртский, башкирский, чувашский, лугово-марийский, бурятский, чеченский, коми, осетинский, тувинский, чукотский, якутский и один из саамских языков.

Помимо языков народов России, в сервисе появились некоторые языки Африки и коренных народов Южной Америки, в том числе — практически вымершие языки, которые добавили, чтобы помочь активистам, стремящимся их возродить.

Как рассказал в официальном блоге Google старший программист-разработчик компании Айзек Кэсвелл, добавить все эти языки в программу удалось благодаря прогрессу в области искусственного интеллекта. Машинное обучение проводилось с помощью языковой модели PaLM 2.

На данный момент функционал сервиса находится в процессе обновления — у многих пользователей новые языки пока не видны в меню Google Translate, но некоторым уже удалось найти их и воспользоваться переводом. Как рекомендуют в одном из чатов языковых активистов, ускорить появление языков в меню может использование "гостевого" режима браузера или функции "инкогнито".

Кроме того, уже сейчас перевод с этих языков доступен всем через функцию "Определить язык". Если ввести в Google Translate текст на удмуртском, указав, что вы не знаете, на каком языке он написан, сервис сам "узнает" его и корректно переведет на русский или английский. Ожидается, что в меню у всех пользователей новые языки появятся в ближайшие два-три дня.

"Idel.Реалии" обратились за комментарием о новом функционале переводчика к удмуртскому языковому активисту Алексею (имя изменено).

— Насколько я могу судить, решение добавить удмуртский принадлежит самой компании Google. Ни я, ни коллеги с такой просьбой не обращались, поскольку это бессмысленно, если у вас нет большого корпуса параллельных текстов — на вашем языке и на другом, более крупном. Я знаю, что такой корпус уже подготовили тувинцы — и они, действительно, передали его Google, что помогло ускорить создание переводчика. Мы над таким корпусом работаем, но пока не закончили, так что Google использовал другие, уже опубликованные открытые источники, — рассказал Алексей.

Активист добавил, что оценил бы качество перевода с удмуртского и на удмуртский на три по пятибалльной шкале: "Он пока далек от идеала, но в целом его можно использовать в простых сценариях. Как я заметил, иногда он ошибается в местоимениях, например, вместо "вы" (тӥ), пишет "ты" (тон). Лексика пока слабоватая, знает мало неологизмов, чаще может использовать русские заимствования. Также пока не очень хорошо спрягает формы глаголов. По моим ощущениям, с удмуртского на русский переводит лучше, нежели с русского на удмуртский".

— Если машинный переводчик переводит хорошо, то он может быть полезен для изучающих язык на старте обучения, но иногда может и ошибаться, и запутывать. И всё же в условиях ограниченных источников для изучения языка это ценный инструмент. Впрочем, не единственный: не так давно мы перевели с помощью нейронной сети сборник рассказов удмуртского писателя Багай Аркаша на русский язык. Кроме того, разработали сервис по проверке правописания для удмуртского "Янгыштэк". Им активно пользуются редакторы газет, журналов, пишущие на удмуртском. Вообще, проектов в нашей среде очень много, со многими из них можно ознакомиться в канале "Удмурт диджитал", — заключил Алексей.

Ранее "Idel.Реалии" рассказывали о том, как в Google Translate появился татарский язык, и о работе языковых активистов над базой чувашского языка для этого сервиса.

Подписывайтесь на наш канал в Telegram. Что делать, если у вас заблокирован сайт "Idel.Реалии", читайте здесь.

XS
SM
MD
LG