"Солнце загорало" и другие забавные ошибки переводчика чувашского языка от "Яндекса"
В случае с чувашским языком "Яндекс. Переводчик" неплохо переводит публицистические тексты, но не может передать смысла стихов. Такой вывод мы сделали после теста программы вместе со специалистом.
В начале февраля в сервисе «Яндекс. Переводчик» появился чувашский язык. Перевод разрабатывал Николай Плотников со своей командой.
«В 2016 году мы создали корпус чувашского языка с функцией параллельных переводов. Изначально проект создавался, чтобы в дальнейшем делиться переводчиком с сервисами «Яндекс», Google и другими. На данный момент нам удалось собрать где-то до 270 тысяч пар слов и выражений», - рассказывает Николай.
В 2019 году авторы проекта связались с «Яндексом» и добились того, чтобы чувашский язык появился в списке для онлайн-перевода. Эксперт говорит, что для хорошего перевода нужно собрать 1 миллион пар лексических единиц. По этой причине сейчас он ходит в Национальную библиотеку, сканирует книги на чувашском языке, а затем передает данные корректорам.
Вместе с Николаем Плотниковым мы проверили, какие ошибки допускает «Яндекс. Переводчик» в случае с чувашским языком. Сначала перевели новость о едином проездном с чувашского на русский.
"При переводе во втором предложении обстоятельство "сегодня" лучше было бы поставить в начало. "По-моему, этот вопрос в Чебоксарах" - некорректное предложением. Пропущено слово "актуальный". "Ездят на проезд" - также некорректное словосочетание. Правильно - "пользуются проездными", - говорит специалист.
"Это особенность нейронного алгоритма. Когда он не знает какого-то слова, пытается его придумать сам. Иногда можно увидеть очень интересные слова. В целом, перевод неплохой и может помочь в работе. Вместо перевода объемного текста вручную достаточно будет исправить несколько ошибок," - комментирует Николай.
Перевод публицистических текстов эксперт оценил как неплохой. Однако, как оказалось, сервис плохо передает смысл стихов. Мы перевели несколько строф из поэмы "Нарспи". В русском варианте появились забавные ошибки вроде "солнце сильно загорало", "быстро брал снег" и "упасть с дороги". Николай Плотников считает, что когда удастся собрать 1 миллион пар переводов лексических единиц, сервис будет работать гораздо лучше.