Top.Mail.Ru
программы машинного перевода
Время чтения 7 мин.

Перевод онлайн. Как выбрать лучший сервис машинного перевода?

В 2024 году машинный перевод продолжает быть привычным инструментом для бизнеса. Можно локализовать инструкцию, договор или письмо зарубежных партнеров в пару кликов, сэкономив время, деньги и нервы.

Особенно популярны переводчики онлайн с русского на английский и наоборот — это самая востребованная языковая пара в сфере переводов на территории РФ.

Но качество перевода в разных сервисах и для разных языков сильно отличается. Как выбрать лучший для своих задач и не разочароваться в результате? Давайте разбираться.

Для каких задач нужен машинный перевод?

  • Перевести документы, с общим содержанием которых необходимо оперативно ознакомиться, при этом качество перевода с т. з. красоты речи и точности мелких оборотов не важно. Чаще всего это относится к инструкциям, письмам, отзывам;
  • Быстро поменять язык для текстов на сайте. Актуально для интернет-магазинов, IT-проектов, турфирм;
  • Перевести большие объемы типовых документов — контрактов, отчетов, патентов;
  • Получить черновой вариант перевода, чтобы переводчик потом его «причесал» под нужный стиль и терминологию компании.

А еще машинные сервисы выручают, когда нужно перевести с/на редкие языки. Например, венгерский, персидский или финский. С ними работает меньшее количество переводчиков, и их услуги обойдутся дороже.

Но не для всех тематик машинный перевод подходит! Особенно осторожными нужно быть с:

  • Юридическими и финансовыми документами. Тут важна точность формулировок, которые машина может исказить;
  • Маркетинговыми и рекламными текстами. Машина не передаст креатив, юмор, игру слов и другие особенности языка, которые не получится передать на иной язык с помощью буквальных и дословных методов перевода;
  • Узкоспециализированными техническими текстами. Нефтегазовая тематика, авиация и медицина пестрят большим количеством терминов и жаргонизмов, которые стандартные машинные движки не смогут передать так, как это принято в сфере.

Сравниваем популярные сервисы машинного перевода

У каждого сервиса своя специфика. Посмотрим на плюсы и минусы Google, Яндекс и DeepL переводчиков. А также разберем типичные ошибки, чтобы вы знали, к чему готовиться.

  • Работает с 100+ языками, включая очень редкие;
  • Переводит до 5 000 символов за раз;
  • Можно загружать документы и переводить целые сайты;
  • Есть мобильное приложение с возможностью оффлайн-перевода;
  • Бесплатный, не требует регистрации;
  • Не всегда точно переводит многозначные слова;
  • Может путать род и склонение существительных;
  • Иногда пропускает куски текста или вставляет лишние пробелы.
  • Хорошо переводит с английского и других европейских языков на русский;
  • Работает с 95 языками;
  • Может переводить сайты целиком;
  • Позволяет выбрать тематику/стиль (обычный текст, технический документ, разговорная речь и т. д.);
  • Бесплатный, не требует регистрации;
  • Не всегда правильно передает термины;
  • С некоторыми парами языков работает не очень точно;
  • Неуклюжие формулировки в текстах «на выходе».
  • Наиболее точный из перечисленных сервисов. Приближен по качеству к результатам работы переводчика;
  • Переводит на 25 европейских языков;
  • Умеет сохранять форматирование и верстку документов;
  • Позволяет редактировать готовый перевод прямо в редакторе;
  • Есть API для интеграции в свои программы;
  • Работает только с европейскими языками.

Типичные ошибки машинных переводчиков

Даже самые продвинутые нейросети не застрахованы от ошибок. На что стоит обращать внимание:

  1. Путаница в терминологии. Так, Pressure Sensor машина может перевести как «Датчик давления» вместо «Прессостат». Придется вычитывать и править вручную.
  2. Неверный перевод идиом и устойчивых выражений. «Держать ухо востро» и «душа в душу» машина нередко понимает буквально.
  3. Ошибки в числах, единицах измерения, дробях. Из «12,3 Мпа» запросто получится «12.300 Мпа».
  4. Потеря форматирования — жирных/курсивных начертаний, маркированных списков, таблиц, которые придется восстанавливать.
  5. Неловкие, неестественные фразы. Вместо «Запустите приложение» машина напишет «Осуществите инициацию программного обеспечения».

Как уменьшить количество ошибок машинного перевода

На данный момент полностью исключить ошибки вряд ли удастся . Однако их можно минимизировать. Для этого необходимо::

  1. Выбирать целевой язык вручную, а не полагаться на автоопределение;
  2. Соблюдать знаки препинания, пробелы между словами;
  3. Разбивать длинные предложения на короткие и простые;
  4. Загружать текст частями, а не целиком (особенно в Google и Яндексе).

Лайфхак — перевести текст сначала на английский, а с него на нужный язык. Это улучшит качество для менее распространенных языков.

Примеры переводов разными сервисами

Посмотрим на примере, как справляются с техническими текстами разные машинные переводчики. Для сравнения возьмем исходный машинный перевод (MT), его улучшенную версию с помощью GPT и профессиональный человеческий перевод (ПЕМТ).

ОригиналMTGPTПЕМТ
NOTE TO PHYSICIAN: This product is an organophosphate (cholinesterase-inhibiting) insecticide.Примечание для врача: данный препарат является фосфорорганическим (ингибирующим холинэстеразу) инсектицидом.Заметка для врача: Этот продукт — органофосфатный (ингибирующий холинэстеразу) инсектицид.Указание для медика: Этот продукт – инсектицид, относящийся к органофосфатам и ингибиторам холинэстеразы.
If foreign body is found the bag labeled REJECTED and isПри обнаружении инородного тела пакет маркируется как rejected иЕсли обнаружено инородное тело, пакет помечается как ‘Отклонено’ иЕсли обнаружено инородное тело, пакет помечается как «БРАК» и
The test pieces are to be checked prior to and after each BATCHКонтрольные образцы проверяются перед началом и после окончания каждой партииКонтрольные образцы должны быть проверены до и после каждой партииИспытательные образцы следует проверять до и после каждой партии.
REJECT — Return to vendorReject — возврат поставщикуОтклонить — вернуть поставщикуОтказ — отправить обратно поставщику
Correct range: 6 to 8 Ohm between RED & YELLOW wires.Правильный диапазон: 6-8 ом между красным и желтым проводами.Корректный диапазон: 6-8 Ом между красной и желтой проводкой.Корректный диапазон: от 6 до 8 Ом между красным и желтым проводами.

Сравнивая полученные результаты можем сделать следующие выводы:

Машинный перевод (MT) часто содержит неточности:

  • Оставляет некоторые слова без перевода (REJECTED, Reject);
  • Допускает стилистические ошибки («Примечание для врача» вместо «Указание»);
  • Неверно склоняет слова по падежам («между красным и желтым проводами»).

Версия, улучшенная с помощью GPT, показывает более правильный вариант:

  • Переводит все слова, хоть иногда и не совсем точно (REJECTED → Отклонено);
  • Подбирает более естественные формулировки;
  • Лучше справляется с согласованием слов.

Но самый качественный результат все равно дает привлечение профессионального переводчика (ПЕМТ):

  • Использует правильную терминологию (physician → медик, range → диапазон);
  • Соблюдает технический стиль изложения;
  • Грамотно оформляет текст с точки зрения пунктуации.

Впрочем, стоит отметить, что все три варианта способны передать общий смысл фраз из оригинала. Машинный перевод может быть вполне применим для первичного ознакомления с документом, но для публикации или для использования в работе все же лучше довериться профессионалу.

Кастомный машинный перевод — что это и кому подойдет?

Представьте, что Искусственный Интеллект (ИИ) обучили переводить в  соответствии со стилем и терминологией вашей компании. Теперь он знает, какие слова типичны для вашей отрасли и понимает нюансы внутренних регламентов. Вот это и есть кастомный перевод.

Кастомный движок создают на базе готовых нейросетей типа Google AutoML. Его тренируют на текстах из вашей сферы, серьезно следят за соблюдением глоссария и единством стиля. В итоге вы получаете свой персональный переводчик. Он локализует тексты именно так, как принято в компании — никаких двусмысленностей и разнобоя в терминах.

Дорого? Да. Но если у вас большие объемы переводов и важна конфиденциальность — оно того стоит. Переводы не утекут в открытый доступ, как это бывает с обычными онлайн-сервисами. Все останется внутри контура компании.

В долгосрочной перспективе при больших объемах переводов такое решение выйдет дешевле, чем постоянная работа с человеком, и скорость перевода больших объемов у машины значительно выше. Это особенно актуально для банков, страховых, промышленных гигантов.

А как переводы обрабатывают в компании ТРАКТАТ?

У нас многоступенчатая система перевода и контроля качества:

1. Сначала текст переводит специально обученный под клиента ИИ. Он знает специфику документов и терминологию заказчика;

2. Потом машинный перевод вычитывает и правит переводчик-человек. Он исправляет ошибки, делает текст более стилистически гладким и естественным;

3. Дальше подключается редактор и проверяет перевод на соответствие глоссарию и стандартам заказчика;

4. В конце — контрольное чтение менеджером отдела контроля качества и финальная шлифовка.

Мы интегрировали машинный перевод с нейросетью GPT. Она дополнительно улучшает стилистику, добавляет переводу креатива и живости. Кроме того, есть перевод по фото онлайн. Достаточно загрузить изображение с текстом, и система распознает его, переведет и отправит результат. Об этом мы написали отдельную и очень интересную статью-исследование, в которой коллеги поделились своим опытом внедрения GPT в работу.

По такой схеме мы переводим документы на многие языки мира, и всегда подберем переводчика с подходящей экспертизой под проект.

Резюмируем:

1. Машинный перевод — мощный инструмент для бизнеса. Экономит время, деньги и нервы. Но не всегда обеспечивает нужное качество;

2. Для разовых задач сгодятся бесплатные онлайн-сервисы типа Google и Яндекс.Переводчика. DeepL даст более точный перевод, но он платный;

3. Не стоит забывать о типичных ошибках машинных переводчиков — путаницу в терминах, кривой перевод идиом, потерю форматирования;

4. Если у вас много переводов и нужна конфиденциальность — задумайтесь о создании кастомного движка. Он будет переводить документы с учетом специфики вашего бизнеса;

5. В идеале — заказывайте профессиональный перевод у нас. Комбинация «машина + человек + дополнительная обработка нейросетью» — ключ к качественному переводу в адекватные сроки.Остались вопросы? Обращайтесь к нам — подскажем, как локализовать документы быстро, качественно и без головной боли.

Баннер Технологии в ТРАКТАТ