Меню
Статья
19 апреля 2024

Машинный перевод: определение понятия, история развития, разновидности

Машинный перевод представляет собой перевод текстового фрагмента с заданного языка на другой при помощи использования компьютерных технологий. Первые попытки изменить текст были сделаны в середине прошлого столетия. За это время технология изменилась и результат значительно улучшился. Так ли удобен машинный перевод на самом деле и сможет ли он вытеснить услуги профессиональных филологов? 

triptonkosti.ru
triptonkosti.ru

История развития 

Машинный перевод – это одно из направлений искусственного интеллекта. Условно историю развития можно разделить на несколько этапов: 

  • первые разработки появились в 1940-х гг. Ученые проводили исследования с целью понять возможности использования компьютерной техники для осуществления автоматического перевода. Однако из-за ограниченности ресурсов и несовершенства технологий первые попытки не увенчались успехом; 
  • появление статистического подхода в 1950-х гг. позволило работать с текстами больших объемов на разных языках. Поиск соответствий между ними позволил значительно улучшить качество, но пока не довел его до приемлемого; 
  • появление систем на основе правил каждого языка улучшил качество результата. При этом по-прежнему требовалась ручная доработка; 
  • использование нейронных сетей – существенный рывок в развитии машинного перевода. Нейросети дают возможность моделировать зависимости между словами и словосочетаниями в тексте, а значит, добиться более грамотного результата. 

История показывает, что технология машинного перевода постоянно усовершенствуется. Добавляются новые алгоритмы, разрабатываются новые технологии. Вероятнее всего в будущем это приведет к более качественному результату. 

Виды машинного перевода 

Автоматизированный или машинный перевод представляет собой процесс, при котором программное обеспечение разбивает оригинальный текст на одном языке на слова и фразы, после чего заменяет их соответствующими словами и фразами на другом языке. При этом используются разнообразные алгоритмы, шаблоны и базы данных. На основе информации система переводит большие объемы данных без вмешательства человека. Существует несколько методов машинного перевода с использованием различных механизмов работы с данными: 

  • на основе правил. В основе словари и правила выбранного языка, которые были собраны экспертами; • статистический. В основе анализ большого количества переведенных человеком текстов для поиска аналога целевого сегмента. В таком переводе есть вероятность возникновения проблем с языковыми парами, имеющими различные формулировки; 
  • нейронный. Осуществляется при помощи баз данных, словарей, глоссариев, а также согласованных вариантов перевода переводчиками; 
  • гибридный. Включает статистический и нейронный типы. Позволяет добиться оптимальной точности при работе с текстами. Несмотря на большой прогресс и получение более точных результатов машинный перевод пока не вытеснил труд людей полностью. 

Преимущества и недостатки 

Среди положительных характеристик машинного перевода можно выделить: 

  • возможность быстро получить результат. Для обработки большого текстового фрагмента требуется несколько секунд; 
  • точность переводов. Современные алгоритмы научились работать даже с технически сложными текстами;
  • низкие затраты по сравнению с привлечением переводчиков и возможность масштабируемости. 

Однако машинный перевод не вытеснит профессиональных переводчиков полностью. Для этого есть несколько причин: 

  • отсутствие креативности в результате. Машина не способна точно распознать смысл исходного материала, увидеть особенности диалекта; 
  • недостаточная согласованность. Машина не учитывает коннотации, что зачастую приводит к результату, который необходимо переработать и дополнить; 
  • отсутствие конфиденциальности. Любой материал, прогоняемый через переводчик, будет использоваться для дальнейшего усовершенствования алгоритмов. Некоторые компании не могут позволить допустить утечку важных данных, пусть даже потенциальную. 

Яндекс и Гугл 

В 2016 году в Google появилась возможность использовать машинный перевод. Русский язык был подключен к системе год спустя. Разработанная Гугл платформа Google Neural Machine разбивает предложение на слова и словосочетания для дальнейшего перевода. Если такой информации не было в словарном запасе, фрагмент оставался неизменным. Однако, некоторые имена собственные переводчик пытался разбить на несколько частей для дальнейшего перевода. 

Для пользователей онлайн-версии доступен механизм краудсорсинга, при котором существует возможность выбирать наиболее подходящую версию перевода. Это особенно удобно при использовании разговорных выражений. 

Яндекс-Переводчик использует немного другой алгоритм. В 2017 году была запущена программа на основе нейросетей. При работе с предложениями используется гибридный метод, при котором алгоритм находит наиболее подходящий вариант перевода исходного текста. Нейронный перевод не слишком подходит для работы с небольшими предложениями и короткими фразами. Для этих целей лучше использовать статистический метод. 

Вместо заключения 

Машинный перевод – это удобная функция, которую можно использовать в повседневной жизни. Она значительно упрощает общение при наличии языкового барьера. Однако мечта о синхронном переводе пока еще далека от реальности. 

Нейросеть обучается на параллельных текстах. В то же время для ее усовершенствования необходимо наличие оригинала, которого при подаче текстовой информации создать сложно. 

Вместе с тем большой шаг в развитии нейросетей позволяет предположить, что уже через несколько лет технология машинного перевода продвинется далеко вперед. В результате будет получаться точный результат, в котором будет минимальное количество ошибок и недочетов. Остается гадать, насколько доступными будут эти механизмы и как люди смогут использовать их на практике. 

CAPTCHA