Машинный перевод: определение понятия, история развития, разновидности

Машинный перевод представляет собой перевод текстового фрагмента с заданного языка на другой при помощи использования компьютерных технологий. Первые попытки изменить текст были сделаны в середине прошлого столетия. За это время технология изменилась и результат значительно улучшился. Так ли удобен машинный перевод на самом деле и сможет ли он вытеснить услуги профессиональных филологов?

triptonkosti.ru

Содержание

История развития
Виды машинного перевода
Преимущества и недостатки
Яндекс и Гугл
Вместо заключения

История развития

Машинный перевод – это одно из направлений искусственного интеллекта. Условно историю развития можно разделить на несколько этапов:

первые разработки появились в 1940-х гг. Ученые проводили исследования с целью понять возможности использования компьютерной техники для осуществления автоматического перевода. Однако из-за ограниченности ресурсов и несовершенства технологий первые попытки не увенчались успехом;
появление статистического подхода в 1950-х гг. позволило работать с текстами больших объемов на разных языках. Поиск соответствий между ними позволил значительно улучшить качество, но пока не довел его до приемлемого;
появление систем на основе правил каждого языка улучшил качество результата. При этом по-прежнему требовалась ручная доработка;
использование нейронных сетей – существенный рывок в развитии машинного перевода. Нейросети дают возможность моделировать зависимости между словами и словосочетаниями в тексте, а значит, добиться более грамотного результата.

История показывает, что технология машинного перевода постоянно усовершенствуется. Добавляются новые алгоритмы, разрабатываются новые технологии. Вероятнее всего в будущем это приведет к более качественному результату.

Виды машинного перевода

Автоматизированный или машинный перевод представляет собой процесс, при котором программное обеспечение разбивает оригинальный текст на одном языке на слова и фразы, после чего заменяет их соответствующими словами и фразами на другом языке. При этом используются разнообразные алгоритмы, шаблоны и базы данных. На основе информации система переводит большие объемы данных без вмешательства человека. Существует несколько методов машинного перевода с использованием различных механизмов работы с данными:

на основе правил. В основе словари и правила выбранного языка, которые были собраны экспертами; • статистический. В основе анализ большого количества переведенных человеком текстов для поиска аналога целевого сегмента. В таком переводе есть вероятность возникновения проблем с языковыми парами, имеющими различные формулировки;
нейронный. Осуществляется при помощи баз данных, словарей, глоссариев, а также согласованных вариантов перевода переводчиками;
гибридный. Включает статистический и нейронный типы. Позволяет добиться оптимальной точности при работе с текстами. Несмотря на большой прогресс и получение более точных результатов машинный перевод пока не вытеснил труд людей полностью.

Преимущества и недостатки

Среди положительных характеристик машинного перевода можно выделить:

возможность быстро получить результат. Для обработки большого текстового фрагмента требуется несколько секунд;
точность переводов. Современные алгоритмы научились работать даже с технически сложными текстами;
низкие затраты по сравнению с привлечением переводчиков и возможность масштабируемости.

Однако машинный перевод не вытеснит профессиональных переводчиков полностью. Для этого есть несколько причин:

отсутствие креативности в результате. Машина не способна точно распознать смысл исходного материала, увидеть особенности диалекта;
недостаточная согласованность. Машина не учитывает коннотации, что зачастую приводит к результату, который необходимо переработать и дополнить;
отсутствие конфиденциальности. Любой материал, прогоняемый через переводчик, будет использоваться для дальнейшего усовершенствования алгоритмов. Некоторые компании не могут позволить допустить утечку важных данных, пусть даже потенциальную.

Яндекс и Гугл

В 2016 году в Google появилась возможность использовать машинный перевод. Русский язык был подключен к системе год спустя. Разработанная Гугл платформа Google Neural Machine разбивает предложение на слова и словосочетания для дальнейшего перевода. Если такой информации не было в словарном запасе, фрагмент оставался неизменным. Однако, некоторые имена собственные переводчик пытался разбить на несколько частей для дальнейшего перевода.

Для пользователей онлайн-версии доступен механизм краудсорсинга, при котором существует возможность выбирать наиболее подходящую версию перевода. Это особенно удобно при использовании разговорных выражений.

Яндекс-Переводчик использует немного другой алгоритм. В 2017 году была запущена программа на основе нейросетей. При работе с предложениями используется гибридный метод, при котором алгоритм находит наиболее подходящий вариант перевода исходного текста. Нейронный перевод не слишком подходит для работы с небольшими предложениями и короткими фразами. Для этих целей лучше использовать статистический метод.

Вместо заключения

Машинный перевод – это удобная функция, которую можно использовать в повседневной жизни. Она значительно упрощает общение при наличии языкового барьера. Однако мечта о синхронном переводе пока еще далека от реальности.

Нейросеть обучается на параллельных текстах. В то же время для ее усовершенствования необходимо наличие оригинала, которого при подаче текстовой информации создать сложно.

Вместе с тем большой шаг в развитии нейросетей позволяет предположить, что уже через несколько лет технология машинного перевода продвинется далеко вперед. В результате будет получаться точный результат, в котором будет минимальное количество ошибок и недочетов. Остается гадать, насколько доступными будут эти механизмы и как люди смогут использовать их на практике.

Администрация Сайта

293

Комментировать