Машинный перевод: определение понятия, история развития, разновидности
Машинный перевод представляет собой перевод текстового фрагмента с заданного языка на другой при помощи использования компьютерных технологий. Первые попытки изменить текст были сделаны в середине прошлого столетия. За это время технология изменилась и результат значительно улучшился. Так ли удобен машинный перевод на самом деле и сможет ли он вытеснить услуги профессиональных филологов?

История развития
Машинный перевод – это одно из направлений искусственного интеллекта. Условно историю развития можно разделить на несколько этапов:
- первые разработки появились в 1940-х гг. Ученые проводили исследования с целью понять возможности использования компьютерной техники для осуществления автоматического перевода. Однако из-за ограниченности ресурсов и несовершенства технологий первые попытки не увенчались успехом;
- появление статистического подхода в 1950-х гг. позволило работать с текстами больших объемов на разных языках. Поиск соответствий между ними позволил значительно улучшить качество, но пока не довел его до приемлемого;
- появление систем на основе правил каждого языка улучшил качество результата. При этом по-прежнему требовалась ручная доработка;
- использование нейронных сетей – существенный рывок в развитии машинного перевода. Нейросети дают возможность моделировать зависимости между словами и словосочетаниями в тексте, а значит, добиться более грамотного результата.
История показывает, что технология машинного перевода постоянно усовершенствуется. Добавляются новые алгоритмы, разрабатываются новые технологии. Вероятнее всего в будущем это приведет к более качественному результату.
Виды машинного перевода
Автоматизированный или машинный перевод представляет собой процесс, при котором программное обеспечение разбивает оригинальный текст на одном языке на слова и фразы, после чего заменяет их соответствующими словами и фразами на другом языке. При этом используются разнообразные алгоритмы, шаблоны и базы данных. На основе информации система переводит большие объемы данных без вмешательства человека. Существует несколько методов машинного перевода с использованием различных механизмов работы с данными:
- на основе правил. В основе словари и правила выбранного языка, которые были собраны экспертами; • статистический. В основе анализ большого количества переведенных человеком текстов для поиска аналога целевого сегмента. В таком переводе есть вероятность возникновения проблем с языковыми парами, имеющими различные формулировки;
- нейронный. Осуществляется при помощи баз данных, словарей, глоссариев, а также согласованных вариантов перевода переводчиками;
- гибридный. Включает статистический и нейронный типы. Позволяет добиться оптимальной точности при работе с текстами. Несмотря на большой прогресс и получение более точных результатов машинный перевод пока не вытеснил труд людей полностью.
Преимущества и недостатки
Среди положительных характеристик машинного перевода можно выделить:
- возможность быстро получить результат. Для обработки большого текстового фрагмента требуется несколько секунд;
- точность переводов. Современные алгоритмы научились работать даже с технически сложными текстами;
- низкие затраты по сравнению с привлечением переводчиков и возможность масштабируемости.
Однако машинный перевод не вытеснит профессиональных переводчиков полностью. Для этого есть несколько причин:
- отсутствие креативности в результате. Машина не способна точно распознать смысл исходного материала, увидеть особенности диалекта;
- недостаточная согласованность. Машина не учитывает коннотации, что зачастую приводит к результату, который необходимо переработать и дополнить;
- отсутствие конфиденциальности. Любой материал, прогоняемый через переводчик, будет использоваться для дальнейшего усовершенствования алгоритмов. Некоторые компании не могут позволить допустить утечку важных данных, пусть даже потенциальную.
Яндекс и Гугл
В 2016 году в Google появилась возможность использовать машинный перевод. Русский язык был подключен к системе год спустя. Разработанная Гугл платформа Google Neural Machine разбивает предложение на слова и словосочетания для дальнейшего перевода. Если такой информации не было в словарном запасе, фрагмент оставался неизменным. Однако, некоторые имена собственные переводчик пытался разбить на несколько частей для дальнейшего перевода.
Для пользователей онлайн-версии доступен механизм краудсорсинга, при котором существует возможность выбирать наиболее подходящую версию перевода. Это особенно удобно при использовании разговорных выражений.
Яндекс-Переводчик использует немного другой алгоритм. В 2017 году была запущена программа на основе нейросетей. При работе с предложениями используется гибридный метод, при котором алгоритм находит наиболее подходящий вариант перевода исходного текста. Нейронный перевод не слишком подходит для работы с небольшими предложениями и короткими фразами. Для этих целей лучше использовать статистический метод.
Вместо заключения
Машинный перевод – это удобная функция, которую можно использовать в повседневной жизни. Она значительно упрощает общение при наличии языкового барьера. Однако мечта о синхронном переводе пока еще далека от реальности.
Нейросеть обучается на параллельных текстах. В то же время для ее усовершенствования необходимо наличие оригинала, которого при подаче текстовой информации создать сложно.
Вместе с тем большой шаг в развитии нейросетей позволяет предположить, что уже через несколько лет технология машинного перевода продвинется далеко вперед. В результате будет получаться точный результат, в котором будет минимальное количество ошибок и недочетов. Остается гадать, насколько доступными будут эти механизмы и как люди смогут использовать их на практике.