Maxsoft - Продукты- Надежный партнер в сфере IT технологий, MaxSoft. Тел. (391) 222-09-37
Maxsoft
Новости
О компании
Семинары
Вакансии
Контакты
TeamViewer
5nine Software
Компания ABBYY
Acronis
ADOBE CREATIVE CLOUD
Astralinux
Corel Corporation
Компания Dr.WEB
О компании Entensys
О компании ESET
О компании InfoWatch
О «Лаборатории Касперского»
Kerio Technologies
Microsoft Corporation
О компании Positive Technologies
Prestigio
PROMT
Машинный перевод PROMT
SearchInform
О компании Trend Micro
Veeam
Vitro-CAD
О компании VMware
О компании Альта-Софт
О компании АСКОН
Флагманская разработка «А-Реал Консалтинг» – Интернет Контроль Сервер (ИКС)
О компании ИнфоТеКС
О компании «Код Безопасности»
МойОфис
О компании ООО «НТЦ ИТ РОСА»
ГК «Смарт-Софт»
Программный комплекс «Стахановец»
Компания НПО «Эшелон»
Последние новости

  02.07.2019
Выход новой версии комплексной системы информационного трехмерного проектирования Model Studio CS

  01.07.2019
Снижение цен на CorelDRAW!

  20.06.2019
Летние курсы по BIM

  04.06.2019
Новая цифровая САПР-платформа nanoCAD Plus 11 для отечественных компаний

  26.04.2019
Окончание поддержки Windows 7, Office 2010 и WS 2008, SQL Server 2008

  15.03.2019
ВСТРЕЧАЙТЕ НОВЫЙ CORELDRAW GRAPHICS SUITE 2019. ТЕПЕРЬ И ДЛЯ MAC!

  13.12.2018
НДС в России вырастет до 20% c 1 января

  06.12.2018
Обновление прайс-листа СТМ на 2019 год

  08.10.2018
Скидка 30% на новые лицензии Adobe!

  30.09.2018
День Машиностроителя. Специальные условия на nanoCAD Механика

Web-лаборатория
Учебный центр
Инженерный центр
Сервис-Центр

Главная >> Продукты >> PROMT >> Машинный перевод PROMT

МАШИННЫЙ ПЕРЕВОД PROMT

Что такое Машинный перевод?

Машинный перевод (МП, MT, Machine Translation) – перевод текстов с одного естественного языка на другой специальной компьютерной программой.

Зачем нужен машинный перевод?

Программы-переводчики оказываются просто незаменимыми, когда возникает необходимость:

  • быстро понять общий смысл текста,
  • быстро проанализировать многоязычную информацию из интернета,
  • оптимизировать перевод большого объема текстов по одной тематике (процесс разбивается на два этапа: машинный перевод и постредактирование человеком),
  • сделать информацию на сайте понятной иностранным пользователям, встроив функцию перевода на сайт,
  • быстро вести переписку с иностранными партнерами, а также свободно общаться в социальных сетях и на форумах,
  • извлечь информацию из большого объема текстов, опираясь на лингвистические характеристики слов. Например, выяснить, сколько раз в тексте встречаются имена собственные, какие это имена и какие действия связаны с этими именами.
Какие бывают системы машинного перевода?

Rule - based Machine Translation (RBMT, Машинный перевод, основанный на правилах)

Эта технология основана на словарной информации и анализе грамматических правил конкретных языков. Такие системы строятся на основе лингвистического описания двух естественных языков (двуязычных словарей и других баз данных, содержащих морфологическую, грамматическую и семантическую информацию), формальных грамматик и собственно алгоритмов перевода. Качество перевода зависит от объемов лингвистических баз данных (словарей) и глубины описания естественных языков, т. е., необходим учет максимального количества особенностей грамматической структуры как входного, так и выходного языка.

Существует два типа rule - based систем:

  • системы по типу Transfer – предполагают морфологический, синтаксический и семантический анализ текста на языке входа; преобразование в структуру выходного языка (TRANSFER); синтез текста на выходном языке,
  • системы по типу Interlingua – предполагают анализ входного текста в терминах метаязыка и синтез метаструктуры текста на выходном языке.

Преимущества RBMT -систем:

  • Синтаксическая и морфологическая точность,
  • Стабильность и предсказуемость результата,
  • Возможность настройки на предметную область.

Недостатки RBMT -систем:

  • Трудоемкость и длительность разработки,
  • Необходимость поддерживать и актуализировать лингвистические базы данных.

Компании-производители систем машинного перевода на основе технологии rule - based: PROMT, Systran, Linguatec

Statistical Machine Translation (SMT, Статистический машинный перевод)

Эта технология основана на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов. Такие системы перевода строятся на основе сравнения больших объемов корпусов параллельных текстов. Корпус параллельных текстов — это тексты, содержащие предложения на одном языке и соответствующие им предложения на втором. Статистический машинный перевод обладает свойством «самообучения»: чем больше в распоряжении имеется параллельных корпусов и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода.

Преимущества SMT -систем:

  • Гладкость перевода,
  • Легкость в построении при достаточном количестве параллельных корпусов,
  • Переносимость технологии на любые языковые пары.

Недостатки SMT:

  • Ограниченность параллельных корпусов в природе,
  • Неумение справляться с морфологией и синтаксисом,
  • Искажение информации (дублирование, пропуск, подмена информации).

Компании-производители систем статистического машинного перевода: PROMT, Google, SDL Language Weaver, Microsoft, Asia Online, IBM.

Hybrid Machine Translation (HMT, Гибридный машинный перевод)

В связи с тем, что технологии SMT и RBMT имеют свои недостатки и сложности, а также достигли определенного предела в своем развитии, разработчики решений по МП рассчитывают на технологический прорыв за счет создания гибридной технологии перевода. Эта технология основана на совмещении методов RBMT и SMT . Такой подход позволяет взять сильные стороны обеих технологий (грамматическую точность при переводе от RBMT и гладкость перевода от SMT).

Компании-производители систем машинного перевода на основе гибридной технологии: PROMT, Systran.

Помимо систем машинного перевода, существуют программы, принцип работы которых основан на технологии Translation Memory.

Translation Memory (TM, Память переводов)

Translation Memory – это двуязычные базы часто встречающихся предложений. В основе технологии лежит принцип «не переводить один и тот же текст дважды».

Технология базируется на сравнении документа, который нужно перевести, с данными, хранящимися в предварительно созданной базе переводов. В общем массиве текста система находит сегменты, которые уже были однажды переведены, и берет перевод из базы переводов Translation Memory.

Компании-производители систем TM: PROMT, SDL Trados, Atril (системы Déjà Vu), OmegaT.

Для перевода больших объемов типовой документации принято использовать технологии TM и МТ вместе, так как каждая из них решает разные подзадачи в рамках общей задачи: базы TM обеспечивают извлечение и подстановку переведенного ранее контента, а с помощью MT производится перевод нового контента.

 

С Уважением,
Команда Maxsoft


© Максcофт 2005
 

Единый телефон:
(391) 222-09-37

Адрес:
660049 г. Красноярск, ул. Урицкого, 52, помещение 56 "Макссофт"
e-mail: info@maxsoft.ru

Cхема проезда, вопросы
MaxSoft в Google
Яндекс.Метрика