...Первые эксперименты по машинному переводу начались в самом начале пятидесятых годов.
В 52-м году была первая конференция по машинному переводу в МАИТИ, и в 54-м году –знаменитый Джорджтаунский эксперимент по машинному переводу. Тогда СССР – это была сверхдержава, и необходимо было отслеживать тексты по физике, по математике, которые выходили в СССР. Понятно, что переводчиков с русского языка на английский не хватало. Но вот стали строить систему машинного перевода в США. Причём, первая эта система называлась «ГАД», она всего включала порядка 250 слов и порядка 30 синтаксических конструкций. Но первый эксперимент, который был проведён с участием публики – журналистов и так далее, показал, что эта программа работает довольно успешно. То есть, процент ошибок при переводе текстов в конкретной предметной области, например в области физики, был невелик. И тогда, именно с того времени стали выделяться большие деньги на развитие систем машинного перевода.
И надо сказать, что эта тенденция продолжалась в течение почти 20-ти лет. То есть, до конца семидесятых годов.
И действительно первое было такое впечатление, что вот-вот - и всё! И машинный перевод будет, и не нужно будет ни обычных переводчиков, и ничего не надо, и не только специальные тексты будут переводиться, но и литературные тексты.
Но к концу семидесятых годов оказалось, что эти надежды абсолютно беспочвенны. Более того, одна из комиссий Конгресса, исследовав состояние дел в этой области, пришла к выводу, что это невыгодно, что очень много денег было потрачено (государственных денег!) на финансирование программ по машинному переводу, но, к сожалению, адекватного результата не было получено.
А проблема была в качестве. Качестве перевода. Но нужно помнить те компьютеры, которые тогда были в те времена.
Например в МГИМО была мини-ЭВМ СМ-4. Она занимала комнату в 100 квадратных метров. И ещё к тому же она требовала летом очень серьёзного охлаждения – там стояли капитальнейшие охлаждатели.
И такие твёрдые диски, где хранилась информация (они были где-то по три гигабайта) возили на тележке.
В те времена эти машины потребляли очень много энергии. Они требовали обслуживания людьми, безусловно, это всё требовало денег, конечно. И, когда сравнили те страницы текста, которые выдаёт программа машинного перевода, и те силы и деньги, которые были вложены в этот перевод, а, кроме того, оказалось, что и необходимо постредактирование, то выяснилось, что эти затраты не окупают себя. И собственно государственное финансирование в этой области было свёрнуто почти на 15 лет.
Но потом эти исследования опять начались, потому что, собственно, качественный перевод мало, где нужен.
Есть сфера художественной литературы – это понятно. Но огромное количество публикаций по физике, химии, математике, то есть, то, что необходимо, то, что ту информацию, которую нужно получать для того, чтобы там знать какие-то последние научные и технические новости. Или обычные новости, тривиальные, например, сообщения информационных агентств. Для них не нужны сложные системы машинного перевода.
А, если вы имеете какой-то задел, то есть, если у вас есть какой-то перевод с ошибками и так далее, но там есть все необходимые ключевые слова, если вы являетесь специалистом в этой области, вы всё поймёте. И этого будет вполне достаточно.
Запросы на более сложные и совершенные программы есть, но их сейчас невозможно сделать. Машинный перевод в своём развитии прошёл несколько разных этапов. И первый этап – это идея пословного перевода. То есть, мы берём слово источников языка, то есть, которое мы переводим, берём словарь и подставляем значение, которое есть в целевом языке. Все программы первого поколения были устроены именно так. И первые варианты программы «ГАД» как раз вот так и выглядели.
Но оказывается что для простой, предметной сферы это в целом ряде случаев подходит, потому что вы получаете необходимые, ключевые слова и какие-то схематические отношения между ними. Вы можете сказать, о чём идёт текст, о чём речь идёт в этом тексте.
А дальше уже появилась идея семантического метода языка, которая стоит между источником-языком и целевым языком. Но вот этот этап развития системы машинного перевода до сих пор не закончен, потому что оказалось, что сделать такой семантический метаязык очень трудно. И для того, чтобы делать успешные программы такого рода, необходимы фундаментальные исследования в области семантики и синтаксиса естественного языка.
Такие исследования ведутся, но пока большинство обходятся именно программами первого поколения.
Эти программы первого поколения устроены таким образом, что происходит бесконечный процесс переписывания исходного предложения во внутреннее представление системы. И оно переходит на многих уровнях. И, в конце концов, те разработчики системы, которые её начинали, они уже не очень понимают, как можно поправить, улучшить эту программу. И она уже работает, а поскольку слоёв очень много, то они не понимают, где поправить, как исправить ошибку, которая постоянно появляется.
Но есть успехи, достигнутые, в основном, в тех областях, где не стараются создать программу, которая будет конкурировать с человеком, а создать программу, которая помогает человеку. Самый простой пример это автоматические словари, которые на сегодняшний день использует практически каждый переводчик...