Читайте также:
|
|
В 1949 г. знаменитый американский математик Уоррен Уивер написал получивший широкую известность, документ, посвященный вопросу, который он определил как "решение мировой проблемы перевода". Идея заключалась в том, чтобы смоделировать на компьютере функции переводчика с языка на язык. Нельзя сказать, чтобы в намеченном Уивером плане все было гладко: он предлагал разработать некий промежуточный "универсальный" язык, который назвал машинезийским. Однако, несмотря на подобные довольно серьезные трудности, план Уивера был достаточно прост и очевиден. Обрабатывая предложение, написанное на одном языке, компьютер должен был найти в словаре аналог каждого из слов на другом языке, а затем расставить полученные слова в соответствии с правилами грамматики.
Эти идеи нашли активный отклик среди лингвистов, ученых других специальностей, инженеров. Репутация Уивера ни у кого не вызывала сомнений: он был директором отдела естественных наук Рокфеллеровского фонда. В свою очередь компьютеры (хотя в то время на них смотрели больше как на "числодробилки") уже продемонстрировали свои возможности на примере задачи, во многом сходной с переводом - при расшифровке секретных кодов. В самом деле, именно для расшифровки кодов в годы второй мировой войны в Великобритании был изготовлен "Колосс" - мощный электронный предшественник цифровых компьютеров. Представлялось, что "расшифровка" чужого языка - это следующий логический шаг. Как заявлял Уивер, "глядя на статью на русском языке, я говорю себе: 'В действительности статья написана по-английски, только зашифрована какими-то непонятными символами', и начинаю ее расшифровывать".
Сотрудникам министерства обороны США тоже понравилась эта идея. Военные загорелись мыслью заполучить быстрый и простой способ изучения технических журналов на русском языке, что позволило бы им узнавать о достижениях СССР в науке. И на исследования в области машинного перевода были выделены многие миллионы долларов. Энтони Дж.Эттингер, возглавивший в начале пятидесятых годов финансируемые Пентагоном исследовательские программы Гарвардского университета, позднее вспоминал, что советские ученые испытывали столь же сильное желание быстро получать переводы американских журналов. Как он образно выразился, по обе стороны железного занавеса "... идеи быстрого и точного машинного перевода расцвели пышным цветом".
Однако со временем пышные цветы начали постепенно увядать. В 1954 г. сам Эттингер составил компьютерную программу, которая слово за словом переводила русские тексты на английский язык. Но, как и многие другие программы машинного перевода, его механический словарь вскоре увяз в неоднозначных переводах слов и идиоматических выражений английского и других естественных языков (выражение 'естественные языки' специалисты по информатике используют для того, чтобы отличить обычные языки, которыми пользуются люди, от значительно более строгих и формализованных языков программирования, используемых для общения с компьютерами. Однако поскольку большая часть пионерских исследований в области машинного перевода была выполнена в США, под естественным языком чаще всего подразумевают английский, забывая о том, что в других странах 'естественными' являются другие языки. Когда-то даже была предложена программа перевода с естественного на немецкий язык!).
В силу своей неоднозначности ничем не ограниченный естественный язык не может служить идеальным средством для общения с вычислительной машиной (Не при всех обстоятельствах он является таковым и для общения между людьми. Математические соображения передаются с помощью специальной символики, а языки программирования высокого уровня способны помочь одному человеку объяснить какую-нибудь алгоритмическую процедуру другому, не обязательно прибегая при этом к помощи вычислительной машины. Например, при военной подготовке или при судействе в спортивных соревнованиях используется ограниченное, заранее отобранное подмножество языка). Машина, в отличие от человека, не может распознавать идиомы, поэтому ей трудно быть абсолютно уверенной в истинном смысле, например, такой фразы: "Едва ли вы узнаете маленького Джона сейчас. Он вырос на целую голову".
Естественный язык всегда неоднозначен, поскольку в нем отсутствует нечто соответствующее скобкам, которые используются в математике для указания приоритета операций. Фраза "старые мужчины и женщины" неоднозначна в том смысле, что нельзя быть полностью уверенным, относится ли определение "старые" и к женщинам. Если бы можно было использовать скобки, пригодная для понимания машиной фраза выглядела бы так: "Старые (мужчины и женщины)".
В середине шестидесятых годов финансирование исследований в области машинного перевода в основном прекратилось и работа постепенно угасла. Стало ясно, что для перевода с языка на язык недостаточно механического знания значений некоторых слов и правил грамматики. Чтобы действительно научиться переводить с одного языка на другой, машина, как и человек, должна понимать смысл слов. Попытки обучения компьютеров пониманию английского языка стали одной из первоочередных проблем в области искусственного интеллекта, однако до сих пор они не увенчались успехом. Не последнее место среди возникающих трудностей занимает точное определение смысла слова 'понимать'. Острые дискуссии развернулись по целому ряду вопросов. Какой из факторов - смысл слов или грамматика - важнее для естественного языка? Можно ли выразить такое понимание в виде формально-логической системы правил или для него требуется такая же масса информации, какую усваивает человек просто потому, что живет на этом свете?
В результате академических по началу споров дружные доселе сообщества исследователей искусственного интеллекта в который раз уже раскололись на множество антагонистических группировок. Одни ставят перед собой чисто практическую задачу: создать коммерческие устройства, способные понимать фразы на естественном языке. Они стремятся разработать программы, которые облегчили бы общение с компьютерами и дали бы пользователям возможность вводить инструкции на естественных языках, а не на языках программирования типа Бейсика или Паскаля - и нельзя сказать, чтобы они так уж мало преуспели в этом. Стремительный рост мощности персональных компьютеров, а также создание и совершенствование устройств распознавания речи привели к созданию новых, поистине удивительных технологий сбора и обработки информации. Так, например, внедрение средств голосового ввода в банковские системы позволит значительно повысить производительность труда банковских служащих, избавив их от длительного сидения за клавиатурой компьютера. Кроме того, появится возможность вводить данные по телефону. Однако применение средств машинного перевода, сколь бы совершенны они ни были, по-прежнему ограничено формальными рамками подмножества естественного языка - в данном случае, финансовыми приложениями. Другие исследователи предпочитают решать абстрактно-логические задачи. Поскольку язык и мышление, объединяемые интеллектом, тесно взаимосвязаны, они полагают, что попытки создать машины, способные понимать естественный язык, углубят наше представление о том, как работает человеческий разум, и со временем это приведет к построению истинно разумных компьютерных программ, которые смогут этот разум имитировать.
Однако до понимания компьютерами человеческой речи еще далеко.
Дата добавления: 2015-11-16; просмотров: 42 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
БУДНИ ПРОФЕССИОНАЛА | | | ПЕРЕВОДЧИК В КАРМАНЕ |