|
Обробка природної мови (синтаксичний, морфологічний, семантичний аналізи тексту; англ. parsing). Обробляють текст різноманітними способами: насамперед його вводять в комп'ютер через пристрої введення (сканування, розпізнавання, набір на клавіатурі або іншими способами) або отримують записаний раніше з дисків або через мережу, звичайно інтернет. Наприклад, створення автоматичних пошукових систем в Інтернет широко використовує лінгвістичний аналіз. Це також частина комп'ютерної лінгвістики. Пошукові машини індексують текст і створюють щось подібне до словників. Наприклад, Гугл використовує ці тексти для автоматичного перекладу. Сюди включають також:
1. Корпусна лінгвістика, створення і використання електронних корпусів текстів
2. Створення електронних словників, тезаурусів, онтологій. Наприклад, Lingvo. Словники використовують, наприклад, для автоматичного перекладу, перевірки орфографії.
3. Автоматичний переклад текстів. Серед російських перекладачів популярним є Промт. Серед безкоштовних відомий перекладач Google Translate
4. Автоматичне вилучення фактів з тексту (Витяг інформації) (англ. fact extraction, text mining)
5. Автореферірованіе (автоматичне реферування текстів). Ця функція включена наприклад в Майкрософт Ворд.
6. Побудова систем управління знаннями. Див Експертні системи
· Гіпертекст — це така форма організації тексту, при якій його одиниці представлені не в лінійній послідовності, а як система явно вказаних можливих переходів, зв'язків між ними. Слідуючи цим зв'язкам, можна читати матеріал в будь-якому порядку, утворюючи різні лінійні тексти. Найпростіший приклад гіпертексту «доінтернетовської епохи» — це будь-який словник чи енциклопедія, де кожна стаття має посилання до інших статей цього ж словника. У результаті читати такий текст можна по-різному: від однієї статті до іншої, у міру потреби, ігноруючи гіпертекстові посилання; читати статті одну за одною, справляючись із відсиланнями; переходити від одного відсилання до іншого і т. д.
· Загальновідомим і яскраво вираженим прикладом сучасного гіпертексту служать веб-сторінки, підготовлені за допомогою HTML (мова розмітки гіпертексту) і розміщені у web-мережі. Відповідно, в комп'ютерній термінології під гіпертекстом розуміється текст, сформований за допомогою мови розмітки, потенційно містить у собі гіперпосилання. Гіперпосилання дозволяють переходити від вихідного (одного) тексту до безлічі інших текстів, розміщених у web-мережі.
У лінгвостилістиці послуговуються цим терміном на позначення набору текстів, «що містять вузли переходу від одного тексту до іншого і дозволяють вибирати певні відомості для читання або послідовність читання, в такий спосіб формуючи щоразу інший організований у систему лінійний текст». Завдяки технічним засобам візуалізації, зокрема, електронному гіпертексту, що дав змогу чітко позначити вузли переходу з одного текстового рівня на інший, зросла роль мовних одиниць, що формують цей вузол переходу, — їх комунікативна, стилістична вага. Активне послугування електронним гіпертекстом дало змогу формувати нові текстові масиви — із складною текстовою архітектурою, з наявністю різних семіотичних компонентів, із мультилінгвальною структурою, відповідно актуалізувалися нові дисципліни, серед яких стилістика гіпертексту.
9. Моделі породження мовлення: основні напрями, одиниці й поняття.
9. Моделі породження мовлення. Стохастичні моделі породження мовлення. Стохастичні моделі – це моделі ймовірнісні, тобто множинність елементів повідомлення може бути репрезентована за допомогою розподілу ймовірностей (Дж.Міллер, Н.Хомський; пор. також праці Дж.Селфриджа).
До стохастичних моделей психолінгвістики належать і граматики з граничним числом станів. Граматика з граничним числом станів – це будь-яка модель, у якій як елемент виступає граматичний клас (наприклад, частина мови) і визначається характер залежності між граматичними класами, що послідовно з’являються. Ця залежність може бути не ймовірнісною, і сама модель постає стохастичною.
Для ґрунтовнішого розуміння слід зупинитися на класичній осгудівській моделі породження, в якій імовірний принцип також відіграє важливу функцію. За концепцією Ч.Осгуда, породження здійснюється паралельно на кількох рівнях згідно з певними закономірностями кожного з цих рівнів. При цьому закономірності розподілу одиниць вищого рівня враховують закономірності розподілу одиниць нижчих рівнів. Вищий рівень – рівень мотивації, основна одиниця – речення. Другий рівень – семантичний, основна одиниця – функціональний клас (при кодуванні), ядро, „нуклеус” (при декодуванні)..
VIII.7.1. Моделі безпосередніх складників. Ця модель передбачає виконання операції деривації, тобто послідовної підстановки на місце більшої одиниці двох (тільки двох) більш дрібних компонентів, з яких вона складається. В результаті цих послідовних підстановок утворюється „термінальний (граничний) ланцюжок”, тобто само речення. У модель породження за безпосередніми складниками входять і так звані контекстні обмеження – граматичні правила: (талановитий) + рід + число + відмінок + (художник) + число + відмінок + (пише) + особа + число... Специфічні риси граматики безпосередніх складників: 1) вона дихотомічна; 2) вершину дерева являє собою речення як єдине синтаксичне ціле, тобто фіксується послідовність операцій, необхідних для вияву синтаксичних зв’язків; 3) були опрацьовані два важливих поняття: а) напрями розгалуження дерева – правобічне (регресивне) і лівобічне (прогресивне); до речі, у більшості європейських мов домінує регресивне вставлення, а в японській, вірменській, у тюркських мовах переважає прогресивне; б) глибина речення: вона визначається за максимальною кількістю вузлів лівого розгалуження дерева.
7.2. Моделі на основі трансформаційної граматики. Про трансформаційну граматику написано багато, але тут необхідно згадати, що структура моделі Н.Хомського включає чотири компоненти: 1) синтаксичний компонент (опрацьований самим Н.Хомським та ін.); 2) семантичний компонент (теорія опрацьована Дж.Катцом, Дж.Фодором), який охоплює дві ланки: а) лексикон (складається з граматичної, генерувальної і семантичної частин, при цьому остання забезпечує власне-семантику); б) правила співвіднесення лексикону з граматичною структурою, тобто проекційні правила; 3) фонологічний компонент (детально описаний в працях Н.Хомського і М.Халле). Він постає опертям інтерпретації результатів дії синтаксичного копонента, але не на глибинному, а на поверхневому рівні; ґрунтується на концепції диференційних фонетичних ознак Якобсона-Халле; 4) прагматичний компонент – прагматичні правила, тобто правила співвіднесення граматичної структури з контекстом (ситуацією). Він не згадується уже навіть в літературі 70-х років.
Ця модель викликала немало критичних зауважень. При цьому критикували і прибічники й опоненти (про критику детально описано у підручнику О.О.Леонтьєва. Психолінгвістичні моделі на основі трансформаційної граматики опрацьовувалися в межах психолінгвістики другого покоління (за О.О.Леонтьєвим).
VIII.7.2.1. Коґнітивні моделі. У межах психолінгвістики третього покоління (за О.О.Леонтьєвим) у 70-ті роки вирізнилась коґнітивна психолінгвістика як особливий напрям коґнітивної психології. Коґнітивна психологія – та частина психологічної науки, яка, за визначенням Р.Л.Солсо, вивчає те, як людина отримує інформацію про світ, як ця інформація уявляється людиною, як вона зберігається в пам’яті і перетворюється в знання і як ці знання впливають на увагу і поведінку людини.
Щодо психолінгвістики коґнітивний підхід тлумачиться О.О.Леонтьєвим як такий підхід, за якого вивчається роль пізнавальних процесів у мовленнєвій діяльності.
Модель породження І.Шлезінгера передбачає, що основу породження складає система щонайпростіших семантичних пар. Наприклад: Mary had a little lamb. Основу цього висловлення становить уява про співвідношення „власника” і „майна” (посесивні відношення). З „ягням” співвіднесена ідея маленького розміру. Ці взаємопов’язані змістові характеристики
(посесивні відношення і зв’язок предмета та його розміру) І.Шлезінгер називає „протовербальними елементами”. До цих елементів прилягають чотири різновиди правил реалізації: 1) реляційні правила, вони приписують кожному протовербальному елементу граматичну і фонологічну характеристики; 2) правила лексикалізації, вони обирають потрібні лексеми; 3) правила узгодження; 4) інтонаційні правила. Уводиться поняття комунікативне виваження: відповідний компонент моделі визначає, який із компонентів речення є комунікативним центром (логічним суб’єктом, фокусом, темою).
Дата добавления: 2015-09-06; просмотров: 249 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Особливості семантичного простору мови. | | | Моделювання структур репрезентації знань: пропозиційний, фреймовий підходи. |