Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Автоматизированный анализ текста

Читайте также:
  1. I. Анализ политической концепции
  2. II. Анализ ритма
  3. II. Робота з текстами підручника
  4. II. САМОАНАЛИЗ
  5. II. Требования к оформлению текста дипломной работы.
  6. II.II. Биофациальный анализ
  7. II.III. Анализ общегеологических данных и обобщение результатов фациального анализа

ПЛАН РАБОТЫ

1) На сайте компании Microsystems, Ltd. http://www.analyst.ru/index.php?lang=rus&dir=content/downloads/

выбрать версию TextAnalyst - 2.01. и загрузить бесплатную копию.

2) После установки программы внимательно изучить учебник, который открывается в окне «Начало работы».

3) Выбрать текст для анализа объемом 2-3 страницы и сохранить его в формате.txt

4) Провести анализ текста с помощью установленной программы.

5) Результат работы представить в форме отчета, который должен включать:

· Исходный текст

· Реферат с указанием веса предложений

· Семантическое дерево с объяснением терминов «сеть понятий», «смысловой вес», «вес связи»

· Тематическое дерево с разъяснением значения понятия «тематическая структура текста»

· Итоговый вывод о качестве реферата и возможностях программы.

6) Сделать описание программы «Адвего» http://advego.ru/text/seo/ Провести семантический анализ исходного текста с помощью этой программы.

Для анализа был выбран рассказ Э. Хемингуэя «Там, где тихо, светло».

Для перехода на нужную страницу, необходимо пройти путь: Адвего.ru -> Сервис -> Инструменты. На сайте представлены три вида анализа текста: проверка орфографии, семантический анализ, проверка уникальности (для проверки текста на уникальность сайт предлагает скачать программу Advego Plagiatus).

Проверка орфографии – анализ текста на наличие грамматических ошибок.

Семантический анализ текста - это оценка текста, позволяющая определить количественный состав отдельных слов в тексте, а также выделить фразы и слова, составляющие его семантическое ядро. Анализатор текста показывает семантическое ядро текста с количеством и частотой запросов, список слов и стоп-слов, а также грамматические ошибки.

При проверке орфографии или семантическом анализе текста, скопированный текст необходимо вставить в окно для анализа и нажать «Проверить». Можно выбрать язык текста, по умолчанию стоит русский язык.

7) Представить полученные результаты, с объяснением понятий «тошнота документа» (классическая и академическая, как они вычисляются) и «стоп-слова».

Тошнота текста -это насыщенность текста ключевыми словами. По тошноте текста можно судить о натуральности текста и его SEO-оптимизации под поисковые запросы. Высокий показатель тошноты для поисковиков является плохим знаком. Это означает, что статья написана для поисковиков, а не для посетителей сайта. Определить процент тошноты можно при помощи семантического анализа текста Адвего.

Классическая тошнота -это коэффициент, показывающий заспамленность текста самым повторяющимся словом. Определяется как квадратный корень из количества повторений самого тошнотного слова. Самое тошнотное слово может снижать релевантность по остальным словам. Оптимальное значение классической тошноты равно 7. Большая тошнота может помешать продвижению сайта.

Академическая тошнота характеризует натуральность документа. Если в документе много различных повторяющихся слов, то показатель академической тошноты будет большим. Академическая тошнота измеряется в процентах и зависит от частоты повторения слов и объема текста. Вычисляется как отношение числа повторов самых частых слов к общему числу слов в тексте.

Стоп-слова – это слова, не несущие какой-либо самостоятельной смысловой нагрузки, но необходимые для полноценного восприятия текста. К стоп-словам относятся предлоги, союзы, местоимения.

8) Сравнить результаты семантического анализа, полученные с помощью обоих программ.


Дата добавления: 2015-09-05; просмотров: 113 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
НФП-2005 14 страница| Задание 2. Найдите в правой колонке английские соответствия русским идиомам (пословицам и поговоркам), расположенным в левой колонке.

mybiblioteka.su - 2015-2024 год. (0.005 сек.)