Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Оценка качества информационного поиска

Читайте также:
  1. II. Историческая оценка для нового, патриотического гуманизма
  2. А5 Контроль качества контрольных сварных соединений
  3. Алгоритм диагностического поиска.
  4. Балльная оценка признаков, определяющих результативность труда
  5. Бальная оценка блюда.
  6. Бальная оценка способности поддерживать рынок (исследование и развитие продукта, распределение, послепродажное обслуживание) в DPM-Model
  7. Благоприятные и неблагоприятные качества ума

С ростом числа поисковых машин, различных методик, алгоритмов поиска возникла необходимость сравнивать качество их работы. Для этого были введены две характеристики: точность () поиска и его полнота ().

Точность (англ. precision, обозн. ) - доля релевантных документов выборки по отношению ко всем документам в выборке.

Полнота (англ. recall, обозн. ) - доля релевантных документов в выборке по отношению ко всем релевантным документам коллекции.

Эти два критерия обычно конфликтуют. Стопроцентная точность и полнота на практике недостижимы.

Пусть - число документов в коллекции, - число документов в коллекции, релевантных некоторому запросу, - число документов в выборке, полученной системой на данном запросе, - число релевантных документов в выборке. Тогда

  Релевантные Нерелевантные  
Извлечены
Не извлечены
 

 

10. Способы улучшения поиска при помощи тезаурусов и онтологий.

· WordNet в сочетании с векторной моделью информационного поиска в экспериментах H. Voorhees и P. Vossen.

· WordNet в булевской модели поиска вопросно-ответной системы Южного Методистского университета США.

· Традиционные информационно-поисковые тезаурусы в комбинации с разного рода статистическими моделями.

· Тезаурус для автоматического индексирования в булевских моделях поиска документов, в задаче автоматической рубрикации, автоматического аннотирования.

 

11. Определите «интеллектуальность» агентов Semantic Web.

 


Дата добавления: 2015-11-30; просмотров: 26 | Нарушение авторских прав



mybiblioteka.su - 2015-2024 год. (0.005 сек.)