Читайте также:
|
|
С ростом числа поисковых машин, различных методик, алгоритмов поиска возникла необходимость сравнивать качество их работы. Для этого были введены две характеристики: точность () поиска и его полнота ().
Точность (англ. precision, обозн. ) - доля релевантных документов выборки по отношению ко всем документам в выборке.
Полнота (англ. recall, обозн. ) - доля релевантных документов в выборке по отношению ко всем релевантным документам коллекции.
Эти два критерия обычно конфликтуют. Стопроцентная точность и полнота на практике недостижимы.
Пусть - число документов в коллекции, - число документов в коллекции, релевантных некоторому запросу, - число документов в выборке, полученной системой на данном запросе, - число релевантных документов в выборке. Тогда
Релевантные | Нерелевантные | ||
Извлечены | |||
Не извлечены | |||
10. Способы улучшения поиска при помощи тезаурусов и онтологий.
· WordNet в сочетании с векторной моделью информационного поиска в экспериментах H. Voorhees и P. Vossen.
· WordNet в булевской модели поиска вопросно-ответной системы Южного Методистского университета США.
· Традиционные информационно-поисковые тезаурусы в комбинации с разного рода статистическими моделями.
· Тезаурус для автоматического индексирования в булевских моделях поиска документов, в задаче автоматической рубрикации, автоматического аннотирования.
11. Определите «интеллектуальность» агентов Semantic Web.
Дата добавления: 2015-11-30; просмотров: 26 | Нарушение авторских прав