Читайте также: |
|
Частотная модель взвешивания терминов тесно связана с частотным методом индексирования (раздел 2.4). Одна из наиболее известных весовых функций записывается следующим образом [10]:
. |
Здесь – вес, приписываемый термину , – частота термина в документе, – обратная документная частота.
Также на практике широко применяется весовая функция
, |
где – максимальная частота термина в -ом документе, то есть частота термина, который встречается в документе чаще всего. Весовой коэффициент отражает значимость термина в -ом документе.
При использовании различительной силы терминов их индексационные веса могут быть вычислены по формуле
, |
где – значение различительной силы термина . Полнота поиска здесь может быть обеспечена путем поиска высокочастотных терминов, а точность поиска определяется положительными значениями различительной силы.
Дата добавления: 2015-07-10; просмотров: 243 | Нарушение авторских прав