Читайте также: |
|
Частотная модель взвешивания терминов тесно связана с частотным методом индексирования (раздел 2.4). Одна из наиболее известных весовых функций записывается следующим образом [10]:
![]() |
Здесь – вес, приписываемый термину
,
– частота термина в документе,
– обратная документная частота.
Также на практике широко применяется весовая функция
![]() |
где – максимальная частота термина в
-ом документе, то есть частота термина, который встречается в документе чаще всего. Весовой коэффициент
отражает значимость термина
в
-ом документе.
При использовании различительной силы терминов их индексационные веса могут быть вычислены по формуле
![]() |
где – значение различительной силы термина
. Полнота поиска здесь может быть обеспечена путем поиска высокочастотных терминов, а точность поиска определяется положительными значениями различительной силы.
Дата добавления: 2015-07-10; просмотров: 243 | Нарушение авторских прав