Читайте также:
|
|
Поисковые системы — программно-аппаратные комплексы с веб-интерфейсом, предоставляющие возможность поиска информации в Интернете. Например, такие как google, yandex, rambler, mail и т.д.
Принцип работы поисковых систем:
1. находить новые сайты и вносить их в собственную базу данных (хранилище) адресов;
2. ранжировать сайты в базе данных и делать результаты поиска наиболее соответствующими запросам пользователей.
Т.е. все поисковые системы выполняют поиск исключительно по своей базе данных, которая строится специальной программой, называемой поисковым роботом (или как ее еще называют индексатор, паук, кроулер, бот, червяк). Когда поисковый робот заходит на сайт он сразу же начинает разбивать его на некие составляющие. Во-первых, выполняется выборка всех ссылок из документа и добавления их в очередь для дальнейшего «путешествия» робота по просторам интернета. После чего робот начинает обработку текста страницы, разбивая его на некие логические составляющие, которые еще называют пассажами.
Пассаж — последовательность слов или одно слово, находящееся в рамках html тега или знака препинания. Слова разбиваются на пассажи в зависимости от знаков препинания. Помимо разбивки текста на пассажи робот выполняет расчленение текста и удаление так называемых «шумовых слов» или как еще их называют стоп слова. Другими словами, робот удаляет из текста все предлоги и незначимые части речи, которые выражаются в таких словах: в, на, при, а, у, из, от. То есть это те слова, которые не несут смысловой нагрузки. После того как все вышеописанные манипуляции будут выполнены поисковый робот помещает эти данные в основной индекс по которому и выполняется поиск информации.
Виды поисковых систем:
1. Поисковые каталоги
Информация хранится в виде тем — категорий и подкатегорий. Каталоги являются первоисточниками для ознакомления с новыми темами, которые незнакомы пользователю. Например wikipedia.org.
2. Рейтинговые системы
Вариация поискового каталога, которая предусматривает организацию выдачи по количеству обращений посетителей. То есть, основным критерием является популярность ресурса.Поэтому, рейтинговые системы больше всего подходят для поиска развлекательных и новостных материалов.
3. Поисковые указатели
выделяют данные поисковой системы среди всех прочих, которые организовывают поиск интернет-ресурсов по ключевым словам. Успех поиска полностью зависит от слов, заданных в запросе. Однако, когда необходим редкий материал на конкретную тему, правильно подобранные ключевые слова делают данный вид поисковой системы незаменимым. Этот вид характеризует большую часть поисковых систем.
Дата добавления: 2015-08-17; просмотров: 63 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Маской подсети, например 255.255.255.0 | | | Основные виды работы и настройки браузеров |