Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Язык запросов поисковика Google



Язык запросов поисковика Google

Общие правила записи и обработки запросов Google

1. Вводимый текст запроса в Google ограничен 32 словами (термами-образцами). Запрос вводится в особом поле. Ввод запроса завершается нажатием клавиши Enter. В примерах поле ввода запроса будет обозначаться квадратными скобками.

Задание

Проверить – ввести большее число термов-образцов.

2. В запросе игнорируются представленные в следующей строке символы и знаки пунктуации!?,.; [ ] @ / # < >.

Задание

Сравнить запрос без специальных символов и такой же запрос с ними. Проверить число найденных документов.

Далее всегда сравнивать запросы.

3. Слово, содержащее символ апострофа " ' " в запросе, не соответствует слову без этого символа.

Задание

Запросу [ we're ] не соответствует слово "were", а запросу [ were ] – слово "we're".

Осуществить проверку.

4. Символ дефиса " – " в слове запроса при поиске игнорируется или трактуется либо как символ дефиса, либо как символ пробела. В свою очередь, символ пробела в запросе может трактоваться и как пробел, и как дефис. Причем, цепочка подряд идущих пробелов считается одним пробелом, а все расположенные в начале и в конце запроса пробелы игнорируются.

Пример

Запрос [ e-mail ] ищет веб-страницы со словами "email" и "e-mail", а также страницы, содержащие цепочку из двух разделенных пробелом слов "e mail". В тоже время запрос [ email ] ищет страницы именно со словом "email".

Задание

Осуществить проверку, по каждому примеру выписать количество найденных документов.

5. Google ищет только те страницы, которые соответствуют всем словам запроса, т.е. по умолчанию между словами запроса подразумевается выполнение оператора И, причем порядок слов не учитывается.

Пример

Запрос [ compact fold-up bicycle ] ищет страницы, в которых есть и слово "compact", и слово "fold-up", и слово "bicycle". Посмотреть число найденных документов.

Задание

Сравнить с запросами [ compact], [fold-up] и [ bicycle ]

6. Google ищет страницы, которые соответствуют всем морфологическим формам слов запроса.

Задание

Запрос [ child ] ищет страницы, в которых есть слово "child", слово "children" или слово "children's".

7. Google ищет страницы, которые точно соответствуют морфологическим формам слов запроса, но не синонимам.

Задание

Запрос [ children ] ищет страницы, в которых есть слово "children", а не слово "kids".

8. Обычно слова с большими и маленькими буквами считаются разными морфологическими формами одного слова. Поэтому при вводе запроса безразлично, какой регистр использовать.



Задание

Запрос [ child ] и [CHILD]

9. Некоторые слова запроса, называемые "стоп-словами" (например, встречающиеся намного чаще других местоимения, предлоги и частицы, которые при поиске не представляют особой ценности, а также некоторые одиночные цифры и буквы) обычно не учитываются при поиске.

Задание

Запрос [ child ] и [child in]

Сравнить число обнаруженных страниц.

10. При выводе результатов более высокий приоритет имеют страницы, у которых совпадения с образцами расположены ближе друг к другу и соответствуют порядку образцов в запросе.

Задание

Сравнить. Запрос придумать самостоятельно с малым числом найденных документов.

Использование в запросах специальных символов и простейших операторов

1. Цитирование (двойные кавычки)

Запрос с заключенной в двойные кавычки фразой, найдет страницы, содержащие точно цитируемый текст запроса. Цитирование означает дословное повторение текста, а поэтому фиксирует порядок слов и отменяет как игнорирование регистра, так и поиск других морфологических форм слов. Таким образом, двойные кавычки используются для поиска точных цитат, имен собственных и цепочек слов, состоящих в определенном порядке.

Задание

Запрос [ "Larry Page" ] ищет веб-страницы, в которых есть фраза "Larry Page", а не станицы, содержащие фразу "Larry has a home page", фразу "Larry E. Page" или фразу "Congressional page Larry Smith".

Отметим, что запрос Larry Page (без кавычек) будет искать страницы с любой из перечисленных выше фраз.

Сравнить результаты запросов

2. Заполнитель слов в цитатах (* оператор)

Для обозначения внутри цитаты произвольных слов используется * оператор. Google рассматривает каждый символ " * " в качестве заполнителя части цитаты одним или несколькими произвольными словами.

Задание

Запрос [ "Google * my life" ] ищет страницы, содержащие фразы, которые начинаются словом "Google", за которым следует одно или несколько слов, а затем слова "my life". Такими фразами могут быть "Google is my life" или "Google has totally changed my life" или. "Google my life"

3. Поиск чисел из диапазона (.. оператор)

Две стоящие рядом точки между числами обозначают в запросе диапазон чисел. Результатом поиска в этом случае будут страницы, содержащие любое из чисел из заданного диапазона. При записи диапазона не допускается использование пробелов.

Задание

[ Russian Revolution 1800..2000 ] ищет страницы, которых обязательно содержат по одной из морфологических форм слов "Russian" и "Revolution", а также любое число из диапазона от 1800 до 2000.

Такими фразами могут быть "1917 Russian Revolution", "Russian revolution in 1905" или "revolutions in Russia (1905–1917)".

4. Отмена поиска других морфологических форм и поиск "стоп-слов" (+ оператор)

Символ " + " перед любым из слов запроса отменяет действующий по умолчанию поиск других морфологических форм. При этом между знаком " + " и словом не должно быть пробелов. Оператор + также рекомендуется ставить перед “стоп-словами”, если при поиске их нужно учитывать. Иначе эти слова просто игнорируются.

Задание

Запрос [ +book ] ищет страницы, в которых присутствует слово "book", а не слово "books" или другие производные от слова "book" слова.

Сравнить запросы ["book"], [book] и [+book].

5. Исключение из поиска страниц с определенными словами (– оператор)

Символ " – " перед любым из слов запроса означает исключение из поиска страниц, содержащих эти слова. При этом между знаком " - " и словом не должно быть пробелов.

Задание

Запрос [ team spartak -football ] ищет веб-страницы, в которых на английском языке

упоминаются любая их спартаковских команд, кроме футбольной.

Проверить!

6. Использование при поиске синонимов (~ оператор)

Символ " ~ " перед любым из слов запроса означает использование в поиске всех синонимов этих слов. При этом между символом " ~ " и словом не должно быть пробелов.

Задание

Запрос [ ~run ] ищет не только страницы, в которых есть слова "run", "running" или "runner’s", но и станицы со словом "marathon". Проверить!

7. Запросы с альтернативными словами (оператор ИЛИ)

Наличие между двух слов запроса оператора, записанного большими буквами OR (или с помощью символа вертикальной черты " | ") означает необходимость поиска страниц, в которых есть хотя бы одно из разделяемых этим оператором слов. Причем символ " | " в отличие от слова "OR" может и не отделяться от соседних слов пробелами.

Оператор используется при наличии нескольких альтернатив или нескольких синонимов, а его действие распространяется только на соседние слова. При этом следует иметь в виду, что приоритет оператора И, который используется по умолчанию, если слова запроса отделены друг от друга пробелами, выше приоритета оператора ИЛИ. Для группировки элементов запроса с оператором ИЛИ можно использовать кавычки.

Задание

Запрос [ island Tahiti | Hawaii ] как и запрос [ Tahiti OR Hawaii ] ищет страницы, в которых упоминается только остров Гаити или остров Гавайи, или оба этих острова. Запросу [ filter | stop "junk email" | spam ] соответствует страницы, на которых упоминается фильтрация либо ненужной электронной почты, либо спама.

Специальные операторы, уточняющие поиск в запросах Google

Интернет поисковики обычно предоставляют для неквалифицированных пользователей упрощенный механизм уточнения их поисковых запросов – средство так называемого “расширенного поиска”. Обычно этот механизм представляет собой форму, заполняя поля которой, неподготовленный пользователь может конкретизировать свой запрос. Следует иметь в виду, что для уточнения поиска можно использовать и особые, специальные операторы, которые записываются непосредственно в строке запроса. В поисковике Google эти операторы представляют собой особые, заканчивающиеся символом двоеточия ": " слова, за которым следуют параметры.

Отметим, что использование некоторых из этих операторов требует знаний правил оформления веб-страниц на языке HTML, лицензионных прав на использования контента, и даже особенностей работы с некоторыми интернет сервисами. Поэтому в этом курсе мы ограничимся рассмотрением особенностей применения лишь некоторых специальных операторов и их сочетанием с другими простейшими операторами.

1. Поиск только на указанном сайте (оператор site:)

Присутствие в запросе оператора site: ограничит поиск только указанным сайтом или доменом. Отметим, что данному оператору в форме “расширенного поиска” Google соответствует поле “Искать на сайте или в домене:” (раздел формы “Дополнительные настройки”).

Заданиеы

Запрос [ admissions site:www.lse.ac.uk ] ищет страницы, содержащие слово "admissions", лишь на сайте Лондонской школы экономики (подразделение Лондонского университета) www.lse.ac.uk.

Запрос [ peace site:gov ] также как и запрос [ peace site:.gov ] ищет страницы, содержащие слово "peace", на всех сайтах домена gov, т.е. на сайтах государственных органов США.

2. Сочетание операторов поиска с простейшими операторами и специальными символами

Вы можете использовать многие операторы поиска в сочетании с ранее рассмотренными простейшими операторами +, -, OR или |, а также с двойными кавычками.

Заданиеы

В запросе [ windows security –site:microsoft.com ] символ " - " непосредственно перед оператором site: означает исключение сайта microsoft.com из поиска страниц, содержащих слово "windows" и слово "security".

В запросе [ recommendations site:edu site:guu.ru ] содержится заведомо невыполнимое условие расположения страниц: только в домене edu, и только на сайте guu.ru. Поэтому этот запрос является ошибочным.

При выполнении запроса [ recommendations site:edu | site:guu.ru ] Google будет искать страницы со словом "recommendations" только на всех сайтах домена edu, а также на сайте guu.ru.

3. Поиск файлов в указанном формате (оператор filetype:)

Присутствие в запросе оператора filetype: ограничит поиск в сети файлов теми, которые представлены только в указанном в качестве параметра оператора формате. Параметром в этом случае является одно из известных расширений имен файлов, например, txt, doc, xls, ppt, pdf, html, htm filetype и др. Оператору: в форме “расширенного поиска” Google соответствует поле “Найти файлы в формате:” (раздел формы “Дополнительные настройки”).

Заданиеы

Запрос [ web page evaluation checklist filetype:pdf ] ищет файлы в формате Adobe Acrobat PDF (который обычно используется для публикации документации), имя которых имеет расширение pdf, а в содержании файлов присутствуют слова "web", "page","evaluation" и "checklist".

Запрос [ стандарт туризм магистр -site:guu.ru filetype:pdf ] ищет на всех Интернет сайтах за исключением сайта guu.ru файлы формата pdf, в которых обязательно присутствуют слова "стандарт", "туризм" и "магистр" или другие их морфологические формы.

4. Поиск ссылающихся на указанный URL страниц (оператор link:)

Оператор link: в запросе организует поиск страниц, которые содержат гиперссылки на указанный в качестве параметра оператора URL. Следует отметить, что в запросе данный оператор нельзя сочетать с обычными термами-образцами поиска. Этому оператору в дополнительном разделе “Найти страницы” формы “расширенного поиска” Google соответствует поле “c ссылками на эту страницу:”.

Заданиеы

Запрос [ link:www.googleguide.com ] ищет веб-страницы, которые содержат гиперссылки на домашнюю страницу Справочной системы Google.

Запрос [ link:www.google.com -site:google.com ] ищет страницы, содержащие гиперссылки на домашнюю страницу Google, на всех сайтах за исключением сайта этой корпорации.

5 Поиск определений к заданным словам, фразам и акронимам (оператор define:)

Оператор define: организует поиск веб-страниц, которые содержат определение указанного в качестве параметра термина. Следует иметь в виду, что оператор define: нельзя сочетать с другими операторами и образцами поиска.

Задание

Запрос [ define:web service ] ищет веб-страницы, которые содержат определение термина "web service".

6 Просмотр последней версии веб-страницы из кэша Google (оператор cache:)

Оператор cache: передает браузеру последнюю проиндексированную версию веб-страницы из кэша Google, URL которой указан в качестве параметра оператора. Оператор cache: не сочетается с другими операторами и образцами поиска.

Задание

По запросу [ cache:creativecommons.org ] будет быстро показана версия домашней страницы некоммерческой организации Creative Commons из кэша Google. Эта версия в принципе может и отличаться от домашней страницы сайта, если ее совсем недавно изменили. Следует иметь в виду, что специальные операторы Google позволяют выполнять поиск веб-страниц как по регионам их регистрации, так и по лицензированным правам использования контента на условиях лицензий Creative Commons. Кроме того, с помощью специальных операторов можно осуществлять поиск в отдельных элементах веб-страниц. Например, с помощью таких операторов, как allintitle:, intitle:, allintext:, intext:, allinanchor:, inanchor:, allinurl:, inurl: можно осуществлять поиск по заголовкам, тексту, адресам и ссылкам веб-страниц. Заметим, что многие из этих дополнительных возможностей поиска доступны и в дополнительных разделах формы “расширенного поиска”.

Как уже говорилось, специальные операторы Google позволяют выполнять поисковые запросы к страницам некоторых веб-сервисов. Например, с помощью таких операторов, как group: и author: можно осуществлять поиск по страницам сервиса Google Groups. Однако рассмотрение всех перечисленных выше, а также других возможностей специальных операторов Google выходит за рамки данного курса. Здесь мы рассмотрим лишь общие рекомендации по использованию в запросах Google специальных операторов поиска.

Рекомендации по использованию специальных операторов поиска в запросах

o Не все специальные операторы допускают наличие пробелов после символа двоеточия. Поэтому первый параметр любого из специальных операторов рекомендуется записывать сразу за двоеточием.

o Многие специальные операторы могут располагаться в любом месте запроса. Однако записывать их рекомендуется как можно правее, что делает тест запроса более понятным.

o Специальные операторы поиска являются лишь элементами запроса и многие из них могут сочетаться с другими операторами.

o Некоторые из специальных операторов не сочетаются с другими операторами поиска.

― Это, прежде всего, специальные операторы поиска в отдельных элементах веб-страниц, имена которых начинаются с "allin", например, allintitle: или allintext:.

― А также специфические операторы, запрашивающие специальную информацию, например, cache:, info:, related: или define:.

o Никогда не используйте в одном запросе противоречащие друг другу операторы.

o Будьте внимательны и осторожны, при многократном использовании в запросе одного и того же специального оператора.

Краткие сведения о языке запросов поисковика Яндекс

Поисковые системы Яндекс и Google имеют одинаковое функциональное назначение. Поэтому вполне естественно, что языки поисковых запросов этих систем очень похожи. Общие правила записи и обработки запросов в Яндексе и Google практически совпадают. Однако состав операторов поиска, синтаксис их записи, и даже функциональные возможности этих операторов в Яндексе и Google немного отличаются друг от друга.

1. Цитирование и заполнитель слов в цитатах

Также как в Google для поиска точных цитат, имен собственных и цепочек слов, состоящих в

определенном порядке, в Яндексе применяются двойные кавычки. При этом символ звездочки

" * " внутри двойных кавычек Яндекс использует в тех же целях что и Google.

2 Поиск чисел из диапазона и использование при поиске синонимов

В Яндексе отсутствует механизмы поиска чисел из заданного диапазона и использования при

поиске синонимов слов. При этом оператор Google ".. " в Яндексе не определен.

3. Учет в запросе поиска "стоп-слов"

В Яндексе оператор " + " перед словом (без пробела) предписывает обязательное использование

этого слова в поиске. Поэтому данный оператор также как и в Google рекомендуется ставить

перед “стоп-словами”, если при поиске их нужно учитывать.

4. Отмена поиска других морфологических форм

В отличии от Google для поиска точной формы слова (без учета его морфологии) в Яндексе

нужно поставить непосредственно перед ним символ восклицательного знака "! ".

Для поиска нормальной формы слова (т.е. слова в именительном падеже и единственном числе)

нужно в запросе поставить перед словом два восклицательных знака.

Пример

В Яндексе запросу [!!Иванов ] на веб-страницах будет соответствовать только форма

"Иванов", а не другие формы этой фамилии ("Ивановым", "Ивановы" и т. д.) и, конечно,

не имя "Иван" и его формы ("Ивану", "Иванам" и т. д.).

5. Исключение из поиска страниц с определенными словами

Как и в Google для исключения из поиска страниц, содержащих определенные слова, в Яндексе

можно использовать оператор " - " (или оператор " ~~ "), а для исключения из поиска страниц,

содержащих эти слова в пределах одного предложения – оператор " ~ ".

Пример Задание

 

Запросы [ спартак -футбол ] и [ спартак -футбольный ] отличаются друг от друга, т.к.

слова "футбол" и "футбольный" не считаются разными морфологическими формами одного

слова. Поэтому фразе "«Спартак» футбольный клуб" соответствует только первый запрос.

6. Запросы с альтернативными словами

Кроме того в запросах с альтернативными словами Яндекс, также как и Google использует

символ вертикальной черты " | ". Однако в отличие от Google оператор " | " Яндекса должен

отделяться от соседних слов пробелами.

7. Учет в запросе поиска присутствия слов в одном предложении

С помощью операторов " & " и " && ", которые должны отделяться от соседних слов

пробелами, Яндекс позволяет ограничить поиск теми страницами, где некоторые слова

находятся в одном предложении, а другие - в любом месте страницы.

Пример Задание

Запрос [ магистры & туризм && Москва ] ищет страницы, на которых в одном

предложении присутствуют слова "магистры" и "туризм", и в тоже время где угодно на

странице есть слово "Москва".

Несомненно, что язык запросов Яндекса использует более гибкий механизм поиска. Он очень

хорошо учитывает морфологию русского языка, более чувствителен к регистру букв, позволяет

учитывать не только присутствие слов в одном предложении, но и расстояние между словами.

Яндекс с помощью круглых скобок позволяет группировать элементы запроса и даже влиять на

ранжирование результатов поиска. Однако всеми этими изощренными механизмами

пользуются не более 1% пользователей.

Что касается специальных операторов поиска системы Яндекс, то их набор и функциональные

возможности значительно уступают поисковику Google. Здесь мы упомянем лишь оператор,

ограничивающий поиск указанным сайтом, который практически идентичен оператору Google

site:, и оператором поиска файлов в указанном формате mime:, который является аналогом

оператора Google filetype:.


Дата добавления: 2015-08-29; просмотров: 15 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
На эту тему я говорил уже немало и придется, видимо, повторяться, но здесь у меня особая задача – отличить рационализм от того, что так называют его оппоненты, ругатели, а иногда, будто веря им, и | 

mybiblioteka.su - 2015-2024 год. (0.027 сек.)