Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Чего не могут видеть поисковые движки

Читайте также:
  1. II. При использовании такого материала необходимо различать грехи, отталкивающие по самой своей природе, и грехи, которые зачастую могут выглядеть привлекательными.
  2. V- Для вас горы это только место где могут прятаться враги
  3. А без настоящей любви могут заключаться браки, но не будет настоящей пары.
  4. Ангелы света не могут творить зла; они всецело определены к добру и ему служат, но вполне свободно, сами избирая наилучшие пути к осуществлению воли Божией.
  5. Болезни недостаточного питания могут быть обусловлены дефицитом
  6. В деревне нашей видеть вас...
  7. В отличие от Англии, Уайтфилд выходил на городские улицы не потому, что его не хотели видеть в церквах, а потому, что церковные здания были для него слишком малы.

Целесообразно также сделать обзор тех типов контента, которые поисковые движки не могут видеть.

Например, несмотря на то, что поисковые движки могут обнаружить, что вы показываете изображение, но они не могут определить, изображение чего именно вы показываете (если не учитывать ту информацию, которую вы им даете в атрибуте alt). Однако они способны определить цвет пиксела и (во многих случаях) установить порнографический характер изображения по количеству телесного цвета в изображении JPEG. Поэтому поисковый движок не может сказать, что показано на изображении – Барт Симпсон, лодка, дом или торнадо. Кроме того, поисковые движки не распознают содержащийся в изображении текст. Поисковые движки экспериментируют с технологиями оптического распознавания символов (optical character recognition, OCR), чтобы извлекать текст из изображений, но эти технологии еще не имеют широкого применения при поиске.

Кроме того, обычный здравый смысл оптимизации всегда подсказывал, что поисковые движки не умеют читать Flash-файлы, но это несколько преувеличено. Поисковые движки уже начинают извлекать информацию из Flash-файлов, как это показано в объявлении компании Google по адресуhttp://googlewebmastercentral.blogspot.com/2008/06/improved-flash-indexing.html. Однако поисковому движку нелегко определить, что именно содержится во Flash. Одна из самых больших проблем состоит в том, что когда поисковые движки смотрят внутрь Flash, то они по-прежнему ищут текстовый контент, но Flash – это изобразительное средство и у дизайнера нет никаких причин (кроме поисковых движков), чтобы встраивать внутрь него текст. Здесь нет также никаких семантических подсказок, которые присутствуют в HTML-тексте (таких, как теги заголовков страниц, жирный текст и т. д.) даже тогда, когда HTML используется совместно с Flash.

Третий тип контента, который поисковые движки видеть не могут, – это изобразительные элементы всего того, что содержится во Flash, поэтому этот аспект Flash ведет себя точно так же, как изображения. Например, когда текст преобразуется в векторную форму (визуализируется графически), то текстовая информация (которую могут читать поисковые движки) теряется. Мы обсудим методы оптимизации Flash в главе 6.

Аудио– и видеофайлы поисковым движкам тоже читать непросто. Как и в случае изображений, эти данные анализировать нелегко. Есть несколько исключений, когда поисковые движки могут извлечь некоторое ограниченное количество данных (таких, как теги ID3 из файлов МР3 или текстовые примечания, изображения и маркеры глав из расширенных подкастов формата ААС). Однако в конечном итоге отличить видеоизображение игры в футбол от лесного пожара невозможно.

Поисковые движки не могут также прочитать никакого контента внутри программы. Поисковому движку нужно найти в исходном коде web-страницы текст, который удобочитаем для человеческого глаза (как мы уже говорили ранее). То, что вы можете видеть его после загрузки страницы в браузер, не помогает – он должен быть видим и читаться в исходном коде этой страницы.

Пример технологии, которая предоставляет значительное количество читаемого человеком (но не видимого поисковыми движками) контента, – это AJAX. AJAX (основанный на JavaScript метод динамического отображения контента на web-странице после извлечения данных из базы данных (без необходимости обновления всей страницы целиком)). Этот метод часто используется в инструментальных средствах, когда посетитель сайта может сделать ввод данных, а инструмент AJAX затем извлекает и отображает правильный контент.

Проблема возникает потому, что контент извлекается скриптом, работающем на клиентском компьютере (машине пользователя), после ввода информации пользователем. Это может привести к получению множества вариантов вывода. Кроме того, до этого ввода данных контент в коде HTML данной страницы отсутствует, так что поисковый движок его видеть не может.

Аналогичные проблемы возникают и с другими формами JavaScript, которые до выполнения действия пользователем не визуализируют контент в HTML.

В пятой версии HTML была создана конструкция, известная как тег embed, чтобы дать возможность встраивать в HTML-страницы дополнительные модули (программы, находящиеся на компьютере пользователя, а не на web-сервере вашего web-сайта). Этот тег часто используется для встраивания видео– и аудиофайлов в web-страницы. Тег embed говорит дополнительному модулю, где он должен искать используемый файл с данными. Встраиваемый при помощи дополнительных модулей контент совершенно невидим для поисковых движков.

Фреймы и плавающие рамки – это метод встраивания содержимого другой web-страницы в вашу web-страницу. Плавающие рамки используются чаще (чем обычные фреймы) для встраивания контента с другого web-сайта. Вы можете очень просто сделать плавающую рамку при помощи примерно такого кода:

<iframe src ="http://accounting.careerbuilder.com" width="100 %" height="300"> <p>Your browser does not support iframes.</p>

</iframe>

Фреймы обычно используются для подразделения контента web-сайта, но их можно использовать и для встраивания контента с других web-сайтов, как это представлено на рис. 2.21 с сайтом http://accounting.careerbuilder.com на web-сайте Chicago Tribune.

Рис. 2.21. Визуализированная в браузере страница с фреймами

Это пример хорошей работы по втягиванию контента (при условии, что у вас есть разрешение на это) с другого сайта и размещению его на вашем сайте. Однако поисковые движки распознают фрейм для втягивания контента другого сайта и соответственно игнорируют контент внутри фрейма (поскольку это контент другого издателя). Иначе говоря, они не считают втянутый с другого сайта контент частью уникального контента вашей web-страницы.


Дата добавления: 2015-10-13; просмотров: 122 | Нарушение авторских прав


Читайте в этой же книге: Как поисковые движки приводят в действие коммерцию в Интернете | Распределение результатов поиска и трафика | Различные намерения и влияние листинга в платных и естественных результатах | Прочие факторы, которые необходимо учитывать | Как понять компоновку страниц результатов поиска | Как вертикальные результаты встраиваются в SERP | Просмотр и индексирование | Извлечение и рейтинги | Оценка контента на web-странице | Какой контент поисковые движки могут видеть на web-странице |
<== предыдущая страница | следующая страница ==>
Примечание| Анализ документа и семантическая связность

mybiblioteka.su - 2015-2024 год. (0.005 сек.)