→ При разработке сайта лендинг в подарок! ЖМИ! ←
Дек
13

База данных поисковой системы

Поиск и индексация находящихся в сети страниц осуществляется при помощи поисковых агентов. Все полученные ими данные помещаются в базу данных. Пользователи, желающие найти в сети что-либо, на странице поисковика вводят в специальное поле детализующую информацию. В этом случае могут быть использованы ключевые слова, даты и другие параметры.

Для эффективного поиска критерии информации, введённой в поисковую строку должны находиться в соответствии с критериями, которые использует агент при поиске и индексации информации. В базе данных отыскивается предмет запроса на основании указанной в форме информации. Затем выводятся подготовленные базой данных документы. Для определения порядка показа документов в списке используется алгоритм ранжирования. В идеале первыми размещаются наиболее релевантные запросу документы.

Разными поисковиками используется разные алгоритмы ранжирования, но существует несколько главных принципов, которые используются всеми поисковиками без исключения. Прежде всего, учитывается количество ключевых слов в содержимом документа, тэги, в которые заключены эти слова, месторасположение искомых слов относительно документа, а также удельный вес слов, которые используются для определения релевантности. Перечисленные принципы закладываются в алгоритмы всех поисковых систем.

Некоторыми поисковиками учитывается время нахождения страницы в базе данных и индекс цитируемости – количество ссылок с других сайтов на данную страницу. Базой данных выводится список документов, ранжированных таким образом, и возвращается пользователю, который сделал данный запрос. Способ показа полученного списка у разных поисковых систем тоже будет отличаться. Одними выводятся только ссылки на сайты, другими кроме ссылок показываются первые несколько предложений, которые содержатся в документе, третьими вместе со ссылкой выдаётся заголовок документа.

При щелчке по интересующему документу происходит его запрос с того сервера, на котором он располагается, и если сервер, к которому обратились, доступен, он выдаёт содержимое запрашиваемой страницы. Когда пользователь ищет информацию, то, кажется, что всё происходит практически мгновенно (при нормальной скорости интернета, конечно), на самом деле происходит множество сложных операций, которые пользователь не видит непосредственно.

Спонсоры публикации: samoeinteresnoe.com — приметы на свадьбу в октябре (и на весь 2013 год). ЕвроКлиник — Развернутая программа (VIP), Компьютерная томография живота. Лечение в Европе — Рак поджелудочной железы, Рак пищевода. Авторы публикации: Сергей и Бэлла Петровы.

Прокомментировать

Рубрики

Наши услуги

В прямом эфире