МИР ВЕБМАСТЕРА
Меню сайта
Категории каталога
ВебМастеру [111]Раскрутка сайта [122]Уроки Photoshop [44]Who is who в Инете [21]
PC [13]Разное [0]CopyPaste [4]
Главная » Статьи » Раскрутка сайта

Проблемы современных поисковых систем

это бомба $550 дают просто так

С появлением сети Интернет возникло множество проблем, по сути так и не разрешенных по сей день. Одним из основных недостатков является протокол HTTP, который используется для передачи информации и по сути подходит лишь для навигации по сайтам, и в то же время не очень удобен для их поиска по ней. То же самое можно сказать и о протоколе передачи файлов FTP, который даже более примитивен, чем HTTP, и предназначен только для передачи данных.

Основная проблема современной Сети состоит в том, что эти протоколы не позволяют отслеживать изменение информации. Учитывая, что на сегодняшний день в Сети находятся миллиарды страниц, отыскать быстро или вообще найти нужную и актуальную информацию уже не представляется возможным. Нужно учитывать и тот факт, что информация, размещенная на этих страницах, подвергается постоянным изменениям и, хотя уже появился механизм получения данных по RSS, однако далеко не на всех сайтах он есть.

Проблема отчасти решается тем, что каждая поисковая система выбирает те доменные зоны, в которых она может обеспечить быстрое обновление информации и выстраивать соответствующую стратегию обходов интернет ресурсов в них так, чтобы отследить как можно большее количество часто обновляющихся сайтов, не растратив свои мощности на старые, неизменяющиеся сайты.

Так, российские поисковые системы Яндекс и Рамблер индексируют сайты в доменных зонах .ru, .ua, .by постсоветских республик и не индексируют зарубежных сайтов, украинские Мета и Аванпорт индексируют исключительно украинские ресурсы и т.д.
Таким образом, каждая поисковая система имеет свое собственное, ограниченное ее ресурсами, множество доступных для поиска документов. Ни одна из подобных систем не имеет и не может иметь достаточных мощностей, чтобы охватывать все ресурсы в сети Интернет, поэтому в любой момент может возникнуть ситуация, когда информационные потребности пользователя не смогут быть удовлетворены. Как правило, в этом случае пользователь переходит на другую поисковую систему и пытается искать то, что ему нужно, там.

При этом необходимо также учитывать поведение “типичного пользователя” поисковой системы. Никто не обучает пользователей поиску информации в Сети, что привело к тому, что большинство пользователей используют простые запросы из 2-3 слов, по которым во многих случаях невозможно определить информационную потребность. Статистика показывает, что расширенными возможностями поиска, в том числе логическими операторами, пользуются менее 3% пользователей. На качестве поиска сказывается также неоднородность пользователей, то есть различия в знаниях, образовании, социальном положении и т.д.

Тем не менее, такой подход, когда каждая система отвечает за выбранные доменные зоны, в некоторых случаях оказывается очень неэффективным. Например, очень велика вероятность того, что в украинских поисковых системах не удастся найти информацию, которая есть в российских системах, и напротив, в российских не удастся найти нужную информацию, которую можно отыскать в зарубежных.
В связи с этим можно смело утверждать, что эффективность поиска здесь зависит от информационных потребностей пользователя.
Потребности пользователей в общем случае можно разделить на навигационные, информационные, транзакционные и нечеткие.
Навигационные потребности возникают в тех случаях, когда пользователь ищет конкретные сайты по интересующей его теме. Обычно результатом поиска при обработке таких запросов служит список ресурсов со ссылками на стартовые страницы. По статистике, навигационных запросов около 20%.
Информационные запросы пользователи задают при поиске информации о чем-либо. В результате пользователь получает список страниц (обычно внутренних) с нужной информацией. Как показывает статистика, таких запросов около 50%.
Транзакционные запросы направлены на совершение какого-либо действия, например, покупки товара. Таких запросов в Сети 20%.

К нечетким запросам относят словосочетания, по которым невозможно определить информационную потребность пользователя.
Проблема любой поисковой машины состоит в том, что количество страниц по искомой теме в Сети может быть настолько большим (десятки, а то и сотни тысяч), что просмотреть их все пользователю становится совершенно невозможно, поэтому важнейшим параметром работы поисковых систем является релевантность.

Релевантность показывает, насколько результаты поиска в поисковой системе соответствуют ожиданиям пользователя. При этом нужно учитывать, что релевантность вещь очень субъективная, зависит от того, насколько правильно пользователь подобрал ключевые слова, и по каждому запросу будет разной.

Релевантность является основным критерием качества поиска, однако математически оценить поисковые результаты, согласно классической теории Сэлтона, позволяют полнота и точность поиска.

Полнота поиска определяется количеством релевантных документов, которые доступны в поисковой системе по данному запросу.

Точность поиска определяет количество страниц, которые точно соответствуют ожиданиям пользователя и представляет собой отношение релевантных страниц к общему количеству страниц, найденных системой. Собственно, этот параметр показывает, насколько эффективно система умеет отфильтровывать нерелевантные документы.

Кроме того, есть еще ряд параметров, с помощью которых можно оценить поисковую машину.

Усилия, интеллектуальные или физические, затрачиваемые пользователями на формулирование запросов, помощь в процессе поиска и просмотр выдаваемой информации.

Время с момента поступления запроса в систему до выдачи ответа.

Форма представления выдачи, которая влияет на возможность использования выданных материалов пользователями.

Полнота массива, т. е. степень охвата всех релевантных документов, интересующих пользователей.
Все шесть критериев, интересующих пользователей, кроме двух, сравнительно легко измерить. Затраты труда пользователей можно выразить через время, необходимое для формулирования запроса, диалога с системой и просмотра выданной системой информации. Время реакции системы можно измерить непосредственно; так же легко установить форму выдачи.

Определение полноты охвата массива может представить некоторые затруднения, если заранее неизвестно количество материалов, представляющих интерес в данной предметной области. Однако просмотр опубликованных указателей и справочных изданий позволяет сравнительно легко оценить полноту охвата в любом данном случае.



BBCode:
HTML:  
[ Скрыть ссылки ]




Категория: Раскрутка сайта | Добавил: razor (16.03.2009) | Автор: Вячеслав Тихонов
Просмотров: 849276 |
Всего комментариев: 0




avatar
Форма входа
Поиск
TRANSLATOR
Друзья сайта
Статистика
p
IP:54.196.26.1


Здесь и Сейчас: 1
Прохожих: 1
VIP: 0
l
n