МИР ВЕБМАСТЕРА
Меню сайта
Главная » 2009 » Июнь » 18 » Google изменил синтаксис запроса datarange
Google изменил синтаксис запроса datarange
04:46

Когда Google впервые опубликовал свой API (если не ошибаюсь, это случилось весной 2002 г), в представленной документации было обнаружено много интересных моментов, не разжеванных как следует на на официальных сайтах Google. В частности, из нее можно было понять, как работает параметр поиска datarange.

Datarange позволял находить страницы, добавленные в индекс Google или подвергнутые переиндексации в течение определенного периода времени. Границы временного отрезка задаются с помощью Юлианских дат. (Юлианские даты представляют собой количество дней, прошедших с 1 Января 4713 г до н.э. Для примера – в формате Юлианской даты 1 Августа 2001 г будет выглядеть как 2452122. Переход к новой дате осуществляется в полдень. Прим. пер.) Вникнув в метод работы параметра datarange, я создала инструмент GooFresh, доступный сейчас по адресу http://www.researchbuzz.org/wp/tools/goofresh/. GooFresh помогает упростить процесс поиска страниц, привязанных в индексе Google к определенным датам (в частности, он автоматически переводит обыкновенные даты в Юлианские).

Сегодня один из инженеров Google сообщил мне, что принцип обработки datarange-запросов будет немного изменен. Ранее даты присваивались страницам не только при первичном добавлении в индекс, но и при каждой реиндексации. Теперь к каждой странице будет привязана одна единственная дата, соответствующая дате добавления в индекс. Не важно, сколько раз обновлялась та или иная страница и сколько раз ее реиндексировал поисковый бот – при поиске с параметром datarange значение будет иметь только дата ее первой индексации.

(Отметим, что новые страницы добавляются в индекс с некоторым запозданием, поэтому даже если странице присвоена сегодняшняя дата, это вовсе не означает, что страница абсолютно новая. Сегодня ее обнаружил Google, а когда она появилась – вопрос отдельный. Не стоит об этом забывать.)

Для тех, кто целенаправленно отслеживает появление новых ресурсов в Сети, это поистине превосходная новость. Теперь при поиске с заданным параметром datarange не нужно перелопачивать многие тонны повторяющихся страниц, регулярно реиндексируемых из-за незначительных изменений контента.

Как сказал мой знакомый из Google, алгоритм обработки datarange-запросов должен быть окончательно обновлен к концу недели. Пока новый алгоритм обкатывается, привязанный к датам поиск может работать немного странно. Несколько раз в ответ на свой запрос я получала совершенно немыслимое количество результатов (так было, например, с запросом site:us daterange:2454251-2454251).Мне удавалось снизить их число до разумного, немного изменив текст запроса или добавив в него дополнительный параметр (site: us inurl: us daterange:2454251-2454251 ). Готового рецепта у меня нет – здесь нужно экспериментировать.

Для подобных экспериментов прекрасно подходит GooFresh – смело его используйте. Правда, я должна вас предупредить – после некоторого количества введенных запросов Google сообщает мне следующее: «Простите, но вы очень похожи на бота. Пожалуйста, докажите, что вы им не являетесь, выполнив тест CAPTCHA». Это сильно надоедает. Я никогда не думала, что печатаю НАСТОЛЬКО быстро. By Tara Calishain

BBCode:
HTML:  
[ Скрыть ссылки ]


Просмотров: 701 | Добавил: google
Всего комментариев: 1
avatar
0
1 Гроссман • 07:08, 01.02.2012
По моему мнению. Вы ошиблись.




avatar
Форма входа
Календарь новостей
«  Июнь 2009  »
ПнВтСрЧтПтСбВс
1234567
891011121314
15161718192021
22232425262728
2930
Поиск
Друзья сайта
Статистика

Здесь и Сейчас: 1
Прохожих: 1
VIP: 0