осторожно βeta версия!

Апдейты Яндекса за последние 5 лет.

Собрал все апдейты выдачи и ТИЦ за последние пять лет: с весны 2006 года и по сей день. Основной целью эксперимента был поиск закономерности между апдейтами выдачи и апдейтами ТИЦ. Информация о том, что они существуют, неоднократно встречалась на различных околосеошных форумах и блогах. Так же достаточно простые размышления о ресурсоемкости самого пересчета ТИЦ косвенно подтверждают наличие таких закономерностей.

Сбор данных

Мне найти все данные в одном месте не удалось. Более-менее подробный список апдейтов с 2007 года присутствует на pr-cy.ru, но после его проверки, были обнаружены провалы в несколько недель и не корректные даты апдейтов выдачи. Намного более точный, но к сожалению не такой старый, с 2008 года, список был обнаружен на tools.promosite.ru. В итоге пришлось собирать недостающую информацию вручную с профильных разделов на forum.searchengines.ru. Информация об апдейтах на этом форуме присутствует с лета 2006 года. Данных старше найти не удалось вовсе. Буду благодарен, если кто-то подскажет, где их раздобыть, для полноты картины и потомков.

Анализ и визуализация

В текстовом формате проводить анализ такого объема дат не удобно, я бы даже сказал практически невозможно. Несколько дней занимался визуализацией данных, для их анализа. В итоге остановился на точечном графике. По оси ординат год, по абсцисс недели, точки расставлены с точностью до дня. Синяя точка на графике любое существенное обновление выдачи, красная апдейт ТИЦ. Графики статичные и после написания статьи сами обновляться не будут, к концу 2011 года обновлю обязательно.

График №1: Апдейты выдачи

график всех апдейтов выдачи за последние пять лет с 2006 по 2011 годы

График №2: Апдейты ТИЦ

график всех апдейтов ТИЦ за последние пять лет с 2006 по 2011 годы

График №3: Апдейты выдачи и ТИЦ

график всех апдейтов ТИЦ и выдачи за последние пять лет с 2006 по 2011 годы

Выводы

Честно сказать, эксперимент обманул мои надежды. Найти очевидные зависимости и закономерности между апами ТИЦ и выдачи мне не удалось. Если брать во внимание только эти факторы, то можно сказать, что: "Все апдейты Яндекса происходят абсолютно хаотично, не имеют периодичности, не повторяются в каких либо временных рамках". Скорее всего внутри компании есть внутренний график, привязанный к недоступным нам, простым смертным, событиям.

UPD: 7 марта 2011 года

Если эта статья была вам интересна и полезна, рекомендую прочитать её продолжение: Алгоритмы Яндекса с 2007 по 2010 год.

Делюсь списками апдейтов.

Мне они достались монотонным, ручным трудом и никаких результатов не принесли. Если кому нужны. пользуйтесь, возможно ваши исследования будут результативнее моих. Если кто-то вдруг обнаружит ошибки или неточности сообщите мне пожалуйста.

ВложениеРазмер
serp-up.txt5.07 КБ
tic-up.txt736 байт

Комментарии (43)

Ваша оценка: Нет Средняя: 4 (15 голосов)
Аватар пользователя Гость

Делюсь писками апдейтов

:) мой извращенный мозг уже нашел ошибку в заголовке последнего абзаца, и уж точно вы имели ввиду не список :)

Аватар пользователя webpavilion

все таки я букву "с" пропустил а не мягкий знак как вы подумали. Спасибо большое за внимательность.

Аватар пользователя Гость

Очень интересные исследования! Продожайте. Читаю Ваши посты с удовольствием. Прекрасное отвлечение от монотонного оптимизаторского труда. Разрядка в некотором роде.

Аватар пользователя webpavilion

Спасибо, для меня написание статей для блога тоже своеобразный отдых.

Аватар пользователя Гость

Как всегда на высоте;)
А на чем, если не секрет, собираете все данные для анализа?
PHP/Perl/Python?

Аватар пользователя webpavilion

знаком в той или иной мере со всеми языками вами перечисленными, для личных нужд пользуюсь PHP

Аватар пользователя Гость

ну график немного показывает что яндекс старается делать по 2 апа рядом, хотя тоже не везде. Я думаю, что апы не ограничены по времени, просто после определенных изменений поиска происходит ап, а они могут быть 1 раз в полгода или каждый месяц.

Аватар пользователя Гость

как сервер справится с нагрузкой - так и апает
а щас не успевает все гс, дорвеи, мфа и прочую чушь проиндексировать, а уж тиц считать и подавно

Аватар пользователя webpavilion

раньше справлялся, а сейчас вдруг перестал? не думаю что причина в этом.

Аватар пользователя Гость

А для чего именно вы собирали статистику ? Проводили какие то эксперименты ?

Аватар пользователя webpavilion

Эта статья побочный продукт более масштабных изысканий.

Аватар пользователя Гость

Занимайся полезным делом, а не ерундой.

Аватар пользователя webpavilion

Можно подумать вы с 9:00 до 24:00 вкалываете за полезными делами с перерывами на поесть и опорожнится? У меня хобби такое: графики строить и данные анализировать, мне нравится.

Аватар пользователя Гость

Главное делать то что самому нравится.

Аватар пользователя Гость

Спасибо! Не удержался... "Скорее всего внутри компании есть внутренний график, привязанный к недоступным нам, простым смертным, событиям", например возвращению шефа из командировки

Аватар пользователя Гость

Надо попробовать как-то соединить эти точки, возможно нам откроются какие-то тайны ) похоже на перфокарту.

Аватар пользователя Гость

График апов тиц свидетельствует о постоянной модернизации, у меня сложилось впечатление, что график приводит не только сам ап, но и его доработку (переап). так например серия апов лишь им начинается всё остальное переап в плоть до явной обособленности.
x3y8 - ап, x6y8 - переап
x10y8 - ап, x11y8-x20y8 - переап

Аватар пользователя webpavilion

интересное предположение, спасибо за ваш комментарий.

Аватар пользователя Гость

И график апов выдачи вызывает у меня те-же мысли

Аватар пользователя Гость

Непонятный график, может быть я просто не математик? Почему бы не сделать ось с месяцами?

Аватар пользователя webpavilion

по неделям проще(точнее) ориентироваться по крайней мере мне.

Аватар пользователя Гость

Спасибо за проделанную работу, конечно. Информация действительно представлена не в самой удобной форме, но разобраться можно. Ещё было полезно визуализировать не только информацию о датах обновлений, но и информацию о промежутках между ними. Где-то я уже видел подобную статистику...

Аватар пользователя webpavilion

Пожалуйста, Что именно не удобно? Для меня очевидно что 26 неделя это начало июля, точно так же как и то что июль летний месяц.

Аватар пользователя Гость

Если бы я мог сразу сказать, что именно неудобно, я бы предложил изменения :) Просто я примерно минуту сначала смотрел на график и пытался понять, что к чему. Не могу сказать, что конкретно не нравится... может быть, не помешали бы вертикальные линии, обозначающие недели. И кстати, для меня вообще не очевидно, что 26 неделя - это июль :) Никогда не считал недели :)

Аватар пользователя Гость

Антон выкладывает очень важные исследования.
По крайней мере для себя, для анализа, очень полезно;)

Аватар пользователя Гость

pchart, конечно, хорошо, но исследование изначально ничего не должно было показать. Вы надеялись, что точки на графике сольются в слово "Яндекс" и тогда можно было бы предсказать что следующий апдейт будет, где не хватает точек? :)

Аватар пользователя webpavilion

От pChart там осталось 1/3 наверное, проект умер, не развивается c 2008 года, допиливаю под себя.

Не надеюсь, что то предсказать, мне просто интересно, на одном из форумов юзер соединил точки у него получилось 08.03.2011 дать ссылку?

Аватар пользователя Гость
сегодня к сожалению 8е и нет апа тиц
Аватар пользователя Гость

честно думал об этом графике около неделю искал зависимости, последовательности и т.д. и т.п., даже задумывался о возможностях если бы знали когда следующий ап будет, в конце понял что нихрена поддающиеся математическим последовательностям нету. Но натолкнуло на другую мысль, я предположил что яндекс проводит апы по принципу накопления, тоесть например яндекс проиндексировал определённое количество страниц и организовал ап, дабы опустошить это временное хранилище индексации и тиц также пересчитывается пока определённое кол-во данных о тице не соберётся и ап, и когда там надо чёто испытать просто лимит кол-ва индексированных страниц уменьшают и всё, так легче ориентироватся(это о странностях поведения апов иногда)

Аватар пользователя webpavilion

Спасибо за толковый комментарий. Математической последовательности быть не может, но должны быть какие то закономерности, сейчас делаю вторую статью на эту же тему. Проверить вашу теорию никак нельзя к сожалению.

Аватар пользователя Гость

Буду с удовольствием ждать, да к сожалению мою теорию проверить очень сложно...

Аватар пользователя Гость

Отличный сбор данных! Можно ещё на эти графики наложить даты внедрения яндексом новых алгоритмов. Для истории самое то!

Аватар пользователя webpavilion

Этим и занимаюсь уже третий день, завтра готово будет.

Аватар пользователя Гость
Эти графики наглядно показывают что нет никакой строгой периодичности. У яндекса скорее всего апдейты происходят по нажатию кнопки. У гугля в отличии от яндекса апдейты стоят в задании с определенной периодичностью или по мере накопления проиндексированного материала.
Аватар пользователя Гость
Откуда такие данные?
Аватар пользователя Гость
В ТИЦе тенденция во время НГ праздников подолгу не апатся, видно отдыхают.
Аватар пользователя webpavilion
На то они и праздники вся страна отдыхает.
Аватар пользователя Гость
Не туда копаете, уважаемый!
Аватар пользователя webpavilion
Копаю куда интересно, если направление с вашим не сходится - не значит что оно не верное.
Аватар пользователя Гость
Очень интересно было углубиться в столь давнюю историю апов. Спасибо автору за большой проделанный труд ;)
Аватар пользователя Гость
Было бы интересно группировать отчеты по кварталам. Интересны годовые сравнения кварталов, например: 1 квартал 2011, 2010, 2009 года, что в них происходило с Выдачей ну и тИЦ-ем в придачу.
Аватар пользователя Гость
Интересно. Положил в копилку, вдруг пригодится. Когда продолжение большого эксперимента будет? Ждем....
Аватар пользователя Гость
Обалдеть) наверно много времени и сил нужно чтоб такой график руками состряпать, респект)))

Отправить комментарий