В конце мая произошла крупнейшая утечка конфиденциальных данных Google — в ночь с 27 на 28 мая около 2500 документов попало в сеть. Известно, что информация о возможности утечки поступила от анонимного пользователя на почту основателя Moz.com, Ренда Фишкина, еще 5 мая, но тогда на это не обратили внимание.
Источник фото: ryanhanley.com
А теперь, когда шумиха немного поутихла, мы с вами разберем, что именно попало в сеть и как сеошникам работать с этой информацией.
Использование метрики «siteAuthority» отрицалось работниками Google, потому что факт ее использования означает авторитет сайта, а дата его создания влияет на ранжирование страницы в поиске.
И хотя из утекших документов не до конца понятно, как именно учитывается метрика и насколько сильно она влияет на результат, то, что ее влияние вообще учитывается — большая новость.
Формально это не новость, потому что многие поисковые системы используют данные о частоте кликов пользователя, чтобы выдавать юзеру лучшие результаты поиска. Системы изучения кликов, такие как NavBoost и Glue, существуют примерно с 2005 года и работают так:
Но просто кликать — недостаточно. В слитых документах есть сведения о кликах под кодовым названием «голоса» от пользователей — «избирателях», также подсчитаны данные о:
Последний пункт означает, что поисковик также следит за временем пребывания на сайте, в чем тоже нет ничего страшного, если бы только Google не отрицал отслеживание кликов ранее.
Источники: journal.topvisor.com и Twitter
Инженер Google Search Пол Хаар еще в своем резюме 2019 года проболтался об использовании в Google сервиса учета кликов Navboost, хотя ранее отрицал этот факт. И его коллега, Гарри Ийеш на SMX West в 2016 также заявлял, что «…непосредственное использование кликов в ранжировании было бы ошибкой».
Такая ложь в будущем грозит Google судебными исками от западных пользователей: мало кто из них любит, когда посягают на их конфиденциальность.
В августе 2019 года представители компании отрицали само существование фильтра Sandbox, или «песочницы»:
Источники: journal.topvisor.com и Twitter
«Песочница» сайтов — это фильтр, который держит сайты-новички под особым контролем и будто в теневом фильтре. При этом сайт по всем показателям ранжируется, но фактически не выдается по поиску.
Фильтр Sandbox «живет» три месяца, а потом спадает в том случае, если наполнение сайте не противоречит правилам поисковой системы.
При этом больший вес у ссылок на сайты с высокими местами в выдаче и у новостных сайтов. Использовать это в работе просто: ссылайтесь на официальные ресурсы, первоисточники и/или на крупные сайты при наполнении сайтов контентом.
На примере этой статьи: если рассказываете о сливе данных Google, дайте ссылку на ресурс со слитыми документами, как на первоисточник. Но учтите, что Google сам оценивает «вес» ссылок, основываясь на внутреннем критерии Homepage Trust.
Ключевые слова в заголовках и title лучше вставлять. Google смотрит, насколько заголовки соответствуют запросам пользователей. К этому же пункту отнесем и «свежесть» самого контента.
Имеет значение не только дата публикации, но и дата изменения и обновления материалов. Поэтому в идеале дата обновления контента должна прописываться отдельно.
Новые сайты помечаются флажком «маленького личного сайта»:
Источник: API Reference
Из слитых документов, однако, непонятно, вешается ли флажок smallPersonalSite на все новые сайты или только на новые одностраничные сайты и мини-блоги.
Мы отобрали самые интересные сливы данных по мнению редакции Partnerkin, но есть и другие данные, с которыми можно ознакомиться по ссылкам: