Итоги года: Яндекс!


Каким был 2016 год в Яндекс: основные изменения поискового алгоритма, принципов ранжирования. Рекомендации, как подготовить сайт к 2017 году.»
Мы продолжаем подводить итоги года. Сегодня мы собрали для вас наиболее значимые изменения в поиске Яндекса, которые так или иначе влияют на ранжирование и восприятие сайта целевыми пользователями.
В этом выпуске:
- Как изменился поиск Яндекс в 2016 году
- Мобильные изменения
- Искусственный интеллект и машинное обучение
Как изменился поиск Яндекс в 2016 году
30 декабря 2015 года в блоге для вебмастеров Яндекса появилось неоднозначное заявление о влиянии кликджекинга на ранжирование. Спустя месяц Яндекс «признался», что заявление на самом деле говорило о запуске нового алгоритма, понижающего в поисковой выдаче сайты за использование технологии кликджекинга. Неплохое начало года.
При этом Яндекс не указал четкого перечня сервисов и функций сайта, которые будут расцениваться как кликджекинг. В одном из комментариев к посту в блоге эксперт Яндекса ответил:
Вывод #1: скрытый сбор данных пользователей приводит к понижению в выдаче, о чем приходит сообщение в Яндекс.Вебмастер. Однако случаев не так много.
Мобилизация по Яндексовски
В конце 2015 года Яндекс начал помечать в выдаче страницы, оптимизированные под мобильные устройства. В феврале 2016 года запущен алгоритм Владивосток, который учитывает мобилопригодность как фактор ранжирования при формировании мобильной выдачи.
Неоптимизированные страницы также попадают в мобильную выдачу, но получают меньший приоритет в сравнении с мобилопригодными.
Яндекс определяет мобилопригодность по следующим факторам:
- отсутствие горизонтальной прокрутки
- контент оптимизирован для просмотра с мобильного экрана
- отсутствие элементов, не поддерживаемых мобильными браузерами (Flash, Java, Silverlight)
Следующим шагом навстречу мобильности становится новый фактор ранжирования — размер шрифта, о чем Яндекс сообщает в блоге.
Рекомендованный размер шрифта для текста на мобильной странице — 12рх.
Яндекс постоянно публикует срезы активности аудитории с различных устройств. Так, с компьютеров распределение трафика по тематикам таково:
С планшетов распределение поиска по тематикам выглядит так:
С мобильных телефонов распределение поисковых запросов выглядит так:
Вывод #2: если ваш сайт относится к тематике, интерес к которой выше с мобильного устройства, то важно заняться оптимизацией ресурса под мобильные экраны. Это не только улучшит поведенческие факторы (сайт станет удобнее, пользователи будут дольше оставаться на сайте, просматривать больше страниц), но и продвинет сайт в мобильной выдаче.
Исследование Яндекса о поиске с компьютеров, планшетов и мобильных устройств.
Искусственный интеллект в поиске и машинное обучение
2 ноября Яндекс сообщил о запуске нового алгоритма семантического поиска, способного определять не символьное (техническое) соответствие документа запросу, а смысловое. Палех ищет не по словам, используемым в запросе и присутствующим в контексте страницы (заголовки, теги, описания, контент), а по смысловому соответствию документа запросу.
До внедрения Палеха позиции сайта в выдаче определял Матрикснет — алгоритм машинного обучения, использующий множество пользовательских данных для построения формулы ранжирования. Это несовершенный инструмент, так как обеспечивает точность ранжирования только при наличии большого массива данных.
Чтобы исправить ситуацию Яндекс запускал в выдачу многорукого бандита. Алгоритм выбрасывал в ТОП выдачи сайты, по которым Матрикснету не хватало пользовательских данных, чтобы собрать достаточный массив факторов для точного ранжирования.
Матрикснет использует поведение пользователей как подсказку, какой сайт лучше соответствует запросу, какой — хуже.
Матрикснет способен правильно ранжировать сайты по запросам, по которым имеется достаточное количество данных. Из 280 миллионов ежедневных обращений к поиску Яндекс регистрирует до 40% уникальных запросов. Это значит, что такой запрос (либо такая формулировка запроса) не повторялась ни разу за весь период наблюдения и сбора данных. Соответственно Матрикснет не знает, что показать пользователю. Качество выдачи ухудшается.
Палех определяет релевантность поискового запроса заголовку документа. Искусственный интеллект обучался на разных отрицательных примерах (содержащих и не содержащих слова из запроса, с естественными словосочетаниями и составленными искусственно).
Система намеренно не учитывает кликабельность заголовка в качестве основного сигнала ранжирования, так как задача алгоритма — найти полезную информацию, а не продвинуть в ТОП сайты с наиболее кликабельными заголовками.
Алгоритм пока применяется к ограниченному числу документов. Запуск нового алгоритма отнюдь не значит, что остальные факторы ранжирования теряют значение. Для качественного ранжирования в Яндекс поиске все также важны ссылки на документ, текст самого документа, поведенческие факторы (клики и переходы как из поисковой выдачи, так и с тематических цитирующих сайтов).
Палех считает положительными примеры тех сайтов, на которые пользователи с большей вероятностью кликнут или на которых останутся.
Палех сопоставим по принципу действия с искусственным интеллектом RankBrain от Google.
Вывод #3 или что значит Палех для поисковой оптимизации?
Применяя семантические алгоритмы, поисковые системы избавляют оптимизаторов от необходимости переспама ключевых слов в текстах. Чтобы сайт ранжировался высоко, важно:
- достаточное количество контента
- качество текстов
- трастовость сайта
Проверить качество контента в GetGoodRank!
Палех не внесет существенных корректив в позиции сайтов, он лишь поможет соотнести низкочастотные запросы (чаще описательного характера — мультфильм про назойливую девочку и бедного медведя) с релевантным сайтом.
Палех никак не коснется коммерческих сайтов, на которых контент ограничивается описаниями товаров и спецификациями.
Наблюдения вебмастеров показывают, что с запуском Палеха в Яндексе ужесточились меры в отношении переспама. Страницы с естественным, непереспамленным контентом получают приоритет в ранжировании.
Выводы
Для высокого ранжирования в Яндекс сегодня необходимы:
- мобильная версия
- пользовательская безопасность на сайте
- качественный контент с правильно оптимизированными заголовками
- ссылки
- поведенческие факторы (по заявлению Садовского в выступлении на Optimization 2016 становится ясно, что Палех также учитывает вероятность реакции пользователя на подобранный вариант — останется/не останется на сайте).