Уникальность

Уникальность контента для сайта
Справочник оптимизатора
Автор: Игорь Быстров
«Ведущий рубрики "Справочник оптимизатора" блога GetGoodRank, копирайтер, блоггер.
Уникальность контента - необходимо условие для высокого ранжирования сайта в поиске. Рассказываем, зачем нужна уникальность поисковикам и пользователям, как проверить уникальность. »

Уникальность контента является важным фактором для продвижения сайтов, указывая, что текст создавался исключительно для данного проекта. Уникальный контент создается с учетом целей сайта и потребностей и ожиданий целевой аудитории.

Уникальность проверяется поисковыми машинами в процессе индексации страниц. Поисковые роботы определяют, появлялся ли подобный текст ранее на иных сайтах. Неуникальный контент пессимизирует (понижает) сайт в поисковой выдаче.

Для определения уникальности текста используют специальные программы либо онлайн-сервисы, которые можно найти в сети. Уникальность определяется в процентах. Если тексту присваивается низкий процент уникальности, это указывает на некачественный рерайтинг или машинный синонимайз (замены значимых слов синонимами, при этом может сильно нарушаться грамматическая структура и логика текста) уже опубликованной статьи на другом сайте.

Уникальный контент важен для поисковиков для ранжирования и для пользователей, так как уникальный, актуальный, интересный контент, который пользователь не встречал раньше, вызывает интерес. Это в свою очередь сказывается на поведенческих факторах сайта: время на сайте, глубина просмотра, количество кликов и взаимодействий с сайтом.

анализ сайтаБольше о поведенческих факторах

Поисковики оценивают только техническую уникальность текста, тогда как пользователи ценят смысл и актуальность материала.

анализ сайтаУзнать подробнее о типах уникальности

Как проверяется уникальность

Индексация веб-страниц обязательно проверяет контент на уникальность. Если во время проверки поисковая система обнаруживает, что все статьи либо их значительная часть, размещенные на сайте, заимствованы с других ресурсов, то к этим страницам немедленно применяются различные санкции — исключение из индекса, понижение в выдаче.

Поэтому для успешного продвижения сайта уникальность статьи является обязательным условием.

Поисковики определяют уникальность, используя закон Ципфа. Содержимое страницы разбивается на определенные группы. В первую группу входят знаки препинания, союзы, предлоги, а также прочие слова, не имеющие смысловой нагрузки. Слова в этой группе игнорируются поисковиками. Ко второй группе относятся ключевики, которые указывают поисковым системам на тематику сайта и релевантность контента пользовательскому запросу, а посетителям позволяют легче ориентироваться в информации на сайте. Третья группа состоит из случайных фраз.

На следующем этапе поисковики применяют алгоритм шинглов, смысл которого заключается в делении текста на цепочку слов. Длина шингла — количество слов в цепочке. Соединение цепочки происходит не встык, а внахлест, то есть последнее звено одной цепи одновременно является первым звеном следующей. Программа, позволяющая самостоятельно выбрать шингл для проверки — Advego Plagiatus. Устанавливаемый размер шингла — от 2 до 10. Чем меньший шингл (к примеру, 3 слова в цепочке), тем точнее проверка. Как правило, достичь высокой уникальности при таком шингле невозможно, так как программа найдет множество совпадений в уже опубликованных в интернете текстах.

Уникальность проверка по Адвего

Чем больше совпадений будет обнаружено, тем ниже процент уникальности статьи. Подобная проверка позволяет находить даже частичные дубликаты.

Но алгоритм шинглов, как и любая другая программа, имеет свои недостатки. К примеру, текст, в который вписаны фразеологизмы либо известные цитаты, будет иметь невысокую уникальность. По этой причине многие поисковые машины подобный контент не считают ворованным, поэтому в отношении такой веб-страницы пессимизация не применяется.

Никто доподлинно не знает, как поисковики оценивают уникальность и какие корректирующие коэффициенты применяют к сайту с уникальным/неуникальным контентом при ранжировании.

Добавить комментарий

Войти с помощью: 

Статьи по теме

Битые ссылки
Справочник оптимизатора
Битые ссылки
Ссылку называют битой (англ. bad/broken link), если она ведет на несуществующую страниц...
Nofollow для сео
Справочник оптимизатора
Nofollow
В SEO-оптимизации часто возникает необходимость в запрете индексации гиперссылок. Для э...