NexxDigital - компьютеры и операционные системы

Привет, друзья! Я уже писал про и то какой вред они могут нанести сайту. Сегодняшняя тема напрямую связана с этим явлением. Я расскажу про атрибут rel=canonical.

Атрибут rel=canonical был введен Google 12 февраля 2009 года. Он учитывается до сих пор, поисковой системой Яндекс в том числе. Атрибут rel=canonical указывает поисковым роботам какая страница является предпочтительной при индексации, если на сайте имеется несколько страниц с одинаковым содержимым, но с разными URL-адресами.

Допустим существует 2 страницы:

http://сайт/chto-takoe-alexa-rank.html
http://сайт/chto-takoe-alexa-rank.html?id=4535

В данном случае первая страница является основной, именно для нее и должен быть прописан атрибут rel=canonical. А вторая страница является лишь ее копией, но с другим URL-адресом. Следовательно, если не будет прописан rel=canonical, то поисковая система будет индексировать как основной адрес, так и дубль страницы.

Конечно, поисковые системы не глупы и со временем выкинут дубль из индекса, но на это требуется время. А если сайт ежедневно пополняется несколькими сотнями новых страниц, то отсутствие указания канонического URL-адреса может негативно сказаться на продвижении.

Возьмем интернет магазин с 10 000 товарами. У каждого товара на сайте своя страница и несколько дублей. Представляете как подпортит продвижение сайта могут 20 000 дублированных страниц?

Откуда берутся неканонические страницы на сайте

Неканонические страницы или дубли генерируют движки управления, такие как WordPress, phpBB и прочие. Если у вас сайт написан на чистом HTML, то дублированных страниц в принципе быть не должно, если только вы их специально не добавляли конечно.

Если мы обратимся к справочнику вебмастера в Google и Яндекс, то увидим следующее:

Сообщение Google


Рекомендации Яндекс

Указание атрибута rel=canonical не является строгой директивой. При отсутствии данного атрибута, поисковые системы попытаются определить каноническую страницу самостоятельно.

Как прописать атрибут rel=canonical

С тех пор, как Google ввел данный атрибут, прошло много времени и практически на всех CMS и конструкторах сайтов есть возможность его прописать. В конструкторах сайтов он обычно прописывается автоматически, а для движков существуют дополнения в виде модулей и плагинов.

Если взять CMS WordPress, то практически все SEO плагины предоставляют возможность прописать канонический URL автоматически. Я пользуюсь плагином All In One Seo Pack, поэтому покажу на его примере.

В настройках плагина нужно отметить галочкой, чтобы автоматически прописывались канонические URL-адреса.

Если взглянем на исходный код страницы, то увидим что rel=canonical прописан. И если поисковый робот зайдет на этот дубль страницы, то увидит, что страница не является основной.

Вот такой вот интересный атрибут. Конечно, ничего нового я вам не открыл. Но почему-то многие не обращают внимания на вот такие мелочи, особенно владельцы небольших интернет-магазинов.

Довольно таки часто, можно увидеть на разных сайтах, что на один и тот же контент посетители попадают с разных адресов (URL). Причиной этого явления, есть дублирование содержимого на сайте. Как правильно — это случается при использовании различных систем управления контентом (cms) на сайте. Для того, что бы избежать проблемы, компанией Google еще в 2009 году было предложено использование тега rel=”canonical” , для страницы с определенным url, которая будет участвовать в выдаче поисковых систем. Немного позже все поисковики поддержали идею.

Атрибут rel=»canonical»

Как использовать атрибут rel=”canonical”.

Допустим, вы нашли страницу на которую с разных url приходят посетители и хотите решить проблему с помощью атрибута. Для этого выбираем основной url, например: https://сайт/kak-samomu-raskrutit/page-one-1/ и теперь что бы сообщить об этом поисковой системе необходимо:

  • прописать атрибут rel=”canonical” для основной страницы и добавить на страницу тег в теле , вот пример:

Поисковая система, выделит этот адрес, как основной и он будет использоваться в результатах поиска. Для того, что бы избежать проблем, указывайте абсолютные ссылки, а не относительные.

Нужно использовать:

https://сайт/kak-samomu-raskrutit/page-one-1/

Не использовать:

/kak-samomu-raskrutit/page-one-1/

Теперь перед нами может появится главный вопрос, а передаются ли характеристики такие как ссылочный вес, pr канонической странице? Могу сказать точно, все характеристики страницы, такие как ссылочный вес и т.д, передаются, проверено на практике.

Что бы упростить жизнь вебмастерам и сеошника, рекомендую использовать плагины и модули для CMS, которые будут отслеживать ссылки с дублирование контента и автоматически прописывать канонические атрибуты. Для WordPress могу рекомендовать плагин , отлично справляется с задачей. Достаточно поставить галочку в пункте “Канонические URL’ы” и будут генерироваться канонические страницы автоматически.


Вам остается только проверять правильно и корректировать роботу плагина.

Примеры, где необходимо использовать rel=»canonical».

1. Сервер показывает одинаковое содержимое для протокола https и субдомена www , пример:

http://lonbo.com/page-one
https://loknbol.com/page-one
http://www.lonbo.com/page-one

Так, же для этого случая можно использовать .

2. Для сайтов, которые используют движки , при сохранении контента в разные разделы (категории).

https://сайт/category-1/page-one1/
https://сайт/category-2/page-one1/

3. Динамические URL . Как правило характерно для товаров интернет — магазинов, которые созданы в разные сессии или для разных поисковых запросов. Пример:

https://сайт/products?category=shapka&color=grey
https://сайт/head/grey?gclid=ABCD
https://сайт/shapka/grey/shapkaGrey.html

4. Распространение содержимого сайта(ресурса), на других сайтах , полностью или частично.

Общие правила при использовании атрибута rel=»canonical».

  1. Не используйте атрибута более одного раза, для одной страницы. Поисковик может просто проигнорировать его указание.
  2. Не забывайте включать rel=”canonical” в раздел кода HTML. Особенно проверяйте при использовании плагинов или модулей.
  3. Убедитесь, что каноническая страница открыты для индексации, в противном случае использование бесполезно.
  4. Страницы

На сайте по разным причинам может появиться дублированный контент. Без дополнительной информации поисковая система при этом сама решает какой контент ранжировать выше, а какой ниже. В ряде случае поисковая система может ранжировать выше старый и моральной устаревший контент, потому что выбирает неправильный документ в качестве канонического.

Каноническую страницу легко указать поисковым системам в заголовке страницы, а именно в разделе head документа. Для этого нужно поместить следующий HTML код в head раздел каждого документа, являющегося неканоническим:

Если у Вас есть доступ к HTTP заголовкам, например, через htaccess или PHP, то Вы можете установить канонический URL для файлов, которые не имеют HTML кода, в частности, для PDF, DOC. Для этого используйте код:

Link: ; rel=»canonical»

Случаи, когда rel=»canonical» не работает

Атрибут rel=»canonical» используется поисковыми системами, как подсказка со стороны вебмастеров, какая страница является основной. В тоже время данный атрибут может отработать некорректно. Например, в следующих случаях:

  • Если указать URL канонической страницы страницу отдающую 404 код, то поисковая система будет искать другой актуальный адрес.
  • При взломе сайта Google и Яндекс могут посчитать, что злоумышленники поставили фальшивые канонические адреса и в таком случае также их не учитывать.
  • Если Вы разместили конструкцию внутри тега BODY или в заголовке head при отсутствии закрывающего тега .

Случаи, когда rel=»canonical» можно применять

Как я писал выше, Вы должны использовать rel=»canonical» на страницах, которые являются дубликатами или очень похожими на основную (каноническую). Если у вас есть две похожие страницы, но не идентичные, порой имеет смысл изменить одну из них, чем делать канонической.

Важное, правило: канонической страницей нужно делать только ту страницу, которая находится сейчас в индексе. То есть нельзя использовать для этих целей страницу, которая была исключена из индекса, например, с помощью Robots или мета-тега Noindex или по другим причинам.

Правильное применение rel=»canonical» будет в следующих случаях:

  • Сайты с динамическими URL. Можно использовать данный атрибут для определения предпочтительного URL.
  • В коммерческих сайтах, в первую очередь интернет-магазинах, когда клиенты меняют порядок сортировки, важно чтобы получившийся при этом url не был проиндексирован.
  • При публикации синдицированного контента или дублированного внутри сайта на разных страницах. Важно с помощью rel=»canonical» правильно указать первоисточник.

Когда применять rel=»canonical» не стоит

  • Самая главная ошибка, когда используют данный атрибут при смене URL структуры сайта. На старых документах ставят rel=»canonical» на новые. А это неправильный подход. В таких случаях единственно правильным решением будет использование 301 редиректа.
  • Второй по важности ошибкой является неправильное использование данного атрибута на страницах пагинации. Например, многие указывают rel=»canonical» на страницах пагинации на главную страницу сайта, что является ошибкой. В таком случае оптимальным вариантом использование rel=prev/next.

Чтобы осуществлять правильное продвижение страниц сайта в поисковых системах, необходимо сообщать роботам, какие URL более предпочтительны для попадения в индекс. Это задаётся с помощью специальных тегов.

Что такое rel canonical?

Остановимся подробнее на теге rel=»canonical». Его основная цель - борьба с дублями страниц и неинформативными страницами (например страницами пагинации), а также повышение качества индексации с помощью прописывания приоритетного адреса.

У меня был сайт с ограниченным краулинговым бюджетом. То есть по факту там было тысяч 10 страниц, но в индексе могли быть только 2 тысячи (потому что сайт был молодой и не трастовый). В итоге те страницы, которые мне были нужны в индексе, часто туда не попадали. Помог каноникал — проставление со страниц пагинации каноникала на основные URL позволило четко дать поисковикам понять, какие страницы должны быть в индексе.

Что такое каноническая ссылка?

Тег canonical будет чрезвычайно полезен, если на вашем сайте есть страницы-дубли, которые имеются в доступе по различным адресам. С помощью него необходимо прописать приоритетный канонический URL для восприятия поисковиками.

Что важно - будет также передаваться ссылочный вес и прочие характеристики страницы (PageRank и др.).

Этот атрибут указывается внутри тега на URL-дубликатах с указанием предпочитаемого URL. Оформляется он таким образом:

Для чего нужен каноникал?

При наличии похожих страниц в индексации поисковиками участвуют все они одновременно. В итоге ни одна из них в полной мере не продвигается по причине того, что внутренние ссылки имеются на обе страницы. Поисковик не знает, какой из них нужно отдать приоритет.

То же самое касается и внешних ссылок - продвигается не один URL, а несколько, а вес также распределяется между ними. И сайт находится на более низких позициях, чем мог бы быть.

Благодаря каноникал в индексе поисковиков будет предпочитаемый канонический URL.

Примеры использования

Например, у вас на сайте есть печатная версия страницы. Или отдельный урл для мобильной версии. И вы ставите каноникал с них на основную страницу, в итоге эта основная страница получает больший вес и плюс при ранжировании, а из индекса убирается куча мусора.

Как каноникал используется для пагинации

Нужно проставить rel canonical со страниц пагинации (site.ru/category/page/2) на первую из них (site.ru/category).

Мнения о настройке пагинации разнятся - некоторые специалисты говорят о необходимости закрытия от поисковиков всех страниц пагинации, другие - о том, что лучше их оставить в доступе роботов поисковых систем.

Яндекс рекомендует со всех страниц пагинации настраивать каноническую ссылку на первую из них. Как итог - яндекс-робот воспримет, что именно первую страницу необходимо индексировать. Про индексацию товаров уточняется, что по другим ссылкам Яндекс всё равно будет переходить.

Специалисты Google склоняются к следующим вариантам:

  1. оставить всё по-прежнему - поисковик по-разному распознаёт и воспринимает различные виды страниц;
  2. создать отдельный URL-адрес «Показать всё» и установить его как канонический - особенно рекомендуется для многостраничных статей;
  3. прописать в теге линк атрибуты rel=»prev» и rel=»next» с целью фиксации взаимосвязи между URL-адресами; поисковик будет выдавать первый из них.

А вот видос Деваки, где он подробно поясняет за пагинацию:

Атрибуты rel=»next» и rel=»prev»

Есть также и другое мнение — типа страницы пагинации закрывать не надо, что они наоборот должны получать дополнительный трафик. И тут важны два момента:

  • Все URL должны иметь уникальный параметр тега Title, уникальный текст и meta-теги;
  • Если Вы больше ориентируетесь на Google, то рекомендовано обязательное использование атрибутов rel=»next» и rel=»prev», которые нужно настроить так, чтобы каждая предыдущая страница ссылалась на следующую. На корневом адресе задаётся URL следующего, на последующих - URL предыдущей и следующей, на последней - только предыдущей.

Можно прописать пагинацию этими тегами, а каноническую ссылку оформить на первую или на главную страницу - в зависимости от особенностей ресурса.

Тема с SEO пагинатором

Вот допустим один из блогов (Sawynih или как-то так, уже не помню) писал о кейсе, когда страницы пагинации давали дополнительный трафик.

Если на разных URL представлен похожий товар, навигацию можно задать следующими способами:

  1. Прописать уникальные значения параметров автоматически, собирая заголовки из отдельных частей, к примеру:

    (купить|заказать|приобрести) юбки в (саратове|ростове|астрахани) (по низкой цене|выгодно|дешево) со скидкой (в магазине|в интернет магазине)

    Будут созданы уникальные значения метатегов.

  2. Самым эффективным и трудоемким является самостоятельное прописывание этих параметров, вручную. Все заголовки будут уникальными и очень сильно отличаться друг от друга, в том числе по смыслу. Это позволит продвинуть каждый URL по низкочастотным и низко конкурентным ключевым запросам в ТОП выдачи поисковиков. Благодаря применению этого способа расширится семантическое ядро. Плюс также в том, что для интернет-магазина множество статей писать нецелесообразно.

Важно осуществить эту работу один раз индивидуально для каждого URL. Параметры будут зафиксированы поисковиками.

Настройка Canonical для WordPress

Многие плагины для WordPress прекрасно работают с данным тегом.

Большинство из них просты в применении - активируем плагин, а канонические ссылки прописываются автоматически. В других SEO-плагинах достаточно установить галочку возле этого параметра в настройках. Если какая-то статья относится одновременно к разным категориям, то каноническая ссылка фиксируется самостоятельно.

При использовании плагина Yoast SEO и расположения поста в разных категориях, поисковик будет видеть только одну страницу.

Что еще полезно знать о каноникал?

Важно подчеркнуть следующие моменты:

  1. Тег canonical - не директива, а подсказка, которую следует учесть и проанализировать, выделив наиболее подходящий URL для поисковой выдачи.
  2. Касаемо оформления канонических ссылок отсутствует запрещающий момент в виде относительного пути. Даже в случае введения тега со ссылкой на документ, относительные пути станут восприниматься так, как прописано в базовом URL.
  3. Канонические страницы могут содержать не абсолютно одинаковое наполнение, и это логично. Могут присутствовать незначительные различия.
  4. Даже при наличии ошибки 404, контент будет индексироваться. Но рекомендуется указывать рабочие URL в качестве канонических.
  5. Если канонический url пока не проиндексирован, остаётся ждать - обычно недолго. Когда он распознается, подсказка будет пересмотрена.
  6. Можно использовать редирект - поисковик воспримет перенаправление и будет учитывать другой адрес.
  7. Рекомендуется задавать идентичный тег rel canonical, чтобы результат канонизации был оптимальным.
  8. Канонический урл может прописываться исключительно с текущего домена. Для указания урла с другого домена, следует использовать 301 редирект.
  9. Как оформляются канонические url, можно изучить на примере сайта wikia.com, открыв исходный код страницы http://starwars.wikia.com/wiki/Nelvana_Limited, содержащий canonical url http://starwars.wikia.com/wiki/Nelvana
    Обе ссылки практически одинаковы, но в первой прописан атрибут каноникал - и Google будет отображать версию, заданную в этом параметре.
  10. Вопросы применения каноникал можно задать в официальном блоге для вебмастеров поисковика Google.

В данном случае каноникал проставлен на чёрную овцу

Преимущества, связанные с умением правильно настраивать индексацию с помощью тега canonical:

  • избавление от похожего контента, связанного с недостатками движка, а также созданного искусственно целенаправленными действиями конкурентов;
  • отсутствие необходимости в применении robots.txt для запрета индексации отдельных страниц и угождения всем поисковикам.

Атрибут rel=“canonical” - один из способов борьбы с дублирующимся контентом. Он размещается на любой HTML-странице между тегами . Поисковые роботы начинают считать страницу, указанную в атрибуте rel=“canonical”, приоритетной (канонической). Каноническая страница будет отображаться в поиске, на неё перейдут ссылочный вес и другие характеристики страниц с одинаковым содержанием.

Таким образом, если на вашем сайте есть идентичный или очень похожий контент, доступный по разным URL, с помощью атрибута rel=“canonical” можно указать тот URL, который является предпочтительным для индексации.

Когда нужно использовать канонические ссылки

1. Для предупреждения появления различных дублей. Например:

  • страниц сортировок: /*sort, asc, desc, list=*;
  • дублей из-за UTM-меток: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
  • других страниц c GET-параметрами в URL;
  • дублей в результате особенностей работы CMS (движка).

В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:

href=“https://site.ru/category-1/page-2” />

2. Для доступных по разным URL страниц с очень похожим контентом.

Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.

В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.

В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».

Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:

ru /category-1/show-all” />

Как указать основной URL при помощи атрибута rel=“canonical”?

Прописать между тегами любой HTML-страницы

Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами на странице полный URL страницы, которая должна быть в индексе.

Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.

Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:

ru /” />

Важно!
Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.

В файле Sitemap

В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.

Важно!
Атрибут rel=“canonical” - это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.

В заголовке HTTP

Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.

В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:

Link: ; rel=“canonical”

Важно!
Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.

С помощью плагина

Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:
— для WordPress можно настроить canonical с помощью Yoast SEO ;
— в OpenCart - реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
— для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).

Как проверить правильно ли настроен rel=“canonical”?

Провести анализ можно специальной программой для SEO-анализа сайта - .

С помощью этой программы вы увидите:
— какие страницы на сайте без атрибута rel=“canonical”;
— на каких страницах стоит атрибут rel=“canonical”, и какие страницы являются для них каноническими;

Основные ошибки использования rel=“canonical”

— Канонический URL отдаёт 404 ошибку.
— Указанный канонический URL находится на другом домене или поддомене.
Каноническая ссылка не является индексируемой.
— Использование rel=“canonical” со страниц пагинации на первую страницу.

Для всех страниц пагинации неправильно прописывать канонической первую страницу. Это делает индексацию всех страниц пагинации невозможной.

Для страниц пагинации в качестве канонических нужно указывать эти же страницы.

Например, страница https://site.ru/category-1/page-2 должна содержать каноническую ссылку:

.

— Несколько ссылок rel=“canonical” с одной страницы.

Для одной страницы должна быть одна каноническая страница, в ином случае будет учтён только первый URL.

— Разные канонические URL.

Указывайте одни и те же канонические страницы при разных способах реализации атрибута (например, через XML-карту сайта и через rel=“canonical” на самой странице).

Заключение

Атрибут rel=“canonical” - удобный и полезный инструмент для поискового продвижения. При правильном использовании, он повысит эффективность работы и ускорит индексирование сайта, что, в свою очередь, существенно повлияет на его ранжирование.

Не пропускайте свежие статьи

Подписаться на рассылку

Еще по теме:

Наталия Бондаренко

SEO-оптимизатор

Оптимизирую сайты с 2009 года. Люблю сложные кейсы, которые оказались не по зубам специалистам с других компаний. Делаю очень подробные аудиты.

Пишу статьи-инструкции на блог SiteClinic по SEO-инструментам и аналитике.

Любимая цитата - Чтобы добиться успеха, надо искренне любить то, чем вы занимаетесь



Если заметили ошибку, выделите фрагмент текста и нажмите Ctrl+Enter
ПОДЕЛИТЬСЯ:
NexxDigital - компьютеры и операционные системы