Канонічні посилання: як уникнути хаосу в SEO

Канонічні посилання: як уникнути хаосу в SEO

19.06.24

Визначення

Канонічна сторінка — це сторінка, яку пошукова система визначає як основну серед групи сторінок зі схожим змістом.

Канонічне посилання — це посилання, яке вказує на канонічну сторінку та містить атрибут rel зі значенням canonical: <link rel="canonical" href="посилання"/>.

Неканонічна сторінка — це сторінка, на якій присутній атрибут rel="canonical" з адресою іншої сторінки.

Як виглядає атрибут canonical

Атрибут rel="canonical" можна прописати двома способами:

  • <link rel="canonical" href="посилання" /> — у блоці <head> сторінки.
  • Link: <посилання>; rel="canonical" — у HTTP-заголовку.

Процес канонізації

Канонізація — це процес вибору основної сторінки серед дублікатів (однакових сторінок, доступних за різними адресами) або серед сторінок зі схожим змістом.

Чому canonical важливі для SEO

  1. Уникнення дубльованого контенту.
    Пошукові системи не схвалюють дубльований контент, оскільки він засмічує результати пошуку. Крім того, алгоритмам буває складно правильно визначити головну сторінку. Атрибут rel="canonical" вказує, який URL слід індексувати. У Google зазначають, що вони не завжди визнають вказану канонічну адресу, оскільки теги канонічності є підказками, а не директивами.
    Правильне використання тегів канонічності допомагає знизити ризик того, що робот вибере неправильну канонічну сторінку.
  2. Ефективне використання краулінгового бюджету пошукових систем. Велика кількість дубльованого контенту може негативно вплинути на "краулінговий бюджет". Це означає, що пошукові системи будуть витрачати свої ресурси на сканування неунікальних сторінок замість того, щоб знаходити новий або оновлений контент. Варто зазначити, що при правильному налаштуванні, пошукові боти обходять неканонічні сторінки значно рідше, ніж канонічні.
  3. Консолідація переходів.
    Атрибут канонічності допомагає об'єднати переходи на однакові або повторювані сторінки. Це необхідно для збору всієї інформації про різні сторінки (наприклад, посилання на них) і пов'язання її з одним URL. Наприклад, щоб посилання для сторінки site.com/kondicionery/red?gclid=123 об'єднати з посиланнями для site.com/kondicionery.
  4. Точність даних у Google Search Console.
    Дані зі звіту про ефективність у Google Search Console з 2019 року прив'язані до канонічних адрес. Це означає, що для отримання коректних даних зі звіту потрібно вказати правильні канонічні сторінки.
  5. Захист від спаму.
    Встановлення canonical для кожної сторінки допомагає захиститися від спаму, коли конкуренти генерують сміттєві сторінки через get-параметри.

Коли потрібно використовувати canonical

Існує кілька ситуацій, коли атрибут canonical необхідно використовувати. В інших випадках його можна застосовувати за своїм бажанням.

Для сторінок-дублікатів

Часто одна і та ж сторінка може бути доступна за різними URL-адресами. Це трапляється через те, що розділ/товар/послуга можуть належати до кількох категорій. У цьому випадку потрібно вибрати одну адресу, яка буде основною, а для інших сторінок-дублікатів встановити canonical.

Приклад: у інтернет-магазині на сторінку товару можна потрапити трьома способами:

  • site.com/lg/kondicionery
  • site.com/brand/lg/kondicionery
  • site.com/tehnika-dlya-domu/brand/lg/kondicionery/

Як канонічну адресу можна вибрати будь-яку з цих, але краще вибрати перший або другий варіант, оскільки їх рівень вкладеності менший, ніж у третього. (Дослідження факторів ранжування від Backlinko показало, що короткі URL-адреси корелюють з вищими позиціями в Google).

Також дублями з точки зору пошукових систем вважаються сторінки сортування, оскільки порядок виведення вмісту не змінює сам контент сторінки:

  • site.com/kondicionery/?sort=name_desc
  • site.com/kondicionery/?sort=price_desc
  • site.com/kondicionery/?sort=new
  • і т.д.

Крім того, canonical слід використовувати в тих випадках, коли після застосування фільтрів на сайті вміст сторінки не змінюється.

Приклад: є сторінка "спліт-системи", яка містить 5 моделей. Після застосування фільтра "Площа охолодження до 30 кв. м" на сторінці залишаються ті ж 5 моделей. У цьому випадку контент не змінився, тому варто встановити canonical на батьківську сторінку.

Для сторінок з подібним контентом

Якщо у вас є схожий контент за різними адресами, також слід використовувати canonical. Наприклад, це можуть бути товари, що відрізняються лише кольором або розміром. У цьому випадку обирається одна головна сторінка, а інші встановлюються як канонічні посилання на неї. Цей метод варто застосовувати, коли за ключем "товар+колір" або "товар+розмір" немає попиту.

Для AMP-сторінок

Для сторінок, створених за технологією AMP, потрібно вказувати канонічну адресу на основну сторінку.

Приклад:

  • URL: site.com/amp/kondicionery
  • Canonical: site.com/kondicionery

Ситуації коли можна використовувати canonical

Випадки, коли canonical може бути одним із можливих вирішень технічних питань.

Для динамічних URL-адрес

На сайті можуть створюватися динамічні URL-адреси шляхом додавання різних ідентифікаторів та параметрів через фільтри, спам, переходи за рекламою тощо.

Приклади:

  • site.com/kondicionery/invertorny?color=red
  • site.com/kondicionery/invertorny?gclid=ABCD

Такі дублікати можна відсікти за допомогою canonical.

Для копій сторінок на багатомовних та мультирегіональних сайтах

Версії однієї сторінки на різних мовах вважаються копіями, якщо основний контент написаний на одній мові, а перекладені лише деякі текстові елементи. У такому випадку потрібно вказати як канонічну сторінку основну версію.

Використання rel="canonical" на сторінках пагінації

Canonical на сторінках пагінації можна встановлювати двома способами:

  • якщо існує загальна сторінка, яка містить весь вміст з усієї пагінації, то канонічний тег встановлюється на неї;
  • коли на кожній сторінці пагінації canonical вказує сам на себе.

Для окремих сторінок друку

Іноді сторінки друку формують окремі сторінки, які не мають значення для пошукових систем.

Приклади:

  • site.com/kondicionery/
  • site.com/kondicionery/buy

Встановлення canonical на батьківську сторінку допоможе уникнути дублювання.

Для об'єднання сторінок

Canonical можна використовувати для об'єднання сторінок, коли контент однаковий, а URL-адреси відрізняються:

  • префіксом www або його відсутністю: https://site.com і https://www.site.com
  • протоколами http і https: http://site.com і https://site.com
  • наявністю або відсутністю слеш в кінці URL: site.com/kondicionery/ і site.com/kondicionery

При різному написанні URL-адреси

Наприклад, коли сторінки однакові за контентом, але відрізняються лише наявністю великих літер в адресі:

Приклади:

  • site.com/kondicionery/lg/
  • site.com/kondicionery/LG/

Як вказати канонічну адресу сторінки

Існує 3 основних способи вказання канонічної сторінки.

HTML-код

Найпопулярніший спосіб – використовувати тег <link> у розділі <head> HTML-документа:

<link rel="canonical" href="посилання на канонічну сторінку" />

*Для всіх сторінок-дублікатів потрібно ставити канонічне посилання.

HTTP-заголовок

Канонізація може проводитися як для звичайних HTML-сторінок, так і для електронних документів (PDF, DOC, XLS і т.д.). Наприклад, якщо PDF-файл доступний за різними URL-адресами, то через HTTP-заголовок потрібно вказати канонічну таким чином:

Link: <посилання на канонічну сторінку>; rel="canonical"

Файл Sitemap.xml

Усі сторінки в карті сайту за замовчуванням вважаються канонічними. Тому в картах сайту не повинно бути дублікатів. Інакше пошукові боти можуть плутатися у виборі канонічної адреси. Ніяких атрибутів для вказання канонічної сторінки використовувати не потрібно.

Як правильно використовувати canonical

Правильно:

<link rel=“canonical” href=“https://site.com/kondicionery/lg/” />

Не правильно:

<link rel=“canonical” href=”site.com/kondicionery/lg/” />

Найпоширеніші помилки під час канонізації

  1. Блокування за допомогою файлу robots.txt
    Блокування неканонічних адрес у файлі robots.txt перешкоджає пошуковим роботам сканувати їх вміст. Такі сторінки не передають сигнали, навіть якщо на них встановлено атрибут rel="canonical". Якщо канонічна сторінка була заблокована в robots.txt, то замість неї у пошуковій видачі може бути копія (якщо вона відкрита для індексації).
  2. Поєднання noindex і rel="canonical"
    Коли Google бачить два URL з одного сайту, які виглядають однаково, а ви чітко повідомили про свої вподобання, Google їх намагається об'єднати і обробляти як один (сильніший) URL замість двох. Редіректи, rel=canonical, внутрішні та зовнішні посилання, файли Sitemap, hreflang, тощо демонструють пошуковій системі ваші вподобання, тому чим більш узгоджено вони застосовуються, тим швидше Google їм слідуватиме та використовуватиме для канонічної версії сторінки.
  3. Помилка в написанні канонічної адреси
    Мова йде про випадки, коли адреса канонічної сторінки вибрана правильно, але допущена помилка в її написанні. Наприклад:
    • втрачений слеш в кінці URL або, навпаки, доданий зайвий;
    • вказаний протокол http замість https або навпаки;
    • домен вказаний з www або без нього.
  4. Биті посилання
    Коли одна або декілька сторінок вказують як канонічну адресу сторінку з кодом статусу 4XX — це вважається помилкою. У цьому випадку сигнали з неканонічних сторінок не будуть передані пошуковій системі.
  5. Посилання на сторінки з редіректом
    Канонічні посилання повинні вказувати на найбільш вагому версію сторінки. Редірект же вказує на те, що потрібно враховувати іншу адресу. Через це пошукова система може невірно інтерпретувати тег або проігнорувати його зовсім.
  6. Використання rel=canonical в секції <body>
    Тег rel=canonical повинен бути розміщений в розділі <head> або в HTTP-заголовку. В секції <body> він не враховується.

Висновок

rel="canonical" – це корисний інструмент для SEO, який допомагає вирішити проблеми з дублюванням контенту і неефективним використанням краулінгового бюджету пошукових систем. Головне – це використовувати канонічні посилання з розумом та правильно налаштовувати їх, щоб досягти бажаного результату.

Ми розвиваємо ваші ідеї