Съдържанието е това, заради което обикновеният потребител посещава сайта ви. И ако за него е напълно нормално да прочете едно и също нещо в различни сайтове (или поне не му прави толкова силно впечатление), то за търсачките и в частност Google, дублираното съдържание може да бъде сериозен проблем.
Защо Google не харесва дублирано съдържание?
Както неведнъж са споменавали от компанията, тяхната цел е да предоставят възможно най-полезните за своите потребители резултати. От тази гледна точка, водещо за всеки собственик на уебсайт трябва да бъде предоставянето на качествено съдържание. Един от факторите, по които Google преценяват доколко дадена статия е полезна, е нейната уникалност. Тук е добре да направя едно уточнение – в каква степен ще удовлетвори нуждите на потребителя, спрямо други статии на същата или подобна тематика. И наистина, какъв е смисъла на първа страница да се появяват еднакви или почти еднакви резултати?
Причини за засичането на дублирано съдържание
Съществуват две основни групи от причини за появата на еднакво съдържание на различни url адреси: в и извън сайта. Ето и най-често срещаните:
- Дублирано съдържание извън сайта.
Без значение дали вие сте копирали статия от друг сайт или друг уебмастър го е направил, тя автоматично става неуникална и това може да навреди на доброто и позициониране в търсачката.
В първия случай, от вас зависи дали на сайта ви ще има копирано съдържание. От една страна, ако го правите без съгласието на отсрещната страна, или без да предоставите дължимия линк или споменаване на източника, може да нарушите авторско право. Дори да имате разрешението, проблемите не спират до тук – статията може да бъде наистина полезна за потребителите, но търсачката е възможно да прецени друго. Ако идеята ви е просто да предоставите интересна и полезна информация на редовните си посетители, като в същото време не искате черни точки пред Google, има лесно решение.
Използването на canonical таг ще сигнализира търсачката, че съдържанието на съответната страница е копирано, вие сте наясно с това и цялата тежест на линковете към нея трябва да бъдат пренасочени към първоизточника. Ето и самия код:
<link rel=“canonical“ href=“http://example.com/kopirano-sadarjanie.html“/>
Малко по-сложно стоят нещата, когато други сайтове копират ваше съдържание, и то без разрешение. Често се случва това да навреди на сайта ви, но какво можете да направите?
- Да се свържете с администратора на въпросния сайт и да изисквате обратен линк, позоваване на източника или просто да бъде свалено съдържанието
- При отказ, нямате много варианти, но един от тях е да докладвате дублирано съдържание тук. Все пак трябва много сериозно да се замислите дали си струва подобен ход. Прочетете внимателно какви са изискванията на търсачката да бъде премахнато въпросното съдържание от индекса им.
Моят съвет е да публикувате редовно свежо и уникално съдържание, това ще бъде сигнал за Google, че дори някой да копира от вас, това няма да навреди на позициите ви, нито рискувате наказание по чужда вина.
- Дублирано съдържание в сайта
- domain.com и www.domain.com. За търсачката това са два отделни сайта и съответно трябва да избира кое съдържание да класира в индекса и кое не. За да избегнете подобен конфликт, просто използвайте canonical или 301 редирект. Освен това, в Google Webmaster Tools можете да изберете опция за предпочитан домейн. Отидете в „Настройки” – „Настройки на сайта” и изберете домейн.
- Автоматично генерирано дублирано съдържание – причините могат да бъдат много, в зависимост от системата, която използвате. Пример за това са архивни страници в блогове, url параметри, версии за принтиране, етикети, филтри и много други. Разберете повече за това, как точно работи системата, като най-важното е съдържанието, което искате да се индексира и съответно класира в търсачката, да съществува на един-единствен url-адрес. За всички автоматично генерирани url-и, където отново се появява въпросното съдържаие, използвайте 301 редирект или rel=”canonical”. Другият вариант е да блокирате индексирането на дублираните страници с noindex таг или през забранителна команда в robots.txt. Редно е да спомена, че търсачката „не препоръчва” забрана за индексация на страниците с дублирано съдържание. Причината е, че ботовете няма да могат да разберат, че няколко url-адреса са с едно и също съдържание и съответно ще ги разпознават като няколко различни страници .
Заключение
Дублираното съдържание може да бъде една от причините за наказание от Google, особено при Panda ъпдейт. За да избегнете евентуални проблеми, уверете се, че съдържанието ви се индексира на един-единствен url адрес. Темата е наистина обширна, и ще ви се наложи да търсите допълнителна информация за особеностите на вашия CMS. Най-лесно можете да решите проблема с автоматично генерираното съдържание чрез използването на подходящи плъгини и модули.
Февр.