Loading
Memtor Marketing

Problem duplicate content

image title

Problem duplicate content 1Duplikat w kontekscie medium internetowego jest to treść, która pojawia się na różnych stronach, w różnych publikacjach więcej niż raz. Strony sprawdzane są przez wyszukiwarki pod względem duplicate content czyli powielanej treści i nakładany jest specjalny filtr na strony, w których został wykryty ten problem. Filtr ma na celu wykluczyć z indeksacji lub zmniejszyć widoczność tych stron. Poniżej opisujemy szerzej ten problem i zachęcamy do dzielenia się swoimi wiedzą i spostrzeżeniami.

Gdy w algorytmie wprowadzono reguły, które miały przeciwdziałać powielaniu treści oberwało się serwisom, w których nie było unikalnych tytułów, dobrej struktury strony i były oparte o gotowe cms'y. Dlatego dobrze zoptymalizowane strony miały przewagę nad stronami z wysokim Page Rank, obecnymi w sieci nawet kilka lat.

Problem duplicate content można podzielić na dwa rodzaje: występujący w obrębie jednej witryny (domeny) lub występujący na wielu domenach. Po znalezieniu dwóch stron o podobnej treści Google próbuje ustalić która z nich zawiera oryginalną treść. Najpierw odrzuca kopie, które pochodzą z farmy linków lub umieszczone są na czarnej liście adresów IP. Następnie przeprowadzana jest analiza pozostałych kopii biorąc pod uwagę PageRank, linki przychodzące czy autorytet poszczególnych witryn. Po analizie jakości i czasu indeksacji strony wyszukiwarka decyduje o tym, która publikacja to oryginał. Jeśli strona uznana zostanie za kopię strony z innej domeny to straci widoczność na pewne frazy i trudniej jej będzie osiągnąć wysokie miejsca w wynikach wyszukiwania a nawet może zostać wykluczona z indeksacji i nie będzie się już pojawiała w wynikach wyszukiwania. Jeśli natomiast strona jest kopią strony z tej samej domeny to nie należy się tym zbytnio przejmować ponieważ Google wybiera do indeksacji tylko jedną z nich. W takim przypadku również może dojść do zmian pozycji w wynikach wyszukiwania.
Jednym z często pojawiających się problemów duplikacji treści jest strona główna którą możemy  znaleźć pod różnymi adresami np.:
strona.pl
strona.pl/index.html
www .strona.pl
www .strona.pl/index.html
i tym podobne.

Z technicznego punktu widzenia każdy ten adres URL jest unikatowy i robot indeksuje je jako kolejne podstrony. Choć Google wie że są to te same strony to jednak może to wywołać negatywne efekty. Problem ten można rozwiązać na kilka sposobów. Za pomocą narzędzia dla webmasterów, przekierowań 301 w pliku .htaccess, wykluczeń w pliku robots.txt lub dzięki użyciu rel canonical. Przekierowania 301 i atrybut rel="canonical" przenoszą wartość stron ze zduplikowaną treścią na stronę, na którą przekierowują. Problem może pojawić się również, gdy udostępniamy stronę do wydruku, umożliwiamy przeglądanie treści strony z zastosowaniem filtrów, widoków lub metod sortowania jak i gdy każdemu użytkownikowi jest przypisany inny identyfikator sesji, który jest przechowywany w adresie URL, prowadzimy drugą witrynę dla urządzeń przenośnych.

Jeśli chodzi natomiast o występowanie problemu na różnych domenach to może to być spowodowane udostępnianiem treści do przedruku lub kradzieżą treści. W pierwszym przypadku warto w umowie nałożyć na stronę przedrukowującą obowiązek umieszczania linku do oryginalnego tekstu lub blokowania publikacji przed indeksacją. W przypadku publikacji bez zgody autora zaleca się skontaktowanie z serwisem a w przypadku braku skuteczności zgłosić to do Google.

Źródła:

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=66359

http://www.seomoz.org/learn-seo/duplicate-content

http://googlewebmastercentral.blogspot.com/2008/09/demystifying-duplicate-content-penalty.html

http://www.ittechnology.us/usuwanie-duplicate-content-w-wordpress

9 thoughts on “Problem duplicate content

Pingback: Aktualizacja algorytmu Panda 4.0 – analizy i porady | BiznesNetworking.pl

  • admin

    cherrinek

    Witam, mam problem- moja strona pojawia się od niedawna jako dc. Po wpisaniu related pokazują się różne strony konkurencji ale w mojej ocenie ich treść nie jest aż tak zbliżona do mojej strony. Co mogę zrobić żeby moja strona znów pokazywała się w wyszukiwarce Google? Dodam , że od wielu lat nie miałam żadnych problemów z wyświetlaniem strony w wynikach. Czy możliwe że to działania konkurencji sprawiły ze się zakwalifikowalam jako dc? Pozdrawiam

    Odpowiedz
    • admin

      Bartosz Sobczyk

      ich treść nie jest aż tak zbliżona do mojej strony

      Rozwiń to stwierdzenie. Jeśli treść jest identyczna lub zsynonimizowana to mogłaś dostać filtra od Google. Powodów za które można dostać filtr jest wiele. Jeśli jesteś przekonana że strona poleciała z wyników wyszukiwania przez zbliżoną treść to proponuje zmienić treści na stronie.

      Odpowiedz
    • admin

      Redakcja

      Odświerzenie treści, rewitalizacja jest jak najbardziej wskazana i przy okazji można odróznić sie od podobnych treści. Warto też przyjrzeć się adresom (klasom) IP, czy podobne treści nie pojawiają się na tych samych serwerach. A tutaj grafika obrazująca sytuację przejęcia wartości innej strony pomimo tego że oryginalna była tą pierwszą: PageRank Copy

      Więcej na ten temat w artykule: dejanseo.com.au/hijack/

      Odpowiedz
  • admin

    Kotek Ulotek

    Mam domenę i kilka subdomen z tłumaczeniami na inne języki, m. in. angielski. Na angielskiej subdomenie mam powielone pewne podstrony z domeny głównej, gdyż jeszcze ich nie zdążyłem przetłumaczyć. Pozycjoner przestrzegał mnie, że mogę dostać filtr od google za to. Czy to prawda? Artykuł przeczy temu założeniu, ale może są jakieś wyjątki bądź isnieje ryzyko najazdu nowej Pandy lub Pingwina? Co jakiś czas tłumaczę którąś z podstron, lecz trwa to już około roku i nie widzę problemu ze strony google, choć rzeczywiście pozostałe języki zostały uzupełnione, gdyż początkowo ta sama treść była powielona 5 razy, tj. też w niemieckiej, francuskiej, chorwackiej i rosyjskiej wersji językowej serwisu.

    Odpowiedz
    • admin

      Bartosz Sobczyk

      Odpowiedz na to pytanie była podana w artykule:

      Jeśli strona uznana zostanie za kopię strony z innej domeny to straci widoczność na pewne frazy i trudniej jej będzie osiągnąć wysokie miejsca w wynikach wyszukiwania a nawet może zostać wykluczona z indeksacji i nie będzie się już pojawiała w wynikach wyszukiwania.

      Rozwiązaniem problemu może być między innymi wyłączenie z indeksacji jeszcze nie przetłumaczonych dokumentów.

      Odpowiedz
  • admin

    Andrzej

    Co dokładnie powinienem zrobić, jeśli znalazłem u kogoś artykuł napisany przeze mnie albo moje zdjęcia, ale bez wskazania autora, bez podlinkowania do mojej strony albo nawet wręcz z podpisem, że ktoś inny jest ich twórcą?

    Odpowiedz
    • admin

      Bartosz Sobczyk

      Często wystarczy wysłać wiadomość, pogrozić sądem i zażądać odszkodowania aby nasze teksty i zdjęcia zostały usunięte ze strony na której zostały bezprawnie zamieszczone. Jednak gdy to nie poskutkuje można wystąpić na drogę sądową w postępowaniu cywilnym. Prowadzenie takiej sprawy nie powinno być drogie, a pismo wysłane z kancelarii może dać do myślenia i możemy osiągnąć zamierzony efekt. Jeśli skradzione zostały zdjęcia i mamy na to dowody np. oryginalne zdjęcia z aparatu to pomocna będzie strona: https://www.google.com/webmasters/tools/dmca-dashboard?hl=en&pli=1 Google powinno usunąć domenę, publikującą kradzione zdjęcia, z wyszukiwarki.

      Odpowiedz

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *