Nincs kategorizálva
Júl 11, 12
Weboriginal
No Comments
Duplikált tartalom a Panda világában 2.

Duplikált tartalom a Panda világában 2.

Duplikált tartalom a Panda világában sorozatunk előző részében főleg azt tárgyaltuk ki, hogy mi is a duplikált tartalom ? Mit tekint a Google duplikált tartalomnak, és hogyan változott az évek során a Goolge hozzáállása a duplikált tartalommal kapcsolatban? Most ebben  a cikkben nézzük meg milyen típusai vannak a duplikált tartalomnak és milyen eszközökkel tudjuk megszüntetni?

3. Milyen fajtái vannak a duplikált tartalomnak?

Mielőtt  azokkal az eszközökkel foglalkoznánk amivel meg lehet szüntetni a duplikációt, nézzük meg valójábann milyen fajtái léteznek a duplikált tartalomnak?  Alapvetően 3  kategóriába lehet sorolni a duplikációt. Ezek a következők:

  • Teljes duplikáció
  • Részleges duplikáció
  • Cross-domain duplikáció

(1) Teljes duplikáció

Teljes duplikáció az amikor kettő vagy több oldal  tartalma 100%-ban megegyezik, az egyetlen különbség az oldal URL-jében található

Dupe Content

(2)Részleges duplikáció

Részleges duplikáció esetéről akkor beszélhetünk ha egy vagy több oldalon a szöveges tartalom nagyon kis mértékben tér el egymástól. Szövegek akár másik blokkokban is lehetnek, vagy más sorrendben, vagy nem azonosak a képek az oldalon

Dupe Content

Ezt a fajta duplikációt már nehezebb megállapítani,mint a teljes duplikációt.

(3) Cross-domain duplikáció

Cross-domain duplikációról akkor beszélünk amikor két vagy több weboldalon azonos szöveget találunk.

Dupe Content

Ebben az esetben  teljes vagy részleges duplikációról is beszélhetünk. Sokan azt gondolják, hogy ez nem olyan nagy probléma, de ebben az esetben felvetődik a törvényesség kérdése is. Jogosan másolta le valaki más a mi weboldalunk szövegét?

4, Hogyan és milyen eszközökkel szüntessük meg a duplikált tartalmat?

Elöszőr lássuk a lehetőségeinket, majd  utána speciális esetekre  is kitérünk.

(1) 404 ( Not Found)

Ezzel a legkönnyebb megszüntetni a duplikált tartalmat, nincs más teendő csak törölni a másod példányt, majd az adott oldalon kapjon 404 fejlécet. Ha az eltávolított oldalnak keresőoptimalizálás szempontjából nincsen nagy értéke, vagy nem mutat rá sok link, akkor ez e legjobb megoldás a duplikált tartalom megszüntetésére.

(2) 301 Redirect

Másik lehetőség a duplikált tartalom megszüntetésére, hogy irányítsuk át az oldalt 301 Redirect irányítással. Ez  nem olyan, mint a 404-es oldal, hanem  301 azt “mondja” a felhasználók számára ( úgy az emberi felhasználók  számára, úgy a robotok számára) ez az oldalt véglegesen át van irányítva egy másik oldral.  Normál felhasználól azt fogják látni, hogy a keresett oldal helyett egy új oldal nyílik meg.  Keresőoptimalizálás szempontjából ez  nagyon jó megoldás, mert minden oldalra  mutató link is átirányításra kerül az új oldalra. Ha duplikált tartalom egyik oldala canonical linket is kapott, és a másodpéldányra mutató linkek is találhatóak  a 301 redirect a legjobb megoldás a duplikált tartalom megszüntetésére.

(3) Robots.txt

Másik lehetőség, hogy normál felhasználók számára meghagyjuk a duplikált tartalmat, de robotok számára blokkoljuk.Erre legjobb megoldásnak a robots.txt-ben történő blokkolás tűnik.

Például:

User-agent: *
Disallow: /dupe-page.htm
Disallow: /dupe-folder/

Robots.txt előnye, hogy nagyon könnyű akár url-t akár pedig teljes könyvtárakat blokkolni. Hátránya, hogy ez  néha nagyon megbizhatatlan megoldás.  A robots.txt -ben történő  blokkolás nagyon jó megoldás olyan tartalom esetében  ami még nem került be a Google indexébe, de beindexelt tartalom esetében már nem a legjobb megoldás. Ennek a módszernek a használata tehát nagyon megfontolandó.

(4) Meta Robots

Lehetséges az is, hogy a duplikált tartalmat oldal szinten próbáljuk meg  kontrolálni. A fejlécben a blokkolandó oldalba beillesztjük a No Index tagot. Ez egyszerű megoldás valahogy így kell kinéznie az  oldalnak:

<head>
<meta name=”Robots” content=”Noindex, Nofollow” />
</head>

Ezzel a megoldással tudomására hozzuk a robotoknak, hogy az adott oldalt ne indexelje és ne is kövesse az oldalon lévő linkeket. Ez  már egy kicsit keresőoptimalizálás szempontjából  jobb megoldás, mint a Robots.txt . Ebben az esetben akár dinamikusan is létre lehet hozni ez a kódot, és ez miatt a szabadságunk is jóval nagyobb.

A Meta Robots taggal más lehetőségeink is vannak, példul  “Noindex, Follow”  vagyis az oldalt a robotok az oldalt feltérképezhetik, de  a keresési indexbe ne tegyék bele.  Ez  haszonos olyan esetekben amikor az oldalak különböző variációit akarjuk “blokkolni” de  mondjuk a termék oldalakhoz vezető linkeket követik a robotok.

(5) Rel=Canonical

2009-ben kezdték el használni  a rel=Canoncical tagot. Ezzel a webmestereknek lehetősége lett arra, hogy  egyes oldalaknak canonical verzióját hozhassák létre.  Ezt a tagot a fejlécbe  lehet beilleszteni, hasonlóan  a Meta Robots taghoz.

Például így:

<head>
<link rel=”canonical” href=”http://www.example.com” />
</head>
Fontos a canonical tagot helyesen használni, mert helytelen használat esetén nagyobb hibát tudsz okozni az oldalnak, mint gondolnád

(6) Google URL törlés

Google Webmaster Tools (GWT) segítségével egyesével, kézzel is lehet törölni az indexből url-leket. Ehhez be kell lépni a Webmestet Eszközök  fiókunkba, ahol a Optimalizálás -> URL eltávolítása

url törlés

Ez legyen a legutolsó módszer a duplikált tartalom eltávolítására. Mielőtt ezt az eszközt használod próbáld ki a fenti eszközök bármelyikét, mert ez az eszköz akkor használandó, ha a Google nagyon makacskodik a kívánt oldal indexből történő eltávolítására.

(7) Google paraméterek blokkolása

Másik lehetőség szintén a Google Webmastert Tools-ban  paraméterek blokkolása. A GWT-ben a Konfiguráció -> URL paraméterek pontban érhető el

Dupe Content

Itt paramétereket adhatunk meg, amelyeket a ha a Google megtalál akkor nem indexeli. Ajánlott azért azt az opciót választani hogy ” Let Googlebot Decide”  vagyis döntse el a Google, hogy indexeli-e az adott oldalt vagy nem.

Ha a módosításra kattintasz akkor a következő opciók jelennek meg:

Dupe Content

(8) Rel=Prev & Rel=Next

2011. januárjában kaptunk egy  eszközt kezünkbe Google-tól, hogy még jobban tudjunk harcolni a duplikált tartalmak, főleg a lapozó oldalak által generált duplikáció ellen discount levitra online.

Ezzel a taggal tudjuk a Googlebot számára “elmondani”, hogy az oldal hasonló taggal van ellátva, mint a canonical, de itt a Rel & next  tagnak hívjuk és így néz ki:

Dupe Content

(9) Syndications Source

2010. novemberében Google támogatni kezdte a szindikált tagot, amit a meta elemek között található meg és azzal egy cikk forrását jelölték  ha  valaki más is publikálta az adott cikket.

Dupe Content

Google még tanácsot is adott abban az időben azzal kapcsolatban, hogy mikor ajánlott ezt  a tagot használni, főleg cross domainek esetében ajánlott használni amikor nem teljesen tisztázott, hogy ki volt az aki az adott cikket publikálta. Google ezt a tagok kísérleti jelleggel indította, hivatalosan sohasem jelent meg.

Azóta ezen tag helyett Google inkább a standout tagot javasolja inkább használatra.

(10) Belső linkek 

Ha duplikált tartalom megszüntetésre kerül, akkor fontos a megmaradt oldalakon lévő linkeket is átnézzük, mert nem elég a 301-es átirányítás megcsináltuk, hanem a linkek “végődéseit” is ellenőrizni kell.

(11) Nem csinálni semmit

Csinálhatsz úgy is, hogy nem csinálsz semmit és a feladat oroszlán részét a Google-ra bízod. Ez főleg nagy weboldalak esetében nem túl jó ötlet. Fontos azt is elmondani, hogy nem minden duplikált tartalom okoz problémát, sőt van olyan amit a Google nem vesz észre és ilyen esetekben a legjobb megoldás ha nem csinálunk semmit.

(12) Rel=”alternate” hreflang=”x”

Most áprilisban adta ki Google ezt az új tagot, amivel a nyelvi duplikációt lehet elkerülni. Teljes leírást itt lehet találni erről az új tagról, de blogunkban is lehet arról olvasni, hogyan helyezzük el sitemapban az új tagot.

Sorozatom harmadik részében konkrét példákkal fogom illusztrálni mi is tekintünk duplikált tartalomnak.

Facebook Google+ 

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöljük.