Kopya İçerik Problemi Nedir? Nasıl Başa Çıkılır?

Google gibi büyük arama motorlarının bir problemi var. Kopya içerik. Yinelenen içerik, benzer yazıların web’deki birden fazla yerde (URL) gösterildiği anlamına gelmektedir. Sonuç olarak, arama motorları arama sonuçlarında hangi URL’nin gösterileceğine karar vermekte zorlanıyorlar. Google temsilcileri kopya içerik ile ilgili kafa karışıklıklarını gidermeye çalışsalar da, hala akılları kurcalayan problemler mevcut. Bu yazımızda size kopya içerik ile ilgili detaylı bilgi veriyoruz.

Kopya İçerik Nedir?

Kopya içeriği farklı yönleri gösteren tabelalar kullanarak aynı sayfaya eriştiren bir kavşağa benzetebiliriz. Kullanıcı açısından hangi sayfaya erişildiğinin çok büyük bir önemi yok. Bilgiye erişmesi yeterli. Ancak arama motoru hangi sayfayı kullanıcılara göstereceğine karar vermek zorunda.

kopya içerik problemi nasıl anlaşılır?

Örnek üzerinden gidecek olursak, içeriğiniz x keyword’ü ile ilgili olsun. Bu içerik ise http://www.example.com/keyword-x/ ve http://www.example.com/article-category/keyword-x/ sayfalarında yayınlanıyor olsun. Bu duruma pek çok modern CMS üzerinde karşılaşılıyor. Sorun, bu sayfalar başka web siteleri tarafından link almaya başlayınca başlıyor. Çünkü gelen bu linkler farklı URL’leri destekliyor. Halbuki bu içeriği tek bir URL altında yayınlasaydınız, o URL’in arama sonuçlarında gözükme şansı çoğalacaktı.

Kopya İçerik Hangi Durumlarda Oluşur?

Yinelenen içeriğe neden olan onlarca sebep var. Çoğu teknik hatalardan dolayı meydana gelmektedir. Bir insanın aynı içeriği kaynak ayırt etmeden iki farklı yere koymaya karar vermesi pek sık görülen bir durum değildir. İster istemez biraz mantıklı düşününce kulağa saçma gelecektir. Çoğunlukla, web developerlar bir tarayıcı ya da kullanıcı olarak konuya yaklaşmıyorlar. Bu sebeple hatalar meydana gelebiliyor. http://www.example.com/keyword-x/ ve http://www.example.com/article-category/keyword-x/ adresinde yayında olan makale, yazılımcıya  sorarsanız, yalnızca bir kez var olduğunu söyleyecektir. Aşağıda kopya içerik problemi yaratan bazı durumları görebilirsiniz.

URL kavramının yanlış anlaşılması

Muhtemelen web sitenizin bir veritabanı bulunuyordur. Bu veritabanında yalnızca bir makale var, web sitesinin yazılımı veritabanındaki aynı makalenin birkaç URL’den alınmasına izin veriyor. Bunun nedeni, geliştiricinin gözünde, o makalenin özgünlük tanımının, makalenin URL’de değil veritabanında yer alan ID’si olmasıdır. Ancak arama motoru için URL, herhangi bir içeriğin özgünlük tanımlayıcısıdır. Bunu bir yazılımcınıza açıklarsanız, sorunu çözmeye başlayacaktır.

Session ID’leri

Çoğu zaman kullanıcılarınızın sitenizdeki hareketlerini en detaylı şekilde takip etmeye çalışırsınız. Bunu yapabilmek için “session” kulanılır. Bir oturum, ziyaretçinin sitenizde yaptığı işlemlerin kısa bir geçmişi ve alışveriş sepetindeki öğeler gibi detaylar içerebilir. Bir oturumu ziyaretçinin bir sayfadan diğerine tıklamasıyla bu oturumu korumak için, söz konusu Session ID adı verilen oturumun benzersiz tanımlayıcısı bir yere depolanmalıdır. En yaygın çözüm çerezlerle yapmaktır. Bununla birlikte, arama motorları genellikle çerezleri saklamazlar. Bu noktada, bazı sistemler URL’lerdeki session ID’leri kullanıyor. Bu, web sitesindeki her dahili bağlantının URL’ye bu Oturum Kimliğini eklediği ve bu Oturum Kimliğinin o oturuma özgü olduğu yeni bir URL oluşturduğu ve dolayısıyla içerik kopyalanacağı anlamına gelir.

İzleme ve sıralama için kullanılan URL parametreleri

Yinelenen içerik için başka bir neden, bir sayfanın içeriğini değiştirmeyen URL parametrelerinin kullanılmasıdır. Görebileceğiniz üzere, http://www.example.com/keyword-x/ ve http://www.example.com/keyword-x/?source=rss bir arama motoru için aynı URL değil. Bu, tabii ki izleme parametreleri için geçerli değildir. Bu, önemli bir içeriği değiştirmeyen bir URL’ye ekleyebileceğiniz her parametre için geçerlidir.

Print Sayfaları

İçerik yönetim sisteminiz yazıcı dostu sayfalar oluşturuyorsa ve makale sayfalarınızdan bağlantı veriyorsanız, Google bunları bulacaktır. Şimdi, hangi URL Google’da gösterilmeli? Makalenin kendi URL’i mi? Yoksa print sayfasının URL’i mi?

“WWW” ve “/”

http://example.com/ ve http://www.example.com/ farklı URL’ler ve aynı sayfaları gösteriyor değil mi? Kendi siteniz içinde aynı deneyi yapıp kontrol edin. Aynı durum http://www.example.com ve http://www.example.com/ URL’leri içinde geçerli.

Yukarıda bahsettiğimiz problemlerin üstesinden gelebilmek için aksiyon almalı ve aynı zamanda canonical kullanmaya başlamalısınız.

 

Kategori:

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir