Kategoriler
Blog

Sunucu kaynaklarını sömüren botlar / crawler

Daha önce kendi sunucusunda blog yazacak arkadaşlar için önerilerde bulunmuştum, kendi sunucunda bir WordPress blogu kurarak yazmak isteyen veya yazmayı sürdürenlerin bloglarının yazı, etiket, kategori vs. çoğaldıkça ve bunun yanında ziyaretçi trafiği yükseldikçe pişmiş tavuğun başına gelmeyenler onun başına gelebiildiğini bizzat yaşamış ve yazmıştım.

Buradaki blog maceramda 3 faklı hosting firması ile çalıştım, ilki Arif beyin Tescilet.net firması idi, bu firmada doğduk diyebilirim, ikincisi Dreamhost ve şu anda Seçkin Bey’in yönettiği Hostcin ile çalışıyoruz, mutluyuz.

Tecrübelerime dayanarak web sitelerinin sunucu kaynaklarını o siteye giriş yapan insanlardan çok crawler (indeksleyici) yani arama veya her neyse o şey onlara ait bot’lar sömürüyor diyebilirim.
Burada bu botları engellememiz tabii ki mümkün diyebilirsiniz, fakat diğer taraftan Google, Yahoo, Msn gibi arama motorlarının botlarının veya sadece bloglar ve rss akışı olan siteler özel olan botları engeller isek bu sefer blogunuz oradan gelen ziyaretçilerden mahrum kalabilir. Engellemezseniz blogunuzun bulunduğu sunucunun tüm kaynakları bu botlar tarafından sömürülüp diğer okurlara ve hatta size blogsuz bir hayat kalabiliyor, ya hosting firmanız size “koçum bu seni kesmez daha büyük bir sunucu kirala” diyecek veya direk sizin blogunuzu veya hesabınızı kapatacaktır, o da olmadı bir diğer ihtimal siz ve ziyaretçiler dakikalarca blog sayfanızın açılışını beklemek zorunda kalacaksınız, çok keyifsiz bir hal alacaktır blog yazmak.

Sunucu kaynaklarını sömüren botlar crawler

Tüm bunları yazmamdaki neden benim gibi bu problemlerle karşılaşacak arkadaşlara faydalı olmak, benim tavsiyem Google, Yahoo ve Msn harici diğer tüm arama motoru crawler larını engellemeniz, sunucunuzda iyi bir araştırma yapın ve istatistiklerden blogunuza en çok bağlantı yapılan ip adreslerini kontrol edip o ip adreslerinin hangi firmaya veya hangi ülkeye ait olduklarını tespit edin. Örneğin ip adreslerini araştırdığımda bu bloga Türkiye’den çok ABD kaynaklı ip adreslerinin bağlandığını keşfedince çok şaşırmıştım, bu ip adresleri tahmin edeceğiniz gibi Feedburner, Google vb. servislere ait idi.

Ben çok fazla robot engelledim bunların arasında en berbat olanı aşağıdaki, sizde sunucunuzda bir yavaşlık hissediyorsanız hemen istatistikleri konrol edebiliyorsanız edin veya hosting hizmeti veren firmanıza bu konuda danışın;

Twiceler crawls from the following IP addresses:
38.99.13.121 38.99.44.101 64.1.215.166 208.36.144.6
38.99.13.122 38.99.44.102 64.1.215.162 208.36.144.7
38.99.13.123 38.99.44.103 64.1.215.163 208.36.144.8
38.99.13.124 38.99.44.104 64.1.215.164 208.36.144.9
38.99.13.125 38.99.44.105 64.1.215.165 208.36.144.10
38.99.13.126 38.99.44.106

Kısacası kendi sunucunuzda blog yazacaksanız eğer sunucu kaynaklarını crawler lara, botlara ve kötü niyetli makinelere yedirmeyin, dikkatli olun ve her şeyi hosting firmasına bırakmayın, çünkü onlar çalıştıkları diğer yüzlerce web sitesi gibi sizin blogunuzuda sıradan bir site gibi görecektir, pek fazla ilgilenmeyecektir, oysa sizin blogunuz size özel ve sizin için önemlidir.