Sunucu kaynaklarını sömüren botlar / crawler

Daha önce kendi sunucusunda yazacak arkadaşlar için önerilerde bulunmuştum, kendi sunucunda bir WordPress blogu kurarak yazmak isteyen veya yazmayı sürdürenlerin bloglarının yazı, etiket, kategori vs. çoğaldıkça ve bunun yanında ziyaretçi trafiği yükseldikçe pişmiş tavuğun başına gelmeyenler onun başına gelebiildiğini bizzat yaşamış ve yazmıştım.

Buradaki maceramda 3 faklı firması ile çalıştım, ilki Arif beyin Tescilet.net firması idi, bu firmada doğduk diyebilirim, ikincisi Dreamhost ve şu anda Seçkin Bey'in yönettiği Hostcin ile çalışıyoruz, mutluyuz.

Tecrübelerime dayanarak web sitelerinin sunucu kaynaklarını o siteye giriş yapan insanlardan çok crawler (indeksleyici) yani arama veya her neyse o şey onlara ait 'lar sömürüyor diyebilirim.
Burada bu botları engellememiz tabiki mümkün diyebilirsiniz, fakat diğer taraftan Google, Yahoo, Msn gibi arama motorlarının botlarının veya sadece bloglar ve rss akışı olan siteler özel olan botları engeller isek bu sefer blogunuz oradan gelen ziyaretçilerden mahrum kalabilir. Engellemezseniz blogunuzun bulunduğu sunucunun tüm kaynakları bu botlar tarafından sömürülüp diğer okurlara ve hatta size blogsuz bir hayat kalabiliyor, ya firmanız size "koçum bu seni kesmez daha büyük bir sunucu kirala" diyecek veya direk sizin blogunuzu veya hesabınızı kapatacaktır, o da olmadı bir diğer ihtimal siz ve ziyaretçiler dakikalarca sayfanızın açılışını beklemek zorunda kalacaksınız, çok keyifsiz bir hal alacaktır yazmak.


Sunucu kaynaklarını sömüren botlar crawler

Tüm bunları yazmamdaki neden benim gibi bu problemlerle karşılaşacak arkadaşlara faydalı olmak, benim tavsiyem Google, Yahoo ve Msn harici diğer tüm arama motoru crawler larını engellemeniz, sunucunuzda iyi bir araştırma yapın ve istatistiklerden blogunuza en çok bağlantı yapılan adreslerini kontrol edip o adreslerinin hangi firmaya veya hangi ülkeye ait olduklarını tespit edin. Örneğin adreslerini araştırdığımda bu bloga Türkiye'den çok ABD kaynaklı adreslerinin bağlandığını keşfedince çok şaşırmıştım, bu adresleri tahmin edeceğiniz gibi Feedburner, Google vb. servislere ait idi.

Ben çok fazla robot engelledim bunların arasında en berbat olanı aşağıdaki, sizde sunucunuzda bir yavaşlık hissediyorsanız hemen istatistikleri konrol edebiliyorsanız edin veya hizmeti veren firmanıza bu konuda danışın;

Twiceler crawls from the following IP addresses:
38.99.13.121 38.99.44.101 64.1.215.166 208.36.144.6
38.99.13.122 38.99.44.102 64.1.215.162 208.36.144.7
38.99.13.123 38.99.44.103 64.1.215.163 208.36.144.8
38.99.13.124 38.99.44.104 64.1.215.164 208.36.144.9
38.99.13.125 38.99.44.105 64.1.215.165 208.36.144.10
38.99.13.126 38.99.44.106

Kısacası kendi sunucunuzda yazacaksanız eğer sunucu kaynaklarını crawler lara, botlara ve kötü niyetli makinelere yedirmeyin, dikkatli olun ve her şeyi firmasına bırakmayın, çünkü onlar çalıştıkları diğer yüzlerce web sitesi gibi sizin blogunuzuda sıradan bir site gibi görecektir, pek fazla ilgilenmeyecektir, oysa sizin blogunuz size özel ve sizin için önemlidir.


Bu konuda daha fazla bilgi almak için google crawler, gürses tescilet, blog, blog ahkamlari, blog tavsiyeleri, bot, crawler, dreamhost, feedburner, google, googlebot, hostcin, hosting, ip, tescilet, tescilet.net, twiceler, web robotlari, weblog terimleri/etiketlerini ve Sunucu kaynaklarını sömüren botlar / crawler başlığını site içerisinde arayabilirsiniz. Aşağıdaki seçenekleri de kullanabilirsiniz, unutmayın bunların hepsi bedavadır.

    benzer:
  • 2008: SSH Shell komutları (putty) — Bir sunucu sahibiyseniz veya bir VPS aşağıdaki komutlar işinize yarayabilir. Ben hem kendim için bir arşiv hem de [...]
  • 2006: Oda oyunları — Developer Code Bu oyunda yine ofis tarzında bir odaya giriyoruz ve odayı araştırıp gerekli nesneleri ve [...]
  • 2006: Google Türkiye ofisi açılıyor — İnternet dünyasının en parlak yıldızı Google, yerel kullanıcı ve reklam verenleri en iyi ürün ve hizmetlerle [...]
  • 2009: Friendfeed de Türkiye’deki kullanıcı değişimi — Bizim gibi deneyimli ve eski kullanıcılar şu an popüler olan çoğu internet üzerindeki servislerin [...]
  • 2008: Google ters mi dönmüş? — Biraz önce Google da Mart ayında en çok aranan kelimelere bakıyordum. Türkiye'de en çok arananlar neymiş [...]
  • Yazının ilk görselini göstermek
  • Wordpress de hayat kurtarıcı mysql sorguları
  • Reklamları sadece eski yazılarda göstermek
  • Çok yorumlanan girdileri listelemek
  • Wordpress de benzer yazıları göstermek

etiketler: , , , , , , , , , , , , , , , ,

Sevdiysen:

Elegüne Tweetle bunu

“Sunucu kaynaklarını sömüren botlar / crawler” için 9 Yorum

  1. valla bu botlar gerçekten tehlikeli yazılımlar, bir de bazen sarhoş sarhoş dolaşanlar var onları anlamıyorum, bir yazıya defalarca istek gönderiyor ama ne spam yorum bırakıyor ne birşey en sonunda da barındırma şirketi kapatmıştı sitemi. aynı ddos saldırısı gibi ama bana kim saldırı yapmak istesin. bu arada benim sitemin kapanmasına sebep olan ip adresi 64.13.232.16
    benim trafiğimin sadece %56’sı türkiye’den, geri kalanı amerika, arabistan, israil lübnan hepsi botlar, ama senin listendekiler ben de yok. :D

  2. kıyakmış, sağol

  3. koçum bu seni kesmez daha büyük bir sunucu kirala :)
    arkadaşlar bu gün aldıgımız saldırılar sonunda birşey dikkatimi çekti sadece saldırılar sonucu tüketilen trafik 130 gb kadar dı :) adamlar saldırarak zarar veremesede band ımızı sömürüyorlar geçen gün yaptıgım ayar sonucu google botları bile serverdan banlanmıştı hatta ben bile :)
    şu robotlara bi güzellik yapacam ama biraz kafamı toparlamam lazım önce

  4. aa bak bılmıyodum anlattıgın ıyı olmus. yenı bır sıte acmayı planlarken bunları goz onunde bulundurucam. paylasım ıcın tesekkurler ;)

  5. saolasın volkan

  6. bunları nasıl tespit edebiliriz ?

  7. bu engellemeleri hangi dosyadan ya da nereden yapıyoruz?

  8. robotlar sitenize girmeden siteniz nasıl indexlenecek çok merak ediyorum.
    botların yediği bandwith den ne olacak beyler gerçekçi olun biraz ;)

  9. burda bi düzeltme yapalım; "208.36.144.7" ip adresi bot değil, cuil arama motorunun örümceği diye biliyorum.

Yorum yapın

Smile Grin Wink Razz Sad Surprised Shocked Confused Cool Mad Neutral Red Face Cry Evil Twisted Roll Exclaim Question

(?) Dreamhost %50 indirim için promosyon kodu: wolkanca