Yandex bot blokkeren via htaccess

22 juli 2010 

Ik krijg vaker meldingen van klanten waarbij de servers langzaam worden en bijna niet reageren. Na inspectie van de logs op de server bleek steeds dezelfde spider langs te komen.

Deze spider (YandexBot) is een russische "Google". De bot gebruikt de volledige bandbreedte en houd zich niet aan de robots.txt. Ik raad iedereen aan om deze bot te blokkeren dmv een htacces wijziging. Het is niet zo netjes als via robots.txt, maar noodzakelijk wil je de site up and running houden. Na de wijziging doen de sites het weer als een zonnetje.

SetEnvIfNoCase User-Agent "^Yandex*" bad_bot
Order Deny,Allow
Deny from env=bad_bot

Je kunt ook op ip nummer blokkeren via htaccess:

SetEnvIfNoCase User-Agent "^Yandex*" bad_bot
order allow,deny
deny from 95.108
deny from 93.158
deny from 77.88
deny from 95.26
deny from 95.108
deny from 216.129
Deny from env=bad_bot
allow from all