迷惑なクローラ対策

自サイト、久しぶりにアクセス解析見てみたら、びっしりn@verとb@aiduの足跡が…



回数多すぎだなぁとググってみたら、robots.txtを漁ってる、らしい。


robots.txtて?
robots.txt とは?
あんたらどっから来ただー!って思ってたけど、
設置しておくべきものだったぽい…あちゃー


設置されてない場合は、404返しまくるらしい。
ほ、本当だ…404ダントツすぎる。


けど、n@iverとb@iduの2個はそんなの関係ねぇ!とばかりに、
robots.txtないっすかー?と回ってくるらしい。


快くは思わないので遮断してやろうかなと調べてたら、
断固拒否派がいたり、許可はするけどおしおきする派がいたり。


断固拒否系
Yeti/0.01 - はかいおうこうむてん
検索ロボットYeti/0.01 yetibot@naver.com がうざいのでブロック / No Time to Read
おしおき系
http://ymch.jp/blog/?mode=all&no=4214


自分は対策どうしよう。おしおき式にしようかな?w
参考用ペタペタ
robots.txt 作成から設置まで(まとめ) | CyberAgent SEO Information (サイバーエージェントSEO情報ブログ)


ルート直下に設置把握。
でも、文字コードについて触れられてるページが見つからないのだけど、
特に気にしなくていいのかな?
前の文字コードの件がトラウマで疑心暗鬼になる自分ガイル。