迷惑なクローラ対策
自サイト、久しぶりにアクセス解析見てみたら、びっしりn@verとb@aiduの足跡が…
回数多すぎだなぁとググってみたら、robots.txtを漁ってる、らしい。
robots.txtて?
robots.txt とは?
あんたらどっから来ただー!って思ってたけど、
設置しておくべきものだったぽい…あちゃー
設置されてない場合は、404返しまくるらしい。
ほ、本当だ…404ダントツすぎる。
けど、n@iverとb@iduの2個はそんなの関係ねぇ!とばかりに、
robots.txtないっすかー?と回ってくるらしい。
快くは思わないので遮断してやろうかなと調べてたら、
断固拒否派がいたり、許可はするけどおしおきする派がいたり。
断固拒否系
Yeti/0.01 - はかいおうこうむてん
検索ロボットYeti/0.01 yetibot@naver.com がうざいのでブロック / No Time to Read
おしおき系
http://ymch.jp/blog/?mode=all&no=4214
自分は対策どうしよう。おしおき式にしようかな?w
参考用ペタペタ
robots.txt 作成から設置まで(まとめ) | CyberAgent SEO Information (サイバーエージェントSEO情報ブログ)
ルート直下に設置把握。
でも、文字コードについて触れられてるページが見つからないのだけど、
特に気にしなくていいのかな?
前の文字コードの件がトラウマで疑心暗鬼になる自分ガイル。