ApacheLogViewer:検索ロボットからのアクセスを表示しない方法

ApacheLogViewer で検索ロボットなどの人以外からのアクセスを表示しないようにする方法をメモっておく。

Apache のアクセスログには、http経由でのリクエストが全て含まれている。この中には、Googleなどの検索ロボットからのアクセスも含まれる。このような検索ロボットなどからのアクセスは、アクセス解析時には不要であり、除外して集計したいものだ。

これを実現するには、以下の手順に従い、設定を行えばよい。

  1. ApacheLogViewer 起動画面の下部にある「Setting」 ボタンを押す
  2. プライベートとみなすIPアドレス」タブを選択する
  3. 検索ロボットのIPアドレスまたはホスト名を追加して、「OK」ボタンを押す
  4. プライベートとみなすIPアドレス
  5. Statistics」ボタンを押して、解析画面を表示する
  6. 画面上部の日付の横にある項目から「Global」を選択する
  7. Global

以上の設定により、検索ロボットなどからのアクセスを表示しないようにできる。ちなみに、私の設定内容は、上図に示しているが、以下の通りである。

  • *.alexa.com
  • *.ask.com
  • *.attens.net
  • *.fastsearch.net
  • *.googlebot.com
  • *.inktomisearch.com
  • msnbot.msn.com

トラックバック(0)

このブログ記事に対するトラックバックURL: http://itsmemo.com/mt/mt-tb.cgi/38

※スパム防止のため、管理人がトラックバック内容確認後、公開されます。

コメント(6)

maro :

はじめまして。
記事の内容と同等の事を行おうと思っておりまして設定を行ったのですが、どうも上手くフィルタリングができない状況です。

上記記事の内容以外でも設定しなければならない項目などがあるのでしょうか。。

お分かりでしたら教えていただければ嬉しいです。
宜しくお願い致します。

管理人 itsmemo :

>maro
コメントありがとうございます。
当サイト管理人のitsmemoです。

ご質問の件ですが、私の場合、上記の設定でうまくフィルタリングできています。

上記の手順で設定を行って、これまでと全く状況が変わらないのでしょうか。(全くフィルタリングできていない or 一部はフィルタリングできている?)

maro :

itsmemo様
ご返答ありがとうございます。

フィルタですが、プライベートとみなすIPの部分であるIPを指定しているのですが、それはフィルタリングされているようです。
しかし「*.googlebot.com」のような指定を(ホスト名を追加)の部分で行ってもうまくフィルタリングされてくれないのです・・・

管理人 itsmemo :

>maro様
ApacheLogViewerを初期状態にして、「*.googlebot.com」の指定を行ってみましたが、うまく動作しました。なにか特別な設定があるか、いろいろ探してみましたが、再現できませんでした。。

いったん、*.iniファイルを削除して、初期状態にしてから設定してみてはいかがでしょうか。

お役に立てず、申し訳ありません。。

# ちなみに、当方は、バージョン2.9.5で動作確認しています。

maro :

itsmemo様
度々ご教授いただき感謝しております。
一旦iniファイルを削除し、初期状態から設定しなおしてみたのですが、やはりダメでした。
ホストの設定は上手くいかないのですが、IPを直接指定するとうまくいくのです・・・
バージョンもitsmemo様と同じバージョンです。
あとご質問させていただきたいのですが、「*.googlebot.com」の*というのは対象のドメインより以前にあるものを全て含むという解釈でよろしかったでしょうか。

再度こちらでも検証してみたいと思います。

itsmemo :

>maro様

ちょっと原因がわからないですね・・・

「*.googlebot.com」と指定した場合には、

crawl-66-249-64-15.googlebot.com
crawl-66-249-64-16.googlebot.com
crawl-66-249-64-54.googlebot.com

のようなアドレスがフィルタの対象となります。

お役に立てず申し訳ありません。原因がわかったら、教えて頂けるとありがたいです。

コメントする