Technical: 2004年11月アーカイブ
IISのアクセスログを解析する作業をすることになりました。
Apacheのログであれば、当然、さまざまなツールがあるだろうと思っていましたが、IISのログとなるとフォーマットが一般的なものと異なるかもしれないので、解析用のソフトを探しました。その結果、ログのフォーマットを指定することができるanalogというツールを使うことにしました。
analogの作者は分かりませんが、長い間普及しているソフトウェアのようです。
調べてみると、IISのアクセスログはいくつかのフォーマットの中から指定することができることが分かりました。
すでに稼働していたWebサーバでIISの設定も変えたくなかったので現在のログフォーマットで解析させることにしました。運悪く(?)、標準的なフォーマットではなくカンマ区切りの変な項目順のデータでした。
ドキュメントで調べたところ、カスタマイズ例としてそのフォーマットに対応する方法が書かれていました。問題なく使えました。
既存のログは日別にファイルが分かれており、それを月別に集計するのが目標でした。analogはそんなことも簡単にできるようになっていました。ただ、一ヶ所に蓄積されている日別のログファイルから各月の解析結果を一度に出力する(かつ解析済みのときは上書きしない)方法は分かりませんでした。同じディレクトリへ出力しようとすると、解析結果として出力される画像ファイル(PNG)のファイル名がかぶってしまうのを回避する方法が必要となります。
結局、設定ファイルの対象期間・出力先の項目を書き換えて、一月分ずつの解析を行い、
http://xxx.xxx.xxx/accesslog/200405/
http://xxx.xxx.xxx/accesslog/200406/
http://xxx.xxx.xxx/accesslog/200407/
http://xxx.xxx.xxx/accesslog/200408/
http://xxx.xxx.xxx/accesslog/200409/
http://xxx.xxx.xxx/accesslog/200410/
といった各ディレクトリへ出力させました。
analogの使い方を覚えられたので、ちょっと満足。
