おれが使うシェル操作まとめその2
前回の続き
ここの続き。
id:seiunsky:20081029:1225298769
sort と uniq -c で出現頻度を計算する
よくパフォーマンス測定でログから処理性能を導きだすのに使う。
uniq -c で回数をカウントできるのだけど、連続したデータじゃないと別々のデータとして入力されてしまうので uniq する前に sort してあげないといけないのです。
下記の例では apache の access ログから awk でHTTPの応答コード部分を抜き出して、その出現頻度を計算している。
tail -10 access_log | awk '{print $9}' | sort | uniq -c
出力結果
2 200
7 207
1 401
この方法を使って
例えば一時間あたりのログ等を抜き出して、そこから計測したい値をカウントすれば一時間あたりに何回処理できたか? 等がわかりますね。