すがブロ

sugamasaoのhatenablogだよ

おれが使うシェル操作まとめその2

前回の続き

ここの続き。
id:seiunsky:20081029:1225298769

sort と uniq -c で出現頻度を計算する

よくパフォーマンス測定でログから処理性能を導きだすのに使う。
uniq -c で回数をカウントできるのだけど、連続したデータじゃないと別々のデータとして入力されてしまうので uniq する前に sort してあげないといけないのです。
下記の例では apache の access ログから awk でHTTPの応答コード部分を抜き出して、その出現頻度を計算している。

tail -10 access_log | awk '{print $9}' | sort | uniq -c  

出力結果

2 200
7 207
1 401

この方法を使って

例えば一時間あたりのログ等を抜き出して、そこから計測したい値をカウントすれば一時間あたりに何回処理できたか? 等がわかりますね。