ITPub博客

使用AWK规整KyLin日志改进

原创 作者:壹頁書 时间:2018-06-27 18:43:15 0 删除 编辑

在前文的基础上,增加了改进。
主要是细节格式的调整.
处理100M数据用时7s

http://blog.itpub.net/29254281/viewspace-2156713/

 time awk '
    function ltrim(s) { sub(/^[ \t\r\n]+/, "", s); return s }
    function rtrim(s) { sub(/[ \t\r\n]+$/, "", s); return s }
    function trim(s) { return rtrim(ltrim(s)); }
    /^Query Id:/{split($0,rowdata,":");} 
    /^SQL:/{s=trim($0);next;}   
    /^User:/{print "19700101 000000000 INFO  [Query "trim(rowdata[2])" "s;s="";print $0;}
    /^==========================/{delete rowdata;} 
    {
        if(rowdata[2]!="") 
            if(s!="") s=(s" "trim($0))
            else
                print "19700101 000000000 INFO  [Query "trim(rowdata[2])" "$0;
        else gsub("[,:-]","",$1);gsub("[,:-]","",$2);$5=substr($5,0,36);print ($0);
    }
    
'  kylinbig.log | grep "\\[Query" | nl -n ln | tr "\t" " " | tr -s '  ' ' '  |  sort   -k6,6 -k1n,1   | cut -d ' ' -f 2,3,4,6-  | sed '/Using project:/{x;p;x;}'  > t1.txt








请登录后发表评论 登录
全部评论

注册时间:2013-10-19

  • 博文量
    613
  • 访问量
    5790220