常用命令

awk按指定字符切割

cat 20160524_v1_0.log | awk -F 'uid\":\"' '{print $2}'  | awk -F '\"' '{print $1}' > uid_v1.data

文件内容按行去重

cat text.file | sort -u > text.out

对文件按指定条件过滤

cat uid_v1.uniq | awk '{if(length($0)==32) print $0 }' | grep -v "=" > uid_v1.uniq2

两个文件取交集

cat file1 file2 | sort -u | uniq -d

获取当前时间的前一小时

date -d "1 hour ago" +"%Y%m%d%H"

判断文件夹是否存在,不存在则创建

if [ ! -d "$savePath" ];then
   mkdir "$savePath"
fi

判断文件是否存在

if [ ! -f "$savefile" ];then

变量值减一

hour=3
hour2=`expr $hour - 1`

zip解压

gunzip -c *.gz > output.data

获取文件大小

ls -l $localFilePath | awk '{ print $5 }'

获取hadoop中的某个文件大小

return_str="`hadoop fs -dus $uploadFilePath`"
hdpsize=`echo $return_str | cut -d \  -f 2`

大小比较

-eq             //等于
-ne             //不等于
-gt             //大于
-lt             //小于
-ge            //大于等于
-le            //小于等于

分组求和

awk '{a[$1]+=$2;b[$1]+=$3}END{for(i in a)print i,a[i],b[i]}' msg.3

results matching ""

    No results matching ""