首页 > shell怎么多行并作一行处理?

shell怎么多行并作一行处理?

如果第1行和第2行都不以;开头,则合并这两行为新行,并继续处理新行和第3行;
如果第1行以;开头,则继续处理第2行和第3行。
以上流程仅为方便描述,只要能达到相同效果即可。
如输入为:
;a
;;b
c
d;
e;;;
;f
g
期望输出:
;a
;;b
cd;e;;;
;f
g


这种略复杂的需求,用sed/awk是可以实现,但是我觉得不推荐,这时候一般用python或者perl来做更高效。

不过为了看看我的sed功底还在不在,还是尝试了一下,目前简单测试没有发现问题,代码如下:

sed -r -n '/^;/!{h;s/.*//;x;:l $!{H;n;/^;/!b l};x;s/\n//gp;g};p'

解释几个重点的部分:
1. h;s/.*//;x;是为了清空hold space
2. :l $!{H;n;/^;/!b l};部分是一个循环,将所有的非;开头的行合并到hold space,退出条件有两个:到达最后一行或者遇到一个;开头的行
3. x;s/\n//gp;g 将hold space中的内容去掉换行符并打印出来
4. 最后p打印pattern space中的内容,用来打印;开头的行

答案还没写完,发现一个bug了: 如果文件的末尾有2行以上的非;开头的行,最后一行没有被合并。

修改一下原来的答案为:

sed -r -n '/^;/!{h;s/.*//;x;:l $!{H;n;/^;/!b l};/^;/!{H;g;s/\n//gp;t};x;s/\n//gp;g};p'

修改说明:
1. 跳出循环之后,判断当前行如果不是;开头(根据之前的跳出条件可知,这是最后一行),将当前行加入hold space,然后处理hold space的内容

看吧,一个其实也不是很复杂的需求,用sed来写,命令越写越长,1个月后还能一眼看懂么?这类需求还是不要用sed来做了吧


awk版本

awk '$0 !~ /^;/{a=a$0;}/^;/{print a?a"\n"$0:$0;a=""}END{if(a)print a}' urfile

再附加一个sed的

sed -n '/^;/{H;x;s/^\n//g;p;s/.*//g;x;};/^;/!{H;x;s/\n//g;x};${/^;/!p}' urfile

首先: 将换行符去掉,/\n//g
然后: 判断字母序列右侧是否有数字,有则在右侧添加换行符/([a-z]+)(?=[0-9]+)/\1\/n/g
判断字母序列左侧是否有数字,有则在左侧添加换行符/([a-z]+)(?<=[0-9]+)/\/n\1/g
最后: 将上面正则表达式用sed或者awk实现。


答案

awk '!/^;/{a=a$0}/^;/{if(a!="")print a;print $0;a="";}END{if(a!="")print a;}'

解释

awk语法 test1{statements1}test2{statements2}...

针对每一行,如果满足test1,则执行statement1,如果满足test2,则执行statement2 ...

所以分3部分:

【热门文章】
【热门文章】