当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 3 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : [讨论]大家来看看这个文本要怎么解决!
帖子发表于 : 2008-05-14 7:23 

注册: 2008-03-22 1:19
帖子: 45
送出感谢: 0 次
接收感谢: 0 次
文件名为DATA内容如下:
A B C X1
A B C S2
A B C X3
D F T Y1
D F T S1
M N U K2
M N U K3
我想将文件处理成如下格式:
A B C 3
X1
S2
X3
D F T 2
Y1
S1
M N U 2
K2
K3
即先先将每行前面三个一样的先归类,统计出现的次数,然后在分别显示,后面的不同内容,请问这个应该怎么写SHELL。


页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-05-14 12:23 
头像

注册: 2006-04-12 20:05
帖子: 8495
地址: 杭州
送出感谢: 0 次
接收感谢: 8
代码:
$ awk '{a[$1,$2,$3]++;b[$1,$2,$3]=b[$1,$2,$3] "\n" $4} END{for(i in a){j=i;gsub(/\x1c/," ",j);print j,a[i],b[i]}}' DATA
A B C 3
X1
S2
X3
D F T 2
Y1
S1
M N U 2
K2
K3


_________________
关注我的blog: ε==3


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-05-14 13:18 
头像

注册: 2006-04-12 20:05
帖子: 8495
地址: 杭州
送出感谢: 0 次
接收感谢: 8
这样应该更优雅一点:
代码:
$ awk 'BEGIN{SUBSEP=" "}{a[$1,$2,$3]++;b[$1,$2,$3]=b[$1,$2,$3] "\n" $4}END{for(i in a)print i,a[i],b[i]}' DATA
M N U 2
K2
K3
A B C 3
X1
S2
X3
D F T 2
Y1
S1


_________________
关注我的blog: ε==3


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 3 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译