当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 4 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : awk正则表达式中的空白字符
帖子发表于 : 2011-04-30 20:27 

注册: 2009-07-02 19:11
帖子: 64
送出感谢: 0 次
接收感谢: 0 次
查找一行中的纯数字行(可以包括空格)
cat a

1 2 x
a b 1 2 f
2 3 4
23
上面 的空白全是空格
用grep '^\s*\([0-9]\s*\)*$' a,输出
2 3 4
23
结果正确
用awk '/^\s*([0-9]\s*)*$/' a,输出
23
漏掉了 2 3 4
用awk '/^ *([0-9] *)*$/' a (把\s用空格换掉)
输出

2 3 4
23
结果正确。
这是什么原因?难道在awk中\s不是表示所有的空白字符吗?


页首
 用户资料  
 
2 楼 
 文章标题 : Re: awk正则表达式中的空白字符
帖子发表于 : 2011-04-30 22:11 

注册: 2008-05-24 8:30
帖子: 1453
送出感谢: 2
接收感谢: 30
好像不认 \s 吧,从 manpage 中没有找到,但是肯定是认 [:space:] 的。
代码:
awk '/^[[:digit:][:space:]]+$/' a


页首
 用户资料  
 
3 楼 
 文章标题 : Re: awk正则表达式中的空白字符
帖子发表于 : 2011-05-03 12:59 

注册: 2007-07-01 17:36
帖子: 229
地址: (En):address
系统: (En):System
送出感谢: 2
接收感谢: 3
awk 使用 ERE, ERE里没有\s \S
不知道你grep是不是alias,如果就是默认的grep,它是使用BRE, 你可以试试grep -E ,让它使用ERE,输出也应该不正确。
sed也是一样,默认使用BRE,
sed -n '/^\s*\([0-9]\s*\)*$/p' t.txt
应该输出正确。
但是如果你使用ERE: sed -nr '/^\s*\([0-9]\s*\)*$/p' t.txt 输出又该不正确了。

我没测试,你自己试试。


_________________
---
regards,

Kent


页首
 用户资料  
 
4 楼 
 文章标题 : Re: awk正则表达式中的空白字符
帖子发表于 : 2011-05-03 16:56 

注册: 2009-07-02 19:11
帖子: 64
送出感谢: 0 次
接收感谢: 0 次
我的grep
alias grep='grep --color=auto'


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 4 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译