当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 10 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-04 16:01 

注册: 2010-07-29 13:53
帖子: 4
送出感谢: 0 次
接收感谢: 0 次
例如,文本如下:

代码:
<a href="www.baidu.com"></a><a href="www.google.com"></a><a href="forum.ubuntu.org.cn"></a>


我希望用sed只将其中的url提取出来,结果如下:
代码:
www.baidu.com
www.google.com
forum.ubuntu.org.cn


请问应该如何解决?


页首
 用户资料  
 
2 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-04 17:33 
头像

注册: 2009-04-11 23:46
帖子: 4130
系统: Arch Linux
送出感谢: 11
接收感谢: 124
提取文本用 grep。
代码:
grep -oP '(?<=href=")[^"]+'


PS: 这样的 URL 只有域名,没有协议(scheme),是会出问题的。


_________________
我的博客 https://blog.lilydjwg.me/
提问的智慧
Arch Linux 中文论坛

我的vimrc: https://git.io/vimrc


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-05 17:27 
头像

注册: 2011-05-14 15:53
帖子: 37
送出感谢: 0 次
接收感谢: 0 次
2楼能否解释下这条语句的意思阿?是在看不懂 :em06


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-05 17:30 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 274
看2天正则。就都明白了。

正则无处不在。


_________________
● 鸣学


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-05 23:00 

注册: 2009-07-01 22:04
帖子: 919
送出感谢: 0 次
接收感谢: 13
不是非perl不可:
kose5@kose5-Aspire-4552:~$ echo '<a href="www.baidu.com"></a><a href="www.google.com"></a><a href="forum.ubuntu.org.cn"></a>' |grep -o '="[^"]*"'|tr -d '="'
www.baidu.com
www.google.com
forum.ubuntu.org.cn


_________________
bash不如perl精妙,学不到lisp的皮毛,远不够c++强悍,不过可以用。


页首
 用户资料  
 
6 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-05 23:26 
头像

注册: 2009-04-11 23:46
帖子: 4130
系统: Arch Linux
送出感谢: 11
接收感谢: 124
fnan 写道:
不是非perl不可:
kose5@kose5-Aspire-4552:~$ echo '<a href="www.baidu.com"></a><a href="www.google.com"></a><a href="forum.ubuntu.org.cn"></a>' |grep -o '="[^"]*"'|tr -d '="'
http://www.baidu.com
http://www.google.com
forum.ubuntu.org.cn


我只是比较习惯 PCRE 而已。而且,能少用个进程就少用点。


_________________
我的博客 https://blog.lilydjwg.me/
提问的智慧
Arch Linux 中文论坛

我的vimrc: https://git.io/vimrc


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-07 11:33 

注册: 2009-07-01 22:04
帖子: 919
送出感谢: 0 次
接收感谢: 13
少用个进程,真还得用sed:
kose5@kose5-Aspire-4552:~$ echo '<a href="www.baidu.com"></a><a href="www.google.com"></a><a href="forum.ubuntu.org.cn"></a>' |sed 's/[^"]*="\([^"]*\)"[^"]*/\1/g;s/"/\n/g'
www.baidu.com
www.google.com
forum.ubuntu.org.cn


_________________
bash不如perl精妙,学不到lisp的皮毛,远不够c++强悍,不过可以用。


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-07 13:40 
头像

注册: 2009-04-11 23:46
帖子: 4130
系统: Arch Linux
送出感谢: 11
接收感谢: 124
fnan 写道:
少用个进程,真还得用sed:


谁说的?awk 也可以做到的。


_________________
我的博客 https://blog.lilydjwg.me/
提问的智慧
Arch Linux 中文论坛

我的vimrc: https://git.io/vimrc


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-07 23:09 

注册: 2009-07-01 22:04
帖子: 919
送出感谢: 0 次
接收感谢: 13
实际上,awk几乎可以做任何事:
kose3@kose3-desktop:~$ echo '<a href="www.baidu.com"></a><a href="www.google.com"></a><a href="forum.ubuntu.org.cn"></a>' |awk -F'"' '{i = 1; while (i <= NF) {if ($i ~/=$/) print $(i+1);i++}}'
www.baidu.com
www.google.com
forum.ubuntu.org.cn


_________________
bash不如perl精妙,学不到lisp的皮毛,远不够c++强悍,不过可以用。


页首
 用户资料  
 
10 楼 
 文章标题 : Re: 如何使用sed提取一行中的多个匹配项
帖子发表于 : 2011-06-12 11:52 
头像

注册: 2010-02-21 16:19
帖子: 434
地址: 大连
送出感谢: 1
接收感谢: 2
围观各种脚本帝。


_________________
大连Linux User Group: http://groups.google.com/group/dalian-lug?hl=zh-CN


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 10 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译