当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 3 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 使用wget然后输出到管道,出现断开的管道错误
帖子发表于 : 2016-02-19 14:04 

注册: 2016-02-19 13:55
帖子: 3
系统: ubuntu
送出感谢: 0 次
接收感谢: 0 次
其中url为“http://www.51ztzj.com/zt/xqxzt/”等类似网址,目的是为了将该页面中的所有图片链接下载。
wget -e robots=off -O- -i url | grep -o -E "<[img|IMG].*src=[\'|\"](.*(\.gif|\.jpg))[\'|\"].*[\/]?>" | sed -r 's/.*"(.+)".*/\1/'

运行之后显示如下:
egao@T420:~/下载$ wget -e robots=off -O- -i url | grep -o -E "<[img|IMG].*src=[\'|\"](.*(\.gif|\.jpg))[\'|\"].*[\/]?>" | sed -r 's/.*"(.+)".*/\1/'
--2016-02-19 13:55:50-- http://www.51ztzj.com/zt/xqxzt/
正在解析主机 www.51ztzj.com (www.51ztzj.com)... 121.9.213.244
正在连接 www.51ztzj.com (www.51ztzj.com)|121.9.213.244|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度: 39736 (39K) [text/html]
正在保存至: “STDOUT”

- 0%[ ] 0 --.-KB/s 匹配到二进制文件 (标准输入)
- 10%[=> ] 4.01K --.-KB/s 用时 0.04s


无法写入 “-” (断开的管道)。


为什么会出现断开的管道?我如果从另外的网站如“www.egaoing.com"就不会出现问题,大部分网站都会出现这个错误?


求大神解惑????


附件:
2016-02-19 14-01-41屏幕截图.png
2016-02-19 14-01-41屏幕截图.png [ 98.76 KiB | 被浏览 1123 次 ]

页首
 用户资料  
 
2 楼 
 文章标题 : Re: 使用wget然后输出到管道,出现断开的管道错误
帖子发表于 : 2016-02-21 15:37 

注册: 2016-02-19 13:55
帖子: 3
系统: ubuntu
送出感谢: 0 次
接收感谢: 0 次
自己解决。。。。。部分网站编码不一样的问题。。。


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 使用wget然后输出到管道,出现断开的管道错误
帖子发表于 : 2016-03-07 21:21 
头像

注册: 2009-04-11 23:46
帖子: 4130
系统: Arch Linux
送出感谢: 11
接收感谢: 124
grep 发现是二进制文件,默认只报告是否匹配,所以匹配到了就关掉了输入文件而已。


_________________
我的博客 https://blog.lilydjwg.me/
提问的智慧
Arch Linux 中文论坛

我的vimrc: https://git.io/vimrc


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 3 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 2 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译