当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 2 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : [问题]python 提取网页内容
帖子发表于 : 2008-09-10 9:30 

注册: 2007-03-10 12:34
帖子: 85
送出感谢: 0 次
接收感谢: 0 次
<body topmargin="0" leftmargin="0"><center>
<table border='0' width='466' cellspacing='1' bgcolor='#cccccc'><tbody>
<tr>
<td align=center width='18%' bgcolor='#eeeeee'>你的IP</td>

<td bgcolor='#FFFFFF' width='30%'>&nbsp;<a target="_blank" href="http://www.cz88.net/ip" title="纯真IP数据库(CZ88.NET)"><span id="IPMessage">122.224.112.205</span></a></td>
<td bgcolor='#FFFFFF' width='52%'>&nbsp;<a target="_blank" href="http://www.cz88.net/ip" title="纯真IP数据库(CZ88.NET)"><span id="AddrMessage">浙江省杭州市 </span></a></td>
</tr>
<tr>
<td align=center width='18%' bgcolor='#eeeeee'>操作系统</td>
<td colspan='2' bgcolor='#ffffff'>&nbsp;<a target="_blank" href="http://www.cz88.net/ip" title="纯真IP数据库(CZ88.NET)"><span id="OperatorMessage">Linux , Firefox 3.0.1</span></a></td>
</tr>

</tbody></table>
</center></body></html>

如何提取里面的汉字啊??编码是GB2312


页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-09-10 9:53 

注册: 2006-08-22 23:10
帖子: 166
送出感谢: 0 次
接收感谢: 0 次
re.sub(r'<[^<>]*>','',t)


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 2 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译