当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 2 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 求教关于python的正规表达式
帖子发表于 : 2008-10-25 16:29 

注册: 2008-10-25 16:23
帖子: 1
送出感谢: 0 次
接收感谢: 0 次
import httplib
import re

httpServer = "www.lamp9.cn"
url = "/articleshow.php?class_id=5&id=10143"
conn = httplib.HTTPConnection(httpServer)
conn.request("GET", url)
response = conn.getresponse()
html = response.read().decode('utf-8')
conn.close()
expression2 = '<body>(.*)</body>'
listSentence2 = re.findall(expression2, html)
print listSentence2[0]

以上是我的代码,我要把一张网页中<body></body>之间的所有字符串显示出来。
但运行时报错,如下:
Traceback (most recent call last):
File "E:\python\lamp.py", line 13, in <module>
print listSentence2[0]
IndexError: list index out of range

请问我要怎么改正则表达式以达到我要的效果??


页首
 用户资料  
 
2 楼 
 文章标题 : Re: 求教关于python的正规表达式
帖子发表于 : 2008-10-25 16:33 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
re.findall(expression2, html, re.S)


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 2 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译