话说本人因为需要从某个网页采集一些数据,
每一次要更改网页上的5个下拉菜单,然后发送查询请求,再从网页上复制下来,
需要如此循环查询3000多次,因此写个程序来查询就很有必要了,于是用java写了个爬虫程序,但是遇到个问题,
用java读取下来的中文部分都是些乱码,
有什么技巧可以正常显示吗?
网页是GB2132字体,在InputStreamReader类里没有这样的参数,不知道如何处理啦
在xp下能够正常显示,要是没有别的办法的话,只能启用搁置已久的xp了
话说从某个网页采集一些数据,可是把采集到的中文写到文件里都是些乱码
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
- rosechild
- 帖子: 306
- 注册时间: 2007-06-16 15:10
- channon
- 帖子: 241
- 注册时间: 2007-04-01 14:15
- yiding_he
- 帖子: 2677
- 注册时间: 2006-10-25 18:10
- 来自: 长沙
- 联系:
- rosechild
- 帖子: 306
- 注册时间: 2007-06-16 15:10
- eexpress
- 帖子: 58428
- 注册时间: 2005-08-14 21:55
- 来自: 长沙