html文件在火狐里可以正常显示,文本编辑器打开则乱码

系统安装、升级讨论
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
回复
头像
TeliuTe
论坛版主
帖子: 7675
注册时间: 2007-11-25 13:29
系统: 16/18/20/w7
来自: 新疆博乐
联系:

html文件在火狐里可以正常显示,文本编辑器打开则乱码

#1

帖子 TeliuTe » 2015-04-02 14:57

附件文件编码是GBK的,用wget从网上批量下载的文件,其他的都正常
网页里面没有指定语言,想加个meta标识gbk,结果加不进去,火狐默认打开会乱码

目前是用rpl 把gbk加进去了,但是文件还是不能编辑
忘了是从哪下载的,这个能不能修复

代码: 全选

您打开的文件含有无效字符。如果您强行编辑该文件,可能会造成文件损坏。
您可以另选一种字符编码,然后再试一次。
附件
testbranch.html.tar.gz
(6.09 KiB) 已下载 32 次
头像
astolia
论坛版主
帖子: 6703
注册时间: 2008-09-18 13:11

Re: html文件在火狐里可以正常显示,文本编辑器打开则乱码

#2

帖子 astolia » 2015-04-02 16:26

这个文件里有非GBK范围内的字符,所以严格来说并不是GBK编码。把非法字符去掉就可以了

代码: 全选

cat testbranch.html | tr -d $'\xA0' |  iconv -f GBK
或者直接让iconv忽略非法字符

代码: 全选

iconv -c -f GBK -t UTF-8 testbranch.html
头像
TeliuTe
论坛版主
帖子: 7675
注册时间: 2007-11-25 13:29
系统: 16/18/20/w7
来自: 新疆博乐
联系:

Re: html文件在火狐里可以正常显示,文本编辑器打开则乱码

#3

帖子 TeliuTe » 2015-04-02 20:51

非常感谢,改好了用cat管道出来,再另存为utf8的: http://teliute.org/linux/abs-3.9.1/testbranch.html

代码: 全选

cat testbranch.html | tr -d $'\xA0' |  iconv -f GBK >t.html 
回复