[已解决]gb2312网页里的汉字替换不了,请教有什么方法

系统字体配置、中文显示和输入法问题
回复
头像
TeliuTe
论坛版主
帖子: 7432
注册时间: 2007-11-25 13:29
系统: 14/16/18/Fedroa22/w7
来自: 新疆博乐
送出感谢: 29 次
接收感谢: 99 次
联系:

[已解决]gb2312网页里的汉字替换不了,请教有什么方法

#1

帖子 TeliuTe » 2013-04-05 11:38

utf8的网页没问题,gb2312的网页用sed、awk、rpl都无法替换

代码: 全选

 awk 'gsub(/版权信息/,"作者")' index.htm

代码: 全选

rpl -Rd  -x'.htm' '版权信息' '作者' ./

代码: 全选

find -name '*.htm' -exec sed  -i 'N;N;s/版权信息/作者/g' {} \;

代码: 全选

teliute@TeliuTe:~$ locale
LANG=zh_CN.UTF-8
LANGUAGE=zh_CN:zh:en_US:en
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"
LC_ALL=
附件
index.htm.7z
(1.26 KiB) 下载 14 次
上次由 TeliuTe 在 2013-04-07 11:55,总共编辑 2 次。
头像
YeLee
论坛版主
帖子: 26386
注册时间: 2008-08-13 8:48
系统: Fundu i64
来自: 东海硇州,一双管钥。
送出感谢: 25 次
接收感谢: 307 次
联系:

Re: gb2312网页里的汉字替换不了,请教有什么方法

#2

帖子 YeLee » 2013-04-05 11:46

试一下用iconv转过来,搞定之后再转回去看看,虽然这程序有点麻烦。 :em01 :em01 :em01
◎当我站在道德的高度上俯视别人的时候,发现自己是多么渺小。
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: gb2312网页里的汉字替换不了,请教有什么方法

#3

帖子 eexpress » 2013-04-05 13:31

肯定要先转码。
只是gb2312,系统早就不支持了。至少转回去的时候,使用gbk吧。
● 鸣学
头像
TeliuTe
论坛版主
帖子: 7432
注册时间: 2007-11-25 13:29
系统: 14/16/18/Fedroa22/w7
来自: 新疆博乐
送出感谢: 29 次
接收感谢: 99 次
联系:

Re: gb2312网页里的汉字替换不了,请教有什么方法

#4

帖子 TeliuTe » 2013-04-07 11:54

谢谢二位,全部转成UTF-8然后再替换成功

代码: 全选

find -name '*.htm' -exec enconv {} \;
find -name '*.html' -exec enconv {} \;

find -name '*.htm' -exec sed  -i 'N;N;s/charset=gb2312/charset=UTF-8/g' {} \;
find -name '*.html' -exec sed  -i 'N;N;s/charset=gb2312/charset=UTF-8/g' {} \;

rpl -Rd  -x'.htm' '版权信息' '作者' ./
rpl -Rd  -x'.html' '版权信息' '作者' ./
回复

回到 “字体美化和中文支持”