当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 6 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 需要html entity<->binary转换的。
帖子发表于 : 2008-04-03 16:24 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
&#x6587;&#x6863; 这样的是叫html entity吧,包括那些&gt;的。不是的话,就改标题了。 :lol:
想要和utf8二进制互换的方法。

☎ '/usr/share/doc/libhtml-parser-perl/examples/htext' ~/.config/rox.sourceforge.net/ROX-Filer/Bookmarks.xml
似乎是可以?
反向不会。

xml -> utf8
引用:
$str =~ s/&#x([[:xdigit:]]+);/chr(hex($1))/ge;

utf8 -> xml 有些问题,思路正确。
引用:
$str =~ s/[\x80-]/sprintf("&#x%x;", ord $&)/g;


引用:
HTML::Entities or Encode::encode

是现成的,可有空再去看。

或者有其他直接的命令?系统带的?现成的?

--------------------------------
第2种情况:

%E5%AA%92%E4%BD%93 这样的,怎么搞。
引用:
$str =~ s/\%([A-Fa-f0-9]{2})/pack('C', hex($1))/seg;

代码:
☎  perl html2utf8.pl
%E5%BA%94%E7%94%A8/%E8%84%9A%E6%9C%AC
应用/脚本


反向这样
引用:
$str =~ s/([^A-Za-z0-9])/sprintf("%%%02X", ord($1))/seg;


_________________
● 鸣学


最后由 eexpress 编辑于 2008-04-03 22:31,总共编辑了 5 次

页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-04-03 16:25 
头像

注册: 2007-10-19 14:51
帖子: 4953
地址: 深圳
送出感谢: 0 次
接收感谢: 2
&gt;属于 预定义实体


_________________
Nothing 有事请发邮件到 yms541 AT gmail.com
alias 爱慕颇雷尔='mplayer'


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-04-03 16:26 
头像

注册: 2005-08-15 0:04
帖子: 1880
地址: 南7技校
送出感谢: 0 次
接收感谢: 0 次
urlencode 和 urldecode 什么的

自己去找脚本


_________________
飞得高,飞得低,学习再学习,多少大秘密!
http://zhan.blog.ubuntu.org.cn


页首
 用户资料  
 
4 楼 
 文章标题 :
帖子发表于 : 2008-04-03 16:27 
头像

注册: 2007-10-19 14:51
帖子: 4953
地址: 深圳
送出感谢: 0 次
接收感谢: 2
第二种情况 python和php里都有函数实现


_________________
Nothing 有事请发邮件到 yms541 AT gmail.com
alias 爱慕颇雷尔='mplayer'


页首
 用户资料  
 
5 楼 
 文章标题 :
帖子发表于 : 2008-04-03 16:28 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
urlencode / urldecode in Perl

If you are looking for PHP's urlencode/urldecode equivalent in Perl, you won't find any. But here's what you can do:

Encode:
$str =~ s/([^A-Za-z0-9])/sprintf("%%%02X", ord($1))/seg;

Decode:
$str =~ s/\%([A-Fa-f0-9]{2})/pack('C', hex($1))/seg;

测试


_________________
● 鸣学


页首
 用户资料  
 
6 楼 
 文章标题 :
帖子发表于 : 2008-04-12 20:24 

注册: 2005-07-15 12:06
帖子: 31
送出感谢: 0 次
接收感谢: 0 次
如果是PHP中可以用mb_convert_encoding函数的

代码:
<?php
$str = "这是汉字";
$encoded_str = mb_convert_encoding($str, 'HTML-ENTITIES', "UTF-8");
echo $encoded_str;
?>


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 6 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 2 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译