当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 5 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : debiandoc中文乱码怎么解决?
帖子发表于 : 2008-04-15 14:06 

注册: 2007-04-19 17:30
帖子: 12
地址: PKU
送出感谢: 0 次
接收感谢: 0 次
准备用debiandoc做一份材料。但是发现,源文件中的中文内容经过debiandoc2html处理之后得到的全是乱码。求教怎么解决?


页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-04-15 14:16 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
file看下结果文件的编码。
enconv直接转utf8。如果你的locale是utf8的话。

一般问问题,最好列出你的文件的详细情况。


_________________
● 鸣学


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-04-15 17:08 

注册: 2007-04-19 17:30
帖子: 12
地址: PKU
送出感谢: 0 次
接收感谢: 0 次
我不很明白编码的问题。
用file查看的结果:
代码:
test.sgml: UTF-8 Unicode English text

命令locale得到的结果:
代码:
LANG=en_US.UTF-8
LANGUAGE=en_US:en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

我机器这样的情况应该怎么处理?
文件内容和debiandoc的帮助中的第一个例子一样,只不过改了标题:
代码:
    <!doctype debiandoc public "-//DebianDoc//DTD DebianDoc//EN">
     
     <debiandoc>
     
     <book>
     
     <title>Book Title Here</title>
     <author>
      <name>Osamu Aoki</name>
      <email>debian@aokiconsulting.com</email>
     </author>
     
     <version>Version 1.00</version>
     
     <abstract>
     This provides a simple skeleton example of a debiandoc-sgml document.
     You cannot place "p" or "ref" tags in here.
     </abstract>
     
     <copyright>
       <copyrightsummary>
         Copyright © 2006 by Osamu Aoki <email>debian@aokiconsulting.com</>
       </copyrightsummary>
       <p>
       <url id="http://www.gnu.org/copyleft/gpl.html"
             name="This document may used under the terms of the GNU General Public License version 2 or higher.">
     </copyright>
     
     <toc sect1>  <!-- list section to sect1 in table of content-->
     
     <chapt id="chapter-one"><heading>这是一章</heading>
     
     <!-- This is comment.  Heading tags above can be skipped -->
     
     <p>
     ...
     <sect id="ch-1-sect-1">小节标题
     
     <sect1 id="ch-1-sect1-1">Sect-1-level title
     <p>
     ...contents
     
     <sect2 id="ch-1-sect2-1">Sect-2-level title
     <p>
     ...contents
     
     </sect2>
     </sect1>
     </sect>
     
     </book>
     
     </debiandoc>


得到的结果就有下面的乱码。[/img]


附件:
.png
.png [ 6.21 KiB | 被浏览 677 次 ]
页首
 用户资料  
 
4 楼 
 文章标题 :
帖子发表于 : 2008-04-15 23:09 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
网页看。应该文件内部指定META头的编码信息吧。类似这样
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

否则,只能浏览器里面选择编码了。


_________________
● 鸣学


页首
 用户资料  
 
5 楼 
 文章标题 :
帖子发表于 : 2008-04-16 9:42 

注册: 2007-04-19 17:30
帖子: 12
地址: PKU
送出感谢: 0 次
接收感谢: 0 次
解决了。谢谢!
不过怎么样在源文件中就指定生成网页的编码?


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 5 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译