[建议]要配置 texlive 中文的请先看此帖!
- zhan
- 帖子: 1880
- 注册时间: 2005-08-15 0:04
- 来自: 南7技校
[建议]要配置 texlive 中文的请先看此帖!
tex 是个非常优秀的排版系统,一直想使用它的人也大有人在,可惜神一般存在的 高德纳 在发明之初压根就没有想到中文,因此后来的中文用户要愁上一阵了。不过神没有做的事情,半神和人都可以来做好,所以本帖在各位神与半神的伟大工作的基础之上,提一个人的解决思路,原谅我有些神及半神的名字就没有提及了....
闲话就算了,来正题吧。
首先,tetex 已经停止更新,主页推荐使用 texlive, 在 ubuntu 7.10 以及 debian 上,安装是很简单的,打开包管理器,搜索一下 texlive 会看到相当多的包。因此,安装不是问题,我就不扯了。
关于中文配置,站在巨人的肩上的我们,会有很多的好的选择(如下,都是不需要自己配置的,省却了不少的麻烦):
1 安装 texlive-xetex 包,以及其他需要的包,(不需要 cjk 了,但是 texlive-latex) 还是需要的,然后采用 xetex 以及 xelatex 来处理中文,这样有个缺陷是中英文混排有点问题,不过网上有 jjgod 的 xcp.py 的预处理程序可以用来处理,具体的搜索一下,我就不多嘴了,对这个研究也不多。
2 安装 cjk 相应的包,采用 cjk 来处理中文。然后到网上下载 yulewang 做好的字体包,我记得哈工大的 ftp 上有一份的,这个包直接解压在你的 主目录就可以使用了。找下这个包在什么地方,具体的我不记得了,搜了 YueWang zhfonts 的关键字,结果如下。是能够找到这个包的。
http://www.google.com/search?q=YueWang+ ... CN236CN236
3 直接采用 yulewang liangzi 等人做的 texlive2005 的带有中文支持的 iso, 这个在 ctex 上有说明的。不过貌似链接坏掉了,我什么时候更新到论坛的 ftp 去把。
http://www.google.com/search?hl=en&neww ... tnG=Search
希望该贴对在 linux 下安装配置 tex 系统的兄弟姐妹们有所帮助。特地置顶一下,如果还有什么简单配置 tex 系统的办法(限于 linux 下的方法),请在后面跟帖,我们来一起整理一下 tex 系统中文配置的简单有效的方法。谢谢。
==============================================================
更新一下:
1.关于第一种办法,texlive 的 iso 里面使用的是 xetex 0.996 处理正文时使用一个字体还是比较方便的,但是要分别使用中文和英文不同字体的混排就显得比较麻烦,一种办法是定义很多的标签,在转换字体的时候使用标签框起来,这样总显得有些难受。网上有牛人 jjgod 发了完成这个工作的预处理脚本。而且这个脚本也包含在 texlive 的 iso 中。具体的讨论见 http://bbs.ctex.org/viewthread.php?tid=35195 。
第二个办法就是升级你的 xetex 到 xetex-dev 也就是开发中的 0.997 版本,然后采用 yindian 做的 zhspacing 宏包来处理这个问题。关于 zhspacing 的信息,详细见其项目主页 http://code.google.com/p/zhspacing/ 。注意其中还有个用户手册,建议大家使用之前首先阅读一下。
下面的问题就在于,如何升级你的 xetex 到 xetex-dev。 之前我采用源里面的 texlive, 然后编译 xetex-dev 没有成功,不能正确的生成 .fmt, 于是作罢。后来为了通用 采用了 iso 安装的办法(我的 iso 基本上安装完全了,因此比较大,主要是方便个人在不同的机器和不同的环境上都能使用,我把我自己安装的这个版本做了一个 iso, 放到了论坛的 ftp 上。)。 在这个方式下面成功安装了 xetex-dev 试用了一下,感觉很不错。好的工具应该推荐大家都使用,呵呵。
1) 如果你没有安装 texlive 或是 不想安装以及配置 texlive, 仅仅想试试,那么我推荐你试试我的 iso, 目前放在 http://ftp.ubuntu.org.cn/home/zhan/tex/MyTexlive.iso 下面,其中包含了 0.997 版的 xetex。然后可以选择下载另外一个字体包 texlive2007_fonts.tar.gz (在同一个目录下,其中主要是 CJK 的 utf8 的支持,没有包含 GBK 的,采用了方正的字体)。直接解压到主目录下面就好,注意先移除或改名主目录下面的 .texlive2007。关于 ftp 的用户名和密码请到 本论坛 新闻通知区 查看置顶帖。
2) 当然我的包很笨重,因此重要的就是自己如何编译安装 xetex-dev 了, 我主要参照的是网上的这篇文章, http://blog.linuxgem.org/lyanry/show/487.html 。写得很详细。虽然大家是 ubuntu 操作系统,但是主要的步骤应该差不多。好像需要注意的是设置几个 环境变量比如 TEXMAIN TEXLOCAL TEXLOCAL 等等的。具体的我没有实验过,我只在 gentoo 下面实验了这个网页上的办法,如果有人在 ubuntu 中实验成功,欢迎提出来分享以下,完善这个帖子。
2. 有人问 texlive2007 的字体配置包的位置,我下载了一份放在了 ftp 的我的目录中的 tex 目录下,名字是 YueWang-zhfonts_1.01 里面有相应的说明文档的。 同时正如上文提到的,我也有一份自己用的 字体包扔在 tex 目录下,主要是使用的 liangzi 提供的字体包。同时这个包也支持 context, 关于 yulewang 字体的 context 支持,详见 http://bbs.ctex.org/viewthread.php?tid=39800&page=3 的 23 楼。
3. 上面许诺的 texlive2005 的挂载即用的 iso ,暂时已经找不到了,不过估计有人还有存货,所以这个先放一放了。
闲话就算了,来正题吧。
首先,tetex 已经停止更新,主页推荐使用 texlive, 在 ubuntu 7.10 以及 debian 上,安装是很简单的,打开包管理器,搜索一下 texlive 会看到相当多的包。因此,安装不是问题,我就不扯了。
关于中文配置,站在巨人的肩上的我们,会有很多的好的选择(如下,都是不需要自己配置的,省却了不少的麻烦):
1 安装 texlive-xetex 包,以及其他需要的包,(不需要 cjk 了,但是 texlive-latex) 还是需要的,然后采用 xetex 以及 xelatex 来处理中文,这样有个缺陷是中英文混排有点问题,不过网上有 jjgod 的 xcp.py 的预处理程序可以用来处理,具体的搜索一下,我就不多嘴了,对这个研究也不多。
2 安装 cjk 相应的包,采用 cjk 来处理中文。然后到网上下载 yulewang 做好的字体包,我记得哈工大的 ftp 上有一份的,这个包直接解压在你的 主目录就可以使用了。找下这个包在什么地方,具体的我不记得了,搜了 YueWang zhfonts 的关键字,结果如下。是能够找到这个包的。
http://www.google.com/search?q=YueWang+ ... CN236CN236
3 直接采用 yulewang liangzi 等人做的 texlive2005 的带有中文支持的 iso, 这个在 ctex 上有说明的。不过貌似链接坏掉了,我什么时候更新到论坛的 ftp 去把。
http://www.google.com/search?hl=en&neww ... tnG=Search
希望该贴对在 linux 下安装配置 tex 系统的兄弟姐妹们有所帮助。特地置顶一下,如果还有什么简单配置 tex 系统的办法(限于 linux 下的方法),请在后面跟帖,我们来一起整理一下 tex 系统中文配置的简单有效的方法。谢谢。
==============================================================
更新一下:
1.关于第一种办法,texlive 的 iso 里面使用的是 xetex 0.996 处理正文时使用一个字体还是比较方便的,但是要分别使用中文和英文不同字体的混排就显得比较麻烦,一种办法是定义很多的标签,在转换字体的时候使用标签框起来,这样总显得有些难受。网上有牛人 jjgod 发了完成这个工作的预处理脚本。而且这个脚本也包含在 texlive 的 iso 中。具体的讨论见 http://bbs.ctex.org/viewthread.php?tid=35195 。
第二个办法就是升级你的 xetex 到 xetex-dev 也就是开发中的 0.997 版本,然后采用 yindian 做的 zhspacing 宏包来处理这个问题。关于 zhspacing 的信息,详细见其项目主页 http://code.google.com/p/zhspacing/ 。注意其中还有个用户手册,建议大家使用之前首先阅读一下。
下面的问题就在于,如何升级你的 xetex 到 xetex-dev。 之前我采用源里面的 texlive, 然后编译 xetex-dev 没有成功,不能正确的生成 .fmt, 于是作罢。后来为了通用 采用了 iso 安装的办法(我的 iso 基本上安装完全了,因此比较大,主要是方便个人在不同的机器和不同的环境上都能使用,我把我自己安装的这个版本做了一个 iso, 放到了论坛的 ftp 上。)。 在这个方式下面成功安装了 xetex-dev 试用了一下,感觉很不错。好的工具应该推荐大家都使用,呵呵。
1) 如果你没有安装 texlive 或是 不想安装以及配置 texlive, 仅仅想试试,那么我推荐你试试我的 iso, 目前放在 http://ftp.ubuntu.org.cn/home/zhan/tex/MyTexlive.iso 下面,其中包含了 0.997 版的 xetex。然后可以选择下载另外一个字体包 texlive2007_fonts.tar.gz (在同一个目录下,其中主要是 CJK 的 utf8 的支持,没有包含 GBK 的,采用了方正的字体)。直接解压到主目录下面就好,注意先移除或改名主目录下面的 .texlive2007。关于 ftp 的用户名和密码请到 本论坛 新闻通知区 查看置顶帖。
2) 当然我的包很笨重,因此重要的就是自己如何编译安装 xetex-dev 了, 我主要参照的是网上的这篇文章, http://blog.linuxgem.org/lyanry/show/487.html 。写得很详细。虽然大家是 ubuntu 操作系统,但是主要的步骤应该差不多。好像需要注意的是设置几个 环境变量比如 TEXMAIN TEXLOCAL TEXLOCAL 等等的。具体的我没有实验过,我只在 gentoo 下面实验了这个网页上的办法,如果有人在 ubuntu 中实验成功,欢迎提出来分享以下,完善这个帖子。
2. 有人问 texlive2007 的字体配置包的位置,我下载了一份放在了 ftp 的我的目录中的 tex 目录下,名字是 YueWang-zhfonts_1.01 里面有相应的说明文档的。 同时正如上文提到的,我也有一份自己用的 字体包扔在 tex 目录下,主要是使用的 liangzi 提供的字体包。同时这个包也支持 context, 关于 yulewang 字体的 context 支持,详见 http://bbs.ctex.org/viewthread.php?tid=39800&page=3 的 23 楼。
3. 上面许诺的 texlive2005 的挂载即用的 iso ,暂时已经找不到了,不过估计有人还有存货,所以这个先放一放了。
上次由 zhan 在 2008-01-19 21:38,总共编辑 3 次。
飞得高,飞得低,学习再学习,多少大秘密!
http://zhan.blog.ubuntu.org.cn
http://zhan.blog.ubuntu.org.cn
- zhan
- 帖子: 1880
- 注册时间: 2005-08-15 0:04
- 来自: 南7技校
- smartliu
- 帖子: 174
- 注册时间: 2006-08-04 11:10
- 系统: Arch, macOS, Windows
- 来自: Jinan, Shandong, China
- 联系:
王垠的页面上有关于gbkfonts的说明。使用那个软件可以把Windows下的字体转换成TeX可以使用的Type1字体。。。
之前在Windows下成功弄过,到了Linux下一直没有弄。
===================
李树钧(hooklee, http://www.hooklee.com/, 就是制作ChinaTeX的那个)在他的ChinaTeX发行iso镜像中有对于中文支持的讨论,里面有下xGBKFonts软件,据说比王垠的那个要高级。不知道现在能不能用。不过ChinaTeX一直基于MikTeX,尚不清楚他的方法在Linux的可行性。
之前在Windows下成功弄过,到了Linux下一直没有弄。
===================
李树钧(hooklee, http://www.hooklee.com/, 就是制作ChinaTeX的那个)在他的ChinaTeX发行iso镜像中有对于中文支持的讨论,里面有下xGBKFonts软件,据说比王垠的那个要高级。不知道现在能不能用。不过ChinaTeX一直基于MikTeX,尚不清楚他的方法在Linux的可行性。
2007年10月成功用Ubuntu 10.04 Beta 4光盘引导起来我的DELL XPS M1330,开启了我在私人电脑上的Linux生涯。
2007年12月无法忍受Ubuntu的龟速,开始使用Gentoo。
2008年3月,显卡坏掉,人在国外上学而DELL只提供大陆境内保修服务,无奈在当地买了台MacBook,自此8年远离了Linux的世界。
2015年,用工资买了Lenovo ThinkPad X250,我又回来啦……哈哈哈!!!
http://liuf.net
2007年12月无法忍受Ubuntu的龟速,开始使用Gentoo。
2008年3月,显卡坏掉,人在国外上学而DELL只提供大陆境内保修服务,无奈在当地买了台MacBook,自此8年远离了Linux的世界。
2015年,用工资买了Lenovo ThinkPad X250,我又回来啦……哈哈哈!!!
http://liuf.net
-
- 帖子: 371
- 注册时间: 2005-11-03 17:52
支持楼主,下面转一个我认为写得最好的字体配置教程:
http://www.soforge.com/emacs/teTeX-chinese.html
http://www.soforge.com/emacs/teTeX-chinese.html
-
- 帖子: 115
- 注册时间: 2007-06-02 1:03
补充一下第三点:
现在已经有 texlive2007-ferretl-zhsupport 了,我下载的就是这个。这是去掉了说明文档的版本,1.02G。
给出一个教育网的FTP服务器,目前也只是发现两个服务器有,一个是SMTH那个。还好另外一个服务器直接可以用浏览器打开,下载速度也相当快(我是广西的,firefox直接下载都有1M/s的速度。)。
地址为: ftp://openware.byr.edu.cn/pub/software/ ... zhsupport/
PS:Win和Linux都可直接安装,并且已经配置好了中文支持。太COOL了!
现在已经有 texlive2007-ferretl-zhsupport 了,我下载的就是这个。这是去掉了说明文档的版本,1.02G。
给出一个教育网的FTP服务器,目前也只是发现两个服务器有,一个是SMTH那个。还好另外一个服务器直接可以用浏览器打开,下载速度也相当快(我是广西的,firefox直接下载都有1M/s的速度。)。
地址为: ftp://openware.byr.edu.cn/pub/software/ ... zhsupport/
PS:Win和Linux都可直接安装,并且已经配置好了中文支持。太COOL了!
- hualang0929
- 帖子: 1226
- 注册时间: 2006-11-11 10:23
- 来自: Mars
- 联系:
- zhan
- 帖子: 1880
- 注册时间: 2005-08-15 0:04
- 来自: 南7技校
这个貌似只有 GBK 的支持,所以就没有考虑,写个文档还好设计成和系统不一样的编码,我觉得麻烦。aquachick 写了:补充一下第三点:
现在已经有 texlive2007-ferretl-zhsupport 了,我下载的就是这个。这是去掉了说明文档的版本,1.02G。
给出一个教育网的FTP服务器,目前也只是发现两个服务器有,一个是SMTH那个。还好另外一个服务器直接可以用浏览器打开,下载速度也相当快(我是广西的,firefox直接下载都有1M/s的速度。)。
地址为: ftp://openware.byr.edu.cn/pub/software/ ... zhsupport/
PS:Win和Linux都可直接安装,并且已经配置好了中文支持。太COOL了!
飞得高,飞得低,学习再学习,多少大秘密!
http://zhan.blog.ubuntu.org.cn
http://zhan.blog.ubuntu.org.cn
-
- 帖子: 115
- 注册时间: 2007-06-02 1:03
UNICODE,GBK,UTF-8区别
UTF-8是Unicode的其中一个使用方式。
UTF是 Unicode Translation Format(另一种说法为 UCS Translation Format),即把Unicode转做某种格式的意思。
它定义于ISO 10646,而RFC3629也定义了相似的做法。由于要使文字档案之中的文字与ASCII兼容,故此 UTF-8 选择了使用可变长度字节来储存 Unicode ,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。
中日韩统一表意文字(CJK Unified Ideographs),目的是要把分别来自中文、日文、韩文中,本质相同、形状一样或稍异的表意文字(主要为汉字,但也有仿汉字如日本国字、韩国独有汉字)于ISO 10646及Unicode标准内赋予相同编码。
越南文后来亦加入此计划,所以亦有“CJKV”的称呼。Unicode亦开始收录其仿汉字-字喃。
在UTF8出来之前,繁体中文多数采用Big5码,简体中文采用GB2312,后来增补为BGK,支持简繁体,最新的国家汉字标准为GB18030,GB18030完全兼容GBK、GB2312,并且是后二者的替代标准,也将是今后唯一的字符集国家标准。
目前支持该标准的OS:
2001年9月1日后的Windows2000 的补丁版;
Windows XP;
以及一些Linux、Unix的OS。
GB18030的问题:
由于GB18030中包括了4字节编码汉字,和目前Windows平台中普遍使用的2字节编码的GBK和Unicode3.1有较大区别,因此在使用中出现了很多问题。例如微软的Windows XP中实际上只支持Unicode3.1编码,并不支持GB18030的4字节编码汉字。但是目前Office最新版和WPS Office最新版也都支持。
UTF是 Unicode Translation Format(另一种说法为 UCS Translation Format),即把Unicode转做某种格式的意思。
它定义于ISO 10646,而RFC3629也定义了相似的做法。由于要使文字档案之中的文字与ASCII兼容,故此 UTF-8 选择了使用可变长度字节来储存 Unicode ,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。
中日韩统一表意文字(CJK Unified Ideographs),目的是要把分别来自中文、日文、韩文中,本质相同、形状一样或稍异的表意文字(主要为汉字,但也有仿汉字如日本国字、韩国独有汉字)于ISO 10646及Unicode标准内赋予相同编码。
越南文后来亦加入此计划,所以亦有“CJKV”的称呼。Unicode亦开始收录其仿汉字-字喃。
在UTF8出来之前,繁体中文多数采用Big5码,简体中文采用GB2312,后来增补为BGK,支持简繁体,最新的国家汉字标准为GB18030,GB18030完全兼容GBK、GB2312,并且是后二者的替代标准,也将是今后唯一的字符集国家标准。
目前支持该标准的OS:
2001年9月1日后的Windows2000 的补丁版;
Windows XP;
以及一些Linux、Unix的OS。
GB18030的问题:
由于GB18030中包括了4字节编码汉字,和目前Windows平台中普遍使用的2字节编码的GBK和Unicode3.1有较大区别,因此在使用中出现了很多问题。例如微软的Windows XP中实际上只支持Unicode3.1编码,并不支持GB18030的4字节编码汉字。但是目前Office最新版和WPS Office最新版也都支持。
- 附件
-
- UNICODE,GBK,UTF-8区别.tar.gz
- (7.45 KiB) 已下载 258 次
- Tenyears
- 帖子: 2245
- 注册时间: 2005-06-30 15:46
- 来自: 成都