Linux下使用中文、字体

正文

1. 一般性问题

1.1. 不是已经有很多汉字字库了吗？为什么还要再做一个？

作者：FangQ

答：从您购买的软件的光盘上（特别是Windows或者Office），或者购买的汉字艺术字体的光盘上，甚至从一些软件公司、政府机构的网页上都可以找到或者下载到汉字字库，于是很多人会问，为什么我们还要再做一个新的字库，这样作有必要吗？

答案是肯定的。尽管您可以找到或者使用这些字库，但您需要注意使用这些字库一般需要您遵守一些使用规则：

您可能需要购买才能拥有使用权，非购买的拷贝不但得不到技术支持甚至随时可以被起诉，
您只能在规定的机器或者规定的操作系统上安装并使用，比如Windows上自带的汉字字库是不能安装到其他操作系统比如Linux上使用的，而Redhat上安装的ZYSong也是不允许安装在其他Linux版本上，
您不能对字库进行任何形式的修改，对于字型、字体不满足用户个人需要的情况您只有“盼望”字体开发商在下一个版本会有所改进，除此之外，您没有更好的办法，
您不能随意将您从网络上或者软件光盘上获得的这些汉字字库拿出来打个包提供给别人使用，或者打包到您写的程序中交给客户，无论您赢利与否，这样作从法律上都是违反使用协议的做法。

简言之，您现在能够找到的大多数汉字字体，都不是“自由”的。这里的自由是[“自由”软件]中定义的自由，与“免费”软件是不能混淆的。

我们现在正在开发的字体将是一个“自由”的字体，也就是说，这个字体的拥有者将获得下述的自由[1]：

您拥有使用这个字体的自由，而我们对您的使用目的没有任何限制
您除了字体文件，还可以同时获得生成这些字体的原始数据，从而您拥有学习字体开发过程的自由
您拥有把这个字体随意拷贝给需要的人，或者放入您的产品中，或者放到您的网页上散播的自由
您拥有随时改进这个字体，并把您改进的结果公布给大家使用的自由

而真正“自由”的汉字字体并不多，我们所能够找到的，包括[台湾文鼎公司]在1999年发布的四套字体(宋体两套，楷体两套)，以及[台湾王汉宗教授贡献的多种繁体字体]。另一方面，我们对于完整的汉字字库的需求是非常亟切的。不但中国，日本韩国等国家的语言文字也都是基于汉字系统。特别是中国，大陆、台湾、香港等地汉语用户数目非常庞大；同时，2000年实施的国家标准[GB18030-2000]中收录了Unicode中规定的[CJK统一表意文字区]以及[CJK统一表意文字扩展A区]中大约27000个汉字，这个标准成为在大陆销售软件必须遵循的标准规范，所以开发这个自由的汉字字库将对于“自由软件”在中国的健康发展，以致于整个软件业的平衡都具有战略性的意义。

1.2. 为什么我的机器上的汉字显示为一个方块或者问号？

作者：FangQ

答：一个计算机系统上能够显示汉字大概需要两个基本条件：1、操作系统需要能够识别这个汉字的编码，并且有处理这种编码的能力，2、操作系统需要有这些汉字的“图案”数据（也就是字体），需要的时候显示在屏幕上。

您浏览的文章也好，书写的电子邮件也好，实际上传输的并不是汉字本身，或者传输的并不是汉字的图案，而是汉字的某种编码。如果您的浏览器，或者电子邮件软件上显示出乱码，或者问号，或者方块内四个数字（在Linux上），这说明您的计算机不能正确识别这种编码，或者没有安装能够显示这种编码的字体。您需要安装能够识别汉语的相应模块，并且安装汉字字库，这样您的操作系统才能正确显示这些汉语信息。

1.3. 为什么我屏幕上的汉字边界模糊不清？

作者：FangQ

答：这种情况可能在Windows、Linux、Mac OS，或者各种Unix下都有可能发生，而当前最常见的是Linux下。这种情况可能有两个原因：

您使用的矢量字体(True-Type,Type1等)内部没有提供hinting运算的数据(hinting是一种屏幕显示优化技术，通过一定的数学运算，根据特定字体的笔画特征来调整像素的显示强度，从而达到字体边界清晰易于阅读的目的)，
您使用的矢量字体中没有包含事先制作好的、已经经过屏幕优化过的点阵汉字图形数据。

对于Linux下常见的字体，以及很多网络上能够免费下载的字体基本上都没有完美的解决汉字hinting的问题，如果字体渲染器没有从字体文件中发现hinting数据，并且没有找到嵌入的点阵汉字位图，那么经过Anti-Aliasing(AA，反锯齿技术)变换之后得到的就是一个边界模糊汉字。

我们开发点阵中文就是为了解决这个问题。

1.4. 为什么起“文泉驿”这个很土的名字？

作者：FangQ

答：我同意这是一个很“土”的名字。本来就是个土人，又不想落入当前年轻人追求新奇、逆反思维的俗套，同时又想有一些传统特色。本来是想用“文泉社”，google了一下发现是一个日本出版社的名字，只好改成现在的名字。当然，“文泉”中的“泉”字是参考了【泉通】中的泉字的用意。

1.5. 什么叫作开放源代码？

作者：FangQ

答：开放源代码与自由软件通常是同时提及的。开放源代码是一种与传统上不提供源代码的商业软件开发不同但平行的商业软件开发模式。开放源代码的严格定义可以在OSI（Open Source Initiative）的
[网站]获得。

开放源代码是一种理念，支持这种理念的是一组具有法律意义的开放源代码软件使用协议，这些协议包括了常见的GNU公共使用授权，Apache使用授权，BSD使用授权，MIT使用授权，Mozilla公共使用授权等。OSI组织批准的使用授权可以浏览[这个链接]。

1.6. 什么叫作自由软件？与免费软件的区别是什么？

作者：FangQ

答：与英文不同，“
[自由软件]”和“免费软件”在中文中是很好区分的。正如我们在这个FAQ的第一个问题的解答中那样，自由软件关心的是软件的拥有者拥有自由使用、自由散播、自由修改并发布的自由，而对价格并没有规定一定是免费。也就是说，自由软件要求您不但把您的二进制产品交给用户，而且还要把生成这个产品的原材料(源代码或者数据)也要同时交给您的用户，从而使得您的用户能够通过注入他们新的劳动来改进这个产品。您的用户可以向您通过付费的形式来购买这个软件，但一旦他们拥有这个软件，他们可以在这个基础上进行改进，并将改进后的产品通过赢利或者不赢利的方式销售给他们的用户。一般的说，一个自由软件的所有衍生产品都必须同样满足这个协议，您不能将其中的部分或者全部在不经过软件版权人的许可的情况下变为商业软件。

免费软件是指您可以免费获得或者使用这个软件，但一般情况下您不会拥有源代码，从而没有上述的其他方面的自由。

1.7. 什么是版权(Copyright)？

作者：FangQ

答：版权(copyright)表明了一种原创关系，是对文学、电影、音乐、绘画、软件、设计等的原始创作者的智力财富的一种认可和法律形式的保护。

另外，版权有一定的时限。关于版权的具体严格定义，请参照【中华人民共和国著作权法】，【伯尔尼公约】，【世界版权公约】，另外还可以参照[Wikipedia中的定义和讨论]以及[Font Foundry Myths]的讨论。

1.8. 什么是使用授权(License)？

作者：FangQ

答：使用授权(license)是版权的拥有者对作品的使用者行为的一种约束和规定。使用授权一般规定了用户使用该作品的条件，是否能够修改或者重新发布。从法律意义上来讲(如果有学版权法的可以帮我纠正和改进)，license是一种契约或者合同，具有法律效力。

1.9. 计算机字体的版权都包括哪些内容？为什么需要保护？

作者：FangQ

我们需要重申字体中的“版权”这个概念的含义，我也希望我对这个概念的理解能够被大多数人接受，变成一种共识。

“版权”或者“著作权”主要在于“原创性”，谁创造出新的东西、新的表现形式，谁才拥有版权。而字体的版权与其他智力成果的版权一个显著区别在于字体的构形不是“原创”的。字型作为几千年文明的结晶，是无数先人们的智慧创造的，是属于共同领域（public domain）的智力财产。这里的“构形”是指汉字笔画的基本形状，汉字的拓扑结构和单个汉字特有的几何特征。而开发一个计算机字体，新创造的东西有哪些？我认为包括1.文字的数字化表现形式，2.笔画的特有的艺术装饰,3.字体的hinting以及其他与计算机应用相关的特有的信息。字体开发者对于上述的“原创” 的元素拥有版权。从而字体开发者通过使用授权(license)的形式来限制他们开发出来的字体也是完全合理和有效的。

当然，上述的原则在美国理论上并不成立，1988年美国版权局认为数字化西文字体不具有原创性，所以是不可赋予版权的(uncopyrightable)。然而在现实生活中，美国大量的字体开发商，特别是adobe和MS通过其他相关的法律法规来对他们制作的数字化字体进行合法的保护，而关于“开源”字体的版权和授权问题，仍然是大家讨论的一个焦点（参见FSF的讨论 http://www.fsf.org/blogs/licensing/20050425novalis ）。

中国的版权法更倾向于把汉字字体作为一种艺术作品来进行法律保护(参见http://www.founder.com.cn/cn/news/nr.aspx?nid=297 )。个人来讲，我更倾向于支持这种观点。中文字体与西文字体有很大的差别，中文字体结构复杂，书写工具和书写习惯使得汉字书法的艺术成分远远高于西文字体，而这种艺术成分给汉字字型注入了大量的独立性和原创性。另外汉字数量繁多，完成一个字体需要付出的劳动和技巧要求比西文大很多。所以把汉字字体作为一种艺术形式进行保护是合理的。

从个人感受来看，我相信参与了我们前面CJK点阵汉字开发的朋友都会体会到，完成一个好的汉字字体的确需要付出非常辛苦的劳动，不但需要成千上万小时的劳力，还需要很好的技术和艺术处理。从这个角度，我们更需要理解和尊重很多中文字体开发商的劳动成果，对于他们制作的字体，我们需要在人家的授权允许的前提下进行合法的使用。

我们即将发布的文泉驿字体，从美观角度，不一定比现有的很多商业字体好，但毕竟是大家辛苦的劳动的成果，而且我们规定的GPL使用授权允许大家进行自由散播和修改。

说了很多，总之，我希望大家树立版权意识，鼓励创造，这对于个人和国家都是一件好事。

1.10. 怎么样可以支持这个项目？有汇款帐号或者什么其它方式的支付途径么？

作者：FangQ

答：虽然我们的组织和项目为
非赢利性质的，但维持进行正常的开发，需要付出一定的费用(现在这些费用都是由组织者和参与者无偿地分担的)，这些费用包括网站租用、对项目进行有效的宣传费用、对相关资料、必须的设备进行购买的费用等等。为了加快计划进度，我们需要有足够的经费来维持计划的高效运行，从而为开源社区作出有效的工作。

对于拥有信用卡的用户，我们的计划可以通过sourceforge的“捐献”机制得到支持，进行捐献的页面为 http://sourceforge.net/donate/index.php?group_id=128192 您需要免费注册一个Paypal账号，然后从信用卡或者银行账号捐献适当的数额(Sourceforge收取5%的手续费，Paypal也收取少量手续费)(这种渠道的安全性是有保证的，使用paypal是非常经常的事情)。我们对您的的支持表示感谢！对于在美国的朋友，您还可以直接汇款给我，我的地址可以在我的Wiki页面找到。我向您郑重承诺，我们一定会将收到的每一笔捐款用于这个计划。我们也会将捐款的数额和使用状况在我们的主页及时贴出以便监督。

对于国内用户，我们提供了中行和建行的捐款账号，具体信息参见Donation捐款页面。

1.11. 什么是字符集(Charset)？

作者：FangQ

答：字符集(charset或者character repertoire)是一组抽象字符(abstract character)的集合。我们通常所说的字符一般是一个一维或者二维的符号，这个符号可能会具有一定的语义。对于一种语言，语言中常用的或者所有用以表达语义功能的符号构成该语言的字符集。比如所有汉字构成的字符集，所有日语的片假名、平假名构成的字符集，西欧语言字母构成的字符集等。字符集的子集也为字符集，比如所有日本汉字，或者所有繁体字。

1.12. 什么是编码(Encoding)？

作者：FangQ

答：对于一个给定字符集，为了在计算机内方便地进行表示，我们需要对字符集内的抽象字符元素进行排序，对每个元素赋予一个特定的标号用以区别其他字符。从数学角度，编码(encoding)是一个从整数集子集到字符集抽象元素的映射。

对于字符集内字符的排序可以有各种各样的办法，对于汉语来说，可以按照笔画顺序，可以按照拼音排序，甚至任意顺序进行排列。字符的编码不一定从0或者1开始，也不一定连续。这个映射不一定是1对1的映射。

字符的编码一般为一种约定性的行为。

1.13. 什么是GB2312, GB13000, GB18030, Unicode和UTF-8？

作者：FangQ

答：这些都是对字符集的编码(encoding)。其中常见对汉语字符集的编码包括GB2312-1980, GB13000, GBK, GB12345, GB18030—2000, Big5, Big5+, HKSCS, Big5+HKSCS, CNS 11643-1992等。

当前国际上最为通用的字符编码（商业规范）是Unicode编码。Unicode是由一个非赢利性组织“Unicode学术学会”建立和发展的涵盖世界大多数流行语言的字符编码形式。对于Unicode的详细解释请参见[他们的主页]以及[中文说明]。Unicode[现有的标准]版本为4.1，其中包含的所有语言符号(超过9万个，其中汉字为7万多)列表可以从这个[网页]浏览。

UCS-2, UCS-4, UTF-32, UTF-16, UTF-8, UTF-EBCDIC和UTF-7都是Unicode编码的具体形式。他们的定义和相互关系可以参见[Wikipedia的说明]。

1.14. 汉字有多少个？制作那么多汉字有必要吗？

作者：FangQ

答：随着社会的发展，历史的演变，作为表意文字的汉字总体呈现逐步增多的趋势，但常用汉字增加幅度相对比较缓慢。下表总结了一些主要辞书中收集汉字的数目
[2]
[3]：

辞书	成书年代	汉字总数
尔雅	汉	??
说文解字	汉	9353
字林	晋	12824
玉篇	宋	22510
字汇	明	33179
康熙字典	清	47035
中华大字典	1915	48902
辞源	1915	12890
汉语大字典	1986	~56000
中华字海	1994	87019

为了让计算机系统能够更好的处理汉字信息，对汉字的编码工作在上世纪70年代就开始进行，其中主要的几个汉字标准包含的汉字数目总结在下表中：

标准	发布时间	汉字总数	等价标准
GB2312	1980	6367	GB 12345-90繁体
CNS11643	1992	48027
CCCII	1989	75684
GBK	1995	20902	Unicode 2.0
GB13000	1993	20902	ISO 10646-2000
Big5	1984	13868
HKSCS	1999	4702
GB18030	2000	27484(+)	Unicode 3.0
Unicode CJK		20902
Unicode CJK Ext. A		6582
Unicode CJK Ext. B		42711
Unicode CJK Ext. C1		~24365

对于个人用户来说，使用收录汉字较多的字库不一定是一件好事，因为这样的字体一般会很大（收录CJK Ext. B的True-Type字库一般为20M以上），占用内存，对系统性能有一定的影响。然而对于汉语学术研究和企业来讲，这样的字库是非常有必要的。特别是对于从事古汉语研究，古籍整理，以及日本韩国文字研究的学者来说，显示和编写不常见字甚至罕用字都是日常工作的一部分。而对于从事中文软件开发的企业，让自己的汉语软件能够不依赖于其他企业的商业字体对于该企业来说是一个非常重要的战略。

对于开源用户来说，拥有一个能够免费获得的、开放的、完备的汉字库是及其有必要的。一般情况下，开源用户没有商业软件用户那样的企业级的支持，从个人用户的角度，拥有这样一个选择无疑将大大减轻使用中文交流的困难；而从开源软件开发的角度，这样一个字库将彻底解决用户端语言显示的问题，大大减少了作者为考虑用户语言显示以及字体版权而需要付出的疑虑，从而使程序开发和文件发布简化。

兼顾效率和开发难度，我们现在集中在Unicode CJK Unified Ideograph规定的20902个汉字的矢量汉字和点阵汉字的开发上。该字体的开发可以解决绝大多数自由软件用户的需求。当这个目标完成后，我们将继续开发其他分区的汉字，使得我们的字体成为开源软件中最完备的字库（这样并不意味着您一下子就安装一个很大的字库，相反的，我们开放的开发模式保证您可以通过您的需求，利用字库中的汉字子集制作对于您来说最为需要的字库）。

1.15. 什么是字体(Font)？常见字体有那几种？

作者：FangQ

答：字体一般来说需要包含两个要素：字符的图像信息和字符编码到这些图像信息的映射。

字体的主要功能是将字符的编码转换为一个图片用以显示在屏幕或者用户界面上。从编码到字符的映射有很多中情况：多个编码映射为一个图像：(比如fi)，一个编码映射到多个图像，但最常见的还是一个编码一个图像。

常见的字体有两大类，一类称为位图字体（或者点阵字体），这类字体一般需要用一个二值(0-1)矩阵来表示一个符号，0-1矩阵信息将在屏幕上转换为黑白图像，这样的字体包括bdf,pcf,fnt,hbf等格式；第二类称为矢量字体(outline font)，这类字体中每一个符号是通过数学曲线来描述的，字体中包含了符号边界上的关键点，连线的导数信息等，字体的渲染引擎通过读取这些数学曲线，然后进行一定的数学运算来进行渲染。这类字体的好处是字体可以无限放大而不产生锯齿，使用于高质量的打印和屏幕显示。矢量字体主要包括Type1和True-Type等几类，其中Type1和True-Type比较可以从如下[链接]查看，简言之，True-Type使用了二次B样条(quadratic Bézier spline)而Type1使用了三次B样条曲线(cubic Bézier spline)来描述符号边界，因而TrueType的数学相对简单，易于hinting。

1.16. 什么叫字体的Hinting技术？什么叫Autohint？

1.17. 什么叫Wiki？与Blog的区别是什么？

作者：FangQ

答：说得简单一点(但不准确)，Wiki就是一个人人都能够编辑的网站。普通的网站一般只允许浏览，不让访问者编辑网页的内容，而Wiki不同，访问Wiki的用户拥有更大的权利，他们不但可以修改网页的内容，而且可以不断添加新的页面。

Wiki是为在线形式的协同式文档开发设计的。分布在网络上的用户可以通过浏览器来共同编写和维护一个开放式的文档，这个文档可以是一本书，可以是一个帮助文件，或是一个备忘录，不论内容是什么，Wiki上的用户对于Wiki文档具有同等的权利――创建、编辑和不断修订，直到所修订的文档接近完美[4]。

或许您会问，那Wiki跟论坛有什么区别呢？简单的说，论坛是为了个人与个人之间的交流，而Wiki是为一个群体进行创作。论坛上好的文章是一个人的劳动结晶，而一个好的Wiki却是无数用户共同劳动的结果。Wiki为这个协作式的创作提供了很多强有力的工具，比如说文档修订历史和版本的自动管理，关键字的自动链接等等。

那Wiki和Blog有什么区别呢？Blog是一个个人信息发布系统，也就是说Blog是针对于个人用户的。Blog的拥有者可以通过他(她)的Blog发布新的信息，修改已有的信息，但浏览者却没有修改这些信息的权利。Wiki则是面向一个群体的，这个群体的所有成员都可以平等地编写文档，而他们对共同编写的文档平等地享受所有权。

其实Wiki的概念早在1995年就由Ward Cunningham提出来了，而Wiki文档和网站的大量发展，还是在近几年，其中比较著名的包括

维基百科：http://en.wikipedia.org/wiki/Main_Page
PlanetMath：http://planetmath.org/

其他关于Wiki的详细解释可以参见如下地址 http://zh.wikipedia.org/wiki/WikiWiki

1.18. 您们制作的字体可以在Windows/Mac/Unix/PalmOS上使用吗？

1.19. 我参与这个计划我能够得到什么？

2. Linux系统中文安装和使用的常见问题

2.1. 如何安装新的字体(BDF/PCF/TTF)？

关于在Linux下如何安装TTF字体，我已整理了一篇文章，计划放在我的个人站点上供大家学习。站点地址
http://lifeng.telebyte.com.cn

2.2. 如何让XMMS的歌曲列表正确显示中文？

在正确安装中文字体以后，进入XMMS的首选项的字体标签栏，选中“使用字体集”，并且在上面一个字体栏中选中一个中文字体。还需要写一个~/.gtkrc，告诉xmms(gtk1.x)程序使用文泉驿的字体。内容如下：

style "gtk-default" {

  fontset ="-wenquanyi-wenquanyi bitmap song-medium-r-normal-*-*-130-*-*-p-*-iso10646-1"

}

class "GtkWidget" style "gtk-default"

2.3. 如何为Acrobat Reader安装中文支持？

Adobe官方已经推出了简体/繁体中文的Adobe reader 7软件，安装后直接支持简/繁体中文的显示。下载页面是
http://www.adobe.com/cn/products/acrobat/readstep2.html 下载完之后解压缩，进入解压出来的目录，运行./INSTALL即可. 对于5.x的Acrobat Reader而言，安装中文支持是相当容易，用户只需要去Adobe的主页下载相应的支持包即可。解压缩后会发现里面有个安装的脚本，执行它然后告诉它您的Acrobat Reader安装在了什么位置即可。对于版本7的Acrobat Reader，一个解决方案是从Windows版的Acrobat7中拷贝相应的文件。或者从5.x的支持包拷贝，只不过这时需要更改一些目录的名称。

2.4. 如何为Xpdf安装中文支持？

对于debian用户非常方便，如果您已经安装了xpdf的话

ailantian@vax:~/GNUworks/vecchinese$ apt-cache search xpdf-chinese

xpdf-chinese-simplified – Portable Document Format (PDF) suite — simplified Chinese language support

xpdf-chinese-traditional – Portable Document Format (PDF) suite — traditional Chinese language support

简体中文用户只需要再装一个xpdf-chinese-simplified就可以了

安装方法和普通软件安装一样

apt-get update

apt-get install xpdf-chinese-simplified

2.5. 如何让Emacs使用WenQuanYi Bitmap Song？

在 fedora 4/5 中，emacs 的版本是 21.4，语言环境是 UTF-8。由于这时 emacs-21.4 无法正确为汉字选择 ISO10646-1 字体，因此需要设置。安装 wqy-bitmapfont-song.noarch RPM 后，数据文件目录 /usr/share/wqy-bitmapfont-song-%{version} 中包含了一份 emacs 的初始化文件 set-my-fonts.el。这份初始化文件包含的函数为 emacs 定义默认使用的字体集。在 $HOME/.emacs 初始化文件中引用这份文件，当 emacs 在 X 窗口系统中运行时，这份文件就会发挥作用。请将文件复制到 $HOME/.emacs.d/ 目录，然后在 $HOME/.emacs 中追加下面两句：

(add-to-list 'load-path "~/.emacs.d/")

(load "set-my-fonts")

默认使用的字体是 "wenquanyi"，这是 wenquanyi 12 的别名。如果希望使用其它字体或字号，请自行修改这份文件中，set-my-font-if-in-x 函数的参数。这份文件还可以在 [fedora-gro cvs] 中找到。这个解决办法是 Hellwolf@seu 在 [linuxsir.org 论坛] 上给出的。

2.6. 如何为Ghostview安装中文字体？

2.7. 如何在OpenOffice中使用中文？

2.8. 如何在Kylix中使用中文？

2.9. 如何设置浏览器(Mozilla/Firefox)中的中文字体？

如果是Firefox 1.0.x，通过主菜单中的“编辑”，“首选项”。打开“选项”窗口，在其中的“基本信息”设置，单击“字体和颜色”按钮，打开“字体和颜色”设置窗口。选择“语言编码”为“简体中文”或者“繁体中文”，然后选择下拉列表中的的字体。

2.10. 如果没有管理员权限，如何安装字体？

将字体复制到 ~/.fonts/ ，重新启动Xwindow即可，但是gtk1的程序(xmms,gmplayer等) 不能使用这些字体。

2.11. 如果没有管理员权限，如何安装输入法？

2.12. Linux下如何书写latex中文文档？

有两个解决办法，一个是使用CCT宏包，该宏包目前在中国大陆的数学类杂志社中使用得较为广泛，其工作原理是外挂式的；一个是使用CJK宏包，该宏包要年轻一些，但是更加符合
LaTeX的习惯，各种
TeX发行版中往往都配备了。

2.13. Linux上如何识别和搜索字体文件？

2.14. 什么是xfs？

2.15. 什么是fontconfig？如何设置fontconfig？

2.16. 在Linux下使用Windows下微软的字体和SimSun是否合法？

2.17. 什么叫Locale？

2.18. Linux下关于语言的环境变量有哪些？相互关系？

2.19. 如何设置系统语言为中文？

2.20. 如何在英文环境下显示和输入中文？

作者：fundawang

答：在英文环境下使用中文对于很多人来说是一个非常有用的设置。特别对于留学生来说，在一个以英语作为主导语言的环境下，既需要能够与身边不讲中文的朋友、导师拥有一个共同的、良好的计算机交流的环境，又需要有效地处理中文电子邮件和浏览中文网页，在英文环境下设置中文对于创造一种没有语言隔阂和偏见的，适合国际交流的计算机环境是一个很好的选择。同时，很多操作系统在进行汉化的过程当中可能会造成某种形式上的性能降低，使用英文语言环境下的中文设置可以尽量减少这种情况造成的影响。

有一件很显然的事情，如果想要显示中文，您必须先在系统中正确安装中文字体或者包含汉语字型的Unicode字体。这个我们在上文已经说到了。这里我们着重说一下如何让系统显示出中文。

一个系统是否能够显示出中文，和系统所支持的字符集是相关的。如果系统只能支持ASCII这个字符集，那么就只能显示大小写英文字母、阿拉伯数字和一些半角的标点符号，也就只能使用纯英语；如果系统支持ISO-8859-1这个字符集，那么就可以支持包括法语、德语、西班牙语等在内的多种欧洲语言。同样，如果系统支持GB2312字符集，就可以显示GB2312-80国标中的所有汉字；如果支持GBK字符集，就可以显示包含“镕”等汉字以及大多数繁体字在内的汉字。

英语环境下，系统的语言环境(locale)一般是 en_US。在大多数Linux发行版中，这个 locale 只能支持 ASCII 字符集。为了扩大locale所支持的字符集，我们必须对locale加以变形。比较常见的变形是en_US.UTF-8。这会使得系统的locale所使用的字符集变成UTF-8。

在更改完系统的locale之后，您可以自己安装自己喜欢的输入法，并按照该输入法的要求修改系统的配置文件。

2.21. 为什么我的中文目录都是乱码？

2.22. 如何mount含有中文目录或文件名的FAT32 Windows分区？

作者：brep

答：使用如下命令：

 mount -t vfat -o iocharset=cp936 /dev/hdxx /path/to/mount_point

作者:cobranail

对于某些使用utf8为默认字符编码的发行版（比如Fedora Core系列，Ubuntu等）来说，应该使用

 mount -t vfat -o iocharset=utf8 /dev/hdxx /path/to/mount_point

2.23. 如何mount含有中文目录或文件名的NTFS Windows分区？

作者：brep

答：使用如下命令：

 mount -t ntfs -o iocharset=cp936 /dev/hdxx /path/to/mount_point

作者:cobranail

对于某些使用utf8为默认字符编码的发行版（比如Fedora Core系列，Ubuntu等）来说，应该使用：

 mount -t ntfs -o iocharset=utf8 /dev/hdxx /path/to/mount_point

对于大部分发行版而言，默认的内核配置是不支持向ntfs文件系统写入数据的。

2.24. 如何让Linux下的java程序正确显示和处理中文？

2.25. 如何让Linux下的Qt程序正确显示和处理中文？

2.26. 如何让Linux下的GTK+/GTK+2.0程序正确显示和处理中文？

2.27. 如何让Linux下的Tcl/Tk程序正确显示和处理中文？

2.28. 如何让Linux下的OpenMotif/Lesstif程序正确显示和处理中文？

2.29. 如何在wine中运行中文windows程序？

2.30. 用什么命令把GB2312/GBK/GB18030编码的文档转换为utf-8编码？如何反向转换？

作者：notXX

答：gb2312/gbk/gb18030 to utf-8使用如下命令将编码为gb18030的file1转化为编码为utf-8的file2：

 iconv -f gb18030 -t utf-8 file1 > file2

有的系统没有gb18030字符集的支持，这个时候可以用：

 iconv -f gbk -t utf-8 file1 > file2

或者：

 iconv -f gb2312 -t utf-8 file1 > file2

 iconv -f gb2312 -t utf-8 file1 -o file2

反之，可以这样转换：

 iconv -f utf-8 -t gb18030 file2 > file1

或者：

 iconv -f utf-8 -t gbk file2 > file1

或者：

 iconv -f utf-8 -t gb2312 file2 > file1

更详细的用法请man iconv

2.31. perl程序中如何转换GB2312/GBK/GB18030编码为utf-8编码？如何反向转换？

=====作者： Yourway 答：从Perl5.8开始，可以使用Encode模块来完成这个操作。 use Encode;

$str_ust8 = encode("utf-8",decode("gbk",$str_gbk)); $str_gbk = encode("gbk", decode('utf-8',$str_utf8));

2.32. C程序中如何转换GB2312/GBK/GB18030编码为utf-8编码？如何反向转换？

作者：notXX

答：参见如下的源代码：

    FILE *fin, *fout;char *encFrom, *encTo;char bufin[1024], bufout[1024], *sin, *sout;int mode, lenin, lenout, ret, nline;iconv_t c_pt;encFrom = "utf-8";encTo   = "gbk";if ((c_pt = iconv_open(encTo, encFrom)) == (iconv_t)-1) {printf("iconv_open false: %s ==> %s/n", encFrom, encTo);return -1;}iconv(c_pt, NULL, NULL, NULL, NULL);strcpy(bufin,"姝ｅ父");lenin  = strlen(bufin) + 1;lenout = 1024;sin    = bufin;sout   = bufout;iconv(c_pt,&sin,(size_t*)&lenin,&sout,(size_t*)&lenout);printf("%s -> %s: ret=%d, len_in=%d, len_out=%d/n",encFrom, encTo, ret, lenin, lenout);iconv_close(c_pt);printf("out= %s/n",&sout);

更详细的用法请man 3 iconv

2.33. 如何让SCIM成为默认输入法？

2.34. 如何让fcitx成为默认输入法？

2.35. Linux下如何输入GBK汉字？

3. 文泉驿点阵宋体用户常见问题

3.1. 我使用的是Debian(Ubuntu/ArchLinux)，成功安装wqy后为什么无法选择这个字体？

作者：FangQ

答：Debian以及Debian-based的Linux系统上默认不支持纯点阵字体了，不过在安装WQY字体时系统并不会报错。重新启用点阵字体，您需要使用下面的命令：

 dpkg-reconfigure fontconfig

然后在回答第三个问题时选择yes即可。

您还可以通过下面命令

 sudo unlink /etc/fonts/conf.d/30-debconf-no-bitmaps.conf

来实现同样的目的。如果您仅希望系统启用wqy点阵字体，您还可以使用carlos的方法，

 sudo vi /etc/fonts/conf.d/50-xfonts-wqy.conf

然后拷贝粘贴下面的内容：

 <selectfont><acceptfont><pattern><patelt name="family"><string>WenQuanYi Bitmap Song</string></patelt></pattern></acceptfont></selectfont>

3.2. 使用Debian的用户，为什么在fc-cache后，fc-list不显示Wenquanyi的点阵字库？

作者：RenYou

在安装文泉驿点阵字体后，使用 fc-cache -v -f 可以看到字体所在的目录被cache了，但是 fc-list 却没有显示相应的字体。这种情况很有可能是因为 fontconfig 的设置中禁用了点阵字体。 Debian用户可以用 dpkg-reconfigure fontconfig 重新配置。

或者您也可以这样，直接到/etc/fonts/conf.d/ 这个目录下面有一个链接文件，unlink掉就可以了。debian默认的不使用点阵字体，去掉链接就可以了

3.3. 我使用的是Debian(Ubuntu/ArchLinux)，在安装了xfonts-wqy包之后发现firefox显示速度变慢，请问应该怎么解决？

作者：FangQ

答：xfonts-wqy是carlosliu和caiqian两个人维护的一个文泉驿字体deb安装包，他们采用了压缩的pcf格式，而pcf.gz格式的字体，特别是在显示中文这样的大字符集时，系统渲染速度比较慢。把字体文件解压可以大大提高显示速度，方法为

 cd /path/to/wqy/font/sudo gunzip *.gzsudo rm fonts*sudo mkfontdir .sudo cp fonts.dir fonts.scalesudo fc-cache -fv

我们正在与xfonts-wqy包的维护者联系，直接使用不压缩的字体格式。

3.4. 我觉得某个汉字点阵比较难看，我应该如何反馈给开发者？

作者：FangQ

答：你可以把你认为难看的汉字输入在
“文泉半两”需要优化的字体列表页面中的规定地方，这样开发者就可以有针对性的进行点阵的优化，使得用户可以尽快使用到优化后的点阵。

当然，对于一些书法基础比较好的朋友，你们可以直接帮助我们优化这些点阵，方法是首先安装我们提供的一个firefox搜索引擎，然后通过这个搜索连接直接定位汉字点阵，自行修改后保存即可。

3.5. 为什么我在term中使用wqy点阵字体，英文很难看，没有办法对齐？

作者：FangQ

答：英文字体有两大类，一类叫等宽字体，所有字母数字宽度相同；一类叫非等宽字体，字母数字宽度不同（比如i和m两个字母）。文泉驿点阵宋体中的英文是非等宽的，而一般term中使用的英文字体要求是等宽的，这样就造成了显示上的问题。我们的建议是：在字体选择对话框中选择一个合适的等宽英文字体，如果系统上正确安装了wqy字体，那么term在显示中文时会自动使用wqy点阵字体来显示。

3.6. 我安装了TTF版本的文泉驿点阵宋体，为何系统升级后字体就无法使用了？

作者：FangQ

答：TTF版本的文泉驿点阵宋体采用了一种比较特殊的TTF格式，即SFNT TTF 格式。这种字体中只有点阵部分，而没有矢量部分。幸运的是，
FreeType2支持这种格式；不幸的是，很多字体设置的工具却不能正确识别这种字体中的信息，比如ttfmkdir和 fc-cache。我们在您下载的TTF安装包里面已经包含了手工编辑的字体设置文件，即 fonts.dir/fonts.scale/fonts.cache-1。您通过如前所述的方法设置好字体路径之后，如果你使用fc-cache -fv等命令(或者升级系统)之后，这些手工书写的文件将会被错误信息覆盖。您所需要作的是进入字体安装的目录，然后解压一个叫作font.config.tar.gz的文件，这样将会将恢复曾经备份过的字体信息。有时候您在解压之后，可能还需要touch *一下，并重新启动X窗口。

3.7. 文泉驿字体是否支持繁体字？

作者：FangQ

答：支持，文泉驿点阵宋体覆盖了Unicode CJK Basic,其中包含了BIG5和GB12345编码中的所有繁体字。

4. 点阵中文制作常见问题

4.1. 在我的浏览器上不能编辑点阵，这是为什么？

4.2. 点阵预览不能自动更新怎么办？

4.3. 我想知道正在编辑的汉字的发音和意思应该怎么操作？

4.4. 如何升级和安装离线点阵制作工具？

4.5. 离线点阵工具在我的机器上无法启动，应该怎么办？

4.6. 离线点阵工具使用过程中异常退出，我应该怎么办？

4.7. 在线编辑时如何为自己设置一个用户名？

4.8. 如何给自己建立一个Wiki页面？

4.9. 如何查看一个点阵汉字的编辑历史？

4.10. 为何有的页面显示“本页只读”？

5. 矢量中文制作常见问题

5.1. 能简单的说一下，怎么进行笔画分析吗？

5.2. 进行笔画分析有什么特别需要注意的吗？

因为生成字体的时候需要笔画，和关键点的位置，所以首先是尽量保证笔画的正确性，然后就是关键点的位置要尽量接近给出的位置，

5.3. 笔画分析程序上方的“笔画数”与真实笔画不符合怎么办？

作者：FangQ

答：这个笔画数中的数字是从Unicode学会网站上的unihan数据库中提取的。由于这个工作可能主要是台湾的学者参与并公布的，所以里面大多数汉字是以繁体字或者台湾书写习惯来进行统计的。

同时，另外一方面，我们现在能够找到的简体中文的开源资源非常非常有限，只有一个GB2312的48X48点阵字库（包含6763个汉字），而被unicode收录的汉字总数有7万多个。台湾拥有更多开源的资源（他们这方面工作做得比较早），其中CNS11643字库收录汉字5万多，我们为了尽可能地利用这些已有的资源，我采用了一个"quick and dirty"的办法，就是把简体中文的GB2312字库和CNS10643字库合并（这就是现在矢量笔画分析器显示的汉字图片，总数约5万多个），同时采用unihan中的笔画数目来进行校准（这些笔画对于很多简体中文字来说是错的）。

当您点击“发送”的时候，程序先检查当前汉字的图片是否是40X40，如果是则说明汉字来源为台湾的CNS11643字库，则检查笔画数是否与数据库中的吻合，不吻合不允许发送（数据库中的笔画数大多与这些繁体字是符合的）；如果图片大小是48X48，说明是来自GB2312字库，这样程序会绕过笔画校验，直接发送（尽管上面显示的笔画数可能与真实制作的不同）。

对于简体中文，现在我还没有找到任何开放授权的笔画数数据库，所以这方面我们没有别的更好的选择，同时，这也说明了我们现在的工作的意义和重要性。

在笔画分析程序1.0正式版本中，对于笔画数目，我将添加几个新功能：

“笔画数”改名为“推荐笔画数”，然后点击出现一个说明
用户可以对汉字添加注释，用户可以在其中说明汉字笔画数是否符合，对笔序的讨论、是否是台湾写法等等
强制发送功能，如果您确信您录入的笔画是正确的，则按Ctrl+发送键，此时会取消笔画数校验。

新版本很快会发布出来。