Linux 中文字符集(linux 中文字符)-编程之家

linux怎么看文件的字符集编码?

可以在命令行执行file命令查看返回信息以便确认文件的字符集编码。

格式:file 文件名

例如:

# file ABC.log

ABC.log: UTF-8 Unicode text

从结果看该文件是utf-8格式

# file word.txt
word.txt: ASCII text

从结果看该文件是gbk格式

如果不符合要求,可以通过iconv命令更改文件格式。

kalilinux怎么换成中文显示啊?

你好,dpkg-reconfigure locales选择字符编码:en_US.UTF-8、zh_CN.GBK、zh_CN.UTF-8选择字符:zh_CN.UTF-8(记得用空格)设置完后reboot

怎么判断一个字符串是中文,标点符号?

如果想采用类似ispunct函数的方式找出UTF-8字符串中全部的标点(包括中英文标点)可以参考以下方法:先将UTF8 string转为wchar_t字符类型的wstring。这个可以借助第三方库、系统API(例如windows的MultiByteToWideChar)、C++11的<codecvt>等。之后用<locale>库的ispunct模板函数来识别标点符号。这个函数用法和C版本的ispunct差不多,只是多了字符类型模板参数和一个本地环境locale参数,因此可以根据locale判断出英文字符以外的符号。在中文系统语言的windows下一般不显式设置locale就可以工作:

而linux环境下如果要识别英文以外的标点可能需要指定locale:由于各系统平台下locale配置都不同(有些环境下甚至没有可用的locale),所以如果对移植兼容性要求比较高的话,建议还是采用先转为UTF-16/UTF-32再正则表达式过滤的手段。

linux文件属性的10个字符各代表什么意思?

10个字符表示文件类别和权限,具体如下: 第一个字符表示文件类别,代表的含义如下: -:普通文件 d:目录文件 b:块设备文件 c:字符设备文件 l:符号链接文件 后面9个字符代表3组访问权限: 第1组的3个字符是授权文件所有者的权限; 第2组的3个字符是授权同组用户的权限; 第3组的3个字符是授权其他用户的权限。 每一组的3个字符一次表示读、写、执行权限,其中: r:表示有读权限 w:表示有写权限 x:表示有执行权限 -:表示没有相应的权限