分页: 1 / 1

请问显示所有中文文件名文件

发表于 : 2009-11-04 23:03
xwyxn
请问1,用find或其他,找出所有中文文件名文件?
2,中文开头的文件
如何表达谢谢啦!

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-04 23:05
xiooli
xxx|grep -v "[a-zA-Z]*" 之类的

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-04 23:54
xwyxn
貌似不行

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-04 23:58
JiangHui
用shell脚本很难吧,非中文字符那么多,不可能一个个敲,你怎么让他识别是不是中文

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-05 21:52
xzap
一楼已经给出答案了阿,怎么会不行呢。
楼主不会照着打xxx吧。 :em02

其实就是用grep的- v选项不输出匹配的就可以了。剩下的就是不匹配的了,举个例子。

代码: 全选

ls |grep -v "^[a-zA-Z_]"
如果开头还有奇怪的字符就都放进去

也可以

代码: 全选

ls |grep "^[^\u4E00-\u9FA50-9A-Za-z]"
反正都是一个意思,不完美,但是随便用用肯定可以的

但是还是会有匹配标点符号的

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-06 0:23
aerofox
二楼的办法肯定不行,他把所以带英文字符的文件名都排除了。

我有一点思路,可以用来找出带非ASCII字符的文件,如果想区分中文字符和其它非英语字符,还真没有思路。

在UTF8编码中,中文字符占3个字节(其它编码也不止占一个字节),而ASCII字符只占一个字节,所以如果一个字符串占用的字节数多于字符串的长度,一般来说就可以判断它包含中文字符。下面这个脚本完成这一功能。

代码: 全选

#!/bin/bash
[ `echo -n "$1" | wc -c` -gt ${#1} ]
把这个脚本存成 has_unicode,放到 PATH 指定的一个路径下,那么可以结合 find 找出带 UNICODE 字符的文件并做相应处理(这里只是显示出来):

代码: 全选

find ~ -exec has_unicode {} \; -print
如果想找第一个字符是中文字符,只要把第一字符找出来就可以用相同的方法判断它是哪类字符。有很多种方法可以取出一个字符串的第一个字符,这是其中一种方法:

代码: 全选

a="一个字符串"
b="${a:0:1}"
echo "$b"
一

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-06 5:41
xwyxn
谢谢各位!尤其六楼
二楼答案排除了所有英文字符,这样的文件很少,至少扩展名是基本是英文的!

不是标点符号开头怎么表示?排除英文数字,^[a-zA-Z0-9],
如果中文能像a-z这样精确表达就好了!

Re: 请问显示所有中文文件名文件

发表于 : 2009-11-06 6:54
aerofox
标点符号比较少,可以考虑直接列举出来