请问显示所有中文文件名文件

sh/bash/dash/ksh/zsh等Shell脚本
回复
xwyxn
帖子: 359
注册时间: 2008-03-30 12:19

请问显示所有中文文件名文件

#1

帖子 xwyxn » 2009-11-04 23:03

请问1,用find或其他,找出所有中文文件名文件?
2,中文开头的文件
如何表达谢谢啦!
头像
xiooli
帖子: 6956
注册时间: 2007-11-19 21:51
来自: 成都
联系:

Re: 请问显示所有中文文件名文件

#2

帖子 xiooli » 2009-11-04 23:05

xxx|grep -v "[a-zA-Z]*" 之类的
xwyxn
帖子: 359
注册时间: 2008-03-30 12:19

Re: 请问显示所有中文文件名文件

#3

帖子 xwyxn » 2009-11-04 23:54

貌似不行
JiangHui
论坛版主
帖子: 21308
注册时间: 2007-08-02 20:29
系统: 窓辺とうこ

Re: 请问显示所有中文文件名文件

#4

帖子 JiangHui » 2009-11-04 23:58

用shell脚本很难吧,非中文字符那么多,不可能一个个敲,你怎么让他识别是不是中文
头像
xzap
帖子: 256
注册时间: 2006-08-24 21:25

Re: 请问显示所有中文文件名文件

#5

帖子 xzap » 2009-11-05 21:52

一楼已经给出答案了阿,怎么会不行呢。
楼主不会照着打xxx吧。 :em02

其实就是用grep的- v选项不输出匹配的就可以了。剩下的就是不匹配的了,举个例子。

代码: 全选

ls |grep -v "^[a-zA-Z_]"
如果开头还有奇怪的字符就都放进去

也可以

代码: 全选

ls |grep "^[^\u4E00-\u9FA50-9A-Za-z]"
反正都是一个意思,不完美,但是随便用用肯定可以的

但是还是会有匹配标点符号的
aerofox
帖子: 1453
注册时间: 2008-05-24 8:30

Re: 请问显示所有中文文件名文件

#6

帖子 aerofox » 2009-11-06 0:23

二楼的办法肯定不行,他把所以带英文字符的文件名都排除了。

我有一点思路,可以用来找出带非ASCII字符的文件,如果想区分中文字符和其它非英语字符,还真没有思路。

在UTF8编码中,中文字符占3个字节(其它编码也不止占一个字节),而ASCII字符只占一个字节,所以如果一个字符串占用的字节数多于字符串的长度,一般来说就可以判断它包含中文字符。下面这个脚本完成这一功能。

代码: 全选

#!/bin/bash
[ `echo -n "$1" | wc -c` -gt ${#1} ]
把这个脚本存成 has_unicode,放到 PATH 指定的一个路径下,那么可以结合 find 找出带 UNICODE 字符的文件并做相应处理(这里只是显示出来):

代码: 全选

find ~ -exec has_unicode {} \; -print
如果想找第一个字符是中文字符,只要把第一字符找出来就可以用相同的方法判断它是哪类字符。有很多种方法可以取出一个字符串的第一个字符,这是其中一种方法:

代码: 全选

a="一个字符串"
b="${a:0:1}"
echo "$b"
一
xwyxn
帖子: 359
注册时间: 2008-03-30 12:19

Re: 请问显示所有中文文件名文件

#7

帖子 xwyxn » 2009-11-06 5:41

谢谢各位!尤其六楼
二楼答案排除了所有英文字符,这样的文件很少,至少扩展名是基本是英文的!

不是标点符号开头怎么表示?排除英文数字,^[a-zA-Z0-9],
如果中文能像a-z这样精确表达就好了!
aerofox
帖子: 1453
注册时间: 2008-05-24 8:30

Re: 请问显示所有中文文件名文件

#8

帖子 aerofox » 2009-11-06 6:54

标点符号比较少,可以考虑直接列举出来
回复