请问1,用find或其他,找出所有中文文件名文件?
2,中文开头的文件
如何表达谢谢啦!
请问显示所有中文文件名文件
-
- 帖子: 359
- 注册时间: 2008-03-30 12:19
- xiooli
- 帖子: 6956
- 注册时间: 2007-11-19 21:51
- 来自: 成都
- 联系:
Re: 请问显示所有中文文件名文件
xxx|grep -v "[a-zA-Z]*" 之类的
-
- 帖子: 359
- 注册时间: 2008-03-30 12:19
Re: 请问显示所有中文文件名文件
貌似不行
-
- 论坛版主
- 帖子: 21308
- 注册时间: 2007-08-02 20:29
- 系统: 窓辺とうこ
Re: 请问显示所有中文文件名文件
用shell脚本很难吧,非中文字符那么多,不可能一个个敲,你怎么让他识别是不是中文
- xzap
- 帖子: 256
- 注册时间: 2006-08-24 21:25
-
- 帖子: 1453
- 注册时间: 2008-05-24 8:30
Re: 请问显示所有中文文件名文件
二楼的办法肯定不行,他把所以带英文字符的文件名都排除了。
我有一点思路,可以用来找出带非ASCII字符的文件,如果想区分中文字符和其它非英语字符,还真没有思路。
在UTF8编码中,中文字符占3个字节(其它编码也不止占一个字节),而ASCII字符只占一个字节,所以如果一个字符串占用的字节数多于字符串的长度,一般来说就可以判断它包含中文字符。下面这个脚本完成这一功能。
把这个脚本存成 has_unicode,放到 PATH 指定的一个路径下,那么可以结合 find 找出带 UNICODE 字符的文件并做相应处理(这里只是显示出来):
如果想找第一个字符是中文字符,只要把第一字符找出来就可以用相同的方法判断它是哪类字符。有很多种方法可以取出一个字符串的第一个字符,这是其中一种方法:
我有一点思路,可以用来找出带非ASCII字符的文件,如果想区分中文字符和其它非英语字符,还真没有思路。
在UTF8编码中,中文字符占3个字节(其它编码也不止占一个字节),而ASCII字符只占一个字节,所以如果一个字符串占用的字节数多于字符串的长度,一般来说就可以判断它包含中文字符。下面这个脚本完成这一功能。
代码: 全选
#!/bin/bash
[ `echo -n "$1" | wc -c` -gt ${#1} ]
代码: 全选
find ~ -exec has_unicode {} \; -print
代码: 全选
a="一个字符串"
b="${a:0:1}"
echo "$b"
一
-
- 帖子: 359
- 注册时间: 2008-03-30 12:19
Re: 请问显示所有中文文件名文件
谢谢各位!尤其六楼
二楼答案排除了所有英文字符,这样的文件很少,至少扩展名是基本是英文的!
不是标点符号开头怎么表示?排除英文数字,^[a-zA-Z0-9],
如果中文能像a-z这样精确表达就好了!
二楼答案排除了所有英文字符,这样的文件很少,至少扩展名是基本是英文的!
不是标点符号开头怎么表示?排除英文数字,^[a-zA-Z0-9],
如果中文能像a-z这样精确表达就好了!
-
- 帖子: 1453
- 注册时间: 2008-05-24 8:30
Re: 请问显示所有中文文件名文件
标点符号比较少,可以考虑直接列举出来