请问显示所有中文文件名文件

xwyxn · #1

请问1，用find或其他，找出所有中文文件名文件？
2，中文开头的文件
如何表达谢谢啦！

xiooli · #2

xxx|grep -v "[a-zA-Z]*" 之类的

xwyxn · #3

貌似不行

JiangHui · #4

用shell脚本很难吧，非中文字符那么多，不可能一个个敲，你怎么让他识别是不是中文

xzap · #5

一楼已经给出答案了阿，怎么会不行呢。
楼主不会照着打xxx吧。

其实就是用grep的- v选项不输出匹配的就可以了。剩下的就是不匹配的了，举个例子。

代码：全选

ls |grep -v "^[a-zA-Z_]"

如果开头还有奇怪的字符就都放进去

也可以

代码：全选

ls |grep "^[^\u4E00-\u9FA50-9A-Za-z]"

反正都是一个意思，不完美，但是随便用用肯定可以的

但是还是会有匹配标点符号的

aerofox · #6

二楼的办法肯定不行，他把所以带英文字符的文件名都排除了。

我有一点思路，可以用来找出带非ASCII字符的文件，如果想区分中文字符和其它非英语字符，还真没有思路。

在UTF8编码中，中文字符占3个字节（其它编码也不止占一个字节），而ASCII字符只占一个字节，所以如果一个字符串占用的字节数多于字符串的长度，一般来说就可以判断它包含中文字符。下面这个脚本完成这一功能。

代码：全选

#!/bin/bash
[ `echo -n "$1" | wc -c` -gt ${#1} ]

把这个脚本存成 has_unicode，放到 PATH 指定的一个路径下，那么可以结合 find 找出带 UNICODE 字符的文件并做相应处理（这里只是显示出来）：

代码：全选

find ~ -exec has_unicode {} \; -print

如果想找第一个字符是中文字符，只要把第一字符找出来就可以用相同的方法判断它是哪类字符。有很多种方法可以取出一个字符串的第一个字符，这是其中一种方法:

代码：全选

a="一个字符串"
b="${a:0:1}"
echo "$b"
一

xwyxn · #7

谢谢各位！尤其六楼
二楼答案排除了所有英文字符，这样的文件很少，至少扩展名是基本是英文的！

不是标点符号开头怎么表示？排除英文数字，^[a-zA-Z0-9]，
如果中文能像a-z这样精确表达就好了！

aerofox · #8

标点符号比较少，可以考虑直接列举出来

请问显示所有中文文件名文件

请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件

Re: 请问显示所有中文文件名文件