用一个脚本去除文件里的所有汉字

sh/bash/dash/ksh/zsh等Shell脚本
头像
qiang_liu8183
论坛版主
帖子: 10699
注册时间: 2006-09-10 22:36
系统: Arch Debian
来自: 北京

用一个脚本去除文件里的所有汉字

#1

帖子 qiang_liu8183 » 2008-01-16 0:58

她刚用Ubuntu三个多月,刚才突然问我怎么用脚本去掉一个文件里的所有汉字,真把我问住了,这要求是不是有点变态啊?能实现吗?
上次由 qiang_liu8183 在 2008-01-25 14:55,总共编辑 1 次。
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲
头像
xiooli
帖子: 6956
注册时间: 2007-11-19 21:51
来自: 成都
联系:

#2

帖子 xiooli » 2008-01-16 1:21

保留所有的字母和符号不就行了吗?
Joolix live OS: http://joolix.com

代码: 全选

dpkg -l|awk '/^rc/{print $2}'|sudo xargs dpkg -P
头像
qiang_liu8183
论坛版主
帖子: 10699
注册时间: 2006-09-10 22:36
系统: Arch Debian
来自: 北京

#3

帖子 qiang_liu8183 » 2008-01-16 5:46

xiooli 写了:保留所有的字母和符号不就行了吗?
具体应该怎么写? :em23
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲
头像
stlxv
论坛版主
帖子: 8275
注册时间: 2006-05-03 0:39
来自: المريخ

#4

帖子 stlxv » 2008-01-16 5:50

qiang_liu8183 写了:
xiooli 写了:保留所有的字母和符号不就行了吗?
具体应该怎么写? :em23
你要去掉什么样子的中文?保留什么样子的文字!?

这个问题和具体编码有关,得说清楚了才知道怎么做。

要不再教你一招:把系统所有含有中文的字体全部删除,然后再打开你的那个要删掉所有中文的文件看看(这方法WORD有效,OOo不知道有效不) 8) 8) 8)
PHP是最好的语言!不服来战!
头像
laborer
帖子: 1016
注册时间: 2005-10-25 11:15
联系:

#5

帖子 laborer » 2008-01-16 5:55

代码: 全选

$ echo "测试123.a b c测试" | iconv -c -t ascii
123.a b c
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#6

帖子 eexpress » 2008-01-16 8:35

标题不好哦。
那外国佬的ed2kopera的脚本,就是去掉中文的。论坛有。
● 鸣学
头像
qiang_liu8183
论坛版主
帖子: 10699
注册时间: 2006-09-10 22:36
系统: Arch Debian
来自: 北京

#7

帖子 qiang_liu8183 » 2008-01-16 8:55

stlxv 写了:
qiang_liu8183 写了:
xiooli 写了:保留所有的字母和符号不就行了吗?
具体应该怎么写? :em23
你要去掉什么样子的中文?保留什么样子的文字!?

这个问题和具体编码有关,得说清楚了才知道怎么做。

要不再教你一招:把系统所有含有中文的字体全部删除,然后再打开你的那个要删掉所有中文的文件看看(这方法WORD有效,OOo不知道有效不) 8) 8) 8)
去掉一个文件里所有的中文!其它文字保留
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲
头像
qiang_liu8183
论坛版主
帖子: 10699
注册时间: 2006-09-10 22:36
系统: Arch Debian
来自: 北京

#8

帖子 qiang_liu8183 » 2008-01-16 8:57

eexpress 写了:标题不好哦。
那外国佬的ed2kopera的脚本,就是去掉中文的。论坛有。
标题不好?怎么讲?ee知道那个脚本在哪里吗?有链接没?
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲
头像
qiang_liu8183
论坛版主
帖子: 10699
注册时间: 2006-09-10 22:36
系统: Arch Debian
来自: 北京

#9

帖子 qiang_liu8183 » 2008-01-16 8:59

stlxv 写了:要不再教你一招:把系统所有含有中文的字体全部删除,然后再打开你的那个要删掉所有中文的文件看看(这方法WORD有效,OOo不知道有效不) 8) 8) 8)
这偏方比较变态哦~~~ :em27
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#10

帖子 eexpress » 2008-01-16 9:05

ed2kopera nc 这就是关键词。我不记得地址。我的那个早删除了。
● 鸣学
头像
iblicf
帖子: 3766
注册时间: 2007-01-15 17:15

#11

帖子 iblicf » 2008-01-16 9:29

tr -d '[\200-\377]' < ./src >target

before:
===============================================
43536454
EE 是猪头
o657465209842-94722983472389457#%$#%$^#%^#$
你好
我是谁
alsd阿三地方asd fa哈哈
alsd阿三地方asd fa哈哈
AAAAAAAAAABBBBBBBBBBBBBBBBB
~!@#$@#%#$%*%^&*^()_*)_
==============================================

after:
==============================================
43536454
EE
o657465209842-94722983472389457#%$#%$^#%^#$


alsdasd fa
alsdasd fa
AAAAAAAAAABBBBBBBBBBBBBBBBB
~!@#$@#%#$%*%^&*^()_*)_
上次由 iblicf 在 2008-01-16 9:35,总共编辑 2 次。
头像
patrickhe
帖子: 681
注册时间: 2005-07-21 19:13
来自: Peking, China
联系:

#12

帖子 patrickhe » 2008-01-16 9:31

5楼的方法不是很好吗?
icefireelf
帖子: 3
注册时间: 2007-04-12 14:29

#13

帖子 icefireelf » 2008-01-24 22:10

最简单的方法:
strings 文件名
strings这个linux的内置命令就没考虑过支持汉字,因此完全达标.......
头像
BigSnake.NET
帖子: 12522
注册时间: 2006-07-02 11:16
来自: 廣州
联系:

#14

帖子 BigSnake.NET » 2008-01-24 22:12

icefireelf 写了:最简单的方法:
strings 文件名
strings这个linux的内置命令就没考虑过支持汉字,因此完全达标.......
这招太狠了..
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。
头像
iblicf
帖子: 3766
注册时间: 2007-01-15 17:15

#15

帖子 iblicf » 2008-01-24 22:21

。。。呵呵,strings,这个贴挺有意思呢, ascii (128-255 ) 的 unicode 用来做多字节编码,我那个替换比较规矩,可惜 sed 不支持 !
回复