当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 20 篇帖子 ]  前往页数 1, 2  下一页
作者 内容
1 楼 
 文章标题 : 用一个脚本去除文件里的所有汉字
帖子发表于 : 2008-01-16 0:58 
头像

注册: 2006-09-10 22:36
帖子: 10663
地址: 北京
送出感谢: 1
接收感谢: 16
她刚用Ubuntu三个多月,刚才突然问我怎么用脚本去掉一个文件里的所有汉字,真把我问住了,这要求是不是有点变态啊?能实现吗?


_________________
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲


最后由 qiang_liu8183 编辑于 2008-01-25 14:55,总共编辑了 1 次

页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-01-16 1:21 
头像

注册: 2007-11-19 21:51
帖子: 6956
地址: 成都
送出感谢: 0 次
接收感谢: 4
保留所有的字母和符号不就行了吗?


_________________
Joolix live OS: http://joolix.com
代码:
dpkg -l|awk '/^rc/{print $2}'|sudo xargs dpkg -P


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-01-16 5:46 
头像

注册: 2006-09-10 22:36
帖子: 10663
地址: 北京
送出感谢: 1
接收感谢: 16
xiooli 写道:
保留所有的字母和符号不就行了吗?

具体应该怎么写? :em23


_________________
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲


页首
 用户资料  
 
4 楼 
 文章标题 :
帖子发表于 : 2008-01-16 5:50 
头像

注册: 2006-05-03 0:39
帖子: 8273
地址: المريخ
送出感谢: 0 次
接收感谢: 1
qiang_liu8183 写道:
xiooli 写道:
保留所有的字母和符号不就行了吗?

具体应该怎么写? :em23
你要去掉什么样子的中文?保留什么样子的文字!?

这个问题和具体编码有关,得说清楚了才知道怎么做。

要不再教你一招:把系统所有含有中文的字体全部删除,然后再打开你的那个要删掉所有中文的文件看看(这方法WORD有效,OOo不知道有效不) 8) 8) 8)


_________________
PHP是最好的语言!不服来战!


页首
 用户资料  
 
5 楼 
 文章标题 :
帖子发表于 : 2008-01-16 5:55 
头像

注册: 2005-10-25 11:15
帖子: 1016
送出感谢: 0 次
接收感谢: 1
代码:
$ echo "测试123.a b c测试" | iconv -c -t ascii
123.a b c


_________________
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser


页首
 用户资料  
 
6 楼 
 文章标题 :
帖子发表于 : 2008-01-16 8:35 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
标题不好哦。
那外国佬的ed2kopera的脚本,就是去掉中文的。论坛有。


_________________
● 鸣学


页首
 用户资料  
 
7 楼 
 文章标题 :
帖子发表于 : 2008-01-16 8:55 
头像

注册: 2006-09-10 22:36
帖子: 10663
地址: 北京
送出感谢: 1
接收感谢: 16
stlxv 写道:
qiang_liu8183 写道:
xiooli 写道:
保留所有的字母和符号不就行了吗?

具体应该怎么写? :em23
你要去掉什么样子的中文?保留什么样子的文字!?

这个问题和具体编码有关,得说清楚了才知道怎么做。

要不再教你一招:把系统所有含有中文的字体全部删除,然后再打开你的那个要删掉所有中文的文件看看(这方法WORD有效,OOo不知道有效不) 8) 8) 8)

去掉一个文件里所有的中文!其它文字保留


_________________
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲


页首
 用户资料  
 
8 楼 
 文章标题 :
帖子发表于 : 2008-01-16 8:57 
头像

注册: 2006-09-10 22:36
帖子: 10663
地址: 北京
送出感谢: 1
接收感谢: 16
eexpress 写道:
标题不好哦。
那外国佬的ed2kopera的脚本,就是去掉中文的。论坛有。

标题不好?怎么讲?ee知道那个脚本在哪里吗?有链接没?


_________________
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲


页首
 用户资料  
 
9 楼 
 文章标题 :
帖子发表于 : 2008-01-16 8:59 
头像

注册: 2006-09-10 22:36
帖子: 10663
地址: 北京
送出感谢: 1
接收感谢: 16
stlxv 写道:
要不再教你一招:把系统所有含有中文的字体全部删除,然后再打开你的那个要删掉所有中文的文件看看(这方法WORD有效,OOo不知道有效不) 8) 8) 8)


这偏方比较变态哦~~~ :em27


_________________
看破、放下、自在、随缘、念佛
真诚、清净、平等、正觉、慈悲


页首
 用户资料  
 
10 楼 
 文章标题 :
帖子发表于 : 2008-01-16 9:05 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
ed2kopera nc 这就是关键词。我不记得地址。我的那个早删除了。


_________________
● 鸣学


页首
 用户资料  
 
11 楼 
 文章标题 :
帖子发表于 : 2008-01-16 9:29 
头像

注册: 2007-01-15 17:15
帖子: 3766
送出感谢: 0 次
接收感谢: 0 次
tr -d '[\200-\377]' < ./src >target

before:
===============================================
43536454
EE 是猪头
o657465209842-94722983472389457#%$#%$^#%^#$
你好
我是谁
alsd阿三地方asd fa哈哈
alsd阿三地方asd fa哈哈
AAAAAAAAAABBBBBBBBBBBBBBBBB
~!@#$@#%#$%*%^&*^()_*)_
==============================================

after:
==============================================
43536454
EE
o657465209842-94722983472389457#%$#%$^#%^#$


alsdasd fa
alsdasd fa
AAAAAAAAAABBBBBBBBBBBBBBBBB
~!@#$@#%#$%*%^&*^()_*)_


最后由 iblicf 编辑于 2008-01-16 9:35,总共编辑了 2 次

页首
 用户资料  
 
12 楼 
 文章标题 :
帖子发表于 : 2008-01-16 9:31 
头像

注册: 2005-07-21 19:13
帖子: 681
地址: Peking, China
送出感谢: 0 次
接收感谢: 0 次
5楼的方法不是很好吗?


页首
 用户资料  
 
13 楼 
 文章标题 :
帖子发表于 : 2008-01-24 22:10 

注册: 2007-04-12 14:29
帖子: 3
送出感谢: 0 次
接收感谢: 0 次
最简单的方法:
strings 文件名
strings这个linux的内置命令就没考虑过支持汉字,因此完全达标.......


页首
 用户资料  
 
14 楼 
 文章标题 :
帖子发表于 : 2008-01-24 22:12 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
icefireelf 写道:
最简单的方法:
strings 文件名
strings这个linux的内置命令就没考虑过支持汉字,因此完全达标.......

这招太狠了..


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
15 楼 
 文章标题 :
帖子发表于 : 2008-01-24 22:21 
头像

注册: 2007-01-15 17:15
帖子: 3766
送出感谢: 0 次
接收感谢: 0 次
。。。呵呵,strings,这个贴挺有意思呢, ascii (128-255 ) 的 unicode 用来做多字节编码,我那个替换比较规矩,可惜 sed 不支持 !


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 20 篇帖子 ]  前往页数 1, 2  下一页

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译