当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 4 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 问一个vim文本处理技术的问题
帖子发表于 : 2010-12-07 10:36 

注册: 2009-02-23 15:52
帖子: 40
送出感谢: 5
接收感谢: 0 次
我想要一个常用英文单词的词典文件(用于词典补全),但是在网上找不到,于是我想自己做一个。
我手头有一些其他软件的词典文件,用vim打开后,但是里面除了英文单词外还有很多其他的字符乱码。我想知道如何将连续的 非a-zA-Z 字符变成一个换行符?
这样就可以把每个单词变成一行,另外如何删除列数小于5的行(也就是单词长度小于5的单词,这样的单词没必要补全)?还有,如何删除重复的行?


页首
 用户资料  
 
2 楼 
 文章标题 : Re: 问一个vim文本处理技术的问题
帖子发表于 : 2010-12-07 11:39 
头像

注册: 2009-04-11 23:46
帖子: 4130
系统: Arch Linux
送出感谢: 11
接收感谢: 124
这个就不用 Vim 了吧。这样试试:
代码:
awk '
BEGIN {
  RS="[^A-Za-z]+"
}
{
  if(length($0) >= 5){
    print $0
  }
}
'|sort|uniq


_________________
我的博客 https://blog.lilydjwg.me/
提问的智慧
Arch Linux 中文论坛

我的vimrc: https://git.io/vimrc


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 问一个vim文本处理技术的问题
帖子发表于 : 2010-12-07 11:58 
头像

注册: 2009-04-11 23:46
帖子: 4130
系统: Arch Linux
送出感谢: 11
接收感谢: 124
Vim 里试下以下命令,可能速度有些慢。
代码:
:%s/[^[:alpha:]]\+/\r/g
:v/...../d
:sort u


_________________
我的博客 https://blog.lilydjwg.me/
提问的智慧
Arch Linux 中文论坛

我的vimrc: https://git.io/vimrc


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 问一个vim文本处理技术的问题
帖子发表于 : 2010-12-07 12:30 

注册: 2009-02-23 15:52
帖子: 40
送出感谢: 5
接收感谢: 0 次
lilydjwg 写道:
Vim 里试下以下命令,可能速度有些慢。
代码:
:%s/[^[:alpha:]]\+/\r/g
:v/...../d
:sort u


非常好,只是第一条命令要执行上百次,不过利用宏很好的完成了。最终完全达到了我要的效果。谢谢你了! :em11


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 4 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译