当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 11 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-03-05 23:55 
头像

注册: 2009-07-22 22:23
帖子: 1376
送出感谢: 2
接收感谢: 4
由于研究的关系,经常需要下载一些专利文本。专利文本的一个特点经常是带压缩包的tiff文件,例如一个zip文件,里面有若干tif文件。虽然解压缩,制作pdf都是很容易的。但是一旦这类zip文件多了,一个个处理就很麻烦,于是想到用bash程序来解决。
本人是bash菜鸟,非常的菜,只能学习和理解一些基本的命令,因此写出来的很不好看,但是能用了,希望抛砖引玉。

假定:
下载了若干专利文件,皆为zip文件,下载时就已经用中文进行了命名,如“一种×××.zip”,现在要将每一个压缩包解压并生成单个的pdf文档。命令如下:

代码:
for file in `ls *.zip`;       #得到各文件的文件名
do
   echo ${file%.zip};    #得到的文件名去后缀
   dir=${file%.zip};    #将处理的文件名赋予变量dir
   mkdir $dir;         #建立以dir为文件名的目录
   cp -a $file $dir;    #将目标文件(zip)拷贝到新建的文件夹
   cd $dir;         #进入该文件夹
   unzip -j *.zip;       #解压目标文件(不包含目录)
   rm *.zip;         #删除zip文件
   tiffcp *.tif $dir.pdf;   #根据文件夹中的tiff文件生成pdf文档
   rm *.tif;         #删除tif文件
   mv *.pdf ..;      #将生成的pdf文件移动到文件夹外
   cd ..;         #回上一级目录
   rm -R $dir;         #删除以专利名称命名的文件夹
done;



如果你有更好的方法,请跟帖分享, :em03


_________________
愿扣上你双手,至繁华浪处到沙丘。


页首
 用户资料  
 
2 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-03-06 0:22 
头像

注册: 2010-06-16 1:05
帖子: 14668
地址: Tencent
系统: Mac OS X
送出感谢: 1
接收感谢: 153
for in *.zip就行了,不用ls


_________________
twitter求fo:http://twitter.com/maplebeats
博客求踩:http://maplebeats.com


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-03-06 8:46 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 274
曾在某专利文件里面,加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的,估计以为是病毒。 :em04


_________________
● 鸣学


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-03-06 10:19 
头像

注册: 2009-07-22 22:23
帖子: 1376
送出感谢: 2
接收感谢: 4
eexpress 写道:
曾在某专利文件里面,加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的,估计以为是病毒。 :em04

国内专利不一般是纸质申请材料么?


_________________
愿扣上你双手,至繁华浪处到沙丘。


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-03-06 10:43 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 274
perl又不是二进制。是文本啊。


_________________
● 鸣学


页首
 用户资料  
 
6 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-03-06 11:34 
头像

注册: 2009-07-22 22:23
帖子: 1376
送出感谢: 2
接收感谢: 4
eexpress 写道:
perl又不是二进制。是文本啊。

我以为你弄了个perl程序放在电子文档中呢。原来是写在纸上的程序,一般人都会觉得这程序很奇怪的。 :em02


_________________
愿扣上你双手,至繁华浪处到沙丘。


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-04-01 10:56 
头像

注册: 2012-11-06 12:43
帖子: 287
地址: 安徽合肥
系统: arch,ubuntu
送出感谢: 7
接收感谢: 0 次
为什么目录建了删
删了建
在当前目录或者新建一个不就行了么?

Sent from my MI 1S using Tapatalk 2


_________________
Luckily,I have google.

新手,请大家不吝赐教,十分感谢


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-04-01 11:43 
头像

注册: 2006-02-28 3:11
帖子: 2470
送出感谢: 0 次
接收感谢: 0 次
请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?


_________________
一梦三年,
松风依旧,
萝月何曾老.


灵幽听微, 谁观玉颜?
灼灼春华, 绿叶含丹.


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-04-05 1:03 
头像

注册: 2009-12-01 13:34
帖子: 78
送出感谢: 2
接收感谢: 5
唉,我真是闲的……

代码:
tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir


_________________
myshell^_^
xfce4.10最好用了……
舒适的滚轮升起焦点设计,大量快捷键,alt移动,糟糕的桌面图标……
珍爱生命,LFS 三思~


页首
 用户资料  
 
10 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-04-05 23:34 
头像

注册: 2009-07-22 22:23
帖子: 1376
送出感谢: 2
接收感谢: 4
yjcong 写道:
请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?


是的,需要查新否则已公布的任何结果都可能成为专利申请的障碍。
我一般是在http://www.cnipr.com/查,知识产权局和cnki也可以查,申请一个中国发明专利一般2000元以下,如果有附属物的话可能更多。专利从申请到授权约一年半到两年时间。


_________________
愿扣上你双手,至繁华浪处到沙丘。


页首
 用户资料  
 
11 楼 
 文章标题 : Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本
帖子发表于 : 2013-04-05 23:37 
头像

注册: 2009-07-22 22:23
帖子: 1376
送出感谢: 2
接收感谢: 4
needle 写道:
唉,我真是闲的……

代码:
tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir

:em11


_________________
愿扣上你双手,至繁华浪处到沙丘。


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 11 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 2 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译