菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

sh/bash/dash/ksh/zsh等Shell脚本
回复
头像
shinery
帖子: 1376
注册时间: 2009-07-22 22:23
送出感谢: 2 次
接收感谢: 4 次

菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#1

帖子 shinery » 2013-03-05 23:55

由于研究的关系,经常需要下载一些专利文本。专利文本的一个特点经常是带压缩包的tiff文件,例如一个zip文件,里面有若干tif文件。虽然解压缩,制作pdf都是很容易的。但是一旦这类zip文件多了,一个个处理就很麻烦,于是想到用bash程序来解决。
本人是bash菜鸟,非常的菜,只能学习和理解一些基本的命令,因此写出来的很不好看,但是能用了,希望抛砖引玉。

假定:
下载了若干专利文件,皆为zip文件,下载时就已经用中文进行了命名,如“一种×××.zip”,现在要将每一个压缩包解压并生成单个的pdf文档。命令如下:

代码: 全选

for file in `ls *.zip`; 		#得到各文件的文件名
do 
	echo ${file%.zip}; 	#得到的文件名去后缀
	dir=${file%.zip}; 	#将处理的文件名赋予变量dir
	mkdir $dir;			#建立以dir为文件名的目录
	cp -a $file $dir; 	#将目标文件(zip)拷贝到新建的文件夹
	cd $dir;			#进入该文件夹
	unzip -j *.zip; 		#解压目标文件(不包含目录)
	rm *.zip;			#删除zip文件
	tiffcp *.tif $dir.pdf;	#根据文件夹中的tiff文件生成pdf文档
	rm *.tif;			#删除tif文件
	mv *.pdf ..;		#将生成的pdf文件移动到文件夹外
	cd ..;			#回上一级目录
	rm -R $dir;			#删除以专利名称命名的文件夹
done;

如果你有更好的方法,请跟帖分享, :em03
愿扣上你双手,至繁华浪处到沙丘。
头像
枫叶饭团
论坛版主
帖子: 14685
注册时间: 2010-06-16 1:05
系统: Mac OS X
来自: Tencent
送出感谢: 1 次
接收感谢: 132 次
联系:

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#2

帖子 枫叶饭团 » 2013-03-06 0:22

for in *.zip就行了,不用ls
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#3

帖子 eexpress » 2013-03-06 8:46

曾在某专利文件里面,加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的,估计以为是病毒。 :em04
● 鸣学
头像
shinery
帖子: 1376
注册时间: 2009-07-22 22:23
送出感谢: 2 次
接收感谢: 4 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#4

帖子 shinery » 2013-03-06 10:19

eexpress 写了:曾在某专利文件里面,加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的,估计以为是病毒。 :em04
国内专利不一般是纸质申请材料么?
愿扣上你双手,至繁华浪处到沙丘。
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#5

帖子 eexpress » 2013-03-06 10:43

perl又不是二进制。是文本啊。
● 鸣学
头像
shinery
帖子: 1376
注册时间: 2009-07-22 22:23
送出感谢: 2 次
接收感谢: 4 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#6

帖子 shinery » 2013-03-06 11:34

eexpress 写了:perl又不是二进制。是文本啊。
我以为你弄了个perl程序放在电子文档中呢。原来是写在纸上的程序,一般人都会觉得这程序很奇怪的。 :em02
愿扣上你双手,至繁华浪处到沙丘。
头像
shuizhongyu
帖子: 287
注册时间: 2012-11-06 12:43
系统: arch,ubuntu
来自: 安徽合肥
送出感谢: 7 次
接收感谢: 0
联系:

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#7

帖子 shuizhongyu » 2013-04-01 10:56

为什么目录建了删
删了建
在当前目录或者新建一个不就行了么?

Sent from my MI 1S using Tapatalk 2
Luckily,I have google.

新手,请大家不吝赐教,十分感谢
头像
yjcong
帖子: 2470
注册时间: 2006-02-28 3:11
送出感谢: 0
接收感谢: 0

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#8

帖子 yjcong » 2013-04-01 11:43

请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?
一梦三年,
松风依旧,
萝月何曾老.


灵幽听微, 谁观玉颜?
灼灼春华, 绿叶含丹.
头像
needle
帖子: 78
注册时间: 2009-12-01 13:34
送出感谢: 2 次
接收感谢: 5 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#9

帖子 needle » 2013-04-05 1:03

唉,我真是闲的……

代码: 全选

tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir
myshell^_^
xfce4.10最好用了……
舒适的滚轮升起焦点设计,大量快捷键,alt移动,糟糕的桌面图标……
珍爱生命,LFS 三思~
头像
shinery
帖子: 1376
注册时间: 2009-07-22 22:23
送出感谢: 2 次
接收感谢: 4 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#10

帖子 shinery » 2013-04-05 23:34

yjcong 写了:请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?
是的,需要查新否则已公布的任何结果都可能成为专利申请的障碍。
我一般是在http://www.cnipr.com/查,知识产权局和cnki也可以查,申请一个中国发明专利一般2000元以下,如果有附属物的话可能更多。专利从申请到授权约一年半到两年时间。
愿扣上你双手,至繁华浪处到沙丘。
头像
shinery
帖子: 1376
注册时间: 2009-07-22 22:23
送出感谢: 2 次
接收感谢: 4 次

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

#11

帖子 shinery » 2013-04-05 23:37

needle 写了:唉,我真是闲的……

代码: 全选

tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir
:em11
愿扣上你双手,至繁华浪处到沙丘。
回复

回到 “Shell脚本”