破解 http://www.programfan.com/ 验证码

sh/bash/dash/ksh/zsh等Shell脚本
回复
头像
神vlinux飘飘
帖子: 200
注册时间: 2007-02-05 7:29
来自: 火星

破解 http://www.programfan.com/ 验证码

#1

帖子 神vlinux飘飘 » 2010-07-05 3:06

纯蛋疼,不过现在programfan貌似早已堕落,好多杂草一样的广告遍布论坛,也没什么去暴菊的价值了。
以前是用Java做的识别验证码,现在改用shell,算法都一样--这个验证码的破解称做算法是有点抬举自己了--不过解析BMP文件为01点阵那句脚本我倒是自己优化了一个通宵,自我感觉算是亮点吧~

代码: 全选

cat $@ | od -j +0x36 -tx1 -vx | awk 'BEGIN{ORS=""}{if(NR%2!=0){print $2$3$4$5$6$7$8$9$10$11$12$13$14$15$16$17; if((NR+1)%24==0){print "\n"}}}' | sed '1!G;h;$!d' | sed s/000000/1/g | sed s/ffffff/0/g
自认为的亮点-_-

噢对了,虽然说Java性能不够C,但是SHELL如果用不好,性能更烂。所以这里的识别算法用纯脚本实现,之前识别一张验证码需要10秒,优化之后只需要0.32秒,感慨一下吧。

对了,大家不要拿来给这个网站做灌水机哈,这样做是不道德的,我会在道德层面上谴责你 :em02

例子
#下载验证码图片,保存为code.bmp
curl http://www.programfan.com/common/code.asp -s -o code.bmp
#进行解析
cat code.bmp | sh programfan_code.sh
附件
bmp.zip
验证码例子
(1.96 MiB) 已下载 51 次
programfan_code.sh.zip
识别programfan的验证码
(2.02 KiB) 已下载 49 次
一点很小的善心,乘以13亿,都会变成爱的海洋;
一个很大的困难,除以13亿,都会变得微不足道。
------------------------------------------------------------------
希望13亿的中国人都用ubuntu
头像
tenzu
论坛版主
帖子: 36924
注册时间: 2008-11-21 20:26

Re: 破解 http://www.programfan.com/ 验证码

#3

帖子 tenzu » 2010-07-06 16:21

我想要本论坛的灌水机
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

Re: 破解 http://www.programfan.com/ 验证码

#4

帖子 eexpress » 2010-07-06 16:23

支持lz继续。使用爬虫专业工具。 www:mechainize。更加智能。
● 鸣学
delectate
帖子: 18311
注册时间: 2008-01-09 22:41

Re: 破解 http://www.programfan.com/ 验证码

#5

帖子 delectate » 2010-07-06 17:13

识别验证码这个,感觉靠像素有点落后

怎么说呢,靠像素这个,只能是初级没有干扰的,用个动态+干扰,就失败了

最bt的也是最常用的莫过于google和facebook的验证码
头像
神vlinux飘飘
帖子: 200
注册时间: 2007-02-05 7:29
来自: 火星

Re: 破解 http://www.programfan.com/ 验证码

#6

帖子 神vlinux飘飘 » 2010-07-07 0:41

这个识别算法是07年学习Java时候练手写的了,所以我将脚本的重点放在用SHELL解析BMP上。
到后边我的识别算法都是取图像特征点来进行匹配的,一般只要去噪、腐蚀、取特征点。纠偏都可以省了。
一点很小的善心,乘以13亿,都会变成爱的海洋;
一个很大的困难,除以13亿,都会变得微不足道。
------------------------------------------------------------------
希望13亿的中国人都用ubuntu
头像
yjcong
帖子: 2470
注册时间: 2006-02-28 3:11

Re: 破解 http://www.programfan.com/ 验证码

#7

帖子 yjcong » 2010-07-11 2:45

字母, 字母, LZ把对字母的识别也加上啊

PS:对于那些不能复制的JAVA程序上的规则的数字和字母有没有什么可识别的办法啊?
一梦三年,
松风依旧,
萝月何曾老.


灵幽听微, 谁观玉颜?
灼灼春华, 绿叶含丹.
回复