分页: 1 / 1
如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 11:22
由 zqdongxw
RT,想到了《尼基塔》中伯克霍夫电脑可以采集过滤特定关键字的最新新闻动态,掌握第一手信息反馈给特工。
如今网络充斥着杂七杂八的信息,如何站在自己的角度根据自己的需求理出一条清晰的网络就很有必要了。
类似于谷歌快讯的功能。
也许我孤陋寡闻,请问有没有类似的软件实现?
想自己搭建的话能否提供下思路及设计到的技术?
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 11:36
由 枫叶饭团
用什么程序语言都能行
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 12:42
由 zqdongxw
枫叶饭团 写了:用什么程序语言都能行
敢问@枫叶饭团,精通什么语言?
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 12:57
由 b33e
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 13:08
由 zqdongxw
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 14:39
由 jinjiachen
用正则表达式呀
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 15:47
由 zqdongxw
jinjiachen 写了:用正则表达式呀
能不能详细点呢?
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-22 16:21
由 eexpress
你这就是写一个爬虫。perl爬虫吧,使用www::mechinize模块。抓网页,分段,过滤内容。
Re: 如何技术实现采集某个特定关键字的最新新闻动态
发表于 : 2013-02-25 13:09
由 zqdongxw
eexpress 写了:你这就是写一个爬虫。perl爬虫吧,使用www::mechinize模块。抓网页,分段,过滤内容。
多谢。