如何技术实现采集某个特定关键字的最新新闻动态

为当前最终发行版之前的所有版本提供支持
回复
zqdongxw
帖子: 28
注册时间: 2011-01-23 10:48
送出感谢: 3 次
接收感谢: 0

如何技术实现采集某个特定关键字的最新新闻动态

#1

帖子 zqdongxw » 2013-02-22 11:22

RT,想到了《尼基塔》中伯克霍夫电脑可以采集过滤特定关键字的最新新闻动态,掌握第一手信息反馈给特工。

如今网络充斥着杂七杂八的信息,如何站在自己的角度根据自己的需求理出一条清晰的网络就很有必要了。

类似于谷歌快讯的功能。

也许我孤陋寡闻,请问有没有类似的软件实现?

想自己搭建的话能否提供下思路及设计到的技术? :em06
头像
枫叶饭团
论坛版主
帖子: 14685
注册时间: 2010-06-16 1:05
系统: Mac OS X
来自: Tencent
送出感谢: 1 次
接收感谢: 132 次
联系:

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#2

帖子 枫叶饭团 » 2013-02-22 11:36

用什么程序语言都能行 :em04
zqdongxw
帖子: 28
注册时间: 2011-01-23 10:48
送出感谢: 3 次
接收感谢: 0

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#3

帖子 zqdongxw » 2013-02-22 12:42

枫叶饭团 写了:用什么程序语言都能行 :em04
敢问@枫叶饭团,精通什么语言?
头像
b33e
论坛版主
帖子: 3866
注册时间: 2011-06-07 14:20
系统: Mint18
送出感谢: 16 次
接收感谢: 62 次

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#4

帖子 b33e » 2013-02-22 12:57

zqdongxw
帖子: 28
注册时间: 2011-01-23 10:48
送出感谢: 3 次
接收感谢: 0

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#5

帖子 zqdongxw » 2013-02-22 13:08

jinjiachen
帖子: 2095
注册时间: 2012-12-16 15:43
系统: debian
送出感谢: 8 次
接收感谢: 27 次

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#6

帖子 jinjiachen » 2013-02-22 14:39

用正则表达式呀 :em11
zqdongxw
帖子: 28
注册时间: 2011-01-23 10:48
送出感谢: 3 次
接收感谢: 0

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#7

帖子 zqdongxw » 2013-02-22 15:47

jinjiachen 写了:用正则表达式呀 :em11
能不能详细点呢?
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#8

帖子 eexpress » 2013-02-22 16:21

你这就是写一个爬虫。perl爬虫吧,使用www::mechinize模块。抓网页,分段,过滤内容。
● 鸣学
zqdongxw
帖子: 28
注册时间: 2011-01-23 10:48
送出感谢: 3 次
接收感谢: 0

Re: 如何技术实现采集某个特定关键字的最新新闻动态

#9

帖子 zqdongxw » 2013-02-25 13:09

eexpress 写了:你这就是写一个爬虫。perl爬虫吧,使用www::mechinize模块。抓网页,分段,过滤内容。
多谢。
回复

回到 “老旧版本支持”