当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 9 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 11:22 

注册: 2011-01-23 10:48
帖子: 28
送出感谢: 3
接收感谢: 0 次
RT,想到了《尼基塔》中伯克霍夫电脑可以采集过滤特定关键字的最新新闻动态,掌握第一手信息反馈给特工。

如今网络充斥着杂七杂八的信息,如何站在自己的角度根据自己的需求理出一条清晰的网络就很有必要了。

类似于谷歌快讯的功能。

也许我孤陋寡闻,请问有没有类似的软件实现?

想自己搭建的话能否提供下思路及设计到的技术? :em06


页首
 用户资料  
 
2 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 11:36 
头像

注册: 2010-06-16 1:05
帖子: 14681
地址: Tencent
系统: Mac OS X
送出感谢: 1
接收感谢: 153
用什么程序语言都能行 :em04


_________________
twitter求fo:http://twitter.com/maplebeats
博客求踩:http://maplebeats.com


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 12:42 

注册: 2011-01-23 10:48
帖子: 28
送出感谢: 3
接收感谢: 0 次
枫叶饭团 写道:
用什么程序语言都能行 :em04

敢问@枫叶饭团,精通什么语言?


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 12:57 
头像

注册: 2011-06-07 14:20
帖子: 3866
系统: Mint18
送出感谢: 17
接收感谢: 65
https://code.google.com/p/grass-mud-horse/ :em01


_________________
wiki: ubuntu 技巧


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 13:08 

注册: 2011-01-23 10:48
帖子: 28
送出感谢: 3
接收感谢: 0 次
b33e 写道:

:em20


页首
 用户资料  
 
6 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 14:39 

注册: 2012-12-16 15:43
帖子: 2090
系统: debian
送出感谢: 8
接收感谢: 28
用正则表达式呀 :em11


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 15:47 

注册: 2011-01-23 10:48
帖子: 28
送出感谢: 3
接收感谢: 0 次
jinjiachen 写道:
用正则表达式呀 :em11

能不能详细点呢?


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-22 16:21 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 274
你这就是写一个爬虫。perl爬虫吧,使用www::mechinize模块。抓网页,分段,过滤内容。


_________________
● 鸣学


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 如何技术实现采集某个特定关键字的最新新闻动态
帖子发表于 : 2013-02-25 13:09 

注册: 2011-01-23 10:48
帖子: 28
送出感谢: 3
接收感谢: 0 次
eexpress 写道:
你这就是写一个爬虫。perl爬虫吧,使用www::mechinize模块。抓网页,分段,过滤内容。

多谢。


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 9 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 5 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译