随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。
如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。
以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。
数据存储:
Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt
NoSql 数据库 – MongoDB, Cassandra, Hbase
SQL 数据库 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB
开发平台:
Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(开源大数据应用程序开发框架)
Apache Lucene和 Solr平台
OpenStack(构建私有云和公有云)
Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)
REEF(微软的Hadoop开发者平台)
Storm(集成了各种排队系统和数据库系统)
开发工具和集成:
Apache Mahout(机器学习的编程语言)
Python 和 R(预测分析编程语言)
分析和报告工具:
Jaspersoft(报告和分析服务器)
Pentaho(数据集成和业务分析)
Splunk(IT分析平台)
Talend(大数据集成,数据管理和应用集成)
原文:TOP OPEN SOURCE TOOLS FOR BIG DATA
Big Data 开源
-
- 帖子: 1
- 注册时间: 2014-06-11 11:26
- 系统: win7
- 黄一孟
- 帖子: 892
- 注册时间: 2014-01-24 20:16
- 系统: linux
Re: Big Data 开源
支持开源。
deepinlinux的十宗罪
详细分析国内的三大发行版缘何成功和为何失败
开源软件是什么?自由软件是什么?
大家以为我容易吗?deepinlinux是一个公司有专职人员推广,我有自己的工作,花时间来回帖揭露deepinlinux霸道行为。但愿deepinlinux的推广人员能消停下,我也不用这么累。
只是希望开源软件能在国内更加普及能造福更多人,人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。
感谢回帖中众多支持我和发出公正言论的网友们!让看到ubuntu论坛的自由和公正
详细分析国内的三大发行版缘何成功和为何失败
开源软件是什么?自由软件是什么?
大家以为我容易吗?deepinlinux是一个公司有专职人员推广,我有自己的工作,花时间来回帖揭露deepinlinux霸道行为。但愿deepinlinux的推广人员能消停下,我也不用这么累。
只是希望开源软件能在国内更加普及能造福更多人,人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。
感谢回帖中众多支持我和发出公正言论的网友们!让看到ubuntu论坛的自由和公正
-
- 帖子: 309
- 注册时间: 2014-01-27 19:25
- 系统: debian
Re: Big Data 开源
大数据时代,最近大数据很火。
-
- 帖子: 292
- 注册时间: 2014-03-01 10:03
- 系统: ubuntu debian veket
-
- 帖子: 309
- 注册时间: 2014-01-27 19:25
- 系统: debian
Re: Big Data 开源
编程语言感觉多年没大变革了。ubuntuubun 写了:机器学习的编程语言