数极客首页

大数据领域的顶级开源工具大集合

随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。

以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。

数据存储:

  • Apache Hadoop–?Cloud Foundry(VMware),?Hortonworks,?Hadapt
  • NoSql 数据库 –?MongoDB,?Cassandra,?Hbase
  • SQL 数据库 –?MySql(Oracle),?MariaDB,?PostgreSQL,?TokuDB

开发平台:

  • Apache Hadoop平台 –?Impala(开源大数据分析引擎);?Lingual(ANSI SQL);Paern(analytics);?Cascading(开源大数据应用程序开发框架)
  • Apache Lucene和?Solr平台
  • OpenStack(构建私有云和公有云)
  • Red Hat?(搭载 Hadoop 服务器的标准 Linux 发行版)
  • REEF(微软的Hadoop开发者平台)
  • Storm(集成了各种排队系统和数据库系统)

开发工具和集成:

  • Apache Mahout(机器学习的编程语言)
  • Python?和?R(预测分析编程语言)

分析和报告工具:

  • Jaspersoft(报告和分析服务器)
  • Pentaho(数据集成和业务分析)
  • Splunk(IT分析平台)
  • Talend(大数据集成,数据管理和应用集成)

以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。

英文原文: blackducksoftware

来源:CSDN

链接:http://www.csdn.net/article/2014-04-15/2819321-bigdata-tools-opensource

本文采用「CC BY-SA 4.0 CN」协议转载学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请联系「我们」处理。

发表评论

评论已关闭。

相关文章