当前位置 : IT培训网 > IT培训 > 新闻资讯 > 哪些免费的开源大数据技术最好用

哪些免费的开源大数据技术最好用

时间:2016-08-24 10:40:49  来源:Java培训网  作者:IT培训网  已有:名学员访问该课程
随着科技的发展,大数据已经成为当前社会最热门的技术之一,正呈爆炸式增长。每天来自全球的新项目如雨后春笋般涌现。幸运地是,开源让越来越多的项目可以直接采用大数据技术,其中最好用的有Hadoop、Spark、NiFi、Apache Hiv

做网站用什么程序,很多人不约而同的会说织梦、帝国、海商等等开源站点,那么免费的开源大数据技术又有哪些呢,今天IT培训网就来给大家详细介绍一下。

哪些免费的开源大数据技术最好用_www.itpxw.cn

随着科技的发展,大数据已经成为当前社会最热门的技术之一,正呈爆炸式增长。每天来自全球的新项目如雨后春笋般涌现。幸运地是,开源让越来越多的项目可以直接采用大数据技术,其中最好用的有Hadoop、Spark、NiFi、Apache Hive 2.1、Kafka、Phoenix、Zeppelin、Sparkling Water、Apache Beam、Stanford CoreNLP等等。

第一:Hadoop——高效、可靠、可伸缩,能够为你的数据存储项目提供所需的YARN、HDFS和基础架构,并且运行主要的大数据服务和应用程序。

第二: NiFi——Apache NiFi是由美国国家安全局(NSA)贡献给Apache基金会的开源项目,其设计目标是自动化系统间的数据流。基于其工作流式的编程理念,NiFi非常易于使用、强大、可靠、高可配置。两个最重要的特性是其强大的用户界面和良好的数据回溯工具。堪称大数据工具箱里的瑞士军刀。

第三: Kafka——Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模网站中的所有动作流数据。它已成为大数据系统在异步和分布式消息之间的最佳选择。从Spark到NiFi再到第三方插件工具以至于Java到Scala,它都提供了强大的粘合作用。

第四:Apache Hive 2.1——Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。随着最新版本的发布,性能和功能都得到了全面提升,Hive已成为SQL在大数据上的最佳解决方案。

第五:Spark——使用简单、支持所有重要的大数据语言(Scala、Python、Java、R)。拥有强大的生态系统,成长迅速,对microbatching/batching/SQL支持简单。Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

哪些免费的开源大数据技术最好用_www.itpxw.cn

第六:Sparkling Water——H2O填补了Spark’s Machine Learning的缺口,它可以满足你所有的机器学习。

第八:Phoenix—是HBase的SQL驱动。目前大量的公司采用它,并扩大其规模。HDFS支持的NoSQL能够很好地集成所有工具。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准的JDBC结果集。

第七:Zeppelin——Zeppelin是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括Scala(使用Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。

第九:Apache Beam——在Java中提供统一的数据进程管道开发,并且能够很好地支持Spark和Flink。提供很多在线框架,开发者无需学习太多框架。

第十、Stanford CoreNLP——自然语言处理拥有巨大的增长空间,斯坦福正在努力增进他们的框架。

以上就是关于Hadoop、Spark、NiFi、Apache Hive 2.1、Kafka、Phoenix、Zeppelin、Sparkling Water、Apache Beam、Stanford CoreNLP十大最受欢迎的开源大数据技术的介绍,希望开源大数据爱好者选择自己喜欢的大数据程序,如果想要学习其他技术,请关注IT培训网!

顶一下
(0)
0%
踩一下
(0)
0%

IT培训0元试听 每期开班座位有限.0元试听抢座开始! IT培训0元试听

  • 姓名 : *
  • 电话 : *
  • QQ : *
  • 留言 :
  • 验证码 : 看不清?点击更换请输入正确的验证码

在线咨询在线咨询

温馨提示 : 请保持手机畅通,咨询老师为您
提供专属一对一报名服务。

------分隔线----------------------------
------分隔线----------------------------

推荐内容