spark(关于spark的介绍)
大家好,小付来为大家解答以上的问题。spark,关于spark的介绍很多人还不知道,现在让我们一起来看看吧!
1、Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
2、Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
3、Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
4、Spark 是在 Scala 语言中实现的,它将Scala 用作其应用程序框架。
5、与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。
6、尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。
7、通过名为 Mesos 的第三方集群框架可以支持此行为。
8、Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。
本文到此结束,希望对大家有所帮助。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
随着环保意识的不断增强,越来越多的家庭和企业开始关注绿色能源的应用。地源热泵作为一种高效、节能、环保的...浏览全文>>
-
在中国悠久的历史文化中,复姓是一种独特的存在。复姓是指由两个或更多汉字组成的姓氏,与单姓相比,复姓往往...浏览全文>>
-
在中国广袤的土地上,每个省份都有其独特的魅力和地理特征。当我们提到“离辽宁最远”的地方时,这个问题的答...浏览全文>>
-
随着互联网技术的发展和消费者购物习惯的变化,社区团购作为一种新兴的商业模式,近年来在中国迅速崛起。这种...浏览全文>>
-
在现代家庭用电系统中,单相电表是不可或缺的一部分。它用于测量家庭用电量,并帮助电力公司和用户了解实际的...浏览全文>>
-
在中国广袤的土地上,隐藏着许多令人惊叹的自然奇观。其中,有一个地方以其独特的植被景观闻名遐迩,那就是位...浏览全文>>
-
中国,这片古老而神秘的土地,承载着五千年的文明史,拥有无数令人叹为观止的自然与人文景观。从北国的冰天雪...浏览全文>>
-
在历史的长河中,许多中国名人都有着令人难忘的童年故事。比如,周恩来从小就立志为中华之崛起而读书,他的少...浏览全文>>
-
在我们生活的这个世界上,有许多美丽的地方等待着我们的探索和发现。其中,“碧海金沙”无疑是一个充满诗意的...浏览全文>>
-
在浩瀚的大海中,"碧海方舟"这个词汇充满了诗意与想象的空间。它不仅仅是一个简单的组合词,更像是一幅画,一...浏览全文>>