spark(关于spark的介绍)
大家好,小付来为大家解答以上的问题。spark,关于spark的介绍很多人还不知道,现在让我们一起来看看吧!
1、Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
2、Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
3、Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
4、Spark 是在 Scala 语言中实现的,它将Scala 用作其应用程序框架。
5、与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。
6、尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。
7、通过名为 Mesos 的第三方集群框架可以支持此行为。
8、Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。
本文到此结束,希望对大家有所帮助。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
在工业机械领域中,螺旋锥齿轮减速机是一种广泛应用的动力传输设备。它以其独特的结构设计和高效的工作性能,...浏览全文>>
-
腹泻是一种常见的症状,可能由多种原因引起,比如饮食不当、细菌感染或病毒感染等。面对腹泻,很多人会急于寻...浏览全文>>
-
宝宝腹泻时,家长往往会感到焦虑和无助。这时,合理调整宝宝的饮食显得尤为重要。正确的饮食不仅能帮助缓解腹...浏览全文>>
-
在数学的浩瀚星空中,有一种特殊的方程,它以其独特的魅力吸引着无数探索者的目光,这就是丢番图方程。这种方...浏览全文>>
-
现代建构主义者主张,真实世界的问题解决是促进深度学习的有效途径之一。通过参与实际任务或项目活动,学生能...浏览全文>>
-
在电磁学领域中,“动生电动势”是一个非常重要的概念,它描述了当导体或闭合回路中的导体在磁场中运动时,所...浏览全文>>
-
提到火龙果,许多人会立刻联想到它那鲜艳的颜色和独特的外形。这种热带水果不仅味道鲜美,而且营养价值高,深...浏览全文>>
-
在日常生活中,我们常常会遇到一些有趣的语言转换问题,比如“火龙果”这个词汇,它不仅是一种美味的水果,在...浏览全文>>
-
在生活中,我们常常会遇到一些有趣的语言问题,比如“火龙果”这个常见的水果,在英语中应该怎么表达呢?相信...浏览全文>>
-
火龙果树是一种热带水果植物,因其独特的外观和丰富的营养价值而受到许多园艺爱好者的喜爱。然而,要想让火龙...浏览全文>>