数据剖析工具篇_萌爵百货商行网

数据剖析工具篇

koi

2024-11-15 03:15:33发布
关注私信

361 257 380

Hadoop的MR结构和YARN结构是大数据时代的第一代产品，满足了大家在离线计算上的需求，然而针对实时运算却存在无余，为满足这一需求，起初的大佬研发了spark计算方法，大大的提高了运算效率。

Spark的计算原理

spark的结构为：

节点引见：

整个互动流程是这样的：

运转流程及特点为：

借用上图咱们再来了解一下spark的运算环节：

RDD计算案例

咱们用一个案例来剖析RDD的计算环节：

DAGScheduler关于RDD图形的划分是有必定法令的：

Executor是最终运转task的苦力，他将Task的口头结果反应给Driver，会依据大小驳回不同的战略：

版权声明 1、本网站名称：萌爵百货商行网
2、本站永久网址：http://msbhsh.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报

#数据剖析 #Hadoop #Spark