彩色科技膜拜！华为内部都在强推的783页大数据处理系统：源代码pdf( 二 )

本文插图
第6章作业的调度与指派，

本文插图
第7章NodeManager与任务投运，用户提交的作业为 ResourceManager接受并得到调度运行之后,RM会设法将其投入运行。但是一个作业 (Job 或 App)通常都包含着很多任务,比方说N个MapTask和1个ReduceTask,所以作业的投运终究会分解成许多任务的投运。

本文插图
第8章MRAppMaster与作业投运，

本文插图
第9章YARN子系统的计算框架， Hadoop中 YARN 子系统的使命是为用户提供大数据的计算框架。早期的 Hadoop,甚至早期的 YARN 都只提供一种计算框架,那就是 MapReduce 。如前所述,MapReduce是一种极简的,然而在很多情况下颇为有效的计算模型和框架。
但是Hadoop的MapReduce框架要求使用者提供用Java语言编写的 Mapper和 Reducer,而 App本身则虽然简单但也要求用Java编写,这又使有些用户感到有点不便,而且 MapReduce这个模式也过于简单和单调。所以 Hadoop后来有了一些新的发展,除 MapReduce外又提供了称为Chain和Stream的计算框架。一来使用户不必非得用Java编程;二来更允许用户利用 Linux上的 Utility工具软件搭建更像“数据流”的结构。本章介绍 YARN 子系统为用户提供的计算框架,当然主要还是传统的 MapReduce框架。

本文插图
第10章MapReduce框架中的数据流

本文插图
第11章Hadoop的文件系统HDFS

本文插图
【彩色科技膜拜！华为内部都在强推的783页大数据处理系统：源代码pdf】
第12章HDFS的DataNode

本文插图
第13章DataNode与NameNode的互动，数据节点DataNode在运行中会与三种对端有互动。
第一种是NameNode,如前所述,对于数据块的存储地点,虽然最初是由NameNode分配和指定的,但相关的信息最终来自DataNode的报告。
第二种是用户的App(包括Shell),用户的App可以存在于集群内的任何节点上,不过那是在独立的JVM上,即使与DataNode同在-一个节点上也互相独立;然而真正把数据存储在DataNode上或从DataNode读取数据的却是App(或Shell) 。
第三种是集群中别的DataNode,就是说DataNode与DataNode之间也会有通信和互动,这主要来自数据块复份replica的传输和转储。
数据块在HDFS文件系统中的存储是“狡兔三窟”的,一个数据块要分别存储在若干不同的DataNode.上,但是系统并不要求App把--个数据块分别发送给几个DataNode,而只需发送给其中的一个,后面就是DataNode之间的事了。

本文插图
第14章DataNode间的互动

本文插图
第15章HDFS的文件访问

彩色科技膜拜！华为内部都在强推的783页大数据处理系统：源代码pdf( 二 )

推荐阅读

喝红茶有什么作用,立顿红茶怎么喝最好喝

关于少年励志的文章少年励志文章

乌克兰：乌克兰正式宣布：把中方列入……

车市最前线|比途昂还大两圈，不足30万，大众被逼急了！史上最大的SUV问世

帅丰蒸烤一体机，让90后瞬间爱上烹饪

大S|报应好快！曝大S癫痫复发抢救，疑光头卷2.2亿跑路，小菲或夺回娃

用水|冰箱拿出的冻肉，最忌直接用水冲，教你一妙招，吃着和鲜肉一样香

四大喝茶误区危害您的健康

国际在线网站|美国联邦执法人员与抗议民众再次爆发冲突

动漫呱乐|诠释完美身材，网友：这双腿有故事！，李冰冰再次登时尚封面

[量子科学论]对我国航天事业影响大吗？，30天内两次火箭发射失利

特斯林椅子如何特斯林扶手椅价格

中国最傲娇的两座城市，一直不愿说普通话，是仗着自己高贵吗！

日本福岛核辐射之后，日本产的东西还能用吗

安全|今年第5号预警发布！

生科医学|北京24小时新增本土50例！顺义发生21人聚集性疫情

问董秘|提高效率，减少垃圾。贵公司...，投资者提问：请问:为配合相应国家建筑的相关政策

育儿知识盒子|实力演绎榜样的力量！好父母都这样做，宝爸带孩子排队候车

游民星空有时候设计的太完美也不是好事，LOL中设计最失败的几个英雄

汽车之家|8月份轿车销量Top 10，轩逸荣登榜首