Hadoop中Yarn基本架构是怎么样的
1. Yarn基本概述
Yarn(Yet Another Resource Negotiator)是Apache Hadoop的一个重要组件,它是Hadoop的第二代资源管理和任务调度框架。Yarn的主要目的是为了解决Hadoop MapReduce扩展性不足的问题,并使Hadoop集群能够运行更多类型的应用程序。
在Hadoop 1.x版本中,JobTracker负责资源管理和作业调度,它是Hadoop集群的单点故障。为了解决这个问题,Yarn引入了两个新的主要组件:ResourceManager(资源管理器)和NodeManager(节点管理器)。这样使得资源管理和任务调度的功能分离,实现了更好的扩展性和可靠性。
2. Yarn架构概述
Yarn的基本架构包括三个主要组件:ResourceManager、NodeManager和ApplicationMaster。
(1)ResourceManager(资源管理器):ResourceManager是整个Hadoop集群的控制中心,负责管理集群中的所有资源。它维护着整个集群的资源信息,接收客户端或ApplicationMaster的资源申请,并进行资源的分配。ResourceManager还负责监控集群中的NodeManager和ApplicationMaster,并进行容错处理。
(2)NodeManager(节点管理器):NodeManager是运行在每个集群节点上的代理进程,负责管理和监控集群节点的资源和应用程序。NodeManager负责启动和停止容器(Container),容器是抽象的资源分配单位,可以是CPU、内存等。NodeManager向ResourceManager报告每个节点上的资源使用情况。它还记录节点上运行的每个任务的日志,供调试和故障排除使用。
(3)ApplicationMaster(应用程序管理器):每个应用程序都有一个ApplicationMaster,它是负责管理应用程序的进程。ApplicationMaster与ResourceManager通信,向其申请容器资源,并通过NodeManager启动和停止容器。ApplicationMaster还监控容器的运行状态,处理容器失败情况。ApplicationMaster运行在集群中的某个节点上,而不是集群的主节点上。
3. Yarn工作流程
Yarn的工作流程可以总结为以下几个步骤:
(1)客户端提交应用:客户端向ResourceManager提交应用程序请求,包括应用程序所需的资源和启动脚本。
(2)ResourceManager为应用程序分配资源:ResourceManager根据集群中的资源情况,为应用程序分配合适的资源。然后,ResourceManager将资源分配信息发送给对应的ApplicationMaster。
(3)ApplicationMaster启动:ApplicationMaster接收到资源分配信息后,在集群中的某个节点上启动。ApplicationMaster向NodeManager发起容器启动请求,并开始执行应用程序。
(4)NodeManager启动容器:NodeManager接收到ApplicationMaster的容器启动请求后,向操作系统申请资源,创建容器,并启动应用程序。
(5)应用程序运行:应用程序在容器中运行,通过ApplicationMaster与ResourceManager和NodeManager进行通信,获取所需资源,进行任务调度和监控。
(6)应用程序完成:应用程序执行完毕后,ApplicationMaster通知ResourceManager释放资源。然后,ApplicationMaster和容器都被关闭。
通过以上步骤,Yarn实现了资源的动态分配和任务的调度,提高了Hadoop集群的利用率和运行效率。
猜您想看
-
网易云音乐平台歌单制作技巧,让你的歌单更具有个性
一、制作歌单的...
2023年05月15日 -
如何在Steam平台上修复缺失的游戏文件?
如何在Stea...
2023年04月17日 -
在CS:GO中无法保存键位设置,如何解决?
CS:GO中如...
2023年04月17日 -
如何利用观察技巧成为最佳防守球员
一、学习运动规...
2023年05月15日 -
如何用R语言画堆积柱形图以及时间格式数据做坐标轴的操作
一、堆积柱形图...
2023年07月22日 -
如何用Python实现工程师管理系统
1. 设计数据...
2023年07月20日