Hadoop YARN配置参数—权限与日志聚集相关参数

2016-08-12 16:47:39   作者:MangoCool   来源:MangoCool

配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。


权限相关配置参数:

这里的权限由三部分组成,分别是:

(1)管理员和普通用户如何区分 ;

(2)服务级别的权限,比如哪些用户可以向集群提交ResourceManager提交应用程序;

(3)队列级别的权限,比如哪些用户可以向队列A提交作业等。

管理员列表由参数yarn.admin.acl指定。

服务级别的权限是通过配置hadoop-policy.xml实现的,这个与Hadoop 1.0类似。

队列级别的权限是由对应的资源调度器内部配置的,比如Fair Scheduler或者Capacity Scheduler等。


日志聚集相关配置参数:

日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container/任务日志上传到HDFS上,从而减轻NodeManager负载,且提供一个中央化存储和分析机制。默认情况下,Container/任务日志存在在各个NodeManager上,如果启用日志聚集功能需要额外的配置。

1、 yarn.log-aggregation-enable

参数解释:是否启用日志聚集功能,日志聚合开启后保存到HDFS上

默认值:false


2、 yarn.log-aggregation.retain-seconds

参数解释:在HDFS上聚集的日志最多保存多长时间,单位为s

默认值:-1(不启用日志聚合),例如设置为86400,24小时。


3、 yarn.log-aggregation.retain-check-interval-seconds

参数解释:多长时间检查一次日志,执行时候将满足条件的日志删除(超过参数2设置的时间的日志),如果是0或者负数,则为参数2设置值的1/10,上例值在此处为8640s。

默认值:-1


4.yarn.nodemanager.log.retain-seconds

参数说明:当不启用日志聚合此参数生效,日志文件保存在本地的时间,单位为s。

默认值:10800


5、yarn.nodemanager.remote-app-log-dir

参数解释:当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)。

默认值:/tmp/logs


6、yarn.nodemanager.remote-app-log-dir-suffix

参数解释:远程日志目录子目录名称(启用日志聚集功能时有效)。

默认值:日志将被转移到目录${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}下


参考文章:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-log-aggregation/

                 http://www.cnblogs.com/xizhunet/p/5131731.html

标签: Hadoop YARN 权限 日志

分享:

关于我

一个喜欢唱歌,热衷旅行,爱好电子产品的码农。没事,跟三五好友吼上几嗓子,约上几个背着行囊去露营或者宅在家里抱着孩子敲代码。

座右铭:当你的才华还撑不起你的野心的时候,你就应该静下心来学习,永不止步!

            人生之旅历途甚长,所争决不在一年半月,万不可因此着急失望,招精神之萎葸。


Copyright 芒果酷(mangocool.com) All rights reserved. 湘ICP备14019394号

免责声明:本网站部分文章转载其他媒体,意在为公众提供免费服务。如有信息侵犯了您的权益,可与本网站联系,本网站将尽快予以撤除。