关系经济人类预测化学自然
中准网
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

Hadoop之HDFS的集群之间的数据复制归档机制和安全模式

11月3日 失了心投稿
  1不同集群之间的数据复制
  在我们实际工作当中,极有可能会遇到将测试集群的数据拷贝到生产环境集群,或者将生产环境集群的数据拷贝到测试集群,那么就需要我们在多个集群之间进行数据的远程拷贝,hadoop自带也有命令可以帮我们实现这个功能。1。1集群内部文件拷贝scpcdexportsoftwaresscprjdk8u141linuxx64。tar。gzrootnode2:export1。2跨集群之间的数据拷贝distcpbinhadoopdistcphdfs:node1:8020jdk8u141linuxx64。tar。gzhdfs:cluster2:90002Archive档案的使用
  HDFS并不擅长存储小文件,因为每个文件最少一个block,每个block的元数据都会在NameNode占用内存,如果存在大量的小文件,它们会吃掉NameNode节点的大量内存。
  HadoopArchives可以有效的处理以上问题,它可以把多个文件归档成为一个文件,归档成一个文件后还可以透明的访问每一个文件。2。1如何创建ArchiveUsage:hadooparchivearchiveNamenamepparentsrcdest
  其中archiveName是指要创建的存档的名称。比如test。har,archive的名字的扩展名应该是。har。
  p参数指定文件存档文件(src)的相对路径。
  举个例子:pfoobarabcefg
  这里的foobar是abc与efg的父路径,
  所以完整路径为foobarabc与foobarefg
  例如:如果你只想存档一个目录input下的所有文件:
  hadooparchivearchiveNametest。harpinputoutputdir
  这样就会在outputdir目录下创建一个名为test。har的存档文件。2。2如何查看Archive
  首先我们来看下创建好的har文件。使用如下的命令:hadoopfslsoutputdirtest。har
  这里可以看到har文件包括:两个索引文件,多个part文件(本例只有一个)以及一个标识成功与否的文件。part文件是多个原文件的集合,根据index文件去找到原文件。
  例如上述的三个小文件1。txt2。txt3。txt内容分别为1,2,3。进行archive操作之后,三个小文件就归档到test。har里的part0一个文件里。
  archive作为文件系统层暴露给外界。所以所有的fsshell命令都能在archive上运行,但是要使用不同的URI。HadoopArchives的URI是:har:schemehostname:portarchivepathfileinarchive
  schemehostname格式为hdfs域名:端口,如果没有提供schemehostname,它会使用默认的文件系统。这种情况下URI是这种形式:har:archivepathfileinarchive
  如果用haruri去访问的话,索引、标识等文件就会
  隐藏起来,只显示创建档案之前的原文件:
  2。3如何解压Archive
  按顺序解压存档(串行):Hadoopfscphar:userzoofoo。hardir1hdfs:userzoonewdir
  要并行解压存档,请使用DistCp:hadoopdistcphar:userzoofoo。hardir1hdfs:userzoonewdir2。4Archive注意事项
  1。Hadooparchives是特殊的档案格式。一个Hadooparchive对应一个文件系统目录。Hadooparchive的扩展名是。
  2。创建archives本质是运行一个MapReduce任务,所以应该在Hadoop集群上运行创建档案的命令;
  3。创建archive文件要消耗和原文件一样多的硬盘空间;
  4。archive文件不支持压缩,尽管archive文件看起来像已经被压缩过;
  5。archive文件一旦创建就无法改变,要修改的话,需要创建新的archive文件。事实上,一般不会再对存档后的文件进行修改,因为它们是定期存档的,比如每周或每日;
  6。当创建archive时,源文件不会被更改或删除;3。HDFS安全模式3。1安全模式概述
  安全模式是HDFS所处的一种特殊状态,在这种状态下,文件系统只接受读数据请求,而不接受删除、修改等变更请求,是一种保护机制,用于保证集群中的数据块的安全性。
  在NameNode主节点启动时,HDFS首先进入安全模式,集群会开始检查数据块的完整性。DataNode在启动的时候会向namenode汇报可用的block信息,当整个系统达到安全标准时,HDFS自动离开安全模式。
  假设我们设置的副本数(即参数dfs。replication)是5,那么在Datanode上就应该有5个副本存在,假设只存在3个副本,那么比例就是350。6。在配置文件hdfsdefault。xml中定义了一个最小的副本的副本率(即参数dfs。namenode。safemode。thresholdpct)0。999。
  我们的副本率0。6明显小于0。99,因此系统会自动的复制副本到其他的DataNode,使得副本率不小于0。999。如果系统中有8个副本,超过我们设定的5个副本,那么系统也会删除多余的3个副本。
  如果HDFS处于安全模式下,不允许HDFS客户端进行任何修改文件的操作,包括上传文件,删除文件,重命名,创建文件夹,修改副本数等操作。3。2安全模式配置
  与安全模式相关主要配置在hdfssite。xml文件中,主要有下面几个属性:
  dfs。namenode。replication。min:每个数据块最小副本数量,默认为1。在上传文件时,达到最小副本数,就认为上传是成功的。
  dfs。namenode。safemode。thresholdpct:达到最小副本数的数据块的百分比。默认为0。999f。当小于这个比例,那就将系统切换成安全模式,对数据块进行复制;当大于该比例时,就离开安全模式,说明系统有足够的数据块副本数,可以对外提供服务。小于等于0意味不进入安全模式,大于1意味一直处于安全模式。
  dfs。namenode。safemode。min。datanodes:离开安全模式的最小可用datanode数量要求,默认为0。也就是即使所有datanode都不可用,仍然可以离开安全模式。
  dfs。namenode。safemode。extension:当集群可用block比例,可用datanode都达到要求之后,如果在extension配置的时间段之后依然能满足要求,此时集群才离开安全模式。单位为毫秒,默认为30000。也就是当满足条件并且能够维持30秒之后,离开安全模式。这个配置主要是对集群稳定程度做进一步的确认。避免达到要求后马上又不符合安全标准。
  总结一下,要离开安全模式,需要满足以下条件:
  1)达到副本数量要求的block比例满足要求;
  2)可用的datanode节点数满足配置的数量要求;
  3)1、2两个条件满足后维持的时间达到配置的要求
  3安全模式命令
  手动进入安全模式hdfsdfsadminsafemodeenter
  手动进入安全模式对于集群维护或者升级的时候非常有用,因为这时候HDFS上的数据是只读的。手动退出安全模式可以用下面命令:hdfsdfsadminsafemodeleave
投诉 评论 转载

孟晚舟出任华为轮值董事长,背后有哪些不为人知的秘密?华为公司在官网信息显示,华为副董事长、CFO孟晚舟正式担任华为轮值董事长,郭平不再担任华为轮值董事长,转任到监事会任职。这是孟晚舟首次出任这一职务,也是华为历史上第一位女性轮值……俗话说早上洗澡灭阳气,晚上洗澡生湿气,该什么时候洗澡?如今洗澡已经成为日常的护理工作,尤其是天气逐渐热了起来,很多人都会保持每天洗澡的好习惯,洗澡除了有清洁作用之外,还会给我们带来哪些好处呢?经常洗澡,会给身体带来哪些好处?……我国又一世界级领先,2021年增量占全球80左右,如何做到的文:小清我国在水力、风能、核能、太阳能发电等新能源发展方面取得了显著成就,今年前4个月的新能源发电占比已接近30。2022年14月,我国累计发电26029。3亿千瓦时,其……出尔反尔?台积电已经开始变脸了,背后的原因很现实在中国台湾省,有一些非常知名的代工企业,比如大名鼎鼎的富士康,还有相对没那么熟悉的金仁宝,都是电子行业的头部代工企业,这类企业出海也做得很成功。比如富士康不仅在台湾省本土……洗头时为何头发猛脱?根本原因找到了!不想秃然而至,方法在这头发,作为外貌的门面担当,对个人形象有着非常重要的影响。脱发,作为人类公敌,则在随时为我们制造秃然的惊喜。尤其是在每天洗头时,脱发仿佛到达了一个高峰洗头,是不……公开发表!四川科学家取得雪球地球重磅成果,引发国际关注!近日,成都理工大学古地理重建团队在国际顶级地学期刊PrecambrianResearch上发表了最新研究成果,该研究报道了Sturtian冰期中期的一套风暴沉积记录,为雪球地球……Hadoop之HDFS的集群之间的数据复制归档机制和安全模式1不同集群之间的数据复制在我们实际工作当中,极有可能会遇到将测试集群的数据拷贝到生产环境集群,或者将生产环境集群的数据拷贝到测试集群,那么就需要我们在多个集群之间进行数据……日均新增250家企业,深圳商事主体第一区如何让企业安心?第一季度新登记商事主体2。25万户,也就意味着,第一季度宝安区日均新增250余个老板。一座城区要实现高质量发展,商事主体不仅要看数量,更要看质量。面对商事主体的快速增长,……太狂!YSKM公开放话不想成为theshy!想超越他,成为第LPL春季赛IG和RNG的电竞春晚结束后,IG新上单YSKM引发了大量的关注。一方面是因为他在这场BO3中确实打得非常好,起到了至关重要的作用,另一方面则是YSKM在场外也非常……投保容易,理赔难,保险是一场世纪骗局?最近两个月一直忙于工作和为了提升自身专业服务水平进行充电学习,没有进行更新,请大家多多包涵。今天咱们来聊聊保险到底是不是最大的世纪骗局这个话题我在日常保险销售过程中……陕西一定要去的景区,北峰四面悬绝,是攀登探险的好地方陕西一定要去的景区,北峰四面悬绝,是攀登、探险的好地方今天咱们一起走进西部地区的著名代表陕西省,说起陕西,我们可要注意与其同音的山西区分开来,想起它我们脑海里会浮现出沙漠……专家提醒患了胆结石,要留意2多5少哦2多一要多吃蔬菜和水果水果和蔬菜中含有大量的维生素C与维生素B1,因其代谢产物是碱性的,能有效预防结石的产生。但要注意,不能食用草酸过多的蔬菜,如菠菜和豆类,过量的……
刚刚,两个重要消息来了,A股,行情或迎来反转?上海海港有意挖角河南主帅,球队备战顺利未受传闻影响工人日报提振信心,让消费者敢消费愿消费真正有本事的人,都有这些特征她出道20年什么烂片都接,只为在北京给父母买房,如今怎么样了大雪节气的中医养生保健常识原神弔图雷电将军是的我们是有一个孩子,才怪啊股市交易印花税改革的三个方法夫妻本是同林鸟但可惜,这次罗晋也救不了唐嫣微信推出VIP会员,你会买吗?南宁大型的佛教寺院,昔日规模宏大香火鼎盛,为何如今空无一人再战张本智和!国乒公布大赛征战名单,4位世界冠军围剿日乒
男性虚胖吃什么?男性虚胖食疗方法上海杯王天一神夺魁,等级分狂涨至2777。2,高出郑惟桐22沿一带一路加速奔跑建好太阳之路的第一段助力马达加斯加经济发展人类奔跑速度竟超过暴龙山东行济泰曲三城,冬日美好旅行体验爆笑,关于恋爱的爆笑段子陕西发现2000年前大量彩绘陶怎么回事彩绘陶有怎样的历史谁的精子与谁的卵子不该匹配大陆警告将说到做到后,美国态度变了,拒绝将台纳入印太经济框架属性多少钱(属性是什么意思)孕期不能吃哪些食物盘点会导致胎儿畸形的食物去年这个时候

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州