这是一篇最通熟易懂的Hadoop HDFS实践攻略!(3)
发布时间:2021-01-16 19:28 所属栏目:53 来源:网络整理
导读:具体写入流程: client向namenode发请求,说想要上传文件 namenode会检查目标文件是否存在、父目录是否存在,检查没有问题后返回确认信息 client再发请求,问第一个block应该传到哪些datanode上 namenode经过衡量,返回
具体写入流程:
2、读取机制
3、NameNode机制 通过对HDFS读写流程的了解,可以发现namenode是一个很重要的部分,它记录着整个HDFS系统的元数据,这些元数据是需要持久化的,要保存到文件中. Namenode还要承受巨大的访问量,client读写文件时都需要请求namenode,写文件时要修改元数据,读文件时要查询元数据. 为了提高效率,namenode便将元数据加载到内存中,每次修改时,直接修改内存,而不是直接修改文件,同时会记录下操作日志,供后期修改文件时使用. 这样,namenode对数据的管理就涉及到了3种存储形式:
namenode需要定期对元数据文件和日志文件进行整合,以保证文件中数据是新的,但这个过程很消耗性能,namenode需要快速地响应client的大量请求,很难去完成文件整合操作,这时就引入了一个小助手secondnamenode. secondnamenode会定期从namenode中下载元数据文件和操作日志,进行整合,形成新的数据文件,然后传回namenode,并替换掉之前的旧文件. (编辑:ASP站长网) |
相关内容
网友评论
推荐文章
热点阅读