当前位置:首页 > 教育 >

简答hdfs数据读取和写入的流程(hdfs写数据流程通俗易懂)

来源:原点资讯(www.yd166.com)时间:2023-06-19 08:44:23作者:YD166手机阅读>>

一.HDFS读流程(文件下载)

简答hdfs数据读取和写入的流程,hdfs写数据流程通俗易懂(1)

为了降低整体的带宽消耗和读取延时,HDFS会尽量让读取程序读取离它最近的副本。

如果在读取程序的同一个机架上有一个副本,那么就读取该副本。

如果一个HDFS集群跨越多个数据中心,那么客户端也将首先读取本地数据中心的副本。

语义:下载一个文件

客户端(Client)通过Distributed FileSystem向NameNode请求下载文件,namenode通过查询元数据,找到文件块所在的datanode地址。

NameNode会按距离策略排序返回存放相关块的DataNode地址,Client挑选一台datanode(就近原则,然后随机)服务器,请求读取数据。

datanode开始传输数据给客户端(从磁盘里面读取数据输入流,以packet为单位来做校验)。

客户端以packet为单位接收,先在本地缓存,然后写入目标文件。

语义:下载一个文件其实是获取文件的所有的block元数据,那么子集获取某些block应该成立

HDFS支持Client给出文件的offset自定义连接哪些block的DataNode,自定义获取数据。这个是支持计算层的分治,并行计算的核心。

二.HDFS写流程(文件上传)

简答hdfs数据读取和写入的流程,hdfs写数据流程通俗易懂(2)

Client和NameNode连接创建文件元数据

NameNode判定元数据是否有效

NameNode触发副本放置策略,返回一个有序的DataNode列表

Client与DataNode建立Pipeline连接

Client将块切分成packet(64KB),并使用chunk(512B) chunksum(4B)填充

Client将packet放入发送队列dataqueue中,并向第一个DataNode发送

第一个DataNode收到packet后本地保存并发送给第二个DataNode

第二个DataNode收到packet后本地保存并发送给第三个DataNode

这一个过程中,上游节点同时发送下一个packet

生活中类似于工厂的流水线,结论:流式其实也是变种的并行计算

HDFS使用这种传输方式,副本数对于Client是透明的

当block传输完成,DataNode们各自向NameNode汇报,同时Client继续传输下一个block

所以,Client的传输和block的汇报也是并行的

简答hdfs数据读取和写入的流程,hdfs写数据流程通俗易懂(3)

栏目热文

常用hdfs操作(hdfs操作流程)

常用hdfs操作(hdfs操作流程)

基本语法bin/hadoopfs具体命令 或者 bin/hdfs dfs 具体命令 dfs是fs的实现类。常用命令实操1...

2023-06-19 08:40:41查看全文 >>

hdfs读取步骤(hdfs读取文件步骤)

hdfs读取步骤(hdfs读取文件步骤)

总流程数据读取请求是由HDFS、NameNode、DataNode共同来完成服务的。下图描述了Hadoop中的文件读取操...

2023-06-19 08:24:02查看全文 >>

hdfs系统架构的读写流程(简述hdfs系统架构及读写流程)

hdfs系统架构的读写流程(简述hdfs系统架构及读写流程)

导读:HDFS(Hadoop Distributed File System)是一种分布式文件系统,可运行在廉价的硬件上...

2023-06-19 08:16:03查看全文 >>

hdfs的操作原理(简述hdfs的基本原理)

hdfs的操作原理(简述hdfs的基本原理)

HDFS概述HDFS是一个分布式的文件系统。用于存储文件,通过统一的命名空间——目录树来定位文件。优点高容错性:数据自动...

2023-06-19 08:19:02查看全文 >>

倩女幽魂手游囤货(倩女幽魂手游怎么买银子)

倩女幽魂手游囤货(倩女幽魂手游怎么买银子)

倩女幽魂手游怎么搬砖?游戏中土豪靠充钱就可以获得强大的实力,平民玩家就只能靠搬砖来慢慢进行人物养成。下面我便为大家带来倩...

2023-06-19 08:24:02查看全文 >>

hdfs读写步骤(描述HDFS读写过程)

hdfs读写步骤(描述HDFS读写过程)

概述HDFS(Hadoop Distributed File System)是GFS的开源实现。HDFS的优缺点1、优点...

2023-06-19 08:43:17查看全文 >>

hdfs适合什么读写任务(hdfs适合的读写操作)

hdfs适合什么读写任务(hdfs适合的读写操作)

深入探究HDFS:高可靠、高可扩展、高吞吐量的分布式文件系统在当今数据时代,数据的存储和处理已经成为了各行各业的一个关键...

2023-06-19 08:38:34查看全文 >>

hdfs操作实例(hdfs基本操作实践)

hdfs操作实例(hdfs基本操作实践)

1、启动HDFS:2、WebConsole访问:端口:500703、操作命令:-mkdir:创建目录,-p:先创建父目录...

2023-06-19 08:50:32查看全文 >>

hdfs支持顺序读写(hdfs怎么实现读写操作)

hdfs支持顺序读写(hdfs怎么实现读写操作)

文章来源:加米谷大数据HDFS 的文件访问机制为流式访问机制,即通过 API 打开文件的某个数据块之后,可以顺序读取或者...

2023-06-19 08:34:58查看全文 >>

hdfs操作与基础编程(hdfs新手入门教程)

hdfs操作与基础编程(hdfs新手入门教程)

1、hdfs 是做什么的  hadoop实现了一个分布式文件系统(Hadoop Distributed File Sys...

2023-06-19 08:05:43查看全文 >>

文档排行