RaeV管理员
文章 1946 篇 | 评论 3720 次

作者 Rae 发布的文章

Hadoop系列(十)HDFS的节点距离

在Hadoop集群里面,所有的DataNode节点都是hdfs系统存储数据用,为了使存储数据和读取数据尽可能快,所以在网络拓扑里面两两节点之间都会建立联系,那么两个节点之间距离越近,则我们称为彼此近邻。那这个距离是怎...

Hadoop系列(八)HDFS的副本

在hdfs文件存储中,每一个block块都会有副本,默认的副本数是3,这里我们也可以直接改,修改的文件还是hdfs-core.xml。文件的位置在:${hadoop_home}/etc/hadoop/hdfs-cor...

Hadoop系列(七)HDFS的block块大小配置

HDFS 将所有的⽂件全部抽象成为 block 块来进⾏存储,不管⽂件⼤⼩,全部⼀视同仁都是以 block 块的统⼀⼤⼩和形式进⾏存储,⽅便我们的分布式⽂件系统对⽂件的管理。所有的⽂件都是以 block 块的⽅式存放...

Hadoop系列(六)Hdfs的安全模式

安全模式是hadoop的⼀种保护机制,⽤于保证集群中的数据块的安全性 。当集群启动的时候,会⾸先进⼊安全模式。当系统处于安全模式时会检查数据块的完整性。假设我们设置的副本数(即参数dfs.replication)是3...

Hadoop系列(五)Hdfs运维之配置文件限额

在一个hadoop集群里面,我们经常会涉及到多个用户在操作整个集群,因为对于用户之间,我们经常会把这些用户分开,不允许a用户操作b用户的文件,同时像linux一样,每一个非root用户只能在自己的目录里面存放文件。但...

Hadoop系列(四)Hdfs的常用操作命令

hdfs是一个分布式文件系统,所以在hadoop中,我们可以直接在命令行里面像linux操作文件一样的方式操作hdfs系统上的文件。下面我们来分别演示下。特别说明1、在操作hadoop的时候我们可以使用两种命令,分别...

热文Hadoop系列(二)Hdfs介绍

Hadoop 分布式系统框架中,⾸要的基础功能就是⽂件系统,在 Hadoop 中使⽤FileSystem 这个抽象类来表示我们的⽂件系统,这个抽象类下⾯有很多⼦实现类,究竟使⽤哪⼀种,需要看我们具体的实现类,在我们实...

Hadoop系列(一)Hadoop介绍

做过大数据行业的同学,应该都对hadoop不陌生,曾经2011年左右,Hadoop在国内开始火爆,至今已经走过了10多个年头,但是他目前仍是大家做大数据相关不可或缺的一部分。所以从这篇文章开始我们介绍下hadoop相...