百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

大数据开发-HDFS Shell命令

bigegpt 2024-08-29 11:34 2 浏览

本期带来的文章是大数据开发-HDFS Shell命令,可能大家会好奇,前面是不是有见过shell命令了,这次怎么还有。注意,这次shell面前还有HDFS,指的是在HDFS存储中进行文件夹和文件操作的命令,下面就开始本章节的内容。(内容较多,建议收藏再看)

一、概述

HDFS Shell命令允许使用命令行在HDFS存储中进行文件夹和文件操作,如文件夹的增删改查、文件的增删改查等。

Hadoop支持很多Shell命令,比如hadoop fs、hadoop dfs和hdfs dfs都是HDFS最常用的Shell命令,用来查看HDFS文件系统的目录结构、上传和下载数据、创建文件等。这三个命令既有联系有又区别:

hadoop fs:适用于任何不同的文件系统,比如本地文件系统和HDFS文件系统;

hadoop dfs:只能适用于HDFS文件系统;

hdfs dfs:跟hadoop dfs命令的作用一样,也只能适用于HDFS文件系统。

二、命令

在本教程中,统一使用hdfs dfs命令对HDFS进行操作。开始练习hadoop时,打开Linux之后要用 start-dfs.sh 启动HDFS,HDFS不是开机启动的。

hdfs dfs -操作命令 参数

前面的【hdfs dfs -】部分是固定的,后面的【操作命令 参数】部分是变化的

(1)-help:输出这个命令参数

hdfs dfs -help rm

(2)-ls: 显示目录信息

hdfs dfs -ls /

hdfs dfs -ls / 0 #列出根目录中的内容

hdfs dfs -ls -R / #递归列出多层文件夹的内容

(3)-mkdir:在hdfs上创建目录

hdfs dfs -mkdir /abc #创建名为/abc的文件夹

(4)-moveFromLocal从本地剪切粘贴到hdfs

hdfs dfs -moveFromLocal /home/Hadoop/a.txt /aaa/bbb/cc/dd

(5)-moveToLocal:从hdfs剪切粘贴到本地

hdfs dfs -moveToLocal /aaa/bbb/cc/dd /home/Hadoop/a.txt

(6)–appendToFile :追加一个文件(不在HDFS中)到已经存在的文件末尾

hdfs dfs -appendToFile ./hello.txt /hello.txt

(7)-cat :显示文件内容#注意:只能查看文件文件

hdfs dfs -cat /hadoop-daemon.sh

(8)-tail:显示一个文件的末尾

hdfs dfs -tail /weblog/access_log.1

(9)-text:以字符形式打印一个文件的内容

hdfs dfs -text /weblog/access_log.1

(10)-chgrp 、-chmod、-chown:linux文件系统中的用法一样,修改文件所属权限

hdfs dfs -chmod 666 /hello.txt

(11)-copyFromLocal:从本地文件系统中拷贝文件到hdfs路径去

hdfs dfs -copyFromLocal ./jdk.tar.gz /aaa/

(12)-copyToLocal:从hdfs拷贝到本地

hdfs dfs -copyToLocal /aaa/jdk.tar.gz

(13)-cp :从hdfs的一个路径拷贝到hdfs的另一个路径

hdfs dfs -cp /aaa/jdk.tar.gz /bbb/jdk.tar.gz.2

(14)-mv:在hdfs目录中移动文件

hdfs dfs -mv /aaa/jdk.tar.gz /

(15)hdfs dfs -get /abc/hosts ./hosts #把HDFS中的文件下载到本地Linux中

#注意./hosts是下载后保存到本地的位置

(16)-getmerge :合并下载多个文件,比如hdfs的目录 /aaa/下有多个文件:log.1, log.2,log.3,…

hdfs dfs -getmerge /aaa/log.* ./log.sum

(17)-put:把Linux系统中/etc/hosts文件上传到HDFS中

hdfs dfs -put /aaa/jdk.tar.gz /bbb/jdk.tar.gz.2

(18)-rm:删除文件或文件夹

hdfs dfs -rm -r /aaa/bbb/

(19)-rmdir:递归删除文件/文件夹,文件夹中有文件也能删除

hdfs dfs -rmdir /aaa/bbb/ccc

(20)-df :查看HDFS文件系统的磁盘使用情况

hdfs dfs -df -h /

(21)-du查看文件/文件夹的大小

hdfs dfs -du -h /

(22)-count:统计一个指定目录下的文件节点数量

hdfs dfs -count /aaa/

(23)-setrep:设置hdfs中文件的副本数量

hdfs dfs -setrep 3 /aaa/jdk.tar.gz

这里设置的副本数只是记录在namenode的元数据中,是否真的会有这么多副本,还得看datanode的数量。因为目前只有3台设备,最多也就3个副本,只有节点数的增加到10台时,副本数才能达到10。

(24) - expunge :清空hdfs垃圾桶

hdfs dfs -expunge

(25)hdfs dfs -checksum /abc/hosts #查看文件的MD5值

(26)hdfs dfs -find / -name xyz #查找名字为xyz的文件的位置

以上就是本期的所有内容了,本章节的内容也是以命令为主,需要自己多花一些时间记下来,这样才能提高工作效率。我一直强调基础才是最重要的,打好基础,才能让后面学习的知识更容易被消化。建议收藏再看

希望大家点个关注,及时收取最新文章推送,想了解更多敬请咨询加米谷大数据。

有问题的欢迎在评论区留言,如有侵权请告知。

相关推荐

Docker篇(二):Docker实战,命令解析

大家好,我是杰哥上周我们通过几个问题,让大家对于Docker有了一个全局的认识。然而,说跟练往往是两个概念。从学习的角度来说,理论知识的学习,往往只是第一步,只有经过实战,才能真正掌握一门技术所以,本...

docker学习笔记——安装和基本操作

今天学习了docker的基本知识,记录一下docker的安装步骤和基本命令(以CentOS7.x为例)一、安装docker的步骤:1.yuminstall-yyum-utils2.yum-con...

不可错过的Docker完整笔记(dockerhib)

简介一、Docker简介Docker是一个开源的应用容器引擎,基于Go语言并遵从Apache2.0协议开源。Docker可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,...

扔掉运营商的 IPTV 机顶盒,全屋全设备畅看 IPTV!

其实现在看电视节目的需求确实大大降低了,折腾也只是为了单纯的让它实现,享受这个过程带来的快乐而已,哈哈!预期构想家里所有设备直接接入网络随时接收并播放IPTV直播(电信点播的节目不是太多,但好在非常稳...

第五节 Docker 入门实践:从 Hello World 到容器操作

一、Docker容器基础运行(一)单次命令执行通过dockerrun命令可以直接在容器中执行指定命令,这是体验Docker最快捷的方式:#在ubuntu:15.10容器中执行ech...

替代Docker build的Buildah简单介绍

Buildah是用于通过较低级别的coreutils接口构建OCI兼容镜像的工具。与Podman相似,Buildah不依赖于Docker或CRI-O之类的守护程序,并且不需要root特权。Builda...

Docker 命令大全(docker命令大全记录表)

容器生命周期管理run-创建并启动一个新的容器。start/stop/restart-这些命令主要用于启动、停止和重启容器。kill-立即终止一个或多个正在运行的容器rm-于删除一个或...

docker常用指令及安装rabbitMQ(docker安装rabbitmq配置环境)

一、docker常用指令启动docker:systemctlstartdocker停止docker:systemctlstopdocker重启docker:systemctlrestart...

使用Docker快速部署Storm环境(docker部署confluence)

Storm的部署虽然不是特别麻烦,但是在生产环境中,为了提高部署效率,方便管理维护,使用Docker来统一管理部署是一个不错的选择。下面是我开源的一个新的项目,一个配置好了storm与mono环境的D...

Docker Desktop安装使用指南:零基础教程

在之前的文章中,我多次提到使用Docker来安装各类软件,尤其是开源软件应用。鉴于不少读者对此有需求,我决定专门制作一期关于Docker安装与使用的详细教程。我主要以Macbook(Mac平台)为例进...

Linux如何成功地离线安装docker(linux离线安装httpd)

系统环境:Redhat7.2和Centos7.4实测成功近期因项目需要用docker,所以记录一些相关知识,由于生产环境是不能直接连接互联网,尝试在linux中离线安装docker。步骤1.下载...

Docker 类面试题(常见问题)(docker面试题目)

Docker常见问题汇总镜像相关1、如何批量清理临时镜像文件?可以使用sudodockerrmi$(sudodockerimages-q-fdanging=true)命令2、如何查看...

面试官:你知道Dubbo怎么优雅上下线的吗?你:优雅上下线是啥?

最近无论是校招还是社招,都进行的如火如荼,我也承担了很多的面试工作,在一次面试过程中,和候选人聊了一些关于Dubbo的知识。Dubbo是一个比较著名的RPC框架,很多人对于他的一些网络通信、通信协议、...

【Docker 新手入门指南】第五章:Hello Word

适合人群:完全零基础新手|学习目标:30分钟掌握Docker核心操作一、准备工作:先确认是否安装成功打开终端(Windows用户用PowerShell或GitBash),输入:docker--...

松勤软件测试:详解Docker,如何用portainer管理Docker容器

镜像管理搜索镜像dockersearch镜像名称拉取镜像dockerpullname[:tag]列出镜像dockerimages删除镜像dockerrmiimage名称或id删除...