HDFS基本操作命令
这里写目录标题
- HDFS Shell CLI客户端
- 说明
- 常用命令
- hadoop fs -mkdir [-p] <path>
- hadoop fs -ls [-h] [-R] [<path>...]
- 上传文件到指定目录下
- 方法一:hadoop fs -put [-f] [-p] <localsrc>.....<dst>
- 方法二:hadoop fs -moveFromLocal <localsrc>....<dst>
- 查看HDFS文件内容
- 方法一:hadoop fs -cat <src> ...
- 方法二:hadoop fs -head <file>
- 方法三:hadoop fs -tail [-f] <file>
- 下载文件
- 方法一:hadoop fs -get [-f] [-p] <src>...<localdst>
- 方法二:合并下载hdfs文件
- 拷贝文件
- 追加数据到hdfs文件中
- 查看hdfs磁盘空间
- 查看hdfs文件使用的空间
- hdfs数据移动操作
- 修改hdfs文件副本个数
HDFS Shell CLI客户端
说明
- hdfs shell cli支持操作多种文件系统,包括本地文件系统(file:///),分布式文件系统(hdfs:nn:8020)等
- 操作的是什么文件系统取决于URL种的前缀协议
- 如果没有指定前缀,则将会读取环境变量汇总的fs.defaultFS属性,以该属性作为默认文件系统
- hdfs dfs -ls file:/// #操作本地文件系统
- hdfs dfs -ls hdfs://node1:8020/ #草足hdfs分布式文件系统
- hdfs dfs -ls / #直接根目录,没有指定协议,将夹在读取fs.default FS

常用命令
hadoop fs -mkdir [-p]
path 为待创建的目录
-p选项的行为与unix mkdir -p非常相似,他会沿着路径创建父目录

hadoop fs -ls [-h] [-R] [ …]
path 指定目录路径
-h显示文件size
-R 递归查看指定目录及其子目录

上传文件到指定目录下
方法一:hadoop fs -put [-f] [-p] …
-f 覆盖目标文件(已经存在)
-p保留访问和修改时间,所有圈和权限
localsrc 本地文件系统(客户端所在机器)
dst 目标文件系统(HDFS)

方法二:hadoop fs -moveFromLocal …
和-put功能一样,只不过上传结束,源数据会被删除
hadoop fs -moveFromLocal caixukun.csv /tmp/
查看HDFS文件内容
方法一:hadoop fs -cat …
读取指定文件全部内容,显示在标准输出控制台
注意:对于大文件内容读取,慎重
方法二:hadoop fs -head
查看文件前1kb的内容
hadoop fs -head /source/weibo/star/comment_log/29304839_node1.tcast.cn/caixukun.csv
方法三:hadoop fs -tail [-f]
查看文件最后1kb的内容
-f选择可以动态显示文件中追加的内容
hadoop fs -tail -f /source/weibo/star/comment_log/29304839_node1.tcast.cn/caixukun.csv
下载文件
方法一:hadoop fs -get [-f] [-p] …
下载文件到本地文件系统指定目录,localdst必须是目录
-f覆盖目标文件(已存在下)
-p保留访问和修改时间,所有权和权限

方法二:合并下载hdfs文件
命令:hadoop fs -getmerge [-n1] [-skip-empty-file]
下载多个文件合并到本地文件系统的一个文本中
-n1选项表示在每个文件末尾添加换行符
拷贝文件
hadoop fs -cp [-f] …
-f覆盖目标文件<已存在下>

追加数据到hdfs文件中
hadooToFile …
dst如果文件不存在,将创建文件。
如果为空,则输入为从标准输入中读取

查看hdfs磁盘空间
hdaoop fs -df [-h] [
显示文件系统的容量,可用空间和已用空间
查看hdfs文件使用的空间
hadoop fs -du [-s] [-h]
-s:表示显示指定路径文件长度的汇总摘要,而不是单个文件的摘要
-h:选项将以“人类可读”的方式格式化文件大小
hadoop fs -du -s -h -v /source/weibo/
hdfs数据移动操作
hadoop fs -mv …
移动文件到指定文件夹下
可以使用该命令移动数据,重命名文件的名称
修改hdfs文件副本个数
hadoop fs -setrep [R] [-w]
修改指定文件的副本数
-R表示递归 修改文件夹及其所有
-w客户端是否等待副本修改完毕
相关文章:
HDFS基本操作命令
这里写目录标题 HDFS Shell CLI客户端说明常用命令hadoop fs -mkdir [-p] <path>hadoop fs -ls [-h] [-R] [<path>...]上传文件到指定目录下方法一:hadoop fs -put [-f] [-p] <localsrc>.....<dst>方法二:hadoop fs -moveFromLocal <loc…...
git 实操
首先有安装好的git,安装好后,会在任一目录下右键出现git bash和git gui两个选项 打开git bash,设置好全局变量,用户名和邮箱,设置方法为: git config -- global user.name "xxx" git config --global user.email "xxxxxx.com" 1.创建版本库 git init 命…...
Visual Studio Code Python 扩展中的包管理
排版:Alan Wang Python 凭借其简单的语法和强大的库,目前已成为最流行的编程语言之一,也是最适合那些刚接触编程的人们的语言。但是,随着项目复杂性和规模的增长,管理依赖项的复杂性也会增加。当新用户不断承接更成熟的…...
spring学习笔记九
数据源对象管理 1、加入pom坐标 <dependency><groupId>com.alibaba</groupId><artifactId>druid</artifactId><version>1.1.16</version></dependency><!-- https://mvnrepository.com/artifact/c3p0/c3p0 --><depe…...
java list stream 使用
1、实现List对象集合的简单去重(distinct()) List<User> list list.stream().distinct().collect(Collectors.toList()); 2、实现List集合的根据属性(name)去重 list list.stream().filter(o -> o.getName() ! …...
两个Ubuntu电脑用SSH远程连接
两个Ubuntu电脑用SSH远程连接 1.ssh客户端及服务端的安装: 打开终端后,只需要以下两个命令即可 sudo apt-get install openssh-clientsudo apt-get install openssh-server2.启动ssh服务,执行以下命令: sudo /etc/init.d/ssh …...
讲解 @ServletComponentScan注解
目录: 1、用法介绍2、实例讲解 1、介绍 在SpringBoot项目启动器中添加ServletComponentScan注解后,SpringBoot在启动时会扫描并注册所有带有WebServlet(控制器)、WebFilter(过滤器)、WebListener(监听器&a…...
20款奔驰S350商务型加装原厂前排座椅通风系统,夏天必备的功能
通风座椅的主动通风功能可以迅速将座椅表面温度降至适宜程度,从而确保最佳座椅舒适性。该功能启用后,车内空气透过打孔皮饰座套被吸入座椅内部,持续时间为 8 分钟。然后,风扇会自动改变旋转方向,将更凉爽的环境空气从座…...
Rust vs Go:常用语法对比(十一)
题目来自 Rust Vs Go: Which Language Is Better For Developing High-Performance Applications?[1] 202. Sum of squares Calculate the sum of squares s of data, an array of floating point values. 计算平方和 package mainimport ( "math")func main() { da…...
Spring MVC拦截器和跨域请求
一、拦截器简介 SpringMVC的拦截器(Interceptor)也是AOP思想的一种实现方式。它与Servlet的过滤器(Filter)功能类似,主要用于拦截用户的请求并做相应的处理,通常应用在权限验证、记录请求信息的日志、判断用…...
C++初阶--C++入门
目录 前言C关键字命名空间命名空间的定义命名空间的使用加命名空间名称及作用域限定符使用using namespace 命名空间名称引入使用using将命名空间中的成员引入 C的输入与输出缺省参数全缺省半缺省参数 函数重载参数类型不同参数个数不同参数类型顺序不同 引用引用特性 常引用使…...
Matlab实现PID控制仿真(附上30个完整仿真源码+数据)
本文介绍了如何使用Matlab实现PID控制器的仿真。首先,我们将简要介绍PID控制器的原理和控制算法。然后,我们将使用Matlab编写一个简单的PID控制器,并使用仿真环境来验证其性能。最后,我们将通过调整PID控制器的参数来优化控制系统…...
微信小程序:文件下载
目录 第一步 请求资源 第二步 获取资源后写入到微信本地 获取资源 写入资源(wx.getFileSystemManager)writeFile 的api 第三步 读取资源(openDocument与saveImageToPhotosAlbum) 第一步 请求资源 下面是请求接口中的脚本内容 export let baseUrl http://192.168.78.112…...
QString和QByteArray的区别
QString和QByteArray的区别 本质格式转换QString字符串格式化打印长度 本质 QString是对QByteArray的再次封装 QString可以通过char*来构造,也可以通过QByteArray来构造 QByteArray就是char* QString是编码后的char* QString也是封装了字符串, 但是内部的编码为utf…...
Vue3 Vite electron 开发桌面程序
Electron是一个跨平台的桌面应用程序开发框架,它允许开发人员使用Web技术(如HTML、CSS和JavaScript)构建桌面应用程序,这些应用程序可以在Windows、macOS和Linux等操作系统上运行。 Electron的核心是Chromium浏览器内核和Node.js…...
【Nodejs】Express模板使用
1.Express脚手架的安装 安装Express脚手架有两种方式: 使用express-generator安装 使用命令行进入项目目录,依次执行: cnpm i -g express-generator可通过express -h查看命令行的指令含义 express -hUsage: express [options] [dir] Optio…...
【iOS】App仿写--管理系统
文章目录 前言一、账号界面二、功能界面三、添加功能四、删除功能五、更改功能六、查找功能七、排序功能八、退出功能总结 前言 在日常生活中,如果用文字来记述与管理我们数据会十分麻烦,并且人工成本较高,这里笔者给出一种管理系统的模版&a…...
JS实现队列的数据结构
创建queue.ts /*** 队列*/ export default class Queue<T> {private items: object;private count: number;private header: number;constructor() {this.items {};this.count this.header 0;}/*** 入队列* param element* returns 当前队列的数量*/enqueue(element:…...
title: 用 LangChain 构建基于资料库的问答机器人(四):通过代理使用外部工具
上一篇教程我们介绍了 ReAct 系统,这是一个非常强大的行为模式,但它需要编写大量的示例来告诉 LLM 如何思考、行动,并且为了遵循这个模式,还需要编写代码来分析生成文字、调用函数、拼接 prompt 等,这些工作都是十分繁…...
使用 CSS 自定义属性
我们常见的网站日夜间模式的变化,其实用到了 css 自定义属性。 CSS 自定义属性(也称为 CSS 变量)是一种在 CSS 中预定义和使用的变量。它们提供了一种简洁和灵活的方式来通过多个 CSS 规则共享相同的值,使得样式更易于维护和修改。…...
51单片机+DAC0832信号发生器实战:从硬件搭建到波形调试全记录(附避坑指南)
51单片机DAC0832信号发生器实战:从硬件搭建到波形调试全记录(附避坑指南) 在电子设计领域,信号发生器是工程师和爱好者不可或缺的工具。传统商用设备虽然功能强大,但对于学习嵌入式系统和数模转换原理而言,…...
Qwen3-Reranker-0.6B与Java后端服务集成实战
Qwen3-Reranker-0.6B与Java后端服务集成实战 1. 为什么需要在Java服务中集成重排序模型 在企业级搜索和推荐系统中,我们经常遇到这样的场景:用户输入一个查询词,系统从千万级文档库中召回前100个候选结果,但这些结果的排序质量往…...
突破百度网盘限速:Mac用户7分钟解锁SVIP级下载体验
突破百度网盘限速:Mac用户7分钟解锁SVIP级下载体验 【免费下载链接】BaiduNetdiskPlugin-macOS For macOS.百度网盘 破解SVIP、下载速度限制~ 项目地址: https://gitcode.com/gh_mirrors/ba/BaiduNetdiskPlugin-macOS 还在为百度网盘非会员100KB/s的龟速下载…...
Ostrakon-VL-8B零基础上手:无需Python基础,通过Chainlit界面完成首次图文问答
Ostrakon-VL-8B零基础上手:无需Python基础,通过Chainlit界面完成首次图文问答 你是不是对AI图文对话很感兴趣,但一看到Python代码、命令行就头疼?是不是觉得部署一个多模态大模型需要专业的技术背景?今天我要告诉你一…...
Uncertainty-Aware Pixel-Level Contrastive Learning for Enhanced Semi-Supervised Medical Image Segmen
1. 医学图像分割的挑战与半监督学习机遇 医学图像分割一直是计算机视觉领域的重要研究方向,它能够帮助医生快速定位病灶区域,提高诊断效率。但在实际应用中,我们常常面临标注数据稀缺的问题——专业医生标注一张CT或MRI图像可能需要数小时&am…...
【无标题】260329
一切都只是我想多了么看到你的博文看到你的新年快乐现在看到你删库跑路为什么要这样出现又消失。。。本来就虚无缥缈的一点儿联系又消失殆尽如果现在可以见到你我心里有N个为什么想问你只是觉得憋屈可能是我理解能力不足共情能力有限我猜不到你的心思啊你到底是想联系还是不想联…...
Wan2.2-I2V-A14B GPU算力优化:显存碎片整理与缓存复用机制解析
Wan2.2-I2V-A14B GPU算力优化:显存碎片整理与缓存复用机制解析 1. 引言 在视频生成领域,Wan2.2-I2V-A14B模型凭借其出色的生成质量和稳定性,已成为众多企业和开发者的首选。然而,随着视频分辨率和时长的提升,显存资源…...
Emu3.5 视觉 tokenizer 及其 decoder 的训练过程
下面我把 Emu3.5 视觉 tokenizer 及其 decoder 的训练完整过程,按照“论文明确写到的部分”“公开代码能对上的部分”“需要用开源近似路线复现的部分”三层重新整理。先给结论: 结论:Emu3.5 的视觉部分其实不是“一次性训练完一个模块”,而是至少分成两条链路: 第一条是…...
手把手教你用Verilog写一个纯组合逻辑的FP32加法器(附完整代码与避坑指南)
手把手教你用Verilog实现纯组合逻辑FP32加法器(附完整代码与避坑指南) 在数字电路设计中,浮点运算单元一直是性能优化的关键路径。相比时序逻辑实现,纯组合逻辑的FP32加法器能在一个时钟周期内完成所有计算,显著提升吞…...
模型航空喷气发动机CAD全套图纸(32张)
模型航空喷气发动机CAD学习资料是一套针对航空模型动力系统设计的系统性资源,涵盖从整体结构到局部零件的详细设计思路。32张图纸以标准化工程语言呈现,包含发动机外壳、燃烧室、涡轮组件、进气导管等核心模块的二维与三维视图,通过精确的线条…...
