当前位置: 首页 > news >正文

熟悉常用的 Linux 操作和 Hadoop 操作

文章目录

  • 前言
  • 一、常用命令集合
    • 1、cd命令:切换目录
      • 1、切换到目录/usr/local
      • 2、切换回上级目录
      • 3、切换到当前登录Linux系统的用户的自己的文件夹
    • 2、ls命令:查看文件与目录
    • 3、mkdir命令:创建目录
    • 4、rmdir命令:删除空的目录
    • 5、cp 命令:复制文件或目录
    • 6、mv 命令:移动文件与目录,或更名
    • 7、rm 命令:移除文件或目录
    • 8、cat 命令:查看文件内容
    • 9、tac 命令:反向查看文件内容
    • 10、more 命令:一页一页翻动查看
    • 11、head 命令:取出前面几行
    • 12、tail 命令:取出后面几行
    • 13、touch 命令:修改文件时间或创建新文件
    • 14、chown 命令:修改文件所有者权限
    • 15、find 命令:文件查找
    • 16、tar 命令:压缩命令
    • 17、grep 命令:查找字符串
    • 18、配置环境变量
  • 二、常用的 Hadoop 操作
    • 1.启动 Hadoop,为 hadoop 用户在 HDFS 中创建用户目录/user/hadoop
    • 2、接着在 HDFS 的目录/user/hadoop下,创建 test 文件夹,并查看文件列表
    • 3、将 Linux 系统本地的“~/.bashrc”文件上传到 HDFS 的 test 文件夹中,并查看 test
    • 4、将 HDFS 文件夹 test 复制到 Linux 系统本地文件系统的/usr/local/hadoop目录下
  • 三、总结
  • 四、参考资料


前言

Hadoop 运行在 Linux 系统上,因此,需要学习实践一些常用的 Linux 命令。本实验旨在熟悉常用的 Linux 操作和 Hadoop 操作,为顺利开展后续其他实验奠定基础。
环境:
1、阿里云服务器 Ubuntu18.0.4
2、Hadoop 3.1.3
3、JDK 1.8


一、常用命令集合

1、cd命令:切换目录

1、切换到目录/usr/local

cd /usr/local

2、切换回上级目录

cd …

3、切换到当前登录Linux系统的用户的自己的文件夹

cd ~

2、ls命令:查看文件与目录

  • 查看当前目录下的所有文件与目录

ls -al

3、mkdir命令:创建目录

  • 创建单个目录:
 mkdir a
  • 创建多个目录:
 mkdir -p a1/a2/a3/a4

4、rmdir命令:删除空的目录

  • 删除单个目录:

rmdir a

  • 删除多个目录:
 rmdir -p a1/a2/a3/a4

5、cp 命令:复制文件或目录

  • 将当前用户的主文件夹下的文件.bashrc 复制到目录“/usr”下,并重命名为 bashrc1:
 sudo cp ~/.bashrc /usr/bashrc1
  • 在目录“/tmp”下新建目录 test,再把这个目录复制到“/usr”目录下:
cd /tmp
mkdir test
sudo cp -r /tmp/test /usr

6、mv 命令:移动文件与目录,或更名

  • 将“/usr”目录下的文件 bashrc1 移动到“/usr/test”目录下:
 sudo mv /usr/bashrc1 /usr/test
  • 将“/usr”目录下的 test 目录重命名为 test2:
 sudo mv /usr/test /usr/test2

7、rm 命令:移除文件或目录

  • 将“/usr/test2”目录下的 bashrc1 文件删除:
 sudo rm /usr/test2/bashrc1
  • 将“/usr”目录下的 test2 目录删除:
 sudo rm -r /usr/test2

8、cat 命令:查看文件内容

  • 查看当前用户主文件夹下的.bashrc 文件内容:
cat ~/.bashrc

9、tac 命令:反向查看文件内容

  • 反向查看当前用户主文件夹下的.bashrc 文件的内容:
 tac ~/.bashrc

10、more 命令:一页一页翻动查看

  • 翻页查看当前用户主文件夹下的.bashrc 文件的内容:
 more ~/.bashrc

11、head 命令:取出前面几行

  • 1、查看当前用户主文件夹下.bashrc 文件内容前 20 行:
 head -n 20 ~/.bashrc
  • 2、查看当前用户主文件夹下.bashrc 文件内容,后面 50 行不显示,只显示前面几行
 head -n -50 ~/.bashrc

12、tail 命令:取出后面几行

  • 1、查看当前用户主文件夹下.bashrc 文件内容最后 20 行:
tail -n 20 ~/.bashrc
  • 2、查看当前用户主文件夹下.bashrc 文件内容,并且只列出 50 行以后的数据:
 tail -n +50 ~/.bashrc

13、touch 命令:修改文件时间或创建新文件

  • 1、在“/tmp”目录下创建一个空文件 hello,并查看文件时间:
cd /tmp
touch hello
ls -l hello
  • 2、修改 hello 文件,将文件时间整为 5 天前:
 touch -d “5 days ago” hello

14、chown 命令:修改文件所有者权限

  • 将 hello 文件所有者改为 root 帐号,并查看属性:
 sudo chown root /tmp/hellols -l /tmp/hello

15、find 命令:文件查找

  • 找出主文件夹下文件名为.bashrc 的文件:
 find ~ -name .bashrc

16、tar 命令:压缩命令

  • 1、在根目录“/”下新建文件夹 test,然后在根目录“/”下打包成 test.tar.gz:
sudo mkdir /test
sudo tar -zcv -f /test.tar.gz test
  • 2、把上面的 test.tar.gz 压缩包,解压缩到“/tmp”目录:
sudo tar -zxv -f /test.tar.gz -C /tmp

17、grep 命令:查找字符串

  • 从“~/.bashrc”文件中查找字符串’examples’:
 grep -n 'examples' ~/.bashrc

18、配置环境变量

  • 1、首先,使用 vim 编辑器打开文件“~/.bashrc”,命令如下:
 vim ~/.bashrc
  • 2、然后,在该文件的最上面加入一行如下形式的语句:
export JAVA_HOME=JDK 安装路径
  • 3、最后,执行如下命令使得环境变量配置生效:
source ~/.bashrc
  • 4、查看 JAVA_HOME 变量的值:
echo $JAVA_HOME

二、常用的 Hadoop 操作

1.启动 Hadoop,为 hadoop 用户在 HDFS 中创建用户目录/user/hadoop

 cd /usr/local/hadoop./sbin/start-dfs.sh./bin/hdfs dfs -mkdir -p /user/hadoop

在这里插入图片描述

2、接着在 HDFS 的目录/user/hadoop下,创建 test 文件夹,并查看文件列表

 cd /usr/local/hadoop./bin/hdfs dfs -mkdir test./bin/hdfs dfs -ls

在这里插入图片描述

3、将 Linux 系统本地的“~/.bashrc”文件上传到 HDFS 的 test 文件夹中,并查看 test

cd /usr/local/hadoop
./bin/hdfs dfs -put ~/.bashrc test
./bin/hdfs dfs -ls test

在这里插入图片描述

4、将 HDFS 文件夹 test 复制到 Linux 系统本地文件系统的/usr/local/hadoop目录下

cd /usr/local/hadoop
./bin/hdfs dfs -get test ./

在这里插入图片描述


三、总结

实验内容主要就是熟悉linux命令以及hadoop的一些基本操作,实验内容已全部完成。出现的重大问题就是在启动hadoop过后使用jps查看各个名称节点时,未显示,尝试了许多方法也无法解决,后面猜想可能是jdk和hadoop以及ubuntu等的版本不互相匹配造成,后来跟着林子雨老师的慕课重新装了一边才成功。

四、参考资料

https://www.icourse163.org/learn/XMU-1002335004?tid=1469834441#/learn/announce

相关文章:

熟悉常用的 Linux 操作和 Hadoop 操作

文章目录前言一、常用命令集合1、cd命令:切换目录1、切换到目录/usr/local2、切换回上级目录3、切换到当前登录Linux系统的用户的自己的文件夹2、ls命令:查看文件与目录3、mkdir命令:创建目录4、rmdir命令:删除空的目录5、cp 命令…...

Vue2项目总结-电商后台管理系统

Vue2项目总结-电商后台管理系统 去年做的项目,拖了很久,总算是打起精力去做这个项目的总结,并对Vue2的相关知识进行回顾与复习 各个功能模块如果有过多重复冗杂的部分,将会抽取部分值得记录复习的地方进行记录 一:项目…...

【二】一起算法---队列:STL queue、手写循环队列、双端队列和单调队列、优先队列

纸上得来终觉浅,绝知此事要躬行。大家好!我是霜淮子,欢迎订阅我的专栏《算法系列》。 学习经典算法和经典代码,建立算法思维;大量编码让代码成为我们大脑的一部分。 ⭐️已更系列 1、基础数据结构 1.1、链表➡传送门 1…...

<Linux>环境变量

环境变量 文章目录环境变量一、基本概念二、常见环境变量三、查看环境变量的方法四、测试PATH五、测试HOME六、测试SHELL七、环境变量相关的命令八、环境变量的组织方式九、命令行参数十、通过代码获得环境变量十一、通过系统调用获取环境变量十二、环境变量通常是具有全局属性…...

【MySQL】下载(超详细教程)

目录 First-下载 Second-安装 Third-检测是否安装 Last-总结 First-下载 首先 ,我们一步一步跟着我的操作来,不能越步骤,很容易报错,就芭比Q了。 第一步直接进入这个网址:MySQL :: MySQL 社…...

再探pytorch的Dataset和DataLoader

本文从分类、检测、分割三大任务的角度来剖析pytorch得dataset和dataloader源码,可以让初学者深刻理解每个参数的由来和使用,并轻松自定义dataset。思考:在探究Dataset和DataLoader之前,需要明白一个事情,就是当我们不…...

【2023.3.18 美团校招】

文章目录1. 小美剪彩带2. 最多修改两个字符,生成字典序最小的回文串1. 小美剪彩带 题意:找出区间内不超过k种数字子数组的最大长度 使用双指针的方式,用哈希表来统计每个数出现次数。在双指针移动的过程中,动态的维护区间内不同数…...

程序员必须知道的HTML常用代码有哪些?

HTML 即超文本标记语言,是目前应用最为广泛的语言之一,是组成一个网页的主要语言。在现今这个 HTML5 华丽丽地占领了整个互联网的时候,如果想要通过网页抓住浏览者的眼球光靠因循守旧是不行的,程序猿们需要掌握一些必须知道的 HTM…...

多目标家庭行为检测--人脸识别模块构建

文章目录前言原理项目结构编码配置主控函数人脸采集模块特征提取识别测试前言 2023-3-18 天小雨,午觉舒适程度5颗星。任务完成指数2颗星。续接上文:《MidiaPipe stgcn(时空图卷积网络)实现人体姿态判断(单目标&#x…...

RocketMQ重复消费问题的原因

文章目录 概览消息发送异常时重复发送消费消息抛出异常消费者提交offset失败服务端持久化offset失败主从同步offset失败重平衡清理长时间消费的消息总结概览 消息发送异常时重复发送 首先,我们来瞅瞅RocketMQ发送消息和消费消息的基本原理。 如图,简单说一下上图中的概念: …...

proxy详细介绍与使用

proxy详细介绍与使用 proxy 对象用于创建一个对象的代理,是在目标对象之前架设一个拦截,外界对该对象的访问,都必须先通过这个拦截。通过这种机制,就可以对外界的访问进行过滤和改写。 ES6 原生提供 Proxy 构造函数,…...

基于YOLOv5的舰船检测与识别系统(Python+清新界面+数据集)

摘要:基于YOLOv5的舰船检测与识别系统用于识别包括渔船、游轮等多种海上船只类型,检测船舰目标并进行识别计数,以提供海洋船只的自动化监测和管理。本文详细介绍船舰类型识别系统,在介绍算法原理的同时,给出Python的实…...

【C#】List数据去重

系列文章 【C#】单号生成器(定义编号规则、流水号、产生业务单号) 本文链接:https://blog.csdn.net/youcheng_ge/article/details/129129787 【C#】日期范围生成(构建本周开始、结束日期) 本文链接:https…...

避免踩坑,教给你VSCode中最常用到的6项功能

这里为程序员介绍VSCode中包含的许多令人兴奋的Tips。 1. 插件市场中免费下载使用CodeGeeX插件 AI辅助编程工具CodeGeeX,是完全免费,开源开放给所有开发者使用。程序员普遍反应使用这个插件后,代码编写效率提升2倍以上。 CodeGeeX插件拥有…...

ThingsBoard开源物联网平台智慧农业实例快速部署教程(Ubuntu、CentOS适用)

ThingsBoard部署教程文档 文章目录ThingsBoard部署教程文档1. JDK环境安装2. 安装thingsBoard2.1 ThingsBoard软件包安装2.2 PostgreSQL安装2.3 PostgreSQL初始化配置3. 修改ThingsBord的配置4. 运行安装脚本测试5. 访问测试6. 导入一个仪表盘库6.1 导出仪表盘并导入自己的项目…...

【Java Spring基本问题】记录面试题宝典中自己不熟悉的Spring问题

文章目录Spring Bean定义装配Spring Bean生命周期Spring Bean容器Spring 循环依赖Spring 事务Autowired和ResourceSpring Bean定义装配 参考文章 1. 定义Spring Bean的三种方式 XML文件定义Spring Bean JavaConfig定义Spring Bean Component注解定义SpringBean 2. 装配Spri…...

I2C协议简介 Verilog实现

I2C协议 IIC 协议是三种最常用的串行通信协议(I2C,SPI,UART)之一,接口包含 SDA(串行数据线)和 SCL(串行时钟线),均为双向端口。I2C 仅使用两根信号线&#xf…...

服务器被DDoS攻击,怎么破?

文章目录前言网站受到DDoS的症状判断是否被攻击查看网络带宽占用查看网络连接TCP连接攻击SYN洪水攻击防御措施TCP/IP内核参数优化iptables 防火墙预防防止同步包洪水(Sync Flood)Ping洪水攻击(Ping of Death)控制单个IP的最大并发…...

实现完全二叉树

文章目录1、树概念及结构2、孩子兄弟表示法3、二叉树3.1、二叉树的概念3.2、特殊的二叉树3.3、二叉树的存储4、堆的性质5、数组结构实现完全二叉树1、结构体的定义2、初始化堆3、销毁堆4、交换函数5、向上调整函数6、插入数据7、向下调整函数8、删除堆顶数据函数9、判断是否空堆…...

【独家】华为OD机试 - 矩阵最值(C 语言解题)

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试,独家整理 已参加机试人员的实战技巧本期题目:矩阵最值 题目 给定一个仅包…...

反向工程与模型迁移:打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下,商品详情API作为连接电商平台与开发者、商家及用户的关键纽带,其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息(如名称、价格、库存等)的获取与展示,已难以满足市场对个性化、智能…...

【力扣数据库知识手册笔记】索引

索引 索引的优缺点 优点1. 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度(创建索引的主要原因)。3. 可以加速表和表之间的连接,实现数据的参考完整性。4. 可以在查询过程中,…...

uni-app学习笔记二十二---使用vite.config.js全局导入常用依赖

在前面的练习中,每个页面需要使用ref,onShow等生命周期钩子函数时都需要像下面这样导入 import {onMounted, ref} from "vue" 如果不想每个页面都导入,需要使用node.js命令npm安装unplugin-auto-import npm install unplugin-au…...

屋顶变身“发电站” ,中天合创屋面分布式光伏发电项目顺利并网!

5月28日,中天合创屋面分布式光伏发电项目顺利并网发电,该项目位于内蒙古自治区鄂尔多斯市乌审旗,项目利用中天合创聚乙烯、聚丙烯仓库屋面作为场地建设光伏电站,总装机容量为9.96MWp。 项目投运后,每年可节约标煤3670…...

QT: `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中,将 long long 类型转换为 QString 可以通过以下两种常用方法实现: 方法 1:使用 QString::number() 直接调用 QString 的静态方法 number(),将数值转换为字符串: long long value 1234567890123456789LL; …...

快刀集(1): 一刀斩断视频片头广告

一刀流:用一个简单脚本,秒杀视频片头广告,还你清爽观影体验。 1. 引子 作为一个爱生活、爱学习、爱收藏高清资源的老码农,平时写代码之余看看电影、补补片,是再正常不过的事。 电影嘛,要沉浸,…...

作为测试我们应该关注redis哪些方面

1、功能测试 数据结构操作:验证字符串、列表、哈希、集合和有序的基本操作是否正确 持久化:测试aof和aof持久化机制,确保数据在开启后正确恢复。 事务:检查事务的原子性和回滚机制。 发布订阅:确保消息正确传递。 2、性…...

消息队列系统设计与实践全解析

文章目录 🚀 消息队列系统设计与实践全解析🔍 一、消息队列选型1.1 业务场景匹配矩阵1.2 吞吐量/延迟/可靠性权衡💡 权衡决策框架 1.3 运维复杂度评估🔧 运维成本降低策略 🏗️ 二、典型架构设计2.1 分布式事务最终一致…...

rm视觉学习1-自瞄部分

首先先感谢中南大学的开源,提供了很全面的思路,减少了很多基础性的开发研究 我看的阅读的是中南大学FYT战队开源视觉代码 链接:https://github.com/CSU-FYT-Vision/FYT2024_vision.git 1.框架: 代码框架结构:readme有…...

用神经网络读懂你的“心情”:揭秘情绪识别系统背后的AI魔法

用神经网络读懂你的“心情”:揭秘情绪识别系统背后的AI魔法 大家好,我是Echo_Wish。最近刷短视频、看直播,有没有发现,越来越多的应用都开始“懂你”了——它们能感知你的情绪,推荐更合适的内容,甚至帮客服识别用户情绪,提升服务体验。这背后,神经网络在悄悄发力,撑起…...