当前位置: 首页 > news >正文

熟悉常用的 Linux 操作和 Hadoop 操作

文章目录

  • 前言
  • 一、常用命令集合
    • 1、cd命令:切换目录
      • 1、切换到目录/usr/local
      • 2、切换回上级目录
      • 3、切换到当前登录Linux系统的用户的自己的文件夹
    • 2、ls命令:查看文件与目录
    • 3、mkdir命令:创建目录
    • 4、rmdir命令:删除空的目录
    • 5、cp 命令:复制文件或目录
    • 6、mv 命令:移动文件与目录,或更名
    • 7、rm 命令:移除文件或目录
    • 8、cat 命令:查看文件内容
    • 9、tac 命令:反向查看文件内容
    • 10、more 命令:一页一页翻动查看
    • 11、head 命令:取出前面几行
    • 12、tail 命令:取出后面几行
    • 13、touch 命令:修改文件时间或创建新文件
    • 14、chown 命令:修改文件所有者权限
    • 15、find 命令:文件查找
    • 16、tar 命令:压缩命令
    • 17、grep 命令:查找字符串
    • 18、配置环境变量
  • 二、常用的 Hadoop 操作
    • 1.启动 Hadoop,为 hadoop 用户在 HDFS 中创建用户目录/user/hadoop
    • 2、接着在 HDFS 的目录/user/hadoop下,创建 test 文件夹,并查看文件列表
    • 3、将 Linux 系统本地的“~/.bashrc”文件上传到 HDFS 的 test 文件夹中,并查看 test
    • 4、将 HDFS 文件夹 test 复制到 Linux 系统本地文件系统的/usr/local/hadoop目录下
  • 三、总结
  • 四、参考资料


前言

Hadoop 运行在 Linux 系统上,因此,需要学习实践一些常用的 Linux 命令。本实验旨在熟悉常用的 Linux 操作和 Hadoop 操作,为顺利开展后续其他实验奠定基础。
环境:
1、阿里云服务器 Ubuntu18.0.4
2、Hadoop 3.1.3
3、JDK 1.8


一、常用命令集合

1、cd命令:切换目录

1、切换到目录/usr/local

cd /usr/local

2、切换回上级目录

cd …

3、切换到当前登录Linux系统的用户的自己的文件夹

cd ~

2、ls命令:查看文件与目录

  • 查看当前目录下的所有文件与目录

ls -al

3、mkdir命令:创建目录

  • 创建单个目录:
 mkdir a
  • 创建多个目录:
 mkdir -p a1/a2/a3/a4

4、rmdir命令:删除空的目录

  • 删除单个目录:

rmdir a

  • 删除多个目录:
 rmdir -p a1/a2/a3/a4

5、cp 命令:复制文件或目录

  • 将当前用户的主文件夹下的文件.bashrc 复制到目录“/usr”下,并重命名为 bashrc1:
 sudo cp ~/.bashrc /usr/bashrc1
  • 在目录“/tmp”下新建目录 test,再把这个目录复制到“/usr”目录下:
cd /tmp
mkdir test
sudo cp -r /tmp/test /usr

6、mv 命令:移动文件与目录,或更名

  • 将“/usr”目录下的文件 bashrc1 移动到“/usr/test”目录下:
 sudo mv /usr/bashrc1 /usr/test
  • 将“/usr”目录下的 test 目录重命名为 test2:
 sudo mv /usr/test /usr/test2

7、rm 命令:移除文件或目录

  • 将“/usr/test2”目录下的 bashrc1 文件删除:
 sudo rm /usr/test2/bashrc1
  • 将“/usr”目录下的 test2 目录删除:
 sudo rm -r /usr/test2

8、cat 命令:查看文件内容

  • 查看当前用户主文件夹下的.bashrc 文件内容:
cat ~/.bashrc

9、tac 命令:反向查看文件内容

  • 反向查看当前用户主文件夹下的.bashrc 文件的内容:
 tac ~/.bashrc

10、more 命令:一页一页翻动查看

  • 翻页查看当前用户主文件夹下的.bashrc 文件的内容:
 more ~/.bashrc

11、head 命令:取出前面几行

  • 1、查看当前用户主文件夹下.bashrc 文件内容前 20 行:
 head -n 20 ~/.bashrc
  • 2、查看当前用户主文件夹下.bashrc 文件内容,后面 50 行不显示,只显示前面几行
 head -n -50 ~/.bashrc

12、tail 命令:取出后面几行

  • 1、查看当前用户主文件夹下.bashrc 文件内容最后 20 行:
tail -n 20 ~/.bashrc
  • 2、查看当前用户主文件夹下.bashrc 文件内容,并且只列出 50 行以后的数据:
 tail -n +50 ~/.bashrc

13、touch 命令:修改文件时间或创建新文件

  • 1、在“/tmp”目录下创建一个空文件 hello,并查看文件时间:
cd /tmp
touch hello
ls -l hello
  • 2、修改 hello 文件,将文件时间整为 5 天前:
 touch -d “5 days ago” hello

14、chown 命令:修改文件所有者权限

  • 将 hello 文件所有者改为 root 帐号,并查看属性:
 sudo chown root /tmp/hellols -l /tmp/hello

15、find 命令:文件查找

  • 找出主文件夹下文件名为.bashrc 的文件:
 find ~ -name .bashrc

16、tar 命令:压缩命令

  • 1、在根目录“/”下新建文件夹 test,然后在根目录“/”下打包成 test.tar.gz:
sudo mkdir /test
sudo tar -zcv -f /test.tar.gz test
  • 2、把上面的 test.tar.gz 压缩包,解压缩到“/tmp”目录:
sudo tar -zxv -f /test.tar.gz -C /tmp

17、grep 命令:查找字符串

  • 从“~/.bashrc”文件中查找字符串’examples’:
 grep -n 'examples' ~/.bashrc

18、配置环境变量

  • 1、首先,使用 vim 编辑器打开文件“~/.bashrc”,命令如下:
 vim ~/.bashrc
  • 2、然后,在该文件的最上面加入一行如下形式的语句:
export JAVA_HOME=JDK 安装路径
  • 3、最后,执行如下命令使得环境变量配置生效:
source ~/.bashrc
  • 4、查看 JAVA_HOME 变量的值:
echo $JAVA_HOME

二、常用的 Hadoop 操作

1.启动 Hadoop,为 hadoop 用户在 HDFS 中创建用户目录/user/hadoop

 cd /usr/local/hadoop./sbin/start-dfs.sh./bin/hdfs dfs -mkdir -p /user/hadoop

在这里插入图片描述

2、接着在 HDFS 的目录/user/hadoop下,创建 test 文件夹,并查看文件列表

 cd /usr/local/hadoop./bin/hdfs dfs -mkdir test./bin/hdfs dfs -ls

在这里插入图片描述

3、将 Linux 系统本地的“~/.bashrc”文件上传到 HDFS 的 test 文件夹中,并查看 test

cd /usr/local/hadoop
./bin/hdfs dfs -put ~/.bashrc test
./bin/hdfs dfs -ls test

在这里插入图片描述

4、将 HDFS 文件夹 test 复制到 Linux 系统本地文件系统的/usr/local/hadoop目录下

cd /usr/local/hadoop
./bin/hdfs dfs -get test ./

在这里插入图片描述


三、总结

实验内容主要就是熟悉linux命令以及hadoop的一些基本操作,实验内容已全部完成。出现的重大问题就是在启动hadoop过后使用jps查看各个名称节点时,未显示,尝试了许多方法也无法解决,后面猜想可能是jdk和hadoop以及ubuntu等的版本不互相匹配造成,后来跟着林子雨老师的慕课重新装了一边才成功。

四、参考资料

https://www.icourse163.org/learn/XMU-1002335004?tid=1469834441#/learn/announce

相关文章:

熟悉常用的 Linux 操作和 Hadoop 操作

文章目录前言一、常用命令集合1、cd命令:切换目录1、切换到目录/usr/local2、切换回上级目录3、切换到当前登录Linux系统的用户的自己的文件夹2、ls命令:查看文件与目录3、mkdir命令:创建目录4、rmdir命令:删除空的目录5、cp 命令…...

Vue2项目总结-电商后台管理系统

Vue2项目总结-电商后台管理系统 去年做的项目,拖了很久,总算是打起精力去做这个项目的总结,并对Vue2的相关知识进行回顾与复习 各个功能模块如果有过多重复冗杂的部分,将会抽取部分值得记录复习的地方进行记录 一:项目…...

【二】一起算法---队列:STL queue、手写循环队列、双端队列和单调队列、优先队列

纸上得来终觉浅,绝知此事要躬行。大家好!我是霜淮子,欢迎订阅我的专栏《算法系列》。 学习经典算法和经典代码,建立算法思维;大量编码让代码成为我们大脑的一部分。 ⭐️已更系列 1、基础数据结构 1.1、链表➡传送门 1…...

<Linux>环境变量

环境变量 文章目录环境变量一、基本概念二、常见环境变量三、查看环境变量的方法四、测试PATH五、测试HOME六、测试SHELL七、环境变量相关的命令八、环境变量的组织方式九、命令行参数十、通过代码获得环境变量十一、通过系统调用获取环境变量十二、环境变量通常是具有全局属性…...

【MySQL】下载(超详细教程)

目录 First-下载 Second-安装 Third-检测是否安装 Last-总结 First-下载 首先 ,我们一步一步跟着我的操作来,不能越步骤,很容易报错,就芭比Q了。 第一步直接进入这个网址:MySQL :: MySQL 社…...

再探pytorch的Dataset和DataLoader

本文从分类、检测、分割三大任务的角度来剖析pytorch得dataset和dataloader源码,可以让初学者深刻理解每个参数的由来和使用,并轻松自定义dataset。思考:在探究Dataset和DataLoader之前,需要明白一个事情,就是当我们不…...

【2023.3.18 美团校招】

文章目录1. 小美剪彩带2. 最多修改两个字符,生成字典序最小的回文串1. 小美剪彩带 题意:找出区间内不超过k种数字子数组的最大长度 使用双指针的方式,用哈希表来统计每个数出现次数。在双指针移动的过程中,动态的维护区间内不同数…...

程序员必须知道的HTML常用代码有哪些?

HTML 即超文本标记语言,是目前应用最为广泛的语言之一,是组成一个网页的主要语言。在现今这个 HTML5 华丽丽地占领了整个互联网的时候,如果想要通过网页抓住浏览者的眼球光靠因循守旧是不行的,程序猿们需要掌握一些必须知道的 HTM…...

多目标家庭行为检测--人脸识别模块构建

文章目录前言原理项目结构编码配置主控函数人脸采集模块特征提取识别测试前言 2023-3-18 天小雨,午觉舒适程度5颗星。任务完成指数2颗星。续接上文:《MidiaPipe stgcn(时空图卷积网络)实现人体姿态判断(单目标&#x…...

RocketMQ重复消费问题的原因

文章目录 概览消息发送异常时重复发送消费消息抛出异常消费者提交offset失败服务端持久化offset失败主从同步offset失败重平衡清理长时间消费的消息总结概览 消息发送异常时重复发送 首先,我们来瞅瞅RocketMQ发送消息和消费消息的基本原理。 如图,简单说一下上图中的概念: …...

proxy详细介绍与使用

proxy详细介绍与使用 proxy 对象用于创建一个对象的代理,是在目标对象之前架设一个拦截,外界对该对象的访问,都必须先通过这个拦截。通过这种机制,就可以对外界的访问进行过滤和改写。 ES6 原生提供 Proxy 构造函数,…...

基于YOLOv5的舰船检测与识别系统(Python+清新界面+数据集)

摘要:基于YOLOv5的舰船检测与识别系统用于识别包括渔船、游轮等多种海上船只类型,检测船舰目标并进行识别计数,以提供海洋船只的自动化监测和管理。本文详细介绍船舰类型识别系统,在介绍算法原理的同时,给出Python的实…...

【C#】List数据去重

系列文章 【C#】单号生成器(定义编号规则、流水号、产生业务单号) 本文链接:https://blog.csdn.net/youcheng_ge/article/details/129129787 【C#】日期范围生成(构建本周开始、结束日期) 本文链接:https…...

避免踩坑,教给你VSCode中最常用到的6项功能

这里为程序员介绍VSCode中包含的许多令人兴奋的Tips。 1. 插件市场中免费下载使用CodeGeeX插件 AI辅助编程工具CodeGeeX,是完全免费,开源开放给所有开发者使用。程序员普遍反应使用这个插件后,代码编写效率提升2倍以上。 CodeGeeX插件拥有…...

ThingsBoard开源物联网平台智慧农业实例快速部署教程(Ubuntu、CentOS适用)

ThingsBoard部署教程文档 文章目录ThingsBoard部署教程文档1. JDK环境安装2. 安装thingsBoard2.1 ThingsBoard软件包安装2.2 PostgreSQL安装2.3 PostgreSQL初始化配置3. 修改ThingsBord的配置4. 运行安装脚本测试5. 访问测试6. 导入一个仪表盘库6.1 导出仪表盘并导入自己的项目…...

【Java Spring基本问题】记录面试题宝典中自己不熟悉的Spring问题

文章目录Spring Bean定义装配Spring Bean生命周期Spring Bean容器Spring 循环依赖Spring 事务Autowired和ResourceSpring Bean定义装配 参考文章 1. 定义Spring Bean的三种方式 XML文件定义Spring Bean JavaConfig定义Spring Bean Component注解定义SpringBean 2. 装配Spri…...

I2C协议简介 Verilog实现

I2C协议 IIC 协议是三种最常用的串行通信协议(I2C,SPI,UART)之一,接口包含 SDA(串行数据线)和 SCL(串行时钟线),均为双向端口。I2C 仅使用两根信号线&#xf…...

服务器被DDoS攻击,怎么破?

文章目录前言网站受到DDoS的症状判断是否被攻击查看网络带宽占用查看网络连接TCP连接攻击SYN洪水攻击防御措施TCP/IP内核参数优化iptables 防火墙预防防止同步包洪水(Sync Flood)Ping洪水攻击(Ping of Death)控制单个IP的最大并发…...

实现完全二叉树

文章目录1、树概念及结构2、孩子兄弟表示法3、二叉树3.1、二叉树的概念3.2、特殊的二叉树3.3、二叉树的存储4、堆的性质5、数组结构实现完全二叉树1、结构体的定义2、初始化堆3、销毁堆4、交换函数5、向上调整函数6、插入数据7、向下调整函数8、删除堆顶数据函数9、判断是否空堆…...

【独家】华为OD机试 - 矩阵最值(C 语言解题)

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试,独家整理 已参加机试人员的实战技巧本期题目:矩阵最值 题目 给定一个仅包…...

在软件开发中正确使用MySQL日期时间类型的深度解析

在日常软件开发场景中,时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志,到供应链系统的物流节点时间戳,时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库,其日期时间类型的…...

C++_核心编程_多态案例二-制作饮品

#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为&#xff1a;煮水 - 冲泡 - 倒入杯中 - 加入辅料 利用多态技术实现本案例&#xff0c;提供抽象制作饮品基类&#xff0c;提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

无法与IP建立连接,未能下载VSCode服务器

如题&#xff0c;在远程连接服务器的时候突然遇到了这个提示。 查阅了一圈&#xff0c;发现是VSCode版本自动更新惹的祸&#xff01;&#xff01;&#xff01; 在VSCode的帮助->关于这里发现前几天VSCode自动更新了&#xff0c;我的版本号变成了1.100.3 才导致了远程连接出…...

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法(ISWC2024)

笔记整理&#xff1a;刘治强&#xff0c;浙江大学硕士生&#xff0c;研究方向为知识图谱表示学习&#xff0c;大语言模型 论文链接&#xff1a;http://arxiv.org/abs/2407.16127 发表会议&#xff1a;ISWC 2024 1. 动机 传统的知识图谱补全&#xff08;KGC&#xff09;模型通过…...

多模态大语言模型arxiv论文略读(108)

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题&#xff1a;CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者&#xff1a;Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

初学 pytest 记录

安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

蓝桥杯 冶炼金属

原题目链接 &#x1f527; 冶炼金属转换率推测题解 &#x1f4dc; 原题描述 小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V&#xff0c;是一个正整数&#xff0c;表示每 V V V 个普通金属 O O O 可以冶炼出 …...

Spring是如何解决Bean的循环依赖:三级缓存机制

1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...

基于Java+MySQL实现(GUI)客户管理系统

客户资料管理系统的设计与实现 第一章 需求分析 1.1 需求总体介绍 本项目为了方便维护客户信息为了方便维护客户信息&#xff0c;对客户进行统一管理&#xff0c;可以把所有客户信息录入系统&#xff0c;进行维护和统计功能。可通过文件的方式保存相关录入数据&#xff0c;对…...

论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture Fuzzing

Muffin 论文 现有方法 CRADLE 和 LEMON&#xff0c;依赖模型推理阶段输出进行差分测试&#xff0c;但在训练阶段是不可行的&#xff0c;因为训练阶段直到最后才有固定输出&#xff0c;中间过程是不断变化的。API 库覆盖低&#xff0c;因为各个 API 都是在各种具体场景下使用。…...