当前位置: 首页 > news >正文

熟悉常用的 Linux 操作和 Hadoop 操作

文章目录

  • 前言
  • 一、常用命令集合
    • 1、cd命令:切换目录
      • 1、切换到目录/usr/local
      • 2、切换回上级目录
      • 3、切换到当前登录Linux系统的用户的自己的文件夹
    • 2、ls命令:查看文件与目录
    • 3、mkdir命令:创建目录
    • 4、rmdir命令:删除空的目录
    • 5、cp 命令:复制文件或目录
    • 6、mv 命令:移动文件与目录,或更名
    • 7、rm 命令:移除文件或目录
    • 8、cat 命令:查看文件内容
    • 9、tac 命令:反向查看文件内容
    • 10、more 命令:一页一页翻动查看
    • 11、head 命令:取出前面几行
    • 12、tail 命令:取出后面几行
    • 13、touch 命令:修改文件时间或创建新文件
    • 14、chown 命令:修改文件所有者权限
    • 15、find 命令:文件查找
    • 16、tar 命令:压缩命令
    • 17、grep 命令:查找字符串
    • 18、配置环境变量
  • 二、常用的 Hadoop 操作
    • 1.启动 Hadoop,为 hadoop 用户在 HDFS 中创建用户目录/user/hadoop
    • 2、接着在 HDFS 的目录/user/hadoop下,创建 test 文件夹,并查看文件列表
    • 3、将 Linux 系统本地的“~/.bashrc”文件上传到 HDFS 的 test 文件夹中,并查看 test
    • 4、将 HDFS 文件夹 test 复制到 Linux 系统本地文件系统的/usr/local/hadoop目录下
  • 三、总结
  • 四、参考资料


前言

Hadoop 运行在 Linux 系统上,因此,需要学习实践一些常用的 Linux 命令。本实验旨在熟悉常用的 Linux 操作和 Hadoop 操作,为顺利开展后续其他实验奠定基础。
环境:
1、阿里云服务器 Ubuntu18.0.4
2、Hadoop 3.1.3
3、JDK 1.8


一、常用命令集合

1、cd命令:切换目录

1、切换到目录/usr/local

cd /usr/local

2、切换回上级目录

cd …

3、切换到当前登录Linux系统的用户的自己的文件夹

cd ~

2、ls命令:查看文件与目录

  • 查看当前目录下的所有文件与目录

ls -al

3、mkdir命令:创建目录

  • 创建单个目录:
 mkdir a
  • 创建多个目录:
 mkdir -p a1/a2/a3/a4

4、rmdir命令:删除空的目录

  • 删除单个目录:

rmdir a

  • 删除多个目录:
 rmdir -p a1/a2/a3/a4

5、cp 命令:复制文件或目录

  • 将当前用户的主文件夹下的文件.bashrc 复制到目录“/usr”下,并重命名为 bashrc1:
 sudo cp ~/.bashrc /usr/bashrc1
  • 在目录“/tmp”下新建目录 test,再把这个目录复制到“/usr”目录下:
cd /tmp
mkdir test
sudo cp -r /tmp/test /usr

6、mv 命令:移动文件与目录,或更名

  • 将“/usr”目录下的文件 bashrc1 移动到“/usr/test”目录下:
 sudo mv /usr/bashrc1 /usr/test
  • 将“/usr”目录下的 test 目录重命名为 test2:
 sudo mv /usr/test /usr/test2

7、rm 命令:移除文件或目录

  • 将“/usr/test2”目录下的 bashrc1 文件删除:
 sudo rm /usr/test2/bashrc1
  • 将“/usr”目录下的 test2 目录删除:
 sudo rm -r /usr/test2

8、cat 命令:查看文件内容

  • 查看当前用户主文件夹下的.bashrc 文件内容:
cat ~/.bashrc

9、tac 命令:反向查看文件内容

  • 反向查看当前用户主文件夹下的.bashrc 文件的内容:
 tac ~/.bashrc

10、more 命令:一页一页翻动查看

  • 翻页查看当前用户主文件夹下的.bashrc 文件的内容:
 more ~/.bashrc

11、head 命令:取出前面几行

  • 1、查看当前用户主文件夹下.bashrc 文件内容前 20 行:
 head -n 20 ~/.bashrc
  • 2、查看当前用户主文件夹下.bashrc 文件内容,后面 50 行不显示,只显示前面几行
 head -n -50 ~/.bashrc

12、tail 命令:取出后面几行

  • 1、查看当前用户主文件夹下.bashrc 文件内容最后 20 行:
tail -n 20 ~/.bashrc
  • 2、查看当前用户主文件夹下.bashrc 文件内容,并且只列出 50 行以后的数据:
 tail -n +50 ~/.bashrc

13、touch 命令:修改文件时间或创建新文件

  • 1、在“/tmp”目录下创建一个空文件 hello,并查看文件时间:
cd /tmp
touch hello
ls -l hello
  • 2、修改 hello 文件,将文件时间整为 5 天前:
 touch -d “5 days ago” hello

14、chown 命令:修改文件所有者权限

  • 将 hello 文件所有者改为 root 帐号,并查看属性:
 sudo chown root /tmp/hellols -l /tmp/hello

15、find 命令:文件查找

  • 找出主文件夹下文件名为.bashrc 的文件:
 find ~ -name .bashrc

16、tar 命令:压缩命令

  • 1、在根目录“/”下新建文件夹 test,然后在根目录“/”下打包成 test.tar.gz:
sudo mkdir /test
sudo tar -zcv -f /test.tar.gz test
  • 2、把上面的 test.tar.gz 压缩包,解压缩到“/tmp”目录:
sudo tar -zxv -f /test.tar.gz -C /tmp

17、grep 命令:查找字符串

  • 从“~/.bashrc”文件中查找字符串’examples’:
 grep -n 'examples' ~/.bashrc

18、配置环境变量

  • 1、首先,使用 vim 编辑器打开文件“~/.bashrc”,命令如下:
 vim ~/.bashrc
  • 2、然后,在该文件的最上面加入一行如下形式的语句:
export JAVA_HOME=JDK 安装路径
  • 3、最后,执行如下命令使得环境变量配置生效:
source ~/.bashrc
  • 4、查看 JAVA_HOME 变量的值:
echo $JAVA_HOME

二、常用的 Hadoop 操作

1.启动 Hadoop,为 hadoop 用户在 HDFS 中创建用户目录/user/hadoop

 cd /usr/local/hadoop./sbin/start-dfs.sh./bin/hdfs dfs -mkdir -p /user/hadoop

在这里插入图片描述

2、接着在 HDFS 的目录/user/hadoop下,创建 test 文件夹,并查看文件列表

 cd /usr/local/hadoop./bin/hdfs dfs -mkdir test./bin/hdfs dfs -ls

在这里插入图片描述

3、将 Linux 系统本地的“~/.bashrc”文件上传到 HDFS 的 test 文件夹中,并查看 test

cd /usr/local/hadoop
./bin/hdfs dfs -put ~/.bashrc test
./bin/hdfs dfs -ls test

在这里插入图片描述

4、将 HDFS 文件夹 test 复制到 Linux 系统本地文件系统的/usr/local/hadoop目录下

cd /usr/local/hadoop
./bin/hdfs dfs -get test ./

在这里插入图片描述


三、总结

实验内容主要就是熟悉linux命令以及hadoop的一些基本操作,实验内容已全部完成。出现的重大问题就是在启动hadoop过后使用jps查看各个名称节点时,未显示,尝试了许多方法也无法解决,后面猜想可能是jdk和hadoop以及ubuntu等的版本不互相匹配造成,后来跟着林子雨老师的慕课重新装了一边才成功。

四、参考资料

https://www.icourse163.org/learn/XMU-1002335004?tid=1469834441#/learn/announce

相关文章:

熟悉常用的 Linux 操作和 Hadoop 操作

文章目录前言一、常用命令集合1、cd命令:切换目录1、切换到目录/usr/local2、切换回上级目录3、切换到当前登录Linux系统的用户的自己的文件夹2、ls命令:查看文件与目录3、mkdir命令:创建目录4、rmdir命令:删除空的目录5、cp 命令…...

Vue2项目总结-电商后台管理系统

Vue2项目总结-电商后台管理系统 去年做的项目,拖了很久,总算是打起精力去做这个项目的总结,并对Vue2的相关知识进行回顾与复习 各个功能模块如果有过多重复冗杂的部分,将会抽取部分值得记录复习的地方进行记录 一:项目…...

【二】一起算法---队列:STL queue、手写循环队列、双端队列和单调队列、优先队列

纸上得来终觉浅,绝知此事要躬行。大家好!我是霜淮子,欢迎订阅我的专栏《算法系列》。 学习经典算法和经典代码,建立算法思维;大量编码让代码成为我们大脑的一部分。 ⭐️已更系列 1、基础数据结构 1.1、链表➡传送门 1…...

<Linux>环境变量

环境变量 文章目录环境变量一、基本概念二、常见环境变量三、查看环境变量的方法四、测试PATH五、测试HOME六、测试SHELL七、环境变量相关的命令八、环境变量的组织方式九、命令行参数十、通过代码获得环境变量十一、通过系统调用获取环境变量十二、环境变量通常是具有全局属性…...

【MySQL】下载(超详细教程)

目录 First-下载 Second-安装 Third-检测是否安装 Last-总结 First-下载 首先 ,我们一步一步跟着我的操作来,不能越步骤,很容易报错,就芭比Q了。 第一步直接进入这个网址:MySQL :: MySQL 社…...

再探pytorch的Dataset和DataLoader

本文从分类、检测、分割三大任务的角度来剖析pytorch得dataset和dataloader源码,可以让初学者深刻理解每个参数的由来和使用,并轻松自定义dataset。思考:在探究Dataset和DataLoader之前,需要明白一个事情,就是当我们不…...

【2023.3.18 美团校招】

文章目录1. 小美剪彩带2. 最多修改两个字符,生成字典序最小的回文串1. 小美剪彩带 题意:找出区间内不超过k种数字子数组的最大长度 使用双指针的方式,用哈希表来统计每个数出现次数。在双指针移动的过程中,动态的维护区间内不同数…...

程序员必须知道的HTML常用代码有哪些?

HTML 即超文本标记语言,是目前应用最为广泛的语言之一,是组成一个网页的主要语言。在现今这个 HTML5 华丽丽地占领了整个互联网的时候,如果想要通过网页抓住浏览者的眼球光靠因循守旧是不行的,程序猿们需要掌握一些必须知道的 HTM…...

多目标家庭行为检测--人脸识别模块构建

文章目录前言原理项目结构编码配置主控函数人脸采集模块特征提取识别测试前言 2023-3-18 天小雨,午觉舒适程度5颗星。任务完成指数2颗星。续接上文:《MidiaPipe stgcn(时空图卷积网络)实现人体姿态判断(单目标&#x…...

RocketMQ重复消费问题的原因

文章目录 概览消息发送异常时重复发送消费消息抛出异常消费者提交offset失败服务端持久化offset失败主从同步offset失败重平衡清理长时间消费的消息总结概览 消息发送异常时重复发送 首先,我们来瞅瞅RocketMQ发送消息和消费消息的基本原理。 如图,简单说一下上图中的概念: …...

proxy详细介绍与使用

proxy详细介绍与使用 proxy 对象用于创建一个对象的代理,是在目标对象之前架设一个拦截,外界对该对象的访问,都必须先通过这个拦截。通过这种机制,就可以对外界的访问进行过滤和改写。 ES6 原生提供 Proxy 构造函数,…...

基于YOLOv5的舰船检测与识别系统(Python+清新界面+数据集)

摘要:基于YOLOv5的舰船检测与识别系统用于识别包括渔船、游轮等多种海上船只类型,检测船舰目标并进行识别计数,以提供海洋船只的自动化监测和管理。本文详细介绍船舰类型识别系统,在介绍算法原理的同时,给出Python的实…...

【C#】List数据去重

系列文章 【C#】单号生成器(定义编号规则、流水号、产生业务单号) 本文链接:https://blog.csdn.net/youcheng_ge/article/details/129129787 【C#】日期范围生成(构建本周开始、结束日期) 本文链接:https…...

避免踩坑,教给你VSCode中最常用到的6项功能

这里为程序员介绍VSCode中包含的许多令人兴奋的Tips。 1. 插件市场中免费下载使用CodeGeeX插件 AI辅助编程工具CodeGeeX,是完全免费,开源开放给所有开发者使用。程序员普遍反应使用这个插件后,代码编写效率提升2倍以上。 CodeGeeX插件拥有…...

ThingsBoard开源物联网平台智慧农业实例快速部署教程(Ubuntu、CentOS适用)

ThingsBoard部署教程文档 文章目录ThingsBoard部署教程文档1. JDK环境安装2. 安装thingsBoard2.1 ThingsBoard软件包安装2.2 PostgreSQL安装2.3 PostgreSQL初始化配置3. 修改ThingsBord的配置4. 运行安装脚本测试5. 访问测试6. 导入一个仪表盘库6.1 导出仪表盘并导入自己的项目…...

【Java Spring基本问题】记录面试题宝典中自己不熟悉的Spring问题

文章目录Spring Bean定义装配Spring Bean生命周期Spring Bean容器Spring 循环依赖Spring 事务Autowired和ResourceSpring Bean定义装配 参考文章 1. 定义Spring Bean的三种方式 XML文件定义Spring Bean JavaConfig定义Spring Bean Component注解定义SpringBean 2. 装配Spri…...

I2C协议简介 Verilog实现

I2C协议 IIC 协议是三种最常用的串行通信协议(I2C,SPI,UART)之一,接口包含 SDA(串行数据线)和 SCL(串行时钟线),均为双向端口。I2C 仅使用两根信号线&#xf…...

服务器被DDoS攻击,怎么破?

文章目录前言网站受到DDoS的症状判断是否被攻击查看网络带宽占用查看网络连接TCP连接攻击SYN洪水攻击防御措施TCP/IP内核参数优化iptables 防火墙预防防止同步包洪水(Sync Flood)Ping洪水攻击(Ping of Death)控制单个IP的最大并发…...

实现完全二叉树

文章目录1、树概念及结构2、孩子兄弟表示法3、二叉树3.1、二叉树的概念3.2、特殊的二叉树3.3、二叉树的存储4、堆的性质5、数组结构实现完全二叉树1、结构体的定义2、初始化堆3、销毁堆4、交换函数5、向上调整函数6、插入数据7、向下调整函数8、删除堆顶数据函数9、判断是否空堆…...

【独家】华为OD机试 - 矩阵最值(C 语言解题)

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试,独家整理 已参加机试人员的实战技巧本期题目:矩阵最值 题目 给定一个仅包…...

376. Wiggle Subsequence

376. Wiggle Subsequence 代码 class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();int res 1;int prediff 0;int curdiff 0;for(int i 0;i < n-1;i){curdiff nums[i1] - nums[i];if( (prediff > 0 && curdif…...

Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级

在互联网的快速发展中&#xff0c;高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司&#xff0c;近期做出了一个重大技术决策&#xff1a;弃用长期使用的 Nginx&#xff0c;转而采用其内部开发…...

多种风格导航菜单 HTML 实现(附源码)

下面我将为您展示 6 种不同风格的导航菜单实现&#xff0c;每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

爬虫基础学习day2

# 爬虫设计领域 工商&#xff1a;企查查、天眼查短视频&#xff1a;抖音、快手、西瓜 ---> 飞瓜电商&#xff1a;京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空&#xff1a;抓取所有航空公司价格 ---> 去哪儿自媒体&#xff1a;采集自媒体数据进…...

#Uniapp篇:chrome调试unapp适配

chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器&#xff1a;Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...

Caliper 负载(Workload)详细解析

Caliper 负载(Workload)详细解析 负载(Workload)是 Caliper 性能测试的核心部分,它定义了测试期间要执行的具体合约调用行为和交易模式。下面我将全面深入地讲解负载的各个方面。 一、负载模块基本结构 一个典型的负载模块(如 workload.js)包含以下基本结构: use strict;/…...

人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent

安全大模型训练计划&#xff1a;基于Fine-tuning LLM Agent 1. 构建高质量安全数据集 目标&#xff1a;为安全大模型创建高质量、去偏、符合伦理的训练数据集&#xff0c;涵盖安全相关任务&#xff08;如有害内容检测、隐私保护、道德推理等&#xff09;。 1.1 数据收集 描…...

数学建模-滑翔伞伞翼面积的设计,运动状态计算和优化 !

我们考虑滑翔伞的伞翼面积设计问题以及运动状态描述。滑翔伞的性能主要取决于伞翼面积、气动特性以及飞行员的重量。我们的目标是建立数学模型来描述滑翔伞的运动状态,并优化伞翼面积的设计。 一、问题分析 滑翔伞在飞行过程中受到重力、升力和阻力的作用。升力和阻力与伞翼面…...

【Post-process】【VBA】ETABS VBA FrameObj.GetNameList and write to EXCEL

ETABS API实战:导出框架元素数据到Excel 在结构工程师的日常工作中,经常需要从ETABS模型中提取框架元素信息进行后续分析。手动复制粘贴不仅耗时,还容易出错。今天我们来用简单的VBA代码实现自动化导出。 🎯 我们要实现什么? 一键点击,就能将ETABS中所有框架元素的基…...

人工智能 - 在Dify、Coze、n8n、FastGPT和RAGFlow之间做出技术选型

在Dify、Coze、n8n、FastGPT和RAGFlow之间做出技术选型。这些平台各有侧重&#xff0c;适用场景差异显著。下面我将从核心功能定位、典型应用场景、真实体验痛点、选型决策关键点进行拆解&#xff0c;并提供具体场景下的推荐方案。 一、核心功能定位速览 平台核心定位技术栈亮…...