安装LSF
安装需求
- 基本硬件配置建议:
- CPU 4核或以上(LSF 没有最低 CPU 需求,此处只是建议)
- 内存 8G或以上( 当没有作业在运行时, Linux x86-64 上集群中的 LSF 守护程序将使用大约 488 MB 内存。)
- 交换空间通常配置为物理内存的两倍
- 节点硬件资源的高低,取决于集群运行作业的多少、作业类型(偏向于CPU、还是偏向于内存)
- LSF管理节点的配置要求,可以参考官方说明:Management host selection
- 操作系统要求: 官方正式支持的各种系统,常用为Linux系统。
- 配置共享存储。
- 用户统一管理, 提前设置好LSF管理用户(lsfadmin或者一个普通用户)。
- 集群需要时间同步。
- root用户可以免密从管理节点到其他节点运行ssh。 节点之间要求双向解析主机和IP。
环境说明
本示例中的IP规划如下:
主机名 | LSF集群相关服务 | IP |
lsf-master1 | LSF管理节点 | 192.168.75.154 |
lsf-master2 | LSF候选管理节点 | 192.168.75.155 |
compute | LSF计算节点 | 192.168.75.156 |
配置安装LSF前的相关服务
域名解析
保证计算节点之间能正常解析和反解析IP/hostname。
本示例中为配置本地域名解析,修改每个节点中的/etc/hosts文件,操作如下:
# tail -3 /etc/hosts
192.168.75.154 lsf-master1
192.168.75.155 lsf-master2
192.168.75.156 compute
配置ssh免密登录
root用户能够从管理节点通过ssh无密码访问新节点,方便从管理节点在新节点远程启动LSF。如果是有密码访问,机器少还可以输入密码,但是大的集群还是配置无密码访问效率更高。
免密设置可参考如下操作:
[root@lsf-master1 ~]# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Created directory '/root/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:4K+YpiQOAFK7E1oDsOq1iNOofqea4vlUmkcm65F7St8 root@lsf-master1
The key's randomart image is:
+---[RSA 2048]----+
|+ . |
| + . |
|+ = . |
|+o + . . |
|+ oo +. S |
|+oo.@ . |
|*ooX . . |
|=+*.*=.. |
|=B=OB..E |
+----[SHA256]-----+
[root@lsf-master1 ~]# ssh-copy-id root@lsf-master2
......
root@lsf-master2's password: # 此处输入lsf-master2密码
[root@lsf-master1 ~]# ssh-copy-id root@compute
......
root@compute's password: # 此处输入compute密码
时间同步
确保每个节点时间相同,防止认证失败。
请确认集群各节点时间服务器是否一致,可以查看/etc/chrony.conf文件。参考如下:
# grep server /etc/chrony.conf
server xx.xx.xx.xx prefer iburst minpoll 4 maxpoll 4
配置NFS挂载
LSF安装在共享存储上,每个计算节点挂载即可使用,无需再次安装。
(1)设置共享目录
[root@lsf-master1 ~]# mkdir /tools/[root@lsf-master1 ~]# echo "/tools/ *(rw,sync,no_root_squash)" >> /etc/exports
(2)启动rpcbind服务,并设置开机启动
[root@lsf-master1 ~]# systemctl enable rpcbind --now
(3)启动nfs服务,并设置开机启动
[root@lsf-master1 ~]# systemctl restart nfs-server
(4)查看挂载状态
[root@lsf-master1 ~]# showmount -e localhostExport list for localhost:/tools/ *
账户管理
可以使用OpenLDAP/NIS来统一管理用户,保证同一个用户在每个节点上有相同的UID。
本示例中为便捷操作,使用useradd、groupadd创建UID、GID一致的管理员账户。步骤参考如下所示:
(1)创建集群管理组
groupadd -g 2001 lsf
(2)创建集群管理用户
useradd -u 2000 -G lsf lsfadmin
安装LSF
lsf-master节点解压修改配置
(1)进入LSF安装包所在的位置。
(2)解压 lsfsce10.2.0.12-x86_64.tar.gz
[root@lsf-master1 ~]# cd /tmp[root@lsf-master1 tmp]# ls lsfsce10.2.0.12-x86_64.tar.gzlsfsce10.2.0.12-x86_64.tar.gz[root@lsf-master1 tmp]# tar -xf lsfsce10.2.0.12-x86_64.tar.gz[root@lsf-master1 tmp]# ls lsfsce10.2.0.12-x86_64/lsf/lsf10.1_linux2.6-glibc2.3-x86_64.tar.Z # LSF运行时使用的包lsf10.1_lsfinstall_linux_x86_64.tar.Z # 安装引导包
(3)解压lsf10.1_lsfinstall_linux_x86_64.tar.Z
[root@lsf-master1 tmp]# cd lsfsce10.2.0.12-x86_64/lsf/[root@lsf-master1 lsf]# tar xzf lsf10.1_lsfinstall_linux_x86_64.tar.Z[root@lsf-master1 lsf]# lslsf10.1_linux2.6-glibc2.3-x86_64.tar.Z lsf10.1_lsfinstall lsf10.1_lsfinstall_linux_x86_64.tar.Z[root@lsf-master1 lsf]# cd lsf10.1_lsfinstall/[root@lsf-master1 lsf10.1_lsfinstall]#
(4)编辑安装配置文件
[root@lsf-master1 lsf10.1_lsfinstall]# vim install.config# 设置安装路径LSF_TOP="/tools/lsf" # 设置管理员账号,以实际管理员名称为准LSF_ADMINS="lsfadmin" # 设置集群名称LSF_CLUSTER_NAME="cluster1" # master机器列表,如果有多台机器,建议设置两台master,作为冗余备份LSF_MASTER_LIST="lsf-master1 lsf-master2" # 指定安装文件lsf10.1_linux2.6-glibc2.3-x86_64.tar.Z路径LSF_TARDIR="/tmp/lsfsce10.2.0.12-x86_64/lsf" # 添加计算机节点机器,也可以安装后配置LSF_ADD_SERVERS="lsf-master1 lsf-master2 compute" # 添加客户机(投递机)节点,也可以安装后配置#LSF_ADD_CLIENTS=""
LSF安装
(1)安装lsf集群需要的安装包,根据系统版本不同可能会缺少依赖,需要的依赖安装过程中会在页面显示。通过root用户来安装。
[root@lsf-master1 lsf10.1_lsfinstall]# yum -y install java nfs-utils java-openjdk ed[root@lsf-master1 lsf10.1_lsfinstall]# ./lsfinstall -f install.config
(2)配置系统开机自启方式
[root@lsf-master1 lsf10.1_lsfinstall]# /tools/lsf/10.1/install/hostsetup --top="/tools/lsf" --profile="y" --boot="y"[root@lsf-master1 ~]# systemctl enable lsfd --now
(3)查看LSF环境变量
[root@lsf-master1 lsf10.1_lsfinstall]# . /tools/lsf/conf/profile.lsf[root@lsf-master1 lsf10.1_lsfinstall]# env | grep lsfMANPATH=/tools/lsf/10.1/man:HOSTNAME=lsf-master1LSF_SERVERDIR=/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/etcOLDPWD=/root/lsfsce10.2.0.12-x86_64/lsfLSF_LIBDIR=/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/libLD_LIBRARY_PATH=/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/libPATH=/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/etc:/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/binPWD=/root/lsfsce10.2.0.12-x86_64/lsf/lsf10.1_lsfinstallLSF_BINDIR=/tools/lsf/10.1/linux2.6-glibc2.3-x86_64/binLSF_ENVDIR=/tools/lsf/conf
LSF启动
在计算节点挂载共享存储:
# mkdir /tools# echo "192.168.75.159:/tools /tools nfs defaults 0 0" >> /etc/fstab# mount -a# df -hT | grep /tools172.31.27.152:/tools nfs4 20G 8.0G 12G 41% /tools# su - lsfadmin# . /tools/lsf/conf/profile.lsf
在lsf.conf文件中添加如下内容:
LSF_RSH=ssh
启动(用root用户操作):
# lsfstartup
验证(用普通用户操作):
$ lsload
$ bhosts
相关文章:

安装LSF
安装需求 基本硬件配置建议: CPU 4核或以上(LSF 没有最低 CPU 需求,此处只是建议)内存 8G或以上( 当没有作业在运行时, Linux x86-64 上集群中的 LSF 守护程序将使用大约 488 MB 内存。)交换…...

百度的新想象力在哪?
理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。 作者|皮爷 出品|产业家 沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下&#…...

Linux使用rpm包安装mysql5.7
以前安装过mysql 前言:检查以前是否装有mysql rpm -qa|grep -i mysql安装了会显示: bt-mysql57-5.7.31-1.el7.x86_64 停止mysql服务和删除之前安装的mysql rpm -e bt-mysql57-5.7.31-1.el7.x86_64查找并删除mysql相关目录 find / -name mysql/va…...

LLDB 三种输出方式 对比及原理探索
前言 当我们的项目过大时,就会使我们项目的编译耗时过长,如何在项目运行时进项代码调试,熟练使用LLDB就可以解决这个难题,大幅度提高我们的开发效率。 什么是 LLDB? LLDB是英文Low Lever Debug的缩写,是XCode内置的为我们开发者提供的调试工具,它与LLVM编译器一起,存…...
基于架构软件设计-架构真题(五十八)
“41”视图主要描述系统逻辑架构。其中()视图用于描述对象模型,并说明系统应该为用户提供哪些服务。 过程开发物理逻辑 解析: “41”有逻辑视图、过程视图、物理视图、开发视图和架构的描述。 逻辑视图:设计的对象…...

jvm实现的锁优化
目录 轻量级锁 轻量级锁的工作流程 轻量级锁的解锁 偏向锁 偏向锁的流程: 偏向锁和轻量级锁机区别: 其他优化 自旋锁和自适应自旋锁 锁消除 锁粗化 轻量级锁 “轻量级” 是相对于使用操作系统互斥量来实现的传统锁而言的,因此传统的…...

JMeter做http接口功能测试
1. 普通的以key-value传参的get请求 e.g. 获取用户信息 添加http请求;填写服务器域名或IP;方法选GET;填写路径;添加参数;运行并查看结果。 2. 以Json串传参的post请求 e.g. 获取用户余额 添加http请求;…...
【安全体系架构】——SIEM架构
什么是SIEM架构? 安全信息与事件管理(SIEM)架构是一种综合性的安全管理系统,旨在监控、检测、报告和应对安全事件和威胁。SIEM系统集成了多个安全功能,包括日志收集、事件管理、威胁检测和响应,以提供组织…...
nginx acess日志找不到访问记录问题
这个是AI给出的可能得原因: 如果在nginx中找不到你的访问记录,但你确实进行了访问并得到了返回,可能有以下原因: 日志文件位置设置不正确:请确保你的nginx配置文件中的access_log指令指向了正确的日志文件路径。日志文…...
canvas使用
canvas使用 1 canvas绘制基本 1 概念 HTML5<canvas>元素用于图形的绘制,区别于css,它的绘制通过javascript来完成绘制的 <canvas>标签只是图形容器,必须使用及保本来绘制图形 Canvas API主要聚焦与2D图形。同时<canvas>元素的Web…...
PMP认证考试证书领取的通知
各位考生: 2022年6月、7月、8月PMI认证考试证书领取工作已经开始,您可通过以下两种方式领取证书: 1.联系本人所在培训机构,通过培训机构向考点统一代领。 2.在2023年10月20日-10月31日内,登录本网站报名系统个人账户…...

华为云HECS云服务器docker环境下安装nacos
华为云HECS云服务器,安装docker环境,查看如下文章。 华为云HECS安装docker-CSDN博客 一、拉取镜像 docker pull nacos/nacos-server二、宿主机创建挂载目录 执行如下命令: mkdir -p /usr/local/nacos/logs mkdir -p /usr/local/nacos/con…...
Oracle数据库修改序列,Oracle中的主键值和序列中的值对应不上时的处理方式
select max(stu.id) maxid from student stu; //查询student表中id的最大值select XXX_SEQ.nextval from dual; //查询student表中id对应序列XXX_SEQ的下一个值alter sequence XXX_SEQ increment by 1000; //将序列XXX_SEQ步长改为1000,对应 student表中id的最大值s…...

Verilog基础:避免混合使用阻塞和非阻塞赋值
相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 “避免在一个always块中混杂阻塞赋值和非阻塞赋值”,这条原则是著名的Verilog专家Cliff Cummings在论文SUNG2000中提出的,这个观点在公众讨…...

04、MySQL-------MyCat实现分库分表
目录 九、MyCat实现分库分表1、分库分表介绍:横向(水平)拆分**垂直分表**:水平分表:**分库分表** 纵向(垂直)拆分分表字段选择 2、分库分表操作:1、分析图:2、克隆主从3、…...

开源软件-禅道Zentao
禅道Zentao 简介漏洞复现SQL注入漏洞**16.5****router.class.php SQL注入** **v18.0-v18.3****后台命令执行** 远程命令执行漏洞(RCE)后台命令执行 简介 是一款开源的项目管理软件,旨在帮助团队组织和管理他们的项目。Zentao提供了丰富的功能…...

Linux生产者消费者模型
生产者消费者模型 生产者消费者模型生产者消费者模型的概念生产者消费者模型的特点生产者消费者模型优点 基于BlockingQueue的生产者消费者模型基于阻塞队列的生产者消费者模型模拟实现基于阻塞队列的生产消费模型 生产者消费者模型 生产者消费者模型的概念 生产者消费者模式就…...

【Qt-20】Qt信号与槽
一、什么是信号和槽 信号是特定情况下被发射的事件,发射信号使用emit关键字,定义信号使用signals关键字,在signals前面不能使用public、private、protected等限定符,信号只用声明,不需也不能对其进行定义实现。另外&am…...

“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
云布道师 前言: 随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据 Gartner 报告,到 2025 年 60% 的 B2B 销售组织将从基于经验和直觉的销售转变为数…...
selenium 自动化测试——WebDriver API
控制浏览器 控制浏览器窗口大小:set_window_size()方法 设置全屏模式下运行:maximize_window()方法 from selenium import webdriver from selenium.webdriver.common.by import By import timedriver webdriver.Chrome() driver.get("http://w…...
设计模式和设计原则回顾
设计模式和设计原则回顾 23种设计模式是设计原则的完美体现,设计原则设计原则是设计模式的理论基石, 设计模式 在经典的设计模式分类中(如《设计模式:可复用面向对象软件的基础》一书中),总共有23种设计模式,分为三大类: 一、创建型模式(5种) 1. 单例模式(Sing…...

【力扣数据库知识手册笔记】索引
索引 索引的优缺点 优点1. 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度(创建索引的主要原因)。3. 可以加速表和表之间的连接,实现数据的参考完整性。4. 可以在查询过程中,…...
Qt Widget类解析与代码注释
#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码,写上注释 当然可以!这段代码是 Qt …...

(二)TensorRT-LLM | 模型导出(v0.20.0rc3)
0. 概述 上一节 对安装和使用有个基本介绍。根据这个 issue 的描述,后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作,其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...

STM32F4基本定时器使用和原理详解
STM32F4基本定时器使用和原理详解 前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...
【git】把本地更改提交远程新分支feature_g
创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...
关于 WASM:1. WASM 基础原理
一、WASM 简介 1.1 WebAssembly 是什么? WebAssembly(WASM) 是一种能在现代浏览器中高效运行的二进制指令格式,它不是传统的编程语言,而是一种 低级字节码格式,可由高级语言(如 C、C、Rust&am…...

使用 SymPy 进行向量和矩阵的高级操作
在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...

Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...