当前位置: 首页 > news >正文

LSF 安装目录,快速参考 LSF 命令、守护程序、配置文件、日志文件和重要集群配置参数

样本 UNIX 和 Linux 安装目录

样本 UNIX 和 Linux 安装目录

 

守护程序错误日志文件

守护程序错误日志文件存储在 LSF_LOGDIR 在 lsf.conf 文件中定义的目录中。

LSF 基本系统守护程序日志文件LSF 批处理系统守护程序日志文件
pim.log.host_namembatchd.log.host_name
mbatchd.log.host_namesbatchd.log.host_name
lim.log.host_namembschd.log.host_name

如果在 ego.conf 文件中定义了 EGO_LOGDIR 参数,那么 lim.log.host_name 文件将存储在 EGO_LOGDIR 参数定义的目录中。

配置文件

lsf.conf, lsf.shared和 lsf.cluster.cluster_name 文件位于 lsf.conf 文件中 LSF_CONFDIR 参数指定的目录中。

lsb.params, lsb.queues, lsb.modules和 lsb.resources 文件位于 LSB_CONFDIR/cluster_name/configdir/ 目录中。

文件

描述

install.configLSF 安装和配置的选项
lsf.conf描述集群配置和操作的通用环境配置文件
lsf.shared所有集群共享的定义文件。 用于定义集群名称,主机类型,主机模型和站点定义的资源
lsf.cluster.cluster_name用于定义站点定义的共享资源的主机,管理员和位置的集群配置文件
lsb.applications定义应用程序概要文件以定义相同类型的作业的公共参数
lsb.params配置 LSF 批处理参数
lsb.queues批处理队列配置文件
lsb.resources配置资源分配限制,导出和资源使用限制
lsb.serviceclasses将 LSF 集群中的服务级别协议 (SLA) 定义为服务类,用于定义 SLA 的属性
lsb.users配置用户组,用户和用户组的分层公平共享以及用户和用户组的作业槽限制

lsf.conf 文件中的集群配置参数


参数

描述

UNIX 缺省值

LSF_BINDIR包含 LSF 用户命令的目录,这些命令由同一类型的所有主机共享LSF_TOP/version/OStype/bin
LSF_CONFDIR所有 LSF 配置文件的目录LSF_TOP/conf
LSF_ENVDIR包含 lsf.conf 文件的目录。 必须由 root 用户拥有。/etc (如果未定义 LSF_CONFDIR )
LSF_INCLUDEDIR包含 LSF API 头文件 lsf.h 和 lsbatch.h 的目录LSF_TOP/version/include
LSF_LIBDIRLSF 库,由同一类型的所有主机共享LSF_TOP/version/OStype/lib
LSF_LOGDIR(可选) LSF 守护程序日志的目录。 必须由 root 用户拥有。/tmp
LSF_LOG_MASK来自 LSF 命令的错误消息的日志记录级别LOG_WARNING
LSF_MANDIR包含 LSF 联机帮助页的目录LSF_TOP/version/man
LSF_MISC样本 C 程序和 shell 脚本以及外部 LIM 的模板 (elim)LSF_TOP/version/misc
LSF_SERVERDIR所有服务器二进制文件和 shell 脚本以及由 LSF 守护程序启动的外部可执行文件的目录必须由 root 用户拥有,并且由同一类型的所有主机共享LSF_TOP/version/OStype/etc
LSF_TOP顶级安装目录。 LSF_TOP 的路径必须共享,并且可供集群中的所有主机访问。 它不能是根目录 (/)。未定义

安装所需

LSB_CONFDIRLSF 批处理配置目录的目录,包含用户和主机列表,操作参数和批处理队列LSF_CONFDIR/lsbatch
LSF_LIVE_CONFDIRbconf 命令写入的 LSF 实时重新配置目录的目录。LSB_SHAREDIR/cluster_name/live_confdir
LSF_SHAREDIR每个集群的 LSF 批处理作业历史记录和记帐日志文件的目录必须由主 LSF 管理员拥有LSF_TOP/work
LSF_LIM_PORT用于与 lim 守护程序通信的 TCP 服务端口7879
LSF_RES_PORT用于与 res 守护程序通信的 TCP 服务端口6878
LSF_MBD_PORT用于与 mbatchd 守护程序通信的 TCP 服务端口6881
LSF_SBD_PORT用于与 sbatchd 守护程序通信的 TCP 服务端口6882

 

管理和记帐命令

只有 LSF 管理员和 root 用户才能使用这些命令。


命令

描述

lsadminLSF 管理员工具,用于控制 LSF 集群中 LIM 和 RES 守护程序的操作, lsadmin help 显示所有子命令
lsfinstall使用 install.config 输入文件安装 LSF
lsfrestart在本地集群中的所有主机上重新启动 LSF 守护程序
lsfshutdown关闭本地集群中所有主机上的 LSF 守护程序
lsfstartup在本地集群中的所有主机上启动 LSF 守护程序
badminLSF 用于控制 LSF 批处理系统 (sbatchd, mbatchd,主机和队列) 操作的管理工具 badmin 帮助显示所有子命令
bconf更改活动内存中的 LSF 配置

守护程序


守护程序名称

描述

lim装入信息管理器 (LIM): 收集有关集群中所有服务器主机的装入和资源信息,并通过 LSLIB 向应用程序提供主机选择服务。 LIM 维护有关静态系统资源和动态负载索引的信息
mbatchd管理 批处理守护程序 (MBD): 接受并保存所有批处理作业。 MBD 通过联系 管理 主机 LIM 定期检查所有服务器主机上的装入索引。
mbschd管理 批处理调度程序守护程序: 执行 LSF 的调度功能,并将作业调度决策发送至 MBD 以进行分派。 在 LSF 管理 主机上运行
sbatchd服务器 批处理守护程序 (SBD): 接受来自 MBD 的作业执行请求,并监视作业进度。 控制作业执行,实施批处理策略,向 MBD 报告作业状态以及启动 MBD。
pimProcess Information Manager (PIM): 监视已提交作业在运行时使用的资源。 PIM 用于实施资源限制和负载阈值,以及用于公平共享调度
res远程执行服务器 (RES): 接受来自所有负载共享应用程序的远程执行请求,并处理远程主机上用于负载共享进程的 I/O。

用户命令

查看有关集群的信息。


命令

描述

bhosts显示主机及其静态和动态资源
blimits显示有关正在运行的作业的资源分配限制的信息
bparams显示有关可调批处理系统参数的信息
bqueues显示有关批处理队列的信息
busers显示有关用户和用户组的信息
lshosts显示主机及其静态资源信息
lsid显示当前 LSF 版本号,集群名称和 管理 主机名
lsinfo显示负载共享配置信息
lsload显示主机的动态装入索引

监视作业和任务。


命令

描述

bacct报告已完成 LSF 个作业的记帐统计信息
bapp显示有关附加到应用程序概要文件的作业的信息
bhist显示有关作业的历史信息
bjobs显示有关作业的信息
bpeek显示未完成的作业的标准输出和 stderr
bsla显示有关面向目标的服务级别协议调度的服务类配置的信息
bstatus读取或设置外部作业状态消息和数据文件

提交和控制作业。


命令

描述

bbot相对于队列中的最后一个作业移动暂挂作业
bchkpnt对可设置检查点的作业设置检查点
bkill向作业发送信号
bmig迁移可检查点或可重新运行的作业
bmod修改作业提交选项
brequeue终止作业并重新排队
bresize释放插槽并取消暂挂的作业调整大小分配请求
brestart重新启动检查点作业
bresume恢复已暂挂的作业
bstop暂挂作业
bsub提交作业
bswitch将未完成的作业从一个队列移至另一个队列
btop相对于队列中的第一个作业移动暂挂作业

bsub 命令

bsub [options] 命令[arguments] 命令的所选选项


选项

描述

-ar指定作业可自动调整大小
-H保留提交时处于 PSUSP 状态的作业
-I|-Ip|-Is提交批处理交互式作业。 -Ip 创建伪终端。 -Is 以 shell 方式创建伪终端。
-K提交作业并等待作业完成
-r使作业可重新运行
-x互斥执行
-app 应用程序概要文件名称将作业提交到指定的应用程序概要文件
-b 开始时间以 [[month:]day:]:minute 格式在指定日期和时间上或之后分派作业
-C core_limit设置属于此作业的所有进程的每个进程 (软) 核心文件大小限制 (KB)
-c cpu_time[/host_name | /host_model]限制作业可以使用的总 CPU 时间。 CPU 时间格式为 [hour:]minutes
-cwd "current_working_directory"指定作业的当前工作目录

-D 数据限制

设置属于作业的每个进程的每个进程 (软) 数据段大小限制 (KB)

-E "pre_exec_command [自变量]"在作业运行之前在执行主机上运行指定的 pre-exec 命令
-Ep "post_exec_command [自变量]"在作业完成后在执行主机上运行指定的 post-exec 命令
-e 错误文件将标准错误输出附加到文件
-eo 错误文件将作业的标准错误输出覆盖到指定文件
-F 文件限制为属于作业的每个进程设置每个进程 (软) 文件大小限制 (KB)
-f "local_file op[remote_file]" ...在本地 (提交) 主机和远程 (执行) 主机之间复制文件。 奥普 is one of >, <, <<, ><, <>
-i input_file | -is 输入文件从指定文件获取作业的标准输入
-J "job_name[index_list]%job_slot_limit"将指定的名称分配给作业。 作业数组 index_list 的格式为 start[-end[:step]] ,%job_slot_limit 是可以同时运行的最大作业数。
-k "chkpnt_dir [chkpnt_period] [method=method_name]"使作业检查点可执行,并指定检查点目录,周期 (以分钟为单位) 和方法
-M 内存限制设置每个进程 (软) 内存限制 (KB)
-m "host_name [@cluster_name] [[!] | + [pref_level]] | host_group[[!] | + [pref_level]] | compute_unit[[!] | + [pref_level]] ..."在其中一个指定主机上运行作业。 主机或组的名称后面的加号 (+) 指示首选项。 (可选) 正整数指示首选项级别。 数字越大,表示首选度越高。
-n min_proc[,max_proc]指定并行作业所需的最小和最大处理器数
-o 输出文件将标准输出附加到文件
-oo 输出文件将作业的标准输出覆盖到指定的文件
-p 进程限制限制整个作业的进程数
-q "queue_name ..."将作业提交到其中一个指定队列
-R "res_req" [-R "res_req" ...]指定主机资源需求
-S stack_limit为属于作业的每个进程设置每个进程 (软) 堆栈段大小限制 (KB)
-sla 服务类名指定要在其中运行作业的服务类
-T 线程限制设置整个作业的并发线程数限制
-t term_time以 [[month:]day:]hour:minute 格式指定作业终止截止期限
-v swap_limit设置整个作业的总进程虚拟内存限制 (KB)
-W run_time[/host_name |/host_model]以 [hour:]minute 格式设置作业的运行时限制
-h将命令用法打印到 stderr 并退出
-V将 LSF 发行版打印到 stderr 并退出

 

相关文章:

LSF 安装目录,快速参考 LSF 命令、守护程序、配置文件、日志文件和重要集群配置参数

样本 UNIX 和 Linux 安装目录 守护程序错误日志文件 守护程序错误日志文件存储在 LSF_LOGDIR 在 lsf.conf 文件中定义的目录中。 LSF 基本系统守护程序日志文件LSF 批处理系统守护程序日志文件pim.log.host_namembatchd.log.host_namembatchd.log.host_namesbatchd.log.host_…...

在Mybatis中写动态sql这些标签:if、where、set、trim、foreach、choose的作用是什么,怎么用?

在 MyBatis 中&#xff0c;您可以使用动态 SQL 标签来构建灵活的 SQL 查询&#xff0c;以根据不同的条件生成不同的查询语句。以下是这些标签的作用和用法&#xff1a; 1. **<if> 标签&#xff1a;** 用于根据某个条件动态地包含或排除 SQL 片段&#xff0c;test:可以写…...

7 Python的模块和包

概述 在上一节&#xff0c;我们介绍了Python的异常处理&#xff0c;包括&#xff1a;异常、异常处理、抛出异常、用户自定义异常等内容。在这一节中&#xff0c;我们将介绍Python的模块和包。Python的模块&#xff08;Module&#xff09;和包&#xff08;Package&#xff09;是…...

【JavaWeb 篇】使用Servlet、JdbcTemplate和Durid连接池实现用户登录功能与测试

在现代Web应用程序开发中&#xff0c;用户登录功能是基础中的基础。它为用户提供了安全访问系统的途径。本篇博客将引导您通过使用Servlet、Spring框架的JdbcTemplate以及Durid连接池&#xff0c;来构建一个完整的用户登录功能。我们将详细展示每个部分的代码&#xff0c;并解释…...

【Unity3D赛车游戏】【六】如何在Unity中为汽车添加发动机和手动挡变速?

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;Uni…...

【Go 基础篇】切片:Go语言中的灵活数据结构

在Go语言中&#xff0c;切片&#xff08;Slice&#xff09;是一种强大且灵活的数据结构&#xff0c;用于管理和操作一系列元素。与数组相比&#xff0c;切片的大小可以动态调整&#xff0c;这使得它成为处理动态数据集合的理想选择。本文将围绕Go语言中切片的引入&#xff0c;介…...

龙芯2K1000LA移植交叉编译环境以及QT

嵌入式大赛结束了&#xff0c;根据这次比赛中记的凌乱的笔记&#xff0c;整理了一份龙芯2K1000LA的环境搭建过程&#xff0c;可能笔记缺少了一部分步骤或者错误&#xff0c;但是大致步骤可以当作参考。 一、交叉编译工具链 下载连接&#xff1a;龙芯 GNU 编译工具链 | 龙芯开…...

javaee spring依赖注入之spel方式

spring依赖注入之spel方式 <dependency><groupId>org.springframework</groupId><artifactId>spring-expression</artifactId><version>4.3.18.RELEASE</version></dependency>package com.test.pojo;import java.util.List; …...

【Java集合学习1】ArrayList集合学习及集合概述分析

JavaArrayList集合学习及集合学习概述 一、Java集合概述 Java 集合&#xff0c; 也叫作容器&#xff0c;主要是由两大接口派生而来&#xff1a;一个是 Collection接口&#xff0c;主要用于存放单一元素&#xff1b;另一个是 Map 接口&#xff0c;主要用于存放键值对。对于Col…...

TouchGFX之调试

DebugPrinter类是一种在显示屏上打印调试消息的简单方法&#xff0c;无需向屏幕添加控件。 在使用DebugPrinter之前&#xff0c;需要分配一个实例并将其传递给Application类&#xff0c;且DebugPrinter实例必须兼容所使用的LCD类。 该表列出了DebugPrinter类名称&#xff1a; …...

C# winform加载yolov8模型测试(附例程)

第一步&#xff1a;在NuGet中下载Yolov8.Net 第二步&#xff1a;引用 using Yolov8Net; 第三步&#xff1a;加载模型 private IPredictor yolov8 YoloV8Predictor.Create("D:\\0MyWork\\Learn\\vs2022\\yolov_onnx\\best.onnx", mylabel); 第四步&#xff1a;图…...

浙大陈越何钦铭数据结构07-图6 旅游规划

题目: 有了一张自驾旅游路线图&#xff0c;你会知道城市间的高速公路长度、以及该公路要收取的过路费。现在需要你写一个程序&#xff0c;帮助前来咨询的游客找一条出发地和目的地之间的最短路径。如果有若干条路径都是最短的&#xff0c;那么需要输出最便宜的一条路径。 输入…...

VUE笔记(七)项目登录

1、安装elementui 在终端执行 vue add element 注册组件 如果要使用哪个组件&#xff0c;大家需要在plugins/element.js中注册该组件 import Vue from vue import { Button } from element-ui Vue.use(Button) 在页面组件中使用 <el-button type"primary"&…...

大语言模型之六- LLM之企业私有化部署

数据安全是每个公司不得不慎重对待的&#xff0c;为了提高生产力&#xff0c;降本增效又不得不接受新技术带来的工具&#xff0c;私有化部署对于公司还是非常有吸引力的。大语言模型这一工具结合公司的数据可以大大提高公司生产率。 私有化LLM需要处理的问题 企业内私有化LLM…...

Python3 列表

Python3 列表 序列是 Python 中最基本的数据结构。 序列中的每个值都有对应的位置值&#xff0c;称之为索引&#xff0c;第一个索引是 0&#xff0c;第二个索引是 1&#xff0c;依此类推。 Python 有 6 个序列的内置类型&#xff0c;但最常见的是列表和元组。 列表都可以进…...

OpenCV基础知识(8)— 图形检测

前言&#xff1a;Hello大家好&#xff0c;我是小哥谈。图形检测是计算机视觉的一项重要功能。通过图形检测可以分析图像中可能存在的形状&#xff0c;然后对这些形状进行描绘&#xff0c;例如搜索并绘制图像的边缘&#xff0c;定位图像的位置&#xff0c;判断图像中有没有直线、…...

Java虚拟机

文章目录 JVM运行时数据区域HotSpot虚拟机对象探秘实战&#xff1a;OutOfMemoryError异常 JVM 运行时数据区域 HotSpot虚拟机对象探秘 实战&#xff1a;OutOfMemoryError异常...

c++学习 之 函数重载注意事项

文章目录 引用作为函数重载的条件函数重载遇到默认参数 引用作为函数重载的条件 #include <iostream> using namespace std; void fun(int &a) {cout << "void fun(int & a)" << endl; }void fun(const int &a) {cout << "…...

2023-08-27 LeetCode每日一题(合并区间)

2023-08-27每日一题 一、题目编号 56. 合并区间二、题目链接 点击跳转到题目位置 三、题目描述 以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#…...

C#,数值计算——调适数值积分法(adaptive quadrature)的计算方法与源程序

1 文本格式 using System; namespace Legalsoft.Truffer { /// <summary> /// 调适数值积分法 /// adaptive quadrature /// </summary> public class Adapt { private double x1 { get; } 0.942882415695480; private …...

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞&#xff01;&#xff01;&#xff01; 抽象 现代智能交通系统 &#xff08;ITS&#xff09; 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 &#xff08;…...

golang循环变量捕获问题​​

在 Go 语言中&#xff0c;当在循环中启动协程&#xff08;goroutine&#xff09;时&#xff0c;如果在协程闭包中直接引用循环变量&#xff0c;可能会遇到一个常见的陷阱 - ​​循环变量捕获问题​​。让我详细解释一下&#xff1a; 问题背景 看这个代码片段&#xff1a; fo…...

简易版抽奖活动的设计技术方案

1.前言 本技术方案旨在设计一套完整且可靠的抽奖活动逻辑,确保抽奖活动能够公平、公正、公开地进行,同时满足高并发访问、数据安全存储与高效处理等需求,为用户提供流畅的抽奖体验,助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

Spring Boot 实现流式响应(兼容 2.7.x)

在实际开发中&#xff0c;我们可能会遇到一些流式数据处理的场景&#xff0c;比如接收来自上游接口的 Server-Sent Events&#xff08;SSE&#xff09; 或 流式 JSON 内容&#xff0c;并将其原样中转给前端页面或客户端。这种情况下&#xff0c;传统的 RestTemplate 缓存机制会…...

python/java环境配置

环境变量放一起 python&#xff1a; 1.首先下载Python Python下载地址&#xff1a;Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个&#xff0c;然后自定义&#xff0c;全选 可以把前4个选上 3.环境配置 1&#xff09;搜高级系统设置 2…...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力

引言&#xff1a; 在人工智能快速发展的浪潮中&#xff0c;快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型&#xff08;LLM&#xff09;。该模型代表着该领域的重大突破&#xff0c;通过独特方式融合思考与非思考…...

06 Deep learning神经网络编程基础 激活函数 --吴恩达

深度学习激活函数详解 一、核心作用 引入非线性:使神经网络可学习复杂模式控制输出范围:如Sigmoid将输出限制在(0,1)梯度传递:影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

自然语言处理——循环神经网络

自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元&#xff08;GRU&#xff09;长短期记忆神经网络&#xff08;LSTM&#xff09…...

浅谈不同二分算法的查找情况

二分算法原理比较简单&#xff0c;但是实际的算法模板却有很多&#xff0c;这一切都源于二分查找问题中的复杂情况和二分算法的边界处理&#xff0c;以下是博主对一些二分算法查找的情况分析。 需要说明的是&#xff0c;以下二分算法都是基于有序序列为升序有序的情况&#xf…...

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...