当前位置: 首页 > news >正文

LSF 安装目录,快速参考 LSF 命令、守护程序、配置文件、日志文件和重要集群配置参数

样本 UNIX 和 Linux 安装目录

样本 UNIX 和 Linux 安装目录

 

守护程序错误日志文件

守护程序错误日志文件存储在 LSF_LOGDIR 在 lsf.conf 文件中定义的目录中。

LSF 基本系统守护程序日志文件LSF 批处理系统守护程序日志文件
pim.log.host_namembatchd.log.host_name
mbatchd.log.host_namesbatchd.log.host_name
lim.log.host_namembschd.log.host_name

如果在 ego.conf 文件中定义了 EGO_LOGDIR 参数,那么 lim.log.host_name 文件将存储在 EGO_LOGDIR 参数定义的目录中。

配置文件

lsf.conf, lsf.shared和 lsf.cluster.cluster_name 文件位于 lsf.conf 文件中 LSF_CONFDIR 参数指定的目录中。

lsb.params, lsb.queues, lsb.modules和 lsb.resources 文件位于 LSB_CONFDIR/cluster_name/configdir/ 目录中。

文件

描述

install.configLSF 安装和配置的选项
lsf.conf描述集群配置和操作的通用环境配置文件
lsf.shared所有集群共享的定义文件。 用于定义集群名称,主机类型,主机模型和站点定义的资源
lsf.cluster.cluster_name用于定义站点定义的共享资源的主机,管理员和位置的集群配置文件
lsb.applications定义应用程序概要文件以定义相同类型的作业的公共参数
lsb.params配置 LSF 批处理参数
lsb.queues批处理队列配置文件
lsb.resources配置资源分配限制,导出和资源使用限制
lsb.serviceclasses将 LSF 集群中的服务级别协议 (SLA) 定义为服务类,用于定义 SLA 的属性
lsb.users配置用户组,用户和用户组的分层公平共享以及用户和用户组的作业槽限制

lsf.conf 文件中的集群配置参数


参数

描述

UNIX 缺省值

LSF_BINDIR包含 LSF 用户命令的目录,这些命令由同一类型的所有主机共享LSF_TOP/version/OStype/bin
LSF_CONFDIR所有 LSF 配置文件的目录LSF_TOP/conf
LSF_ENVDIR包含 lsf.conf 文件的目录。 必须由 root 用户拥有。/etc (如果未定义 LSF_CONFDIR )
LSF_INCLUDEDIR包含 LSF API 头文件 lsf.h 和 lsbatch.h 的目录LSF_TOP/version/include
LSF_LIBDIRLSF 库,由同一类型的所有主机共享LSF_TOP/version/OStype/lib
LSF_LOGDIR(可选) LSF 守护程序日志的目录。 必须由 root 用户拥有。/tmp
LSF_LOG_MASK来自 LSF 命令的错误消息的日志记录级别LOG_WARNING
LSF_MANDIR包含 LSF 联机帮助页的目录LSF_TOP/version/man
LSF_MISC样本 C 程序和 shell 脚本以及外部 LIM 的模板 (elim)LSF_TOP/version/misc
LSF_SERVERDIR所有服务器二进制文件和 shell 脚本以及由 LSF 守护程序启动的外部可执行文件的目录必须由 root 用户拥有,并且由同一类型的所有主机共享LSF_TOP/version/OStype/etc
LSF_TOP顶级安装目录。 LSF_TOP 的路径必须共享,并且可供集群中的所有主机访问。 它不能是根目录 (/)。未定义

安装所需

LSB_CONFDIRLSF 批处理配置目录的目录,包含用户和主机列表,操作参数和批处理队列LSF_CONFDIR/lsbatch
LSF_LIVE_CONFDIRbconf 命令写入的 LSF 实时重新配置目录的目录。LSB_SHAREDIR/cluster_name/live_confdir
LSF_SHAREDIR每个集群的 LSF 批处理作业历史记录和记帐日志文件的目录必须由主 LSF 管理员拥有LSF_TOP/work
LSF_LIM_PORT用于与 lim 守护程序通信的 TCP 服务端口7879
LSF_RES_PORT用于与 res 守护程序通信的 TCP 服务端口6878
LSF_MBD_PORT用于与 mbatchd 守护程序通信的 TCP 服务端口6881
LSF_SBD_PORT用于与 sbatchd 守护程序通信的 TCP 服务端口6882

 

管理和记帐命令

只有 LSF 管理员和 root 用户才能使用这些命令。


命令

描述

lsadminLSF 管理员工具,用于控制 LSF 集群中 LIM 和 RES 守护程序的操作, lsadmin help 显示所有子命令
lsfinstall使用 install.config 输入文件安装 LSF
lsfrestart在本地集群中的所有主机上重新启动 LSF 守护程序
lsfshutdown关闭本地集群中所有主机上的 LSF 守护程序
lsfstartup在本地集群中的所有主机上启动 LSF 守护程序
badminLSF 用于控制 LSF 批处理系统 (sbatchd, mbatchd,主机和队列) 操作的管理工具 badmin 帮助显示所有子命令
bconf更改活动内存中的 LSF 配置

守护程序


守护程序名称

描述

lim装入信息管理器 (LIM): 收集有关集群中所有服务器主机的装入和资源信息,并通过 LSLIB 向应用程序提供主机选择服务。 LIM 维护有关静态系统资源和动态负载索引的信息
mbatchd管理 批处理守护程序 (MBD): 接受并保存所有批处理作业。 MBD 通过联系 管理 主机 LIM 定期检查所有服务器主机上的装入索引。
mbschd管理 批处理调度程序守护程序: 执行 LSF 的调度功能,并将作业调度决策发送至 MBD 以进行分派。 在 LSF 管理 主机上运行
sbatchd服务器 批处理守护程序 (SBD): 接受来自 MBD 的作业执行请求,并监视作业进度。 控制作业执行,实施批处理策略,向 MBD 报告作业状态以及启动 MBD。
pimProcess Information Manager (PIM): 监视已提交作业在运行时使用的资源。 PIM 用于实施资源限制和负载阈值,以及用于公平共享调度
res远程执行服务器 (RES): 接受来自所有负载共享应用程序的远程执行请求,并处理远程主机上用于负载共享进程的 I/O。

用户命令

查看有关集群的信息。


命令

描述

bhosts显示主机及其静态和动态资源
blimits显示有关正在运行的作业的资源分配限制的信息
bparams显示有关可调批处理系统参数的信息
bqueues显示有关批处理队列的信息
busers显示有关用户和用户组的信息
lshosts显示主机及其静态资源信息
lsid显示当前 LSF 版本号,集群名称和 管理 主机名
lsinfo显示负载共享配置信息
lsload显示主机的动态装入索引

监视作业和任务。


命令

描述

bacct报告已完成 LSF 个作业的记帐统计信息
bapp显示有关附加到应用程序概要文件的作业的信息
bhist显示有关作业的历史信息
bjobs显示有关作业的信息
bpeek显示未完成的作业的标准输出和 stderr
bsla显示有关面向目标的服务级别协议调度的服务类配置的信息
bstatus读取或设置外部作业状态消息和数据文件

提交和控制作业。


命令

描述

bbot相对于队列中的最后一个作业移动暂挂作业
bchkpnt对可设置检查点的作业设置检查点
bkill向作业发送信号
bmig迁移可检查点或可重新运行的作业
bmod修改作业提交选项
brequeue终止作业并重新排队
bresize释放插槽并取消暂挂的作业调整大小分配请求
brestart重新启动检查点作业
bresume恢复已暂挂的作业
bstop暂挂作业
bsub提交作业
bswitch将未完成的作业从一个队列移至另一个队列
btop相对于队列中的第一个作业移动暂挂作业

bsub 命令

bsub [options] 命令[arguments] 命令的所选选项


选项

描述

-ar指定作业可自动调整大小
-H保留提交时处于 PSUSP 状态的作业
-I|-Ip|-Is提交批处理交互式作业。 -Ip 创建伪终端。 -Is 以 shell 方式创建伪终端。
-K提交作业并等待作业完成
-r使作业可重新运行
-x互斥执行
-app 应用程序概要文件名称将作业提交到指定的应用程序概要文件
-b 开始时间以 [[month:]day:]:minute 格式在指定日期和时间上或之后分派作业
-C core_limit设置属于此作业的所有进程的每个进程 (软) 核心文件大小限制 (KB)
-c cpu_time[/host_name | /host_model]限制作业可以使用的总 CPU 时间。 CPU 时间格式为 [hour:]minutes
-cwd "current_working_directory"指定作业的当前工作目录

-D 数据限制

设置属于作业的每个进程的每个进程 (软) 数据段大小限制 (KB)

-E "pre_exec_command [自变量]"在作业运行之前在执行主机上运行指定的 pre-exec 命令
-Ep "post_exec_command [自变量]"在作业完成后在执行主机上运行指定的 post-exec 命令
-e 错误文件将标准错误输出附加到文件
-eo 错误文件将作业的标准错误输出覆盖到指定文件
-F 文件限制为属于作业的每个进程设置每个进程 (软) 文件大小限制 (KB)
-f "local_file op[remote_file]" ...在本地 (提交) 主机和远程 (执行) 主机之间复制文件。 奥普 is one of >, <, <<, ><, <>
-i input_file | -is 输入文件从指定文件获取作业的标准输入
-J "job_name[index_list]%job_slot_limit"将指定的名称分配给作业。 作业数组 index_list 的格式为 start[-end[:step]] ,%job_slot_limit 是可以同时运行的最大作业数。
-k "chkpnt_dir [chkpnt_period] [method=method_name]"使作业检查点可执行,并指定检查点目录,周期 (以分钟为单位) 和方法
-M 内存限制设置每个进程 (软) 内存限制 (KB)
-m "host_name [@cluster_name] [[!] | + [pref_level]] | host_group[[!] | + [pref_level]] | compute_unit[[!] | + [pref_level]] ..."在其中一个指定主机上运行作业。 主机或组的名称后面的加号 (+) 指示首选项。 (可选) 正整数指示首选项级别。 数字越大,表示首选度越高。
-n min_proc[,max_proc]指定并行作业所需的最小和最大处理器数
-o 输出文件将标准输出附加到文件
-oo 输出文件将作业的标准输出覆盖到指定的文件
-p 进程限制限制整个作业的进程数
-q "queue_name ..."将作业提交到其中一个指定队列
-R "res_req" [-R "res_req" ...]指定主机资源需求
-S stack_limit为属于作业的每个进程设置每个进程 (软) 堆栈段大小限制 (KB)
-sla 服务类名指定要在其中运行作业的服务类
-T 线程限制设置整个作业的并发线程数限制
-t term_time以 [[month:]day:]hour:minute 格式指定作业终止截止期限
-v swap_limit设置整个作业的总进程虚拟内存限制 (KB)
-W run_time[/host_name |/host_model]以 [hour:]minute 格式设置作业的运行时限制
-h将命令用法打印到 stderr 并退出
-V将 LSF 发行版打印到 stderr 并退出

 

相关文章:

LSF 安装目录,快速参考 LSF 命令、守护程序、配置文件、日志文件和重要集群配置参数

样本 UNIX 和 Linux 安装目录 守护程序错误日志文件 守护程序错误日志文件存储在 LSF_LOGDIR 在 lsf.conf 文件中定义的目录中。 LSF 基本系统守护程序日志文件LSF 批处理系统守护程序日志文件pim.log.host_namembatchd.log.host_namembatchd.log.host_namesbatchd.log.host_…...

在Mybatis中写动态sql这些标签:if、where、set、trim、foreach、choose的作用是什么,怎么用?

在 MyBatis 中&#xff0c;您可以使用动态 SQL 标签来构建灵活的 SQL 查询&#xff0c;以根据不同的条件生成不同的查询语句。以下是这些标签的作用和用法&#xff1a; 1. **<if> 标签&#xff1a;** 用于根据某个条件动态地包含或排除 SQL 片段&#xff0c;test:可以写…...

7 Python的模块和包

概述 在上一节&#xff0c;我们介绍了Python的异常处理&#xff0c;包括&#xff1a;异常、异常处理、抛出异常、用户自定义异常等内容。在这一节中&#xff0c;我们将介绍Python的模块和包。Python的模块&#xff08;Module&#xff09;和包&#xff08;Package&#xff09;是…...

【JavaWeb 篇】使用Servlet、JdbcTemplate和Durid连接池实现用户登录功能与测试

在现代Web应用程序开发中&#xff0c;用户登录功能是基础中的基础。它为用户提供了安全访问系统的途径。本篇博客将引导您通过使用Servlet、Spring框架的JdbcTemplate以及Durid连接池&#xff0c;来构建一个完整的用户登录功能。我们将详细展示每个部分的代码&#xff0c;并解释…...

【Unity3D赛车游戏】【六】如何在Unity中为汽车添加发动机和手动挡变速?

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;Uni…...

【Go 基础篇】切片:Go语言中的灵活数据结构

在Go语言中&#xff0c;切片&#xff08;Slice&#xff09;是一种强大且灵活的数据结构&#xff0c;用于管理和操作一系列元素。与数组相比&#xff0c;切片的大小可以动态调整&#xff0c;这使得它成为处理动态数据集合的理想选择。本文将围绕Go语言中切片的引入&#xff0c;介…...

龙芯2K1000LA移植交叉编译环境以及QT

嵌入式大赛结束了&#xff0c;根据这次比赛中记的凌乱的笔记&#xff0c;整理了一份龙芯2K1000LA的环境搭建过程&#xff0c;可能笔记缺少了一部分步骤或者错误&#xff0c;但是大致步骤可以当作参考。 一、交叉编译工具链 下载连接&#xff1a;龙芯 GNU 编译工具链 | 龙芯开…...

javaee spring依赖注入之spel方式

spring依赖注入之spel方式 <dependency><groupId>org.springframework</groupId><artifactId>spring-expression</artifactId><version>4.3.18.RELEASE</version></dependency>package com.test.pojo;import java.util.List; …...

【Java集合学习1】ArrayList集合学习及集合概述分析

JavaArrayList集合学习及集合学习概述 一、Java集合概述 Java 集合&#xff0c; 也叫作容器&#xff0c;主要是由两大接口派生而来&#xff1a;一个是 Collection接口&#xff0c;主要用于存放单一元素&#xff1b;另一个是 Map 接口&#xff0c;主要用于存放键值对。对于Col…...

TouchGFX之调试

DebugPrinter类是一种在显示屏上打印调试消息的简单方法&#xff0c;无需向屏幕添加控件。 在使用DebugPrinter之前&#xff0c;需要分配一个实例并将其传递给Application类&#xff0c;且DebugPrinter实例必须兼容所使用的LCD类。 该表列出了DebugPrinter类名称&#xff1a; …...

C# winform加载yolov8模型测试(附例程)

第一步&#xff1a;在NuGet中下载Yolov8.Net 第二步&#xff1a;引用 using Yolov8Net; 第三步&#xff1a;加载模型 private IPredictor yolov8 YoloV8Predictor.Create("D:\\0MyWork\\Learn\\vs2022\\yolov_onnx\\best.onnx", mylabel); 第四步&#xff1a;图…...

浙大陈越何钦铭数据结构07-图6 旅游规划

题目: 有了一张自驾旅游路线图&#xff0c;你会知道城市间的高速公路长度、以及该公路要收取的过路费。现在需要你写一个程序&#xff0c;帮助前来咨询的游客找一条出发地和目的地之间的最短路径。如果有若干条路径都是最短的&#xff0c;那么需要输出最便宜的一条路径。 输入…...

VUE笔记(七)项目登录

1、安装elementui 在终端执行 vue add element 注册组件 如果要使用哪个组件&#xff0c;大家需要在plugins/element.js中注册该组件 import Vue from vue import { Button } from element-ui Vue.use(Button) 在页面组件中使用 <el-button type"primary"&…...

大语言模型之六- LLM之企业私有化部署

数据安全是每个公司不得不慎重对待的&#xff0c;为了提高生产力&#xff0c;降本增效又不得不接受新技术带来的工具&#xff0c;私有化部署对于公司还是非常有吸引力的。大语言模型这一工具结合公司的数据可以大大提高公司生产率。 私有化LLM需要处理的问题 企业内私有化LLM…...

Python3 列表

Python3 列表 序列是 Python 中最基本的数据结构。 序列中的每个值都有对应的位置值&#xff0c;称之为索引&#xff0c;第一个索引是 0&#xff0c;第二个索引是 1&#xff0c;依此类推。 Python 有 6 个序列的内置类型&#xff0c;但最常见的是列表和元组。 列表都可以进…...

OpenCV基础知识(8)— 图形检测

前言&#xff1a;Hello大家好&#xff0c;我是小哥谈。图形检测是计算机视觉的一项重要功能。通过图形检测可以分析图像中可能存在的形状&#xff0c;然后对这些形状进行描绘&#xff0c;例如搜索并绘制图像的边缘&#xff0c;定位图像的位置&#xff0c;判断图像中有没有直线、…...

Java虚拟机

文章目录 JVM运行时数据区域HotSpot虚拟机对象探秘实战&#xff1a;OutOfMemoryError异常 JVM 运行时数据区域 HotSpot虚拟机对象探秘 实战&#xff1a;OutOfMemoryError异常...

c++学习 之 函数重载注意事项

文章目录 引用作为函数重载的条件函数重载遇到默认参数 引用作为函数重载的条件 #include <iostream> using namespace std; void fun(int &a) {cout << "void fun(int & a)" << endl; }void fun(const int &a) {cout << "…...

2023-08-27 LeetCode每日一题(合并区间)

2023-08-27每日一题 一、题目编号 56. 合并区间二、题目链接 点击跳转到题目位置 三、题目描述 以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#…...

C#,数值计算——调适数值积分法(adaptive quadrature)的计算方法与源程序

1 文本格式 using System; namespace Legalsoft.Truffer { /// <summary> /// 调适数值积分法 /// adaptive quadrature /// </summary> public class Adapt { private double x1 { get; } 0.942882415695480; private …...

NS-USBLoader完整教程:Switch文件传输与RCM注入一站式解决方案

NS-USBLoader完整教程&#xff1a;Switch文件传输与RCM注入一站式解决方案 【免费下载链接】ns-usbloader Awoo Installer and GoldLeaf uploader of the NSPs (and other files), RCM payload injector, application for split/merge files. 项目地址: https://gitcode.com/…...

openpilot终极指南:如何为你的爱车免费升级自动驾驶辅助系统

openpilot终极指南&#xff1a;如何为你的爱车免费升级自动驾驶辅助系统 【免费下载链接】openpilot openpilot is an operating system for robotics. Currently, it upgrades the driver assistance system on 300 supported cars. 项目地址: https://gitcode.com/GitHub_T…...

用机器学习与SHAP解析教育公平:巴西学生成绩预测模型实战

1. 项目概述&#xff1a;用数据透视巴西教育&#xff0c;一场关于公平的算法实验作为一名长期关注教育技术与数据分析的从业者&#xff0c;我始终对一个问题着迷&#xff1a;在一个学生背景千差万别的教育体系中&#xff0c;究竟哪些因素真正决定了他们的学业表现&#xff1f;是…...

初创公司如何通过Taotoken的Token Plan套餐有效控制AI实验成本

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 初创公司如何通过Taotoken的Token Plan套餐有效控制AI实验成本 对于初创公司而言&#xff0c;在产品原型开发和AI功能探索阶段&…...

ARM SME指令集:SQCVT与SQRSHR深度解析与应用

1. ARM SME指令集概述在当今处理器架构设计中&#xff0c;向量化计算已成为提升性能的关键技术。作为ARMv9架构的重要扩展&#xff0c;可扩展矩阵扩展&#xff08;Scalable Matrix Extension&#xff0c;SME&#xff09;指令集引入了多项创新特性&#xff0c;其中FEAT_SME2扩展…...

图自编码器在金融风控中的拓扑模式检测实践

1. 项目概述&#xff1a;当图机器学习遇上金融风控在金融科技领域摸爬滚打了十几年&#xff0c;我见过太多风控系统从“规则为王”到“数据驱动”的变迁。早期的反洗钱&#xff08;AML&#xff09;和反欺诈系统&#xff0c;本质上是一套复杂的“如果-那么”规则库&#xff1a;如…...

麒麟系统启动卡住别慌!这可能是磁盘文件系统坏了,试试这几条Linux命令自救

麒麟系统启动卡顿故障排查指南&#xff1a;从原理到实战的磁盘修复方案 当你的麒麟系统突然卡在启动界面&#xff0c;屏幕上只留下"Boot From Harddisk"或EFI stub信息时&#xff0c;那种焦虑感我深有体会。作为一名经历过数十次类似故障排查的技术顾问&#xff0c;我…...

解决Keil MDK中RL-ARM许可证错误L9937E的方法

1. 问题现象与背景解析最近在维护一个基于Keil MDK的嵌入式老项目时&#xff0c;遇到了一个棘手的许可证错误。项目需要使用RL-ARM实时库&#xff08;Real-Time Library&#xff09;&#xff0c;但编译时出现了以下错误提示&#xff1a;Error: L9937E: RL-ARM is not allowed w…...

量子机器学习模拟器性能优化与门层特性解析

1. 量子机器学习模拟器的性能优化之道量子机器学习(QML)作为量子计算与经典机器学习的交叉领域&#xff0c;其核心挑战在于如何高效模拟量子电路的演化过程。传统量子模拟器如PennyLane的default.qubit采用通用方法处理各类量子门操作&#xff0c;未能充分考虑不同门类型的数学…...

FModel深度指南:UE5.3+ Pak解包与Nanite资源导出实战

1. 这不是“下载器”&#xff0c;而是一把解构现代游戏资产的手术刀很多人第一次听说FModel&#xff0c;是在某个游戏论坛里看到一句轻描淡写的“用FModel扒资源”。于是下载、双击、拖进exe——结果卡在“Loading Pak Files”十分钟不动&#xff0c;或者导出一堆黑屏贴图、错位…...