当前位置：首页 > article >正文

Tensorflow 2.0 GPU的使用与限制使用率及虚拟多GPU

article 2026/3/18 2:11:03

Tensorflow 2.0 GPU的使用与限制使用率及虚拟多GPU

1. 获得当前主机上特定运算设备的列表
2. 设置当前程序可见的设备范围
3. 显存的使用
4. 单GPU模拟多GPU环境

先插入一行简单代码，以下复制即可用来设置GPU使用率：

import tensorflow as tf
import numpy as npprint(tf.__version__)
import os# 设置可使用的 gpu 序号
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
# 用来设置是否在特殊情况下在cpu上进行计算
tf.config.set_soft_device_placement = False
# 
tf.config.experimental.set_memory_growth = True
gpus = tf.config.experimental.list_physical_devices('GPU')print(gpus)if gpus:tf.config.experimental.set_virtual_device_configuration(gpus[0],[tf.config.experimental.VirtualDeviceConfiguration(memory_limit=2048)])logical_gpus = tf.config.experimental.list_logical_devices('GPU')print(len(gpus), len(logical_gpus), 'Logical gpus')
# tf.debugging.set_log_device_placement(True)
# loggpus = config.experimental.list_logical_devices()
# strategy = tf.distribute.MirroredStrategy()
with tf.device('/device:GPU:0'):w = tf.constant([[2, -3.4]])b = tf.constant([4.2])x = tf.random.normal([1000, 2], mean=0, stddev=10)e = tf.random.normal([1000, 2], mean=0, stddev=0.1)W = tf.Variable(tf.constant([5, 1]))B = tf.Variable(tf.constant([1]))

1. 获得当前主机上特定运算设备的列表

#　获取当前物理gpu
gpus = tf.config.experimental.list_physical_devices(device_type='GPU')
# 获取当前物理cpu
cpus = tf.config.experimental.list_physical_devices(device_type='CPU')
print(gpus, cpus)
# 获取当前虚拟gpu个数
logical_gpus = tf.config.experimental.list_logical_devices('GPU')

2. 设置当前程序可见的设备范围

默认情况下 TensorFlow 会使用其所能够使用的所有 GPU

tf.config.experimental.set_visible_devices(devices=gpus[2:4], device_type='GPU')

设置之后，当前程序只会使用自己可见的设备，不可见的设备不会被当前程序使用。

另一种方式是使用环境变量 CUDA_VISIBLE_DEVICES 也可以控制程序所使用的 GPU。
在终端输入

export CUDA_VISIBLE_DEVICES=2,3

或者在代码里加入

import os
os.environ['CUDA_VISIBLE_DEVICES'] = "2,3"

3. 显存的使用

默认情况下，TensorFlow 将使用几乎所有可用的显存，以避免内存碎片化所带来的性能损失。

但是TensorFlow 提供两种显存使用策略，让我们能够更灵活地控制程序的显存使用方式：

仅在需要时申请显存空间（程序初始运行时消耗很少的显存，随着程序的运行而动态申请显存）；
限制消耗固定大小的显存（程序不会超出限定的显存大小，若超出的报错）。

设置仅在需要时申请显存空间。

for gpu in gpus:tf.config.experimental.set_memory_growth(gpu, True)

下面的方式是设置Tensorflow固定消耗GPU:0的2GB显存。

tf.config.experimental.set_virtual_device_configuration(gpus[0],[tf.config.experimental.VirtualDeviceConfiguration(memory_limit=2048)]
)

4. 单GPU模拟多GPU环境

上面的方式不仅可以设置显存的使用，还可以在只有单GPU的环境模拟多GPU进行调试。

tf.config.experimental.set_virtual_device_configuration(gpus[0],[tf.config.experimental.VirtualDeviceConfiguration(memory_limit=2048),tf.config.experimental.VirtualDeviceConfiguration(memory_limit=2048)])

上面的代码就在GPU:0上建立了两个显存均为 2GB 的虚拟 GPU。
进一步说，在物理GPU0上虚拟，那么使用

with tf.device('/device:GPU:3')

做指定gpu计算时，如果gpu0虚拟成３个，那么在 /device:GPU:3 中的gpu序数中,物理gpu1序号为3，即依次往后推

Tensorflow 2.0 GPU的使用与限制使用率及虚拟多GPU

Tensorflow 2.0 GPU的使用与限制使用率及虚拟多GPU

Tensorflow 2.0 GPU的使用与限制使用率及虚拟多GPU 1. 获得当前主机上特定运算设备的列表2. 设置当前程序可见的设备范围3. 显存的使用4. 单GPU模拟多GPU环境先插入一行简单代码，以下复制即可用来设置GPU使用率： import tensorflow as tf import numpy…...

编程日记 2026/2/21 14:53:16

RabbitMQ 2025/3/5

高性能异步通信组件。同步调用以支付为例： 可见容易发生雪崩。异步调用以支付为例： 支付服务当甩手掌柜了，不管后面的几个服务的结果。只管库库发，后面那几个服务想取的时候就取，因为消息代理里可以一直装&#x…...

编程日记 2026/3/14 4:32:46

每日一题-----面试

一、什么是孤儿进程？什么是僵尸进程？ 1.孤儿进程是指父进程在子进程结束之前就已经退出，导致子进程失去了父进程的管理和控制，成为了 “孤儿”。此时，这些子进程会被系统的 init 进程（在 Linux 系统中&…...

编程日记 2025/7/12 14:20:45

JSP+Servlet实现对数据库增删改查功能

前提概要需要理解的重要概念 MVC模式： Model（person类）：数据模型View（JSP）：显示界面Controller（Servlet）：处理业务逻辑请求流程： 浏览器 …...

编程日记 2026/3/13 21:25:17

C++【类和对象】

类和对象 1.this 指针2.类的默认成员函数3.构造函数4.析构函数5.拷贝构造函数 1.this 指针接上文 this指针存在内存的栈区域。 2.类的默认成员函数定义：编译器自动生成的成员函数。一个类，我们不写的情况下会默认生成六个成员函数。 3.构造函数函…...

编程日记 2026/2/16 8:06:22

GStreamer —— 2.13、Windows下Qt加载GStreamer库后运行 - “教程13:播放控制“（附：完整源码）

运行效果(音频) 简介上一个教程演示了GStreamer工具。本教程介绍视频播放控制。快进、反向播放和慢动作都是技术统称为 Trick Modes，它们都有一个共同点修改 Normal playback rate。本教程介绍如何实现这些效果并在交易中添加了帧步进。特别是，它显…...

编程日记 2026/3/17 14:31:46

MongoDB winx64 msi包安装详细教程

首先我们可以从官网上选择对应版本和对应的包类型进行安装： 下载地址：Download MongoDB Community Server | MongoDB 这里可以根据自己的需求， 这里我选择的是8.0.5 msi的版本，采用的传统装软件的方式安装。无需配置命令。下载…...

编程日记 2026/3/14 16:28:30

要查看 SQLite 数据库中的所有表，可以通过查询 SQLite 的系统表 sqlite_master

要查看 SQLite 数据库中的所有表，可以查询 SQLite 的系统表 sqlite_master。每个 SQLite 数据库都包含一个名为 sqlite_master 的系统表。该表定义了数据库的模式，存储了数据库中所有表、索引、视图和触发器等对象的信息。通过查询 sqlite_master&am…...

编程日记 2026/2/9 18:07:13

WinUI 3 支持的三种窗口及受限的窗口透明

我的目标希望能够熟悉 WinUI 3 窗口的基本使用方式，了解可能出现的问题。 WinUI 3 支持三种窗口模式，分别为：常规窗口模式、画中画模式、全屏模式。窗口模式：常规即我们最常见的普通窗口。支持：显示最大化按钮…...

编程日记 2026/3/16 1:09:51

如何借助 ArcGIS Pro 高效统计基站 10km 范围内的村庄数量？

在当今数字化时代，地理信息系统（GIS）技术在各个领域都发挥着重要作用。特别是在通信行业，对于基站周边覆盖范围内的地理信息分析，能够帮助我们更好地进行网络规划、资源分配以及市场分析等工作。今天，就…...

编程日记 2026/3/8 2:28:57

Linux网络之数据链路层协议

目录数据链路层 MAC地址与IP地址数据帧 ARP协议 NAT技术代理服务器正向代理反向代理上期我们学习了网络层中的相关协议，为IP协议。IP协议通过报头中的目的IP地址告知了数据最终要传送的目的主机的IP地址，从而指引了数据在网络中的一步…...

编程日记 2026/3/13 22:42:55

如何使用 PyInstaller 打包 Python 脚本？一看就懂的完整教程！

PyInstaller 打包指令教程 1. 写在前面通常，在用 Python 编写完一个脚本后，需要将它部署并集成到一个更大的项目中。常见的集成方式有以下几种： 使用 PyInstaller 打包。使用 Docker 打包。将 Python 嵌入到 C 代码中，并封装成…...

编程日记 2026/3/9 12:15:38

解锁DeepSpeek-R1大模型微调：从训练到部署，打造定制化AI会话系统

目录 1. 前言 2.大模型微调概念简述 2.1. 按学习范式分类 2.2. 按参数更新范围分类 2.3. 大模型微调框架简介 3. DeepSpeek R1大模型微调实战 3.1.LLaMA-Factory基础环境安装 3.1大模型下载 3.2. 大模型训练 3.3. 大模型部署 3.4. 微调大模型融合基于SpirngBootVue2…...

编程日记 2026/3/14 1:06:08

Hadoop、Hive、Spark的关系

Part1：Hadoop、Hive、Spark关系概览 1、MapReduce on Hadoop 和spark都是数据计算框架，一般认为spark的速度比MR快2-3倍。 2、mapreduce是数据计算的过程，map将一个任务分成多个小任务，reduce的部分将结果汇总之后返回。 3、HIv…...

编程日记 2026/3/3 10:18:38

基于VMware虚拟机的Ubuntu22.04系统安装和配置（新手保姆级教程）

文章目录一、前期准备1. 硬件要求2. 软件下载2-1. 下载虚拟机运行软件二、安装虚拟机三、创建 Ubuntu 系统虚拟机四、Ubuntu 系统安装过程的配置五、更换国内镜像源六、设置静态 IP七、安装常用软件1. 编译工具2. 代码管理工具3. 安装代码编辑软件（VIM&#xff09…...

编程日记 2026/3/15 17:49:21

Python|基于DeepSeek大模型，自动生成语料数据（10）

前言本文是该专栏的第10篇，后面会持续分享AI大模型干货知识，记得关注。在本专栏之前，笔者在文章《Python|基于DeepSeek大模型，实现文本内容仿写（8）》中，有详细介绍通过Python+DeepSeek大模型，实现对目标文本内容的仿写。而在本文中，笔者将基于DeepSeek大模型，通…...

编程日记 2026/2/2 7:54:05

基于SpringBoot的历史馆藏系统设计与实现(源码+SQL脚本+LW+部署讲解等)

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…...

编程日记 2026/3/14 21:38:34

蓝桥杯[每日两题] 真题：好数神奇闹钟 (java版)

题目一：好数题目描述一个整数如果按从低位到高位的顺序，奇数位（个位、百位、万位 ）上的数字是奇数，偶数位（十位、千位、十万位 ）上的数字是偶数，我们就称之为“好数”。给定…...

编程日记 2026/3/14 3:14:38

基于BMO磁性细菌优化的WSN网络最优节点部署算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述无线传感器网络（Wireless Sensor Network, WSN）由大量分布式传感器节点组成，用于监测物理或环境状况。节点部署是 WSN 的关键问…...

编程日记 2026/3/15 8:41:12

学习笔记：Python网络编程初探之基本概念（一）

一、网络目的让你设备上的数据和其他设备上进行共享，使用网络能够把多方链接在一起，然后可以进行数据传递。网络编程就是，让在不同的电脑上的软件能够进行数据传递，即进程之间的通信。二、IP地址的作用用来标记唯一一台电脑…...

编程日记 2026/3/14 8:07:06

Laya中runtime的用法

文章目录 0、环境：2.x版本1、runtime是什么2、使用实例情景需要做 3、script组件模式 0、环境：2.x版本 1、runtime是什么简单来说，如果创建了一个scene，加了runtime和没加runtime的区别就是： 没加runtime&#xff…...

编程日记 2026/2/28 21:16:36

Docker中GPU的使用指南

在当今的计算领域，GPU（图形处理单元）已经成为了加速各种计算密集型任务的关键硬件，特别是在深度学习、科学模拟和高性能计算等领域。Docker作为流行的容器化平台，允许开发者将应用程序及其依赖打包成一个可移植的容器，在不同的环境中运行。当需要在Docker容器中利用GPU的…...

编程日记 2026/2/25 16:34:18

OpenCV计算摄影学（16）调整图像光照效果函数illuminationChange()

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述对选定区域内的梯度场应用适当的非线性变换，然后通过泊松求解器重新积分，可以局部修改图像的表观照明。 cv::illuminati…...

编程日记 2026/2/28 18:30:49

【爬虫】开篇词

一、网络爬虫概述二、网络爬虫的应用场景三、爬虫的痛点四、需要掌握哪些技术？ 在这个信息爆炸的时代，如何高效地获取和处理海量数据成为一项核心技能。无论是数据分析、商业情报、学术研究，还是人工智能训练，网络爬虫&…...

编程日记 2026/3/15 0:25:27

C#变量与变量作用域详解

一、变量基础 1. ‌声明与初始化‌ 声明语法‌：<数据类型> <变量名>（如 int age; string name）‌初始化要求‌： 1、类或结构体中的字段变量（全局变量）‌无需显式初始化‌，默认值…...

编程日记 2026/3/10 3:25:41

深度解析 slabtop：实时监控内核缓存的利器

文章目录深度解析 slabtop：实时监控内核缓存的利器slabtop 简介基本语法与选项命令语法主要选项详解实际应用实例示例 1：每 5 秒刷新显示 slab 缓存信息示例 2：按名称排序，每 10 秒刷新一次显示 slab 缓存信息如何解读 slabtop…...

编程日记 2026/2/20 21:45:24

力扣-股票买入问题

dp dp元素代表最大利润 f[j][1] 代表第 j 次交易后持有股票的最大利润。在初始状态，持有股票意味着你花钱买入了股票，此时的利润应该是负数（扣除了买入股票的成本），而不是 0。所以，把 f[j][1] 初始化为负…...

编程日记 2026/2/28 20:36:53

微服务保护：Sentinel

home | Sentinelhttps://sentinelguard.io/zh-cn/ 微服务保护的方案有很多，比如： 请求限流线程隔离服务熔断服务故障最重要原因，就是并发太高！解决了这个问题，就能避免大部分故障。当然，接口的并发…...

编程日记 2026/2/28 4:52:56

蓝桥杯刷题周计划（第二周）

目录前言题目一题目代码题解分析题目二题目代码题解分析题目三题目代码题解分析题目四题目代码题解分析题目五题目代码题解分析题目六题目代码题解分析题目七题目代码题解分析题目八题目题解分析题目九题目代码题解分析题目十题目代码题解分析题目十一题目代码题解分…...

编程日记 2026/2/22 8:39:25

【C++】C++11部分

目录一、列表初始化 1.1 {}初始化 1.2 initializer_list 二、变量类型推导 2.1 auto 2.2 decltype 三、STL中一些变化 3.1 新增容器四、lambda表达式 4.1 C98中的一个例子 4.2 lambda表达式 4.3 函数对象与lambda表达式五、包装器 5.1 function包装器 5.2 fu…...

编程日记 2026/3/3 6:51:54

Tensorflow 2.0 GPU的使用与限制使用率及虚拟多GPU

1. 获得当前主机上特定运算设备的列表

2. 设置当前程序可见的设备范围

3. 显存的使用

4. 单GPU模拟多GPU环境

相关文章：