当前位置：首页 > news >正文

Cuda By Example - 11 (Texture Memory 2-D)

news 2026/5/21 9:24:31

跟1D一样，2D的代码也没有运行过。旧的方法看看就好。

声明二维Texture

texture<float, 2> texConstSrc;
texture<float, 2> texIn;
texture<float, 2> texOut;

访问二维Texture

使用2D的Texture的便利性体现在blend_kernel函数里。不再需要通过x，y去计算一维索引。二维texture使用tex2D()去读取数据。

__global__ void blend_kernel( float *dst,bool dstOut ) {// map from threadIdx/BlockIdx to pixel positionint x = threadIdx.x + blockIdx.x * blockDim.x;int y = threadIdx.y + blockIdx.y * blockDim.y;int offset = x + y * blockDim.x * gridDim.x;float   t, l, c, r, b;if (dstOut) {t = tex2D(texIn,x,y-1);l = tex2D(texIn,x-1,y);c = tex2D(texIn,x,y);r = tex2D(texIn,x+1,y);b = tex2D(texIn,x,y+1);} else {t = tex2D(texOut,x,y-1);l = tex2D(texOut,x-1,y);c = tex2D(texOut,x,y);r = tex2D(texOut,x+1,y);b = tex2D(texOut,x,y+1);}dst[offset] = c + SPEED * (t + b + r + l - 4 * c);
}

然后拷贝热源数据

__global__ void copy_const_kernel( float *iptr ) {// map from threadIdx/BlockIdx to pixel positionint x = threadIdx.x + blockIdx.x * blockDim.x;int y = threadIdx.y + blockIdx.y * blockDim.y;int offset = x + y * blockDim.x * gridDim.x;float c = tex2D(texConstSrc,x,y);if (c != 0)iptr[offset] = c;
}

二维Texture绑定

使用２维Texture去绑定一维数组，稍微复杂一些：

cudaChannelFormatDesc desc = cudaCreateChannelDesc<float>();
HANDLE_ERROR( cudaBindTexture2D( NULL, texConstSrc, data.dev_constSrc,desc, DIM, DIM, sizeof(float)*DIM));
HANDLE_ERROR( cudaBindTexture2D( NULL, texIn, data.dev_inSrc,desc, DIM, DIM, sizeof(float)*DIM));
HANDLE_ERROR( cudaBindTexture2D( NULL, texOut, data.dev_outSrc,desc, DIM, DIM, sizeof(float)*DIM));

解除绑定

解除绑定的方式跟１D相同

cudaUnbindTexture(texIn);
cudaUnbindTexture(texOut);
cudaUnbindTexture(texConstSrc);

完整代码

#include "../common/book.h"
#include "../common/cpu_anim.h"#define DIM 1024
#define PI 3.1415926535897932f
#define MAX_TEMP 1.0f
#define MIN_TEMP 0.0001f
#define SPEED   0.25f// these exist on the GPU side
texture<float,2>  texConstSrc;
texture<float,2>  texIn;
texture<float,2>  texOut;__global__ void blend_kernel( float *dst,bool dstOut ) {// map from threadIdx/BlockIdx to pixel positionint x = threadIdx.x + blockIdx.x * blockDim.x;int y = threadIdx.y + blockIdx.y * blockDim.y;int offset = x + y * blockDim.x * gridDim.x;float   t, l, c, r, b;if (dstOut) {t = tex2D(texIn,x,y-1);l = tex2D(texIn,x-1,y);c = tex2D(texIn,x,y);r = tex2D(texIn,x+1,y);b = tex2D(texIn,x,y+1);} else {t = tex2D(texOut,x,y-1);l = tex2D(texOut,x-1,y);c = tex2D(texOut,x,y);r = tex2D(texOut,x+1,y);b = tex2D(texOut,x,y+1);}dst[offset] = c + SPEED * (t + b + r + l - 4 * c);
}__global__ void copy_const_kernel( float *iptr ) {// map from threadIdx/BlockIdx to pixel positionint x = threadIdx.x + blockIdx.x * blockDim.x;int y = threadIdx.y + blockIdx.y * blockDim.y;int offset = x + y * blockDim.x * gridDim.x;float c = tex2D(texConstSrc,x,y);if (c != 0)iptr[offset] = c;
}// globals needed by the update routine
struct DataBlock {unsigned char   *output_bitmap;float           *dev_inSrc;float           *dev_outSrc;float           *dev_constSrc;CPUAnimBitmap  *bitmap;cudaEvent_t     start, stop;float           totalTime;float           frames;
};void anim_gpu( DataBlock *d, int ticks ) {HANDLE_ERROR( cudaEventRecord( d->start, 0 ) );dim3    blocks(DIM/16,DIM/16);dim3    threads(16,16);CPUAnimBitmap  *bitmap = d->bitmap;// since tex is global and bound, we have to use a flag to// select which is in/out per iterationvolatile bool dstOut = true;for (int i=0; i<90; i++) {float   *in, *out;if (dstOut) {in  = d->dev_inSrc;out = d->dev_outSrc;} else {out = d->dev_inSrc;in  = d->dev_outSrc;}copy_const_kernel<<<blocks,threads>>>( in );blend_kernel<<<blocks,threads>>>( out, dstOut );dstOut = !dstOut;}float_to_color<<<blocks,threads>>>( d->output_bitmap,d->dev_inSrc );HANDLE_ERROR( cudaMemcpy( bitmap->get_ptr(),d->output_bitmap,bitmap->image_size(),cudaMemcpyDeviceToHost ) );HANDLE_ERROR( cudaEventRecord( d->stop, 0 ) );HANDLE_ERROR( cudaEventSynchronize( d->stop ) );float   elapsedTime;HANDLE_ERROR( cudaEventElapsedTime( &elapsedTime,d->start, d->stop ) );d->totalTime += elapsedTime;++d->frames;printf( "Average Time per frame:  %3.1f ms\n",d->totalTime/d->frames  );
}// clean up memory allocated on the GPU
void anim_exit( DataBlock *d ) {cudaUnbindTexture( texIn );cudaUnbindTexture( texOut );cudaUnbindTexture( texConstSrc );HANDLE_ERROR( cudaFree( d->dev_inSrc ) );HANDLE_ERROR( cudaFree( d->dev_outSrc ) );HANDLE_ERROR( cudaFree( d->dev_constSrc ) );HANDLE_ERROR( cudaEventDestroy( d->start ) );HANDLE_ERROR( cudaEventDestroy( d->stop ) );
}int main( void ) {DataBlock   data;CPUAnimBitmap bitmap( DIM, DIM, &data );data.bitmap = &bitmap;data.totalTime = 0;data.frames = 0;HANDLE_ERROR( cudaEventCreate( &data.start ) );HANDLE_ERROR( cudaEventCreate( &data.stop ) );int imageSize = bitmap.image_size();HANDLE_ERROR( cudaMalloc( (void**)&data.output_bitmap,imageSize ) );// assume float == 4 chars in size (ie rgba)HANDLE_ERROR( cudaMalloc( (void**)&data.dev_inSrc,imageSize ) );HANDLE_ERROR( cudaMalloc( (void**)&data.dev_outSrc,imageSize ) );HANDLE_ERROR( cudaMalloc( (void**)&data.dev_constSrc,imageSize ) );cudaChannelFormatDesc desc = cudaCreateChannelDesc<float>();HANDLE_ERROR( cudaBindTexture2D( NULL, texConstSrc,data.dev_constSrc,desc, DIM, DIM,sizeof(float) * DIM ) );HANDLE_ERROR( cudaBindTexture2D( NULL, texIn,data.dev_inSrc,desc, DIM, DIM,sizeof(float) * DIM ) );HANDLE_ERROR( cudaBindTexture2D( NULL, texOut,data.dev_outSrc,desc, DIM, DIM,sizeof(float) * DIM ) );// initialize the constant datafloat *temp = (float*)malloc( imageSize );for (int i=0; i<DIM*DIM; i++) {temp[i] = 0;int x = i % DIM;int y = i / DIM;if ((x>300) && (x<600) && (y>310) && (y<601))temp[i] = MAX_TEMP;}temp[DIM*100+100] = (MAX_TEMP + MIN_TEMP)/2;temp[DIM*700+100] = MIN_TEMP;temp[DIM*300+300] = MIN_TEMP;temp[DIM*200+700] = MIN_TEMP;for (int y=800; y<900; y++) {for (int x=400; x<500; x++) {temp[x+y*DIM] = MIN_TEMP;}}HANDLE_ERROR( cudaMemcpy( data.dev_constSrc, temp,imageSize,cudaMemcpyHostToDevice ) );    // initialize the input datafor (int y=800; y<DIM; y++) {for (int x=0; x<200; x++) {temp[x+y*DIM] = MAX_TEMP;}}HANDLE_ERROR( cudaMemcpy( data.dev_inSrc, temp,imageSize,cudaMemcpyHostToDevice ) );free( temp );bitmap.anim_and_exit( (void (*)(void*,int))anim_gpu,(void (*)(void*))anim_exit );
}

Cuda By Example - 11 (Texture Memory 2-D)

跟1D一样，2D的代码也没有运行过。旧的方法看看就好。声明二维Texture texture<float, 2> texConstSrc; texture<float, 2> texIn; texture<float, 2> texOut; 访问二维Texture 使用2D的Texture的便利性体现在blend_kernel函数里。不再需要通…...

编程日记 2024/11/1 15:16:52

Go匿名结构体使用场景

1. 定义在 Go 语言中，匿名结构体（Anonymous Struct）是一种没有显式命名的结构体类型。你可以直接在代码中定义并使用匿名结构体，而不需要为其定义一个单独的类型名称。匿名结构体通常用于临时数据结构或一次性使用的场景。匿名…...

编程日记 2024/11/1 15:14:48

Vue 发布十年了！你知道我这十年是怎么过的吗？

2014 年 2 月 3 日，Vue 在 Hacker News 上首次亮相。十年后的今天，Vue 已经成为使用最广泛的前端框架之一，拥有了一个非常丰富的生态系统。本文来梳理一下 Vue.js 十年以来的重要里程碑！ 尤雨溪，无疑是 Vue.js 背后的灵…...

编程日记 2024/11/1 15:13:46

Unity 6 来袭

这里写自定义目录标题 1.提升渲染性能1.1 降低CPU开销 Lower CPU overhead1.2.减少内存带宽1.3.高档低分辨率帧2.多人游戏创作3.扩大多平台覆盖范围3.1.增进Android平台开发4.使用Runtime AI解锁各种可能性4.1.Unity Muse4.2.Unity Sentis5.实现更具吸引力的视觉效果5.1.自适应…...

编程日记 2024/11/1 15:11:44

SpringMVC课时1

一：SpringMVC Spring MVC 是 Spring 提供的一个基于 MVC 设计模式的轻量级 Web 开发框架，本质上相当于 Servlet，负责表述层（控制层）实现简化。由于 Spring MVC 本身就是 Spring 框架的一部分，和 Spring 框架是无缝集成。二：SSM的主要作用三：SpringMVC的原理架构图 …...

编程日记 2024/11/1 15:10:43

【小白学机器学习30】样本统计的核心参数：均值/期望，方差，标准差，标准值。

目录 1 为什么我们要搞出来这么多指标/参数？ 1.1 描述统计学为啥要搞出来这么多复杂的参数？什么平均值等 1.2 所以，需要用少数几个关键数据代表1群数据 1.2.1 平均值 1.2.2 平均值的问题：方差 2 代表性的数据1：…...

编程日记 2024/11/1 15:06:39

flink1.17.2安装和使用

版本：flink1.17.2 单机模式配置 # 为了在别处连接flink-web rest.bind-address: 0.0.0.0命令 # 启动集群 bin/start-cluster.sh # 关闭集群 bin/stop-cluster.sh使用使用浏览器连接 ip:8081 使用flink-web...

编程日记 2024/11/1 15:05:38

C向C++入门-- C语言填坑

1.c参考文档我们在学习c中需要查找参照信息到是从这些文档中得到。 https://legacy.cplusplus.com/reference/ 标准只更新到C11，但是以头⽂件形式呈现，内容⽐较易看好懂。 https://zh.cppreference.com/w/cpp https://en.cppreference.com/w/ 后两…...

编程日记 2024/11/1 15:04:37

扫雷游戏（C语言详解）

扫雷游戏（C语言详解） 放在最前面的1、前言（扫雷游戏的简介）2、扫雷游戏的规则（简易版）3、代码实现（3.1）提醒一下：( i ) 提醒1：( ii ) 提醒2： &…...

编程日记 2024/11/1 15:03:36

信刻全自动光盘摆渡系统

随着各种数据传输、储存技术、信息技术的快速发展，保护信息安全是重中之重。各安全领域行业对跨网数据交互需求日益迫切。针对于业务需要与保密规范相关要求，涉及重要秘密信息，需做到安全的物理隔离，并且保证跨网数据高效安全传输…...

编程日记 2024/11/1 15:02:34

计算机网络的数据链路层

计算机网络的数据链路层数据链路层是OSI参考模型中的第二层，它位于物理层之上，网络层之下。数据链路层的主要功能是在物理层提供的服务的基础上向网络层提供服务，其最基本的服务是将源自网络层来的数据可靠地传输到相邻节点的目标机网络层。…...

编程日记 2024/11/1 15:01:31

从0开始搭建一个生产级SpringBoot2.0.X项目（三）SpringBoot接口统一返回和全局异常处理

前言最近有个想法想整理一个内容比较完整springboot项目初始化Demo。 SpringBoot接口统一返回和全局异常处理，使用ControllerAdvice ExceptionHandler 的组合来实现。一、pom文件新增依赖 <dependency><groupId>com.alibaba</groupId><ar…...

编程日记 2024/11/1 15:00:29

Mybatis-plus-扩展功能

Mybatis-plus-扩展功能一：代码生成器 AutoGenerator 是 MyBatis-Plus 的代码生成器，通过 AutoGenerator 可以快速生成 Entity、Mapper、Mapper XML、Service、Controller 等各个模块的代码，极大的提升了开发效率。功能的演示&#xff1a…...

编程日记 2024/11/1 14:59:28

【AI辅助】AWS Toolkit+AmazonQ

#偶然看到网上某up主用的这个AI工具，感觉还挺实用的，推荐大家~我们不可阻挡AI的攻势，但是成为利用它的人，也是反侵占的方式呢# AWS toolkit Amazon Q 安装 VScode--Extensions--搜索工具--安装安装后，工具栏会多出对…...

编程日记 2024/11/1 14:58:27

云手机简述（概况，使用场景，自己部署云手机）

背景最近经常会看到云手机的相关广告，手痒难耐，了解一下。我的主要需求： Android 已 root，能够做一些自动化等高级功能。能够通过远程adb 控制手机。能够尽量的少花钱，最好是能够提供动态创建删除手机的方式&…...

编程日记 2024/11/1 14:57:26

Java已死，大模型才是未来？

作者：不惑_ 引言在数字技术的浪潮中，编程语言始终扮演着至关重要的角色。Java，自1995年诞生以来，便以其跨平台的特性和丰富的生态系统，成为了全球范围内开发者们最为青睐的编程语言之一然而，随着技术的…...

编程日记 2024/11/1 14:56:24

NCCL安装（Ubuntu等）

目录一、NCCL的定义二、安装NCCL的原因1、加速多GPU通信2、支持流行的深度学习框架3、提高计算效率4、易于使用和集成5、可扩展性三、NCCL安装方法1、下载安装包2、更新APT数据库3、使用APT安装libnccl2包，另外，如果需要使用NCCL编译应用程序&#xff…...

编程日记 2024/11/1 14:55:23

#-*-coding:utf-8-*- # date:2021-03-21 # Author: DataBall - Xian # Function: 加载视频并显示import cv2 if __name__ "__main__":#加载视频cap cv2.VideoCapture(./video/1.mp4)while True:ret, img cap.read()# 获取相机图像if ret True:# 如果 ret 返回值为…...

编程日记 2024/11/1 14:53:21

数据结构模拟题［五］

数据结构试卷（五） 一、选择题 (20 分) 1．数据的最小单位是（ ）。 (A) 数据项 (B) 数据类型 (C) 数据元素 (D) 数据变量 2．设一组初始记录关键字序列为 (50 ，40， 95，20…...

编程日记 2024/11/1 14:49:17

IDEA切换窗口快捷键失效

问题描述： 在idea中，如果切换窗口的快捷键（Alt Tab）失效了，可以通过清除缓存的方式修复...

编程日记 2024/11/1 14:47:15

ROS机器人仿真平台深度解析：从Gazebo集成到多模态感知系统架构设计

ROS机器人仿真平台深度解析：从Gazebo集成到多模态感知系统架构设计【免费下载链接】wpr_simulation 项目地址: https://gitcode.com/gh_mirrors/wp/wpr_simulation 技术原理深度解析 ROS-Gazebo协同仿真架构 WPR仿真平台基于ROS（Robot Operat…...

编程新知 2026/5/21 9:18:21

Show-o2 3D Causal VAE空间：为文本、图像和视频模态提供可扩展解决方案

Show-o2 3D Causal VAE空间：为文本、图像和视频模态提供可扩展解决方案【免费下载链接】Show-o [ICLR & NeurIPS 2025] Repository for Show-o series, One Single Transformer to Unify Multimodal Understanding and Generation. 项目地址: https://gitcod…...

编程新知 2026/5/21 9:16:14

ViGEmBus：让Windows游戏外设兼容性不再是难题

ViGEmBus：让Windows游戏外设兼容性不再是难题【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 你是否曾经遇到过心爱的游戏手柄在Windows上无法被…...

编程新知 2026/5/21 8:59:09

如何彻底解决Mac设备滚动方向冲突：Scroll Reverser终极配置指南

如何彻底解决Mac设备滚动方向冲突：Scroll Reverser终极配置指南【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 你是不是经常在Mac上同时使用触控板和鼠标&#xff0…...

编程新知 2026/5/21 8:48:26

tars 环境安装及开发部署

参考：https://tarscloud.github.io/TarsDocs/installation/source-windows.html 安装环境安装nodejs、vs（已安装了vs2022）、cmake（已安装，版本是3.30.0）、git（已安装，版本是2.45.2）、Mysql 下载并安装nodejs https://nodejs.org/en/ 版本是22.15.0 添加到环…...

编程新知 2026/5/21 7:32:54

2026年京东云OpenClaw/Hermes Agent配置Token Plan详细方法汇总

2026年京东云OpenClaw/Hermes Agent配置Token Plan详细方法汇总。OpenClaw是开源的个人AI助手，Hermes Agent则是一个能自我进化的AI智能体框架。阿里云提供计算巢、轻量服务器及无影云电脑三种部署OpenClaw 与 Hermes Agent的方案、百炼Token Plan兼容主流 AI 工具&…...

编程新知 2026/5/21 7:30:54

别再为printf发愁了！华大HC32L13x单片机串口打印的三种实战配置（Keil MDK环境）

华大HC32L13x单片机串口打印的三种高效配置方案在嵌入式开发中，printf函数作为调试利器，其重要性不言而喻。然而，当您拿到华大HC32L13系列单片机官方SDK，按照常规ARM单片机经验配置printf时，却发现串口毫无反应——这…...

编程新知 2026/5/21 7:24:18

从零搭建CXL设备模拟器：手把手实现CXL.cache协议的关键Opcode

从零搭建CXL设备模拟器：手把手实现CXL.cache协议的关键Opcode 在异构计算架构快速发展的今天，CXL（Compute Express Link）协议正成为连接CPU与加速器设备的关键纽带。作为CXL三大协议之一，CXL.cache协议通过定义设备与主…...

编程新知 2026/5/21 7:17:36

Vue3 + Vitest 浏览器测试从零开发指南

一、我们要做什么？ 写一个 Vue3 计数器组件（显示名字点按钮数字1）写 Vitest 自动化测试（让电脑自动验证功能是否正确）全程不用弹浏览器，在终端就能看到测试结果 ✅二、准备工作（只需要 1 个软…...

编程新知 2026/5/21 6:45:01

跨境电商作图不纠结！风格全覆盖， AI 工具帮你省超多心

做跨境电商这么多年，最头疼的从来不是选品和运营，而是作图！不同平台风格要求不一样、不同国家审美差异大、小白没设计基础、外包贵还改到崩溃… 相信不少跨境卖家都跟我一样，在作图这件事上踩过无数坑。今天就以老卖家的身份&…...

编程新知 2026/5/21 6:42:53

Cuda By Example - 11 (Texture Memory 2-D)

访问二维Texture

二维Texture绑定

解除绑定

完整代码

相关文章：

Cuda By Example - 11 (Texture Memory 2-D)

Go匿名结构体使用场景

Vue 发布十年了！你知道我这十年是怎么过的吗？

Unity 6 来袭

SpringMVC课时1

【小白学机器学习30】样本统计的核心参数：均值/期望，方差，标准差，标准值。

flink1.17.2安装和使用

C向C++入门-- C语言填坑

扫雷游戏（C语言详解）

信刻全自动光盘摆渡系统

计算机网络的数据链路层

从0开始搭建一个生产级SpringBoot2.0.X项目（三）SpringBoot接口统一返回和全局异常处理

Mybatis-plus-扩展功能

【AI辅助】AWS Toolkit+AmazonQ

云手机简述（概况，使用场景，自己部署云手机）

Java已死，大模型才是未来？

NCCL安装（Ubuntu等）

加载视频显示 - python 实现

数据结构模拟题［五］

IDEA切换窗口快捷键失效

ROS机器人仿真平台深度解析：从Gazebo集成到多模态感知系统架构设计

Show-o2 3D Causal VAE空间：为文本、图像和视频模态提供可扩展解决方案

ViGEmBus：让Windows游戏外设兼容性不再是难题

如何彻底解决Mac设备滚动方向冲突：Scroll Reverser终极配置指南

tars 环境安装及开发部署

2026年京东云OpenClaw/Hermes Agent配置Token Plan详细方法汇总

别再为printf发愁了！华大HC32L13x单片机串口打印的三种实战配置（Keil MDK环境）

从零搭建CXL设备模拟器：手把手实现CXL.cache协议的关键Opcode

Vue3 + Vitest 浏览器测试从零开发指南

跨境电商作图不纠结！风格全覆盖， AI 工具帮你省超多心