当前位置：首页 > news >正文

ubuntu 18.04 cuda 11.01 gpgpu-sim 裸机编译

news 2026/2/9 18:43:09

1，环境

ubuntu 18.04

x86_64

cuda 11.01

gpgpu-sim master

commit 90ec3399763d7c8512cfe7dc193473086c38ca38

2，预备环境

一个比较新的 ubuntu 18.04，为了迎合 cuda 11.01 的版本需求

安装如下软件：

sudo apt-get install -y     xutils-dev bison zlib1g-dev flex libglu1-mesa-dev doxygen graphviz     python-pmw python-ply python-numpy python-matplotlib python-pip libpng-dev

3，安装cuda sdk 11.01

下载：

wget https://developer.download.nvidia.com/compute/cuda/11.0.1/local_installers/cuda_11.0.1_450.36.06_linux.run

安装在目录 /home/hanmeimei/cuda/cuda

 bash cuda_11.0.1_450.36.06_linux.run --silent --toolkit --toolkitpath=/home/hanmeimei/cuda/cuda

设置环境变量：

export CUDA_INSTALL_PATH=/home/hanmeimei/cuda/cuda

4，下载编译 gpgpu-sim master

git clone https://github.com/gpgpu-sim/gpgpu-sim_distribution.git

cd gpgpu-sim_distribution/

设置环境：

 . setup_environment

make -j

5. 编译运行 cuda app

此时 nvcc 是刚才安装的 nvcc

vim vectorAdd.cu

#include <iostream>
#include <cuda_runtime.h>#define N 16384// write kernel function of vector addition
__global__ void vecAdd(float *a, float *b, float *c, int n)
{int i = threadIdx.x + blockDim.x * blockIdx.x;if (i < n)c[i] = a[i] + b[i];
}int main()
{float *a, *b, *c;float *d_a, *d_b, *d_c;int size = N * sizeof(float);// allocate space for device copies of a, b, ccudaMalloc((void **)&d_a, size);cudaMalloc((void **)&d_b, size);cudaMalloc((void **)&d_c, size);// allocate space for host copies of a, b, c and setup input valuesa = (float *)malloc(size);b = (float *)malloc(size);c = (float *)malloc(size);for (int i = 0; i < N; i++){a[i] = i;b[i] = i * i;}// copy inputs to devicecudaMemcpy(d_a, a, size, cudaMemcpyHostToDevice);cudaMemcpy(d_b, b, size, cudaMemcpyHostToDevice);// launch vecAdd() kernel on GPUvecAdd<<<(N + 255) / 256, 256>>>(d_a, d_b, d_c, N);cudaDeviceSynchronize();// copy result back to hostcudaMemcpy(c, d_c, size, cudaMemcpyDeviceToHost);// verify resultfor (int i = 0; i < N; i++){if (a[i] + b[i] != c[i]){std::cout << "Error: " << a[i] << " + " << b[i] << " != " << c[i] << std::endl;break;}}std::cout << "Done!" << std::endl;// clean upfree(a);free(b);free(c);cudaFree(d_a);cudaFree(d_b);cudaFree(d_c);return 0;
}

编译：

nvcc vectorAdd.cu --cudart shared -o vectorAdd

拷贝配置文件：

cp gpgpu-sim_distribution/configs/tested-cfgs/SM7_QV100/config_volta_islip.icnt ./

 cp gpgpu-sim_distribution/configs/tested-cfgs/SM7_QV100/gpgpusim.config ./

运行app；

./vectorAdd

运行结束：

ubuntu 18.04 cuda 11.01 gpgpu-sim 裸机编译

1，环境 ubuntu 18.04 x86_64 cuda 11.01 gpgpu-sim master commit 90ec3399763d7c8512cfe7dc193473086c38ca38 2，预备环境一个比较新的 ubuntu 18.04，为了迎合 cuda 11.01 的版本需求安装如下软件： sudo apt-get instal…...

编程日记 2024/10/6 17:10:10

【Kubernetes】常见面试题汇总（五十二）

目录 116. K8S 集群服务暴露失败？ 117.外网无法访问 K8S 集群提供的服务？ 特别说明： 题目 1-68 属于【Kubernetes】的常规概念题，即 “ 汇总（一）~（二十二）” 。题目 69-…...

编程日记 2024/10/6 17:09:09

o1-preview 在 IMO 2024 第一题的实测表现

相关博客：Learning to Reason with LLMs 以及 Introducing OpenAI o1-preview 测试了 IMO 2024 的第一题，OpenAI-o1-preview 的解题过程包括两部分：思考和推理。正确答案是全体偶数，o1-preview 的 **思考方向正确，推…...

编程日记 2024/10/6 17:08:08

iOS--RunLoop原理

前言曾经在写项目的时候遇到过这么一个问题。： 项目中添加了一个tableview，然后还有一个计时器，当滑动tableview的时候会阻塞计时器，你得执行这么一段代码后，计时器才能正常运行。 RunLoop.current.add(timer, for…...

编程日记 2024/10/6 17:06:05

并查集——从LeetCode题海中总结常见套路

目录并查集定义 LeetCode128.最长连续序列先去重再sort： 改进去重的方法： 参考： 并查集定义在计算机科学中，并查集是一种树型的数据结构，用于处理一些不交集（Disjoint Sets）的合并及查…...

编程日记 2024/10/6 17:04:04

深入理解作用域【JavaScript】

一、作用域的内部原理 JavaScript 的作用域机制是理解变量如何被访问和存储的重要概念。下面详细介绍作用域的内部原理，包括编译、执行、查询、嵌套和异常处理这五个步骤。 1. 编译在 JavaScript 的执行过程中，首要的步骤是编译。尽管JavaScript是解…...

编程日记 2024/10/6 17:03:03

微信小程序实战教程：如何使用map组件实现地图功能

在微信小程序中，map组件是一个非常实用的功能，它可以帮助我们快速实现地图展示、定位、标注等操作。本文将详细介绍如何在微信小程序中使用map组件，带你轻松掌握地图开发技能。一、map组件概述 map组件是微信小程序官方提供的一个地图组件…...

编程日记 2024/10/6 17:02:01

张雪峰谈人工智能技术应用专业的就业前景！

一、张雪峰谈人工智能技术应用专业在教育咨询领域，张雪峰老师以其深入浅出的讲解和前瞻性的视角，为广大学子提供了宝贵的专业选择建议。对于人工智能技术应用专业，张雪峰老师通常给予高度评价，认为这是一个充满无限可能且就业前…...

编程日记 2024/10/6 17:01:00

机器学习课程学习周报十五

机器学习课程学习周报十五文章目录机器学习课程学习周报十五摘要Abstract一、机器学习部分1. 统计推断与贝叶斯推断2. GMM和EM算法补充3. 马尔可夫链蒙特卡罗法3.1 蒙特卡罗法3.2 马尔可夫链3.3 Diffusion模型中的马尔可夫链总结摘要本周的学习涵盖了统计推断和贝叶斯推断…...

编程日记 2024/10/6 16:57:58

rabbitMq------客户端模块

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言消费者模块信道管理模块管理的字段提供的接口信道内存管理连接管理类前言在RabbitMQ中，提供服务的是信道，因此在客⼾端的实现中&…...

编程日记 2024/10/6 16:54:56

地理定位营销与开源AI智能名片O2O商城小程序的融合与发展

摘要：本文阐述地理定位营销的概念、手段及其在商业中的应用，探讨开源AI智能名片O2O商城小程序如何与地理定位营销相结合，为企业营销带来新的机遇与挑战。一、引言在当今数字化营销的时代，地理定位营销已成为一种重要的营销手段…...

编程日记 2024/10/6 16:51:53

解决Vue应用中遇到路由刷新后出现 404 错误

解释： Vue 应用中遇到路由刷新后出现 404 错误，通常是因为 Vue 应用是个单页应用（SPA），它通过 Vue Router 管理路由，通过 HTML5 History Mode 实现页面导航无需重新加载页面。当直接访问非首页的路由或者刷…...

编程日记 2024/10/6 16:50:51

在window10下使用directml加速phi-3模型的一些记录

1.安装anaconda，安装python 安装torch等参考网上资料非常多不细描述 2.参考微软官网【在windows上通过DirectML启用Pytorch文档，检查系统版本检查gpu版本 3.参考微软官网【在windows上通过DirectML启用Pytorch】文档，安装torch_directml模…...

编程日记 2024/10/6 16:49:50

通信工程学习：什么是OSPF开放式最短路径优先

OSPF：开放式最短路径优先 OSPF（Open Shortest Path First，开放式最短路径优先）是一种内部网关协议（IGP），被广泛应用于计算机网络中，特别是在构建大型和复杂的网络时。以下是对OSPF的…...

编程日记 2024/10/6 16:48:49

《中国电子报》报道: 安宝特AR为产线作业者的“秘密武器

近日，中国电子报在其文章《下一代工业智能终端重新定义制造业》中对安宝特的增强现实（AR）解决方案给予了高度评价，称其为产线作业者的“秘密武器”。这一创新技术改变了传统制造业的作业方式，使得操作人员能够在生产过…...

编程日记 2024/10/6 16:47:48

【Android】Handler消息机制

文章目录前言概述核心组件概述Android消息机制概述 Android消息机制分析ThreadLocal的工作原理ThreadLocal基础ThreadLocal实现原理 MessageQueueLooperHandler的工作原理总结前言本文用于记录Android的消息机制，主要是指Handler的运行机制。部分内容参考自《An…...

编程日记 2024/10/6 16:46:47

大数据必懂知识点：Parquet、ORC还是Avro作为数据存储格式，哪种在性能和压缩率上更优

目录第一章相关理论 1.1 Parquet格式介绍 1.1.1 起源与发展 1.1.2 特点与优势 1.2 ORC格式介绍 1.3 Avro格式介绍 1.3.1 跨语言支持 1.3.2 动态映射 1.3.3 丰富的数据模式 1.3.4 数据模式灵活性第二章种格式性能比较 2.1 读写性能对比 2.2 查询性能对比 2.3 压…...

编程日记 2024/10/6 16:45:46

P1387 最大正方形

题目描述在一个nm 的只包含 0 和 1 的矩阵里找出一个不包含 0 的最大正方形，输出边长。输入格式输入文件第一行为两个整数n,m(1≤n,m≤100)，接下来 n 行，每行 m 个数字，用空格隔开，0 或 1。输出格式一个整数…...

编程日记 2024/10/6 16:42:42

Python知识点：如何使用Multiprocessing进行并行任务管理

开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！ 如何在Python中使用Multiprocessing进行并行任务管理在现代编程中，…...

编程日记 2024/10/6 16:41:41

React常见优化问题

在React开发中，性能优化是一个重要且持续的过程，旨在提升应用的响应速度和用户体验。以下是一些常见的React优化问题详解，并附上相应的代码示例。 1. 避免不必要的组件渲染 React组件的渲染是由其props或state的变化触发的。但是，…...

编程日记 2024/10/6 16:40:41

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2026/2/1 5:45:17

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/8/27 14:38:58

【AI学习】三、AI算法中的向量

在人工智能（AI）算法中，向量（Vector）是一种将现实世界中的数据（如图像、文本、音频等）转化为计算机可处理的数值型特征表示的工具。它是连接人类认知（如语义、视觉特征）与…...

编程新知 2026/1/1 14:01:45

linux 下常用变更-8

1、删除普通用户查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行，YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID： YW3…...

编程新知 2025/10/7 15:08:22

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

AI编程插件对比分析：CodeRider、GitHub Copilot及其他随着人工智能技术的快速发展，AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者，分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...

编程新知 2026/2/9 2:15:44

让AI看见世界：MCP协议与服务器的工作原理

让AI看见世界：MCP协议与服务器的工作原理 MCP（Model Context Protocol）是一种创新的通信协议，旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天，MCP正成为连接AI与现实世界的重要桥梁。…...

编程新知 2026/1/31 11:13:53

Mac下Android Studio扫描根目录卡死问题记录

环境信息操作系统: macOS 15.5 (Apple M2芯片)Android Studio版本: Meerkat Feature Drop | 2024.3.2 Patch 1 (Build #AI-243.26053.27.2432.13536105, 2025年5月22日构建) 问题现象在项目开发过程中，提示一个依赖外部头文件的cpp源文件需要同步，点…...

编程新知 2026/2/6 1:00:00

云原生玩法三问：构建自定义开发环境

云原生玩法三问：构建自定义开发环境引言临时运维一个古董项目，无文档，无环境，无交接人，俗称三无。运行设备的环境老，本地环境版本高，ssh不过去。正好最近对腾讯出品的云原生 cnb 感兴趣&…...

编程新知 2026/2/2 9:25:26

以光量子为例，详解量子获取方式

光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学（silicon photonics）的光波导（optical waveguide）芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中，光既是波又是粒子。光子本…...

编程新知 2026/2/7 11:51:32

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

FTP 客服管理系统实现kefu123登录，不允许匿名访问，kefu只能访问/data/kefu目录，不能查看其他目录创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...

编程新知 2026/1/25 9:03:19

1，环境

2，预备环境

3，安装cuda sdk 11.01

4，下载编译 gpgpu-sim master

5. 编译运行 cuda app

相关文章：