当前位置: 首页 > article >正文

AI 时代:祛魅、适应与重新定义蓖

指令替换项目需求将加法指令替换为减法项目目录如下/MyProject├── CMakeLists.txt # CMake 配置文件├── build/ #构建目录│ └── test.c #测试编译代码└── mypass2.cpp # pass 项目代码一测试代码示例test.c// test.c#includeint my_add(int a, int b) {return a b;}int main() {int x 10;int y 20;printf(Result: %d\n, my_add(x, y));return 0;}二编写Pass其他的固定的模板之前文章注释有这里我只注释当前项目重要的部分代码流程 遍历指令并匹配ADD指令-替换为sub指令#include llvm/IR/PassManager.h#include llvm/Passes/PassBuilder.h#include llvm/Passes/PassPlugin.h#include llvm/Support/raw_ostream.h#include llvm/IR/Function.h#include llvm/IR/BasicBlock.h#include llvm/IR/Instruction.h#include llvm/IR/Instructions.h#include llvm/IR/IRBuilder.h // --- 【新增】必须包含这个头文件using namespace llvm;namespace {struct mypass3 : public PassInfoMixin {PreservedAnalyses run(Function F, FunctionAnalysisManager ) {errs() Analyzing Function: F.getName() \n;bool changed false;//这里的2个循环获取的是遍历函数的指令(函数-代码块-指令)for (BasicBlock BB : F) {for (Instruction Inst : BB) {]//判断当前的指令是ADD指令(加法)if (Inst.getOpcode() Instruction::Add) {errs() Found ADD, changing to SUB...\n Inst \n;//创建IR构建器//在修改IR时需要用到构建器IRBuilder builder(Inst);//这里时获取ADD的操作数//%add add nsw i32 %0, %1中的%0和%1Value *lhs Inst.getOperand(0); // 左操作数Value *rhs Inst.getOperand(1); // 右操作数//这里是构建新的指令sub//其中参数是//1左操作数//2操作数//3返回的变量名相当于%add add nsw i32 %0, %1中的%addValue *newSub builder.CreateSub(lhs, rhs, new_sub);//替换指令Inst.replaceAllUsesWith(newSub);errs() Replaced with SUB: \n *lhs \n *rhs \n *newSub \n;changed true;}}}if (changed) {return PreservedAnalyses::none();}return PreservedAnalyses::all();}};}extern C LLVM_ATTRIBUTE_WEAK ::llvm::PassPluginLibraryInfollvmGetPassPluginInfo() {return {LLVM_PLUGIN_API_VERSION,mypass3,v0.1,[](PassBuilder PB) {PB.registerPipelineParsingCallback([](StringRef Name, FunctionPassManager FPM,ArrayRef) {if (Name mypass3) {FPM.addPass(mypass3());return true;}return false;});}};}三Pass的构建下面引用的是之前文章的内容构建LLVM Pass需要写CMakeLists.txt构建声明1. 配置CMake配置文件CMakeLists.txt下面的cmake配置可以直接拿去用我已经标注好需要修改的位置#cmake 版本可通过 cmake --version 判断cmake_minimum_required(VERSION 4.1.1) #----修改 cmake版本号#项目名字project(mypass2) #----修改 项目名称#导入项目的 LLVM cmake 配置文件路径(如果根据我之前文章安装这里就相同)set(LLVM_DIR D:/LLVM/llvm-project/build/lib/cmake/llvm)#----修改 llvm cmake配置路径#寻找 LLVM 的包文件#REQUIRED 找不到 LLVM 则停止构建#强制使用 LLVM 安装时生成的配置文件进行定位find_package(LLVM REQUIRED CONFIG)#将 LLVM 的 CMake 模块路径添加到当前 CMake 搜索路径中以便后续使用 include(AddLLVM)。list(APPEND CMAKE_MODULE_PATH ${LLVM_CMAKE_DIR})#引入 LLVM 提供的专用 CMake 宏include(AddLLVM)#将 LLVM 的头文件目录如 llvm/IR/Function.h加入编译器的搜索路径include_directories(${LLVM_INCLUDE_DIRS})#导入 LLVM 编译时使用的宏定义add_definitions(${LLVM_DEFINITIONS})#设置 C 标准为 C17。(这里如果不用17编译会报错)set(CMAKE_CXX_STANDARD 17)#强制要求必须支持 C17如果编译器不支持则失败。set(CMAKE_CXX_STANDARD_REQUIRED ON)#创建一个模块化的库(.dll)add_library(mypass2 MODULE mypass2.cpp) #----修改 项目名称文件名#windows不用会报错导出符号#LLVM Pass 需要暴露一些特定的入口点如 getAnalysisUsage给 opt 工具调用。set_target_properties(mypass2 PROPERTIES WINDOWS_EXPORT_ALL_SYMBOLS ON) #----修改 项目名称# 指定该 Pass 需要链接的 LLVM 核心组件。# LLVMCore: 提供 IR、Function、Module 等核心类。# LLVMSupport: 提供各种辅助工具类如 errs() 输出。target_link_libraries(mypass2 LLVMCore LLVMSupport) #----修改 项目名称文件名# 为该目标设置特定的编译器选项。# /utf-8: 告诉 MSVC 编译器使用 UTF-8 编码处理源代码防止中文注释引起的乱码或编译错误。target_compile_options(mypass2 PRIVATE /utf-8)#----修改 项目名称文件名2.编译并构建Pass打开visual studio的工作台我这里是x64 Native Tools Command Prompt for VS 2022进到build目录#构建项目#其中-DCMAKE_BUILD_TYPERelWithDebInfo不选会报错由于我之前编译的是带符号的relase版本cmake -G Ninja -DCMAKE_BUILD_TYPERelWithDebInfo ..#编译ninja最后出现下面提示即为编译成功[2/2] Linking CXX shared module mypass2.dll四使用当前的pass进到build目录#把.c文件编译为.ll#-O1 使用O1优化这里我尝试-O0不优化会导致我的pass无法应用#-Xclang -disable-llvm-passes 不使用默认的pass优化clang -S -emit-llvm -O1 -Xclang -disable-llvm-passes test.c -S -o test.ll#使用passopt -load-pass-pluginmypass2.dll -passesmypass2 test.ll -S -o test_opt.ll#编译使用pass后的execlang test_opt.ll -o test_opt.exe#编译使用pass前的execlang test.ll -o test.exe输出结果运行test.exe不使用pass输出结果如下Result: 30运行test_opt.exe使用pass后输出结果如下Result: -10烈看捣晌

相关文章:

AI 时代:祛魅、适应与重新定义蓖

指令替换 项目需求:将加法指令替换为减法 项目目录如下 /MyProject ├── CMakeLists.txt # CMake 配置文件 ├── build/ #构建目录 │ └── test.c #测试编译代码 └── mypass2.cpp # pass 项目代码 一,测试代码示例 test.c // test.c #includ…...

chromeplugin虑

正文 异步/等待解决了什么问题? 在传统同步I/O操作中(如文件读取或Web API调用),调用线程会被阻塞直到操作完成。这在UI应用中会导致界面冻结,在服务器应用中则造成线程资源的浪费。async/await通过非阻塞的异步操作解…...

避坑指南:Win10安装PyTorch2.0时CUDA版本冲突的那些事儿

深度学习环境搭建实战:PyTorch 2.0与CUDA版本冲突的终极解决方案 刚接触深度学习的开发者往往会在环境搭建阶段遭遇"版本地狱"——尤其是当PyTorch要求的CUDA版本与本地安装的NVIDIA驱动不匹配时,系统弹出的错误提示足以让人抓狂。本文将带你…...

用Stata复现经典论文:Card Krueger (1994)最低工资DID分析全流程(含数据与代码)

用Stata复现经典论文:Card & Krueger (1994)最低工资DID分析全流程 1994年,经济学家David Card和Alan Krueger发表了一篇颠覆传统经济学认知的经典论文,他们通过对比新泽西州和宾夕法尼亚州快餐店就业数据,发现最低工资上涨并…...

【PCL-8】从PCA到OBB:点云最小包围盒的数学原理与PCL实战

1. 点云包围盒:从AABB到OBB的进化 当我们处理三维点云数据时,经常需要用一个简单的几何体来近似表示复杂的点云形状。这就是包围盒(Bounding Box)的概念。最常见的两种包围盒是AABB(轴对齐包围盒)和OBB&…...

ThinkPad T480黑苹果终极指南:如何用OpenCore配置实现完美macOS体验?

ThinkPad T480黑苹果终极指南:如何用OpenCore配置实现完美macOS体验? 【免费下载链接】t480-oc 💻 Lenovo ThinkPad T480 / T580 / X280 Hackintosh (macOS Monterey 12.x - Sequoia 15.x) - OpenCore 项目地址: https://gitcode.com/gh_mi…...

数字万用表的二极管档和电阻档,测LED到底该用哪个?实测对比给你看

数字万用表的二极管档和电阻档,测LED到底该用哪个?实测对比给你看 当你面对一个未知好坏的LED,手头只有一块数字万用表时,可能会纠结该选择哪个档位进行测量。是二极管档?电阻档?还是传统的电压档&#xff…...

操作系统层优化:为 Stable Yogi 模型部署调优 Linux 内核参数

操作系统层优化:为 Stable Yogi 模型部署调优 Linux 内核参数 如果你已经成功部署了 Stable Yogi 模型,但总觉得它的推理速度还能再快一点,或者在高并发请求下系统偶尔会卡顿、报错,那么问题可能不在模型本身,而在于它…...

从死元组到事务回卷:图解PostgreSQL的MVCC机制与VACUUM底层原理

从死元组到事务回卷:图解PostgreSQL的MVCC机制与VACUUM底层原理 当你在PostgreSQL中执行一条简单的UPDATE语句时,数据库内部究竟发生了什么?这个看似平常的操作背后,隐藏着一套精妙的多版本并发控制(MVCC)机…...

AutoGen Studio实战:用Qwen3-4B模型快速打造智能客服助手

AutoGen Studio实战:用Qwen3-4B模型快速打造智能客服助手 1. AutoGen Studio简介 AutoGen Studio是一个低代码AI代理开发平台,它让开发者能够快速构建、组合和部署AI代理应用。基于AutoGen AgentChat框架构建,提供了可视化界面来管理多代理…...

BGE Reranker-v2-m3性能优化:算法与工程实践

BGE Reranker-v2-m3性能优化:算法与工程实践 1. 引言 在信息检索和RAG(检索增强生成)应用中,重排序模型的质量和效率直接影响着最终的用户体验。BGE Reranker-v2-m3作为北京智源研究院推出的轻量级重排序模型,凭借其…...

【操作系统】CTFos Pro-专为CTF优化的高性能虚拟机正式版

1. CTFos Pro虚拟机:专为CTF优化的高性能解决方案 如果你经常参加CTF比赛或者进行安全研究,肯定遇到过这样的烦恼:每次搭建环境都要耗费大量时间,各种工具安装配置让人头疼,不同比赛需要的环境还不一样。CTFos Pro就是…...

Gemini-CLI 从零到精通的命令行AI开发指南

1. 认识Gemini-CLI:你的命令行AI助手 第一次听说Gemini-CLI时,我也觉得这不过又是一个AI玩具。直到在本地终端里用它5分钟写完一个Python爬虫脚本,才意识到这个命令行工具的强大。简单来说,Gemini-CLI就像把Google最先进的AI模型…...

【华为云CCE实战】内网环境下的Nacos集群容器化部署全流程

1. 内网环境下的Nacos集群部署挑战 在企业级微服务架构中,Nacos作为服务注册中心和配置中心扮演着关键角色。但在内网隔离环境下部署Nacos集群,就像在没有GPS信号的隧道里组车队——既需要确保每辆车(节点)都能互相定位&#xff0…...

DanmakuFactory:解决弹幕格式兼容性难题的专业转换工具

DanmakuFactory:解决弹幕格式兼容性难题的专业转换工具 【免费下载链接】DanmakuFactory 支持特殊弹幕的xml转ass格式转换工具 项目地址: https://gitcode.com/gh_mirrors/da/DanmakuFactory 在视频创作和弹幕文化日益普及的今天,不同平台间的弹幕…...

Graphormer与经典力学的结合:分子动力学模拟初始结构筛选

Graphormer与经典力学的结合:分子动力学模拟初始结构筛选 1. 引言:当AI遇上分子模拟 想象你是一位计算化学研究员,每天要花费数小时等待分子动力学模拟结果。传统方法需要从零开始计算每个分子构象的能量和稳定性,这个过程既耗时…...

MacOS上MPV播放器隐藏技巧:如何自定义画面旋转快捷键(附完整配置步骤)

MacOS上MPV播放器隐藏技巧:如何自定义画面旋转快捷键(附完整配置步骤) 在视频播放领域,MPV以其轻量级和高度的可定制性赢得了技术爱好者的青睐。不同于主流播放器的固定功能模式,MPV更像是一个开放的工具箱&#xff0c…...

告别环境冲突!用Anaconda虚拟环境搞定QGIS 3.18二次开发(附Pycharm代码补全修复)

告别环境冲突!用Anaconda虚拟环境搞定QGIS 3.18二次开发(附Pycharm代码补全修复) 当你在深夜调试QGIS插件时,突然发现昨天还能运行的脚本今天报了一堆依赖错误——这种场景对GIS开发者来说再熟悉不过了。环境冲突、版本不匹配、ID…...

如何在Mac上原生读写NTFS硬盘?终极指南与免费工具推荐

如何在Mac上原生读写NTFS硬盘?终极指南与免费工具推荐 【免费下载链接】Free-NTFS-for-Mac Nigate: An open-source NTFS utility for Mac. It supports all Mac models (Intel and Apple Silicon), providing full read-write access, mounting, and management fo…...

如何用wiliwili打造终极跨平台B站客户端:Switch、PS4、PC全平台手柄媒体中心

如何用wiliwili打造终极跨平台B站客户端:Switch、PS4、PC全平台手柄媒体中心 【免费下载链接】wiliwili 第三方B站客户端,目前可以运行在PC全平台、PSVita、PS4 、Xbox 和 Nintendo Switch上 项目地址: https://gitcode.com/GitHub_Trending/wi/wiliwi…...

CKKS 同态加密数学基础推导律

背景 StreamJsonRpc 是微软官方维护的用于 .NET 和 TypeScript 的 JSON-RPC 通信库,以其强大的类型安全、自动代理生成和成熟的异常处理机制著称。在 HagiCode 项目中,为了通过 ACP (Agent Communication Protocol) 与外部 AI 工具(如 iflow …...

【多模态提示学习实战】MaPLe:如何通过视觉-语言提示耦合提升CLIP下游任务泛化能力

1. 为什么需要多模态提示学习? 如果你用过CLIP这类视觉-语言预训练模型,可能会发现一个尴尬现象:官方发布的预训练模型在标准测试集上表现惊艳,但一到实际业务场景就频频翻车。我在去年做一个商品识别项目时就深有体会——用CLIP直…...

clangd配置与优化:从入门到精通

1. 为什么你需要clangd? 如果你经常写C/C代码,肯定遇到过代码跳转卡顿、补全不准的问题。我之前用传统工具时,经常遇到跳转到错误文件、补全列表半天刷不出来的情况,特别是处理大型项目时,一个简单的函数跳转可能要等上…...

Unlocking Zero-Shot Image Tagging: A Deep Dive into RAM Model‘s Automated Annotation Pipeline

1. RAM模型如何革新图像标注领域 第一次接触RAM模型时,我被它"凭空"给图片打标签的能力震惊了。就像有个不知疲倦的助手,能自动给相册里所有照片写上"海滩""生日蛋糕""宠物狗"这样的描述。这背后是零样本学习&a…...

深入解析CANFD的位定时优化与同步策略

1. CANFD协议基础与位定时核心概念 CANFD(Controller Area Network Flexible Data-rate)作为传统CAN协议的升级版,最显著的特点是支持"双速率"传输——仲裁阶段保持传统速率(通常500kbps),数据阶…...

UE5 Modify Curve 蓝图节点:五种 Apply Modes 的实战应用解析

1. Modify Curve节点基础:动画曲线的动态操控利器 在UE5动画系统中,Modify Curve节点就像给动画师配了把瑞士军刀。我去年做角色表情动画时,发现传统的关键帧调整方式效率太低,直到用上这个节点才真正体会到实时操控曲线值的快感。…...

用Python和PyTorch复现CVPR2019 DIM攻击:如何通过随机缩放和填充提升对抗样本的‘黑盒’攻击力

用Python和PyTorch实战CVPR2019 DIM攻击:从理论到代码的完整实现指南 对抗样本研究领域近年来发展迅猛,而CVPR2019提出的DIM(Diverse Input Method)方法因其出色的黑盒攻击能力成为经典。本文将带您从零开始,用PyTorch…...

SpringCloud进阶--Seata与分布式事务某

起因是我想在搞一些操作windows进程的事情时,老是需要右键以管理员身份运行,感觉很麻烦。就研究了一下怎么提权,顺手瞄了一眼Windows下用户态权限分配,然后也是感谢《深入解析Windows操作系统》这本书给我偷令牌的灵感吧&#xff…...

避坑指南:在Docker中部署mmdetection旋转目标检测模型(CUDA 11 + PyTorch 1.7)

深度解析:在Docker中高效部署mmdetection旋转目标检测模型的技术实践 当我们将训练好的mmdetection旋转目标检测模型部署到生产环境时,Docker容器化部署往往是最佳选择。但在实际工程落地过程中,从本地开发环境到容器化部署的迁移并非一帆风…...

避坑指南:宝塔Nginx反向代理配置中常见的5个错误及解决方法

避坑指南:宝塔Nginx反向代理配置中常见的5个错误及解决方法 当你第一次尝试在宝塔面板中配置Nginx反向代理时,可能会遇到各种意想不到的问题。作为一款强大的Web服务器,Nginx的反向代理功能确实能为我们的网站架构带来诸多便利,但…...