当前位置: 首页 > article >正文

CANN/DeepSeek-OCR-2推理适配

DeepSeek-OCR-2【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer项目简介基于 vLLM-Ascend 的 DeepSeek-OCR-2 模型昇腾 NPU 推理适配方案支持高精度文档 OCR 识别与 Markdown 格式输出此适配任务由智子芯元 KernelCAT 智能体工具自动化完成。功能特性✅ NPU 原生 MOE 算子支持✅ 非侵入式适配方案✅ 模块化设计易于维护和升级✅ 支持单图、PDF 文档和批量评估✅ 结构化 Markdown 输出硬件要求项目要求昇腾设备Atlas 800I/T A2内存≥ 32GB磁盘≥ 50GB (模型存储)快速开始基础环境本项目基于 vllm-ascend v0.8.5rc1 开发可以使用以下镜像docker pull quay.io/ascend/vllm-ascend:v0.8.5rc1创建容器docker run -it -d --nethost --shm-size512g \ --privileged \ --name ds-ocr-2 \ --device/dev/davinci_manager \ --device/dev/hisi_hdc \ --device/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \ -v /usr/local/sbin:/usr/local/sbin:ro \ -v /data/model_weight:/data \ quay.io/ascend/vllm-ascend:v0.8.5rc1 /bin/bash模型下载pip install modelscope -i https://mirrors.huaweicloud.com/repository/pypi/simple # 下载模型 modelscope download --model deepseek-ai/DeepSeek-OCR-2 --local_dir /data/models/DeepSeek-OCR-2参数说明--model: 模型名称--local-dir: 模型存储路径项目部署将本项目包下载后放在容器内/workspace目录下或通过git clone进行拉取。cd /workspace git clone https://gitcode.com/cann/cann-recipes-infer.git cd cann-recipes-infer/contrib/vllm-deepseek-ocr-2执行转换脚本./convert_to_npu.sh脚本会自动安装 Python 依赖包einops, addict, easydict, triton-ascend, PyMuPDF, img2pdf克隆 DeepSeek-OCR-2 源码应用 NPU 适配补丁输出到deepseek_ocr2_npu/目录配置文件修改cd deepseek_ocr2_npu # 初始化环境变量 source set_env.sh # 编辑 config.py 修改以下参数 vi config.py # - MODEL_PATH: 模型路径如 /data/models/DeepSeek-OCR-2 # - INPUT_PATH: 输入文件路径 # - OUTPUT_PATH: 输出文件路径运行推理# 图片流式输出 python run_dpsk_ocr2_image.py # PDF 处理 python run_dpsk_ocr2_pdf.py # 图片批量处理 python run_dpsk_ocr2_eval_batch.py注意使用批量处理脚本时config.py中输入图片路径应为图片文件夹路径性能测试单卡python benchmark.py --image /path/to/image.jpg --concurrent 1,8,16 --warmup 2 --rounds 3参数说明参数说明默认值--image图片文件或目录必填--concurrent并发数列表1,8,16--warmup预热轮数2--rounds测试轮数5--max-tokens最大输出 token8192--gpu-mem显存利用率0.85--output结果输出文件benchmark_results.txt性能数据并发数输出吞吐 (tokens/s)总吞吐 (tokens/s)140.5096.784106.50292.688212.52584.0232413.681136.8164486.621337.26100550.451512.68适配内容MOE 算子: 使用 vllm-ascend 的fused_experts替换 CUDA 实现注意力机制: 注释flash_attn使用 SDPANPU 配置:ENFORCE_EAGERTrue、gpu_memory_utilization0.85项目结构vllm-deepseek-ocr-2/ ├── convert_to_npu.sh # 一键转换脚本 ├── README.md ├── LICENSE └── npu_patch/ ├── deepseek_ocr2_npu.py # NPU MOE 补丁 └── set_env.sh # 环境初始化故障排除问题解决方案指定 NPU 设备export ASCEND_RT_VISIBLE_DEVICES0KernelCAT内测申请KernelCAT限时免费内测中欢迎体验https://kernelcat.cn项目参考DeepSeek AI - DeepSeek-OCR-2 模型vLLM - 高效 LLM 推理框架vLLM-Ascend - vLLM 昇腾适配Meta SAM - 视觉编码器许可证本项目采用 MIT License 开源许可。本项目包含以下第三方代码SAM (Meta) - Apache License 2.0DeepSeek-VL2 (DeepSeek AI) - MIT LicensevLLM - Apache License 2.0【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/DeepSeek-OCR-2推理适配

DeepSeek-OCR-2 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 项目简介 基于 vLLM-Ascend 的 DeepSeek-OCR-2 模型昇腾…...

OnmyojiAutoScript:基于AI的阴阳师自动化脚本架构深度解析

OnmyojiAutoScript:基于AI的阴阳师自动化脚本架构深度解析 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 作为一款专为《阴阳师》手游设计的智能辅助工具&#xff0…...

2026最权威的六大降AI率方案推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 一键生成论文技术近些年于学术辅助范畴快速兴起,其关键价值是借助自然语言处理跟…...

HarmonyOS 6 ArkUI 运动路径动画(motionPath)使用文档

文章目录运动路径动画核心1. 组件作用2. 核心适用场景3. 官方标准参数示例代码解析1 状态变量定义2 运动路径动画核心配置对应功能解析:3 动画触发逻辑对应功能:4 布局控制运行效果完整代码总结运动路径动画核心 1. 组件作用 motionPath 是 ArkUI 提供…...

AGI赋能物联网:从数据管道到智能体网络的范式革命

1. 项目概述:当AGI遇见物联网,一场静默的范式革命最近和几位做物联网平台和边缘计算的朋友聊天,大家不约而同地提到了一个词:AGI,也就是通用人工智能。这让我意识到,我们可能正站在一个技术融合的奇点上。过…...

CANN/hcomm HCCL通信管理器API

HcclGetRootInfo 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT:支持A…...

从设备树到CAN总线:在RK3399开发板上用SPI驱动MCP2515的保姆级避坑指南

从设备树到CAN总线:在RK3399开发板上用SPI驱动MCP2515的保姆级避坑指南 RK3399作为一款性能强劲的六核处理器,在工业控制和嵌入式领域有着广泛的应用。而CAN总线作为一种高可靠性的现场总线协议,在汽车电子和工业自动化中扮演着重要角色。本文…...

调节效应不只是‘分组回归’:用真实商业案例讲透它在AB测试与产品策略中的应用

调节效应不只是‘分组回归’:用真实商业案例讲透它在AB测试与产品策略中的应用 在互联网产品的迭代优化中,AB测试已成为验证新功能效果的标准工具。但当我们发现某个新功能的整体效果"不显著"时,是否就意味着这个功能毫无价值&…...

cann/cann-recipes-infer DeepSeek-R1推理优化

DeepSeek-R1或Kimi-K2模型在NPU实现高性能推理 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 概述 DeepSeek-R1和Kim…...

基于LangChain.js与Azure构建企业级RAG聊天应用实战指南

1. 项目概述:构建一个基于LangChain.js的RAG聊天应用 如果你正在寻找一个能快速上手的、企业级的AI聊天应用模板,这个项目绝对值得你花时间研究。它不是一个简单的“Hello World”示例,而是一个完整的、生产就绪的解决方案,展示了…...

长期项目使用Taotoken按Token计费带来的成本可控性体验

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 长期项目使用Taotoken按Token计费带来的成本可控性体验 在中长期AI应用项目的开发与维护过程中,成本管理是一个贯穿始终…...

CANN/shmem Root Info工具指南

Root Info Generate 工具 - 用户指南 【免费下载链接】shmem CANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。 项目地址: https://gitcode.com/cann/shmem 概述 root_info_generat…...

OpenClaw-Lightcone插件:为AI智能体赋予云端计算机操作能力

1. 项目概述:当AI智能体获得“云端之手” 如果你正在探索AI智能体(Agent)的边界,尤其是如何让它们像真人一样操作电脑、浏览网页、处理数据,那么你很可能已经遇到了一个核心瓶颈: 环境依赖 。传统的浏览…...

【收藏备用】2026年版|普通人程序员如何快速切入AI行业?破除焦虑,找对落地路径

这篇文章想聊清楚一个所有小白和程序员都关心的现实问题:在AI热潮席卷各行各业的2026年,普通人到底该怎么切入AI行业、学好大模型? 如果你最近也在焦虑、在内耗,看着每天冒出的AI新工具、新概念,不知道该学什么、不知道…...

动态域名解析工具diny:基于Cloudflare API的轻量级DDNS解决方案

1. 项目概述:一个轻量级、可定制的动态域名解析工具最近在折腾个人服务器和家庭网络服务时,我又一次被动态公网IP的问题给绊住了。相信很多自己搭网站、建NAS或者跑一些自研服务的朋友都深有体会:运营商给的公网IP说变就变,一旦IP…...

如何搭建个人游戏云:Sunshine串流服务器完全指南

如何搭建个人游戏云:Sunshine串流服务器完全指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine Sunshine是一款开源的自托管游戏串流服务器,专为Moonlight…...

35岁转行AI,社恐杨老师教你如何在大模型时代找到自己的坐标(收藏版)

本文分享了AI开发者“社恐杨老师”的真实故事,他35岁从化学工程转向AI领域,通过自学补齐机器学习底层数学,并成功将AI技术落地企业真实场景。文章核心内容包括:从AI 1.0到AI 2.0,技术会变但“寻找有效需求”是长期不变…...

CANN/asc-tools msobjdump工具

msobjdump 【免费下载链接】asc-tools Ascend C Tools仓是CANN基于Ascend C编程语言推出的配套调试工具仓。 项目地址: https://gitcode.com/cann/asc-tools 概述 本工具主要针对生成的算子ELF文件(Executable and Linkable Format)提供解析和解…...

完全掌握Blender插件:5大实战技巧高效处理虚幻引擎PSK/PSA格式

完全掌握Blender插件:5大实战技巧高效处理虚幻引擎PSK/PSA格式 【免费下载链接】io_scene_psk_psa A Blender extension for importing and exporting Unreal PSK and PSA files 项目地址: https://gitcode.com/gh_mirrors/io/io_scene_psk_psa io_scene_psk…...

EFGP查提交申请记录

select serialNumber,processInstanceName, subject, (case when currentState1 then 進行中 when currentState3 then 已結案 when currentState4 then 已撤銷 when currentState0 then 未開始 else 已暫停 end) from ProcessInstance(nolock) where left(serialNumber,4)L…...

CANN竞赛Add算子测试设计

决赛题目:Add 算子测试用例设计 【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 任务说明 本题目要求参赛者为 CANN …...

Java基础十六:枚举,包,反射

一、枚举(Enum) 1. 什么是枚举 枚举是一种特殊的类,用于定义一组固定的常量。 2. 基本用法 // 最简单的枚举 public enum Season {SPRING, SUMMER, AUTUMN, WINTER }// 使用枚举 public class TestEnum {public static void main(String[…...

如何彻底解决显卡驱动冲突问题:Display Driver Uninstaller深度解析与实战指南

如何彻底解决显卡驱动冲突问题:Display Driver Uninstaller深度解析与实战指南 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/displ…...

论文阅读:MMA: Multi-Modal Adapter for Vision-Language Models

MMA:视觉语言模型的多模态适配器,主要用于改善文本与视觉分支表示之间的对齐,先分析 CLIP 不同层特征的“判别性 / 泛化性”,再只在高层插入一个带共享投影层的多模态适配器,让视觉和文本分支在学习任务特异知识的同时…...

华为CANN/ops-math反射填充3D梯度算子

ReflectionPad3dGrad 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推…...

OnmyojiAutoScript:阴阳师手游智能自动化脚本终极指南

OnmyojiAutoScript:阴阳师手游智能自动化脚本终极指南 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 阴阳师手游的日常任务繁重,从御魂副本到百鬼夜行&a…...

从入门到精通:彻底讲懂Agent的Skill,不做“炫技式浪费”

写在前面 现在做Agent,有一个非常典型的误区: 👉 Skill越多 Agent越强 于是开始疯狂堆Skill、堆工具、堆能力。 结果是什么? • Token飞速消耗• 调用混乱• 成本暴涨• 但任务反而做不好 本质上,这不是“在做A…...

Ceph 对象存储深度解析系列 第二部分:RGW 数据路径、分片和自动化

新钛云服已累计为您分享896篇技术干货简介在本深度解析的第一部分中,我们剖析了 Ceph RGW 内部的高性能请求路径。我们涵盖了其无状态前端、基础 RADOS 存储池以及关键的桶索引,揭示了动态分片如何使单个桶内的对象列表实现几乎无限的可扩展性。我们确立…...

Godot引擎集成本地大语言模型:从原理到实战的完整指南

1. 项目概述:在Godot引擎中集成本地大语言模型 如果你是一名游戏开发者,最近肯定没少听说AI在游戏开发中的应用。从自动生成对话到设计游戏机制,大语言模型(LLM)展现出的潜力让人兴奋。但一提到实际集成,很…...

联邦学习与Transformer融合:在CV与入侵检测中的隐私保护分布式智能实践

1. 项目概述与核心价值最近几年,我一直在关注一个技术交叉点:如何让模型在“看不见”彼此数据的情况下,还能协同进化,变得更聪明。这听起来有点像天方夜谭,但在数据隐私法规日益收紧、数据孤岛问题愈发严重的今天&…...