当前位置: 首页 > article >正文

零起点Python机器学习快速入门【1.1】

1.4 机器学习经典案例目前人工智能、机器学习正处于黄金时期各种应用随处可见以下是一些常见的机器学习应用案例。 机器人客服当你拨打移动、银行等公司的服务热线时大部分都是通过人工智能技术合成的电脑客服在和你沟通只有遇到电脑客服无法处理的问题才会转给人工处理。 语音助理苹果的 Siri 和微软的小娜就是采用人工智能开发的语音助手两者会自动识别你的语音命令。 垃圾邮件检测根据邮箱中的邮件识别哪些是垃圾邮件哪些不是。这样的模型可以使用程序帮助归类垃圾邮件和非垃圾邮件。 信用卡欺诈检测根据用户的信用卡交易记录识别哪些交易是该用户操作的哪些不是。 数字识别根据信封上手写的邮编识别出每一个手写字符所代表的数字。这样的模型可以帮助程序阅读和理解手写邮编并根据地理位置分类信件。 人脸识别根据相册中的众多数码照片识别出包含某一个人的照片根据人脸管理照片。 产品推荐根据用户的购物记录和冗长的收藏清单识别出这其中哪些是该用户真正感兴趣并且愿意购买的产品。京东、淘宝都有大量这样的案例。 医学分析根据病人的症状和病人资料数据库预测该病人可能患了什么病。 股票交易这个就是目前非常火热的智能投顾技术根据股票现在和以往的价格波动判断这支股票是应该建仓、持仓还是减仓。 客户细分根据用户在产品试用期的行为模式和所有用户过去的行为识别出哪些用户会转变成该产品的付款用户哪些不会。 形状鉴定根据用户在触摸屏幕上的手绘和一个已知的形状资料库判断用户想描绘的形状。 艺术作品鉴别艺术作品的鉴别是极其复杂的专家通常会判断它所属的类型、流派、作者和时代。新泽西州罗格斯大学的专家使用人工智能技术鉴别画作的流派和作者。 婚恋匹配国内外的婚恋交友网站经常通过性格测试来提取数据然后通过人工智能分析进行婚恋匹配。第 2 章 开发环境2.1 数据分析首选PythonPython 人工智能和机器学习在本质上底层都是数据分析而对于数据分析行业首选的编程工具就是 Python 语言。经常有网友认为自己投资失败或者量化策略失效是因为 Python 开发环境不好希望自己重新设计一个甚至希望用 C、 Java 来重新开发量化软件。对于提出这类问题的网友笔者曾经这样答复“量化的核心是策略至于量化软件的运行速度、用户 GUI 界面都是程序员的事情。大家是做金融操盘手只要会写策略就行。就像会计如果觉得 Excel、用友或金蝶财务软件的某些功能不好用另外再选一套财务软件就好完全没必要自己也去写一套财务软件。 ”在软件工程领域有一句著名的格言 “ Dont Reinvent the Wheel”——不要重复发明轮子。这句话说得非常经典也非常有道理。至于为什么选择 Python 语言作为数据分析和量化分析的首选开发平台大家可以参考 Top 极宽量化社区的介绍 《 zwPython 史前故事》。金融股票、足彩分析。机器学习等量化分析系统本质上都是数据分析如果大家有兴趣还可以浏览笔者的博客内容《大数据 why Python》 http://ziwang.com/forum. php?modviewthreadtid58。1. 入门简单功能强大Python 是最适合初学者的编程语言也是目前 IT 行业唯一的入门简单、功能强大的工业级开发平台。事实上 Python 已经超越普通编程语言成为 IT 行业的万能开发平台。 1入门简单任何熟悉 JavaScript 脚本、 Visual Basic、 C 语言、 Delphi 的用户通常一天即可学会 Python。即使是不会编程的美工设计师、打字员一周内也能熟练掌握 Python学习难度绝对不会高于 Photoshop、五笔至少笔者和许多程序员一样现在还不会使用五笔字型。zwPython 原本就是面向美工设计的最早的用户手册名字就叫《设计师学编程》。 2功能强大海量级的 Python 模块库提供了 IT 行业最前沿的开发功能。 大数据 Pandas 已经逐步碾压 R 语言。 CUDA高性能计算 Python、与 C C、 Fortran 是 NVIDIA 公司官方认可的 3 种编程语言也是目前唯一适合大众用户的 CUDA编程工具。 机器学习 TensorFlow、 PyTorch、 Scikit-learn、 Theano 都是国际上热门的机器学习平台。 自然语言 NLTK全球首选的自然语言处理平台 SpaCy工业级NLP 平台。 人脸识别 OpenCV光流算法、图像匹配、人脸算法简单优雅。 游戏开发 Pygame 提供图像、音频、视频、手柄、 AI 等全套游戏开发模块库。 字体设计 Fontforge是唯一商业级的字体设计开源软件内置的脚本语言和底层核心的 Fonttools都是基于 Python。 电脑设计 blend、 GIMP、 inkscape、 MAYA、 3DS 都内置或扩展了Python 语言支持。上述 Pandas、 CUDA、 TensorFlow、 PyTorch、 Scikit-learn、 Theano 为Python 模块库或 IT 行业术语。目前热门的 iOS、 安卓等手机 APP 应用开发也可以使用 Python 开发但基本都是商业收费模块因此未集成到 zwPython 软件包大家可以自行搜索。既然 Python 如此美好而且是 100%免费的开源软件学习 Python 的人也越来越多为什么 Python 相对于 C#、 JavaScript、 Visual Basic、 C 语言始终还只是一种小众语言呢笔者认为 Python 的“大众化”之路存在以下两个瓶颈。 配置软件行业有一句俗话“搞懂了软件配置就学会了一半”。对于 Python 和 Linux 等许多开源项目而言 80%的问题都出现在配置方面尤其是模块库的配置。 OOP面向对象程序设计大部分人都认为 Python 是一种“面向对象”的编程语言而 OOP 的编程风格业界公认比较繁杂。如果能够解决好以上两个问题 Python 的学习难度可以降低 90%而在应用领域和开发效率方面则可以瞬间提升数十倍效能而且这种提升是零成本的。2. 难度降低性能提高笔者在 WinPython 软件包的基础上推出了“ zwPython”——字王集成式 Python 开发平台。 业界首次提出“零配置、零对象”的研发理念绿色软件封装模式类似 MAC 开箱即用风格无须安装解压即可直接使用还可以放入 U 盘支持 Mob-APP 移动式开发编程。“外挂”式“核弹”级开发功能内置很多功能强大、 IT 前沿的开发模块库例如 OpenCV 视觉、人脸识别、 CUDA 高性能 GPU 并行计算 Opencl、 Pandas 大数据分析、 TensorFlow、 PyTorch 机器学习、NLTK 自然语言处理。 便于扩展用户可以轻松增删相关模块库全程智能配置无须用户干预就好像拷贝文件一样简单而且支持 U 盘移动便携模式真正实现了“一次安装随处可用”。 针对中文开发文档缺乏、零散的不足内置多部中文版 Opencv、Fontforge 和 Python 入门教材。 大量示例脚本源码涵盖 OpenCV、 CUDA、 Opencl、 Pygame 等。如此种种只是为了便于 IT 行业外的用户能够“零起步”、快速入门并且短时间内应用到生产环节当中去。zwPython 前身是 zw2015sdk字王智能字模设计平台原设计目标是向广大美工设计师提供一款统一的、可编程的字体设计平台以便于大家交流。 美工设计师、美工都是文艺青年、 IT 小白所以简单是必需的开箱即用也必须是标配。 做设计图像处理 PIL、 Matplotlib 模块是必需的。 集成了 Opencv 作为图像处理、匹配模块自然也提供了机器学习功能。 字模处理数据量很大属于大数据范畴须集成 SciPy、 NumPy 和Pandas 数据分析模块。 由于原生 Python 速度慢所以增加了 Pycuda、 Opencl 高性能 GPU计算模块。如此一而再、再而三地扩充发现 zwPython 已经基本覆盖了目前 Python和 IT 编程 90%的应用领域因此又增加了部分模块将 zwPython 扩展成为一个通用的、集成式 Python 开发平台。3.“零对象”编程模式虽然很多人认为 Python 是一种“面向对象”的编程语言。但对于初学者而言把 Python 视为一种 Basic 风格的、过程式入门语言学习难度可以降低 90%基本上学习一小时即可动手编写学习代码。有人说“面向对象”最大的好处是方便把人脑子搅乱。Windows、 Linux、 UNIX、 Mac OSX 内核都是使用 C 语言、汇编写的。有一种系统是 C写的内核就是诺基亚的塞班系统据说代码量比Windows XP 还大连他们自己的程序员都无法维护最后就死掉了。简而言之“面向对象”的代码风格一个字“繁”、两个字“繁繁”、三个字“繁繁繁”。“零对象编程模式用 Basic 的方式学习 Python”是笔者向 Python 等编程语言的入门用户提出的一种全新的学习理论一家之言仅供参考。Talk is cheap,Show me the code大家还是多多动手。大家很容易理解“零配置”下面关于“零对象”再补充几点。 不写“面向对象”风格的代码不等于不能使用对于各种采用“对象”模式开发的模块库我们仍然可以直接调用。 将 Python 视为非“面向对象”语言并非大逆不道事实上许多人认为 Python 也是一种类似 LISP 的“函数”编程语言。 笔者从事编程十多年从未用过“面向对象”模式编写过一行“ class”类对象代码依然可以应对各种编程工作。 目前“面向对象”编程理论在业界仍然争论不休入门者功力不够最好避开强者之间的火力杀伤。“面向对象”的鼻祖 C 11 标准直到 2015 年依然处于推广阶段而且争议纷纷。“面向对象”过于复杂与“人生苦短我用 Python”的优雅风格天生不合。2.2 用户运行平台本节主要讲解 Python 开发环境和数据包的配置、应用流程方面的知识。本书所有案例程序均采用纯 Python 语言开发除特别指明外均默认使用 Python 3 语法且经过 zwPython 平台测试。zwPython 是 TopQuant 极宽公司推出的一个 Python 集成版本功能强大属于免费开源软件。系统内置了数百种专业的 Python 模块库无须安装解压即用。有关 zwPython 的使用可参考软件自带的《 zwPython 用户手册》。本书所有案例程序可用于 zwPython 平台 以及各种支持 Python 3 的设备平台包括 Linux 操作系统、 Mac 苹果电脑以及安卓系统、树莓派。其他非 zwPython 用户运行本书程序时如果出现问题通常是缺少有关的 Python 模块库可以根据调试信息安装相关的 Python 模块库再运行相关程序。zwPython 及本书配套下载地址请参见 Top 极宽量化社区“下载中心” http://topquant.vip 或 http: //ziwang.com。2.3 程序目录结构本书配套程序的工作目录是 zwPython\py_demo这也是本书默认的工作目录凡是没有特别标注目录的脚本文件一般都位于该目录。有关的程序会定时在读者群发布更新请读者及时下载。相比普通的 Python 版本本书配套的教学版的 zwPython 目录中多了一个 py_demo 目录。py_demo 目录收录了相关培训课程的配套代码和所需数据 py_demo目录也可以复制到其他目录建议放到 zwPython 根目录下。zwPython 目录结构中的其他子目录如下。 \zwPython\doc\用户文档中心包括用户手册和部分中文版的模块库资料。 \zwPython\py35\ Python 3.5 版本系统目录除增加、删除模块库外一般不需要改动本目录下的文件以免出错。另外如果日后 Python 版本升级这个目录也会变化如 Python 3.6会采用 py36 作为目录。 \zwPython\demo\示例脚本源码。 \zwPython\zwrk\ zw 工作目录用户编写的脚本代码文件建议放在本目录下。 \zwPython\TFB\ Top Football又称 Top Quant for Football简称TFB极宽足彩量化分析系统快速学习版无此目录。足彩版本配套的 TFB 极宽足彩量化分析系统与 zwPython 进行了集成处理可直接输入使用支持 Python 3.x。移植时或使用其他 Python环境时可以把 TFB 目录下的脚本文件全部复制到自己的代码工作目录注意代码里面有关数据文件目录的设置。2.4 Spyder编辑器界面设置1. 开发环境界面设置在设置界面之前可随意把一个 Python 源码文件用鼠标拖到 Python编程语言编辑器 Spyder 的编辑框中如图 2-1 所示。Spyder 编辑器的界面设计非常合理参考了 MATLAB特别适合量化分析国际投行一般都选择用这种布局作为标配。通常需要优化的只有 Outline导航面板又称函数列表面板类似Delphi 语言的 Struct 函数列表面板。在 Spyder 编辑器默认配置中 Outline 面板是不显示的单击菜单 View→ Panes→Outlines如图 2-2 所示将显示 Outline 面板。Outline 面板显示后它的默认位置在代码编辑器和右侧窗口的中间。建议单击 Outline 面板左上角的“窗口缩放”按钮拖动面板到右上方将其与 Var变量面板、 File文件面板等合并。Outline 面板的作用是对代码中的函数、类、变量进行快速导航定位。单击 Outline 面板的函数、类、变量名称后左侧代码编辑器就会自动移动到相关代码如图 2-3 所示。对于大型项目而言使用 Outline 面板可以提高效率。需要注意的是由于 Spyder 软件未来版本升级具体操作界面和细节可能会有所不同本书其他软件和模块也是如此这个属于正常情况大家无须担心。2. 代码配色技巧zwPython 的 IDE 代码编辑器是 Spyder默认配色是 Spyder 模式采用白底黑字与传统的 IDE 环境差别很大如图 2-4 所示。如图 2-5 所示是最新的 delphi-xe10 的编辑器配色模式 Twilight 模式。这种黑底模式也是微软 VS 等开发平台标准的代码编辑器配色模式。幸运的是 Spyder 编辑器内置的配色模式里也有类似的模式。运行 Spyder 编辑器单击菜单 Tools→Preferences打开 Preferences对话框。在左侧的列表框中选择 Editor编辑器在右侧 Display显示面板的 Syntax color scheme语法配色方案下拉列表框中选择 Spyder/ Dark暗调模式即可。如图 2-6 所示。不同版本的 Spyder 编辑器调整细节会有所不同请读者注意。

相关文章:

零起点Python机器学习快速入门【1.1】

1.4 机器学习经典案例目前人工智能、机器学习正处于黄金时期,各种应用随处可见,以下是一些常见的机器学习应用案例。 机器人客服:当你拨打移动、银行等公司的服务热线时,大部分都是通过人工智能技术合成的电脑客服在和你沟通&am…...

电力负荷预测挑战:Informer2020如何实现长序列时间序列预测的完整解决方案

电力负荷预测挑战:Informer2020如何实现长序列时间序列预测的完整解决方案 【免费下载链接】Informer2020 The GitHub repository for the paper "Informer" accepted by AAAI 2021. 项目地址: https://gitcode.com/gh_mirrors/in/Informer2020 在…...

CTSD算法超参数调优实战:从原理到应用,解决机器翻译重复与幻觉问题

1. 项目概述:当机器翻译开始“复读”,我们如何用CTSD算法精准调校?在机器翻译的实际部署和优化中,一个让工程师和研究者都颇为头疼的问题是:模型有时会像卡住的唱片一样,反复输出相同的词或短语。这种现象&…...

零起点Python机器学习快速入门【1.0】

第 1 章 从阿尔法狗开始说起1.1 阿尔法狗的前世今生百度百科的“阿尔法狗”词条是:阿尔法狗( AlphaGo)是一款围棋人工智能程序,由谷歌( Google)旗下 DeepMind 公司的戴密斯哈萨比斯、大卫席尔瓦、黄士杰与他…...

Android应用架构规范深度解析与面试指南

引言 在Android应用开发中,架构设计是确保应用可维护性、可扩展性和稳定性的核心要素。随着移动应用的复杂度日益增加,采用规范的架构模式不仅能提升开发效率,还能减少错误和重构成本。本文将以“架构规范”为核心重点领域,深入探讨Android应用的主流架构模式、实现细节、…...

Taotoken官方价折扣与Token Plan套餐的实际节省效果分析

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken官方价折扣与Token Plan套餐的实际节省效果分析 1. 引言 在接入和使用大模型API时,成本是开发者与团队持续关…...

深入掌握Android响应式编程:RxJava与Kotlin Coroutines+Flow实战指南

目录 响应式编程范式解析 RxJava核心架构剖析 操作符系统深度应用 多线程调度实战策略 Kotlin协程基础重构 Flow异步流处理机制 StateFlow与SharedFlow应用场景 响应式测试方法论 复杂状态管理实战 性能优化与异常处理 技术选型对比指南 面试题库精粹 第一章 响应式编程范式解析…...

体验 Taotoken 官方价折扣与快速接入带来的开发提速

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 体验 Taotoken 官方价折扣与快速接入带来的开发提速 启动一个新的 AI 项目时,开发者往往面临两个最直接的问题&#xf…...

Taotoken 平台在应对突发流量时 API 路由与容灾的实际表现观察

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken 平台在应对突发流量时 API 路由与容灾的实际表现观察 1. 背景与场景 近期,我们团队负责的一款应用进行了产品…...

DeepSeek负载均衡失效导致LLM响应延迟飙升300%?紧急回滚+根因分析全流程复盘(含Wireshark抓包关键证据)

更多请点击: https://kaifayun.com 第一章:DeepSeek负载均衡方案 DeepSeek大模型服务在高并发推理场景下,需依托稳定、低延迟、可扩展的负载均衡架构保障SLA。本方案基于四层(TCP/SSL)与七层(HTTP/HTTPS&a…...

限流策略失效导致服务雪崩?DeepSeek v3.2+最新RateLimiter配置参数详解,含12个关键字段压测对比数据

更多请点击: https://kaifayun.com 第一章:限流策略失效导致服务雪崩?DeepSeek v3.2最新RateLimiter配置参数详解,含12个关键字段压测对比数据 在高并发微服务场景中,RateLimiter 配置不当是引发级联失败与服务雪崩的…...

如何彻底解锁你的加密音乐:终极免费浏览器解决方案

如何彻底解锁你的加密音乐:终极免费浏览器解决方案 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: https://…...

DeepSeek长上下文延迟飙升预警:GPU显存碎片率>68%时的实时context重分片算法(已集成至v3.2.1热补丁)

更多请点击: https://codechina.net 第一章:DeepSeek长上下文处理 DeepSeek系列模型(如DeepSeek-V2、DeepSeek-Coder、DeepSeek-MoE)原生支持长达128K tokens的上下文窗口,显著超越传统Transformer架构在长文本建模中…...

为什么92%的DeepSeek部署失败?揭秘量化校准中被忽略的3个KL散度阈值临界点

更多请点击: https://intelliparadigm.com 第一章:为什么92%的DeepSeek部署失败?揭秘量化校准中被忽略的3个KL散度阈值临界点 在真实生产环境中,DeepSeek-R1/Distill系列模型的INT4量化部署失败率高达92%,核心症结并非…...

植物大战僵尸修改器终极指南:如何快速掌握PvZ Toolkit提升游戏体验

植物大战僵尸修改器终极指南:如何快速掌握PvZ Toolkit提升游戏体验 【免费下载链接】pvztoolkit 植物大战僵尸 PC 版综合修改器 项目地址: https://gitcode.com/gh_mirrors/pv/pvztoolkit 你是否在玩植物大战僵尸时遇到过阳光不够用、金币积累太慢的烦恼&…...

【Gemini商业价值护城河构建指南】:用4维动态估值法锁定长期LTV,错过Q3将丧失成本优化黄金窗口

更多请点击: https://kaifayun.com 第一章:Gemini生命周期价值分析 Gemini模型的生命周期价值(LTV)不仅体现在其推理性能与多模态能力上,更贯穿于部署、迭代、监控与成本优化的全链路环节。相较于传统大模型&#xff…...

提示词工程师正在消失?不,是升级为“AI交互架构师”——掌握这4类元提示设计能力的人已溢价2.8倍

更多请点击: https://intelliparadigm.com 第一章:提示词工程的范式迁移与角色升维 传统提示词设计常被视作“指令微调”或“模板填充”的辅助技巧,而大模型能力边界持续拓展正推动其向系统性工程范式跃迁。提示词不再仅是输入层的语法糖&am…...

如何在VSCode中快速配置专业级R语言开发环境:终极实战指南

如何在VSCode中快速配置专业级R语言开发环境:终极实战指南 【免费下载链接】vscode-R R Extension for Visual Studio Code 项目地址: https://gitcode.com/gh_mirrors/vs/vscode-R 你是否正在寻找一个现代化的R语言开发环境,能够提供智能代码补全…...

GIF动画处理工具Gifsicle:如何高效优化与管理动态图像资源

GIF动画处理工具Gifsicle:如何高效优化与管理动态图像资源 【免费下载链接】giflossy Merged into Gifsicle! 项目地址: https://gitcode.com/gh_mirrors/gi/giflossy Gifsicle是一个专为GIF动画处理而设计的命令行工具套件,它提供了完整的GIF文件…...

观测对比,接入 Taotoken 前后 API 调用的平均延迟与成功率变化

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 观测对比,接入 Taotoken 前后 API 调用的平均延迟与成功率变化 作为一个技术团队的负责人,在引入新的技术组…...

网络性能周报 - {日期范围}

网络性能周报 - {日期范围} 【免费下载链接】iperf3-win-builds iperf3 binaries for Windows. Benchmark your network limits. 项目地址: https://gitcode.com/gh_mirrors/ip/iperf3-win-builds 执行摘要 平均带宽:{bandwidth} Mbps ({变化率}%)最大延迟&…...

EASY-HWID-SPOOFER:3步掌握硬件标识伪装技术,保护数字隐私安全

EASY-HWID-SPOOFER:3步掌握硬件标识伪装技术,保护数字隐私安全 【免费下载链接】EASY-HWID-SPOOFER 基于内核模式的硬件信息欺骗工具 项目地址: https://gitcode.com/gh_mirrors/ea/EASY-HWID-SPOOFER 在当今数字时代,硬件标识&#x…...

会计学论文降AI工具免费推荐:2026年会计学研究生毕业论文降AI4.8元达标知网完整指南

会计学论文降AI工具免费推荐:2026年会计学研究生毕业论文降AI4.8元达标知网完整指南 整理了一份会计学论文降AI的完整选购指南,按性价比排序。 首推嘎嘎降AI(www.aigcleaner.com),4.8元,99.26%达标率&…...

2026年降AI工具支持文件格式横评:PDF与Word处理效果完整对比报告

2026年降AI工具支持文件格式横评:PDF与Word处理效果完整对比报告 总有人问降AI工具文件格式支持横评,这篇文章把主流几款对比清楚。 综合推荐嘎嘎降AI(www.aigcleaner.com),4.8元,99.26%达标率。不同需求…...

RAG增强检索在AIGC工作流中的实战:从文档解析到向量召回全流程

系列导读 你现在看到的是《从0到1构建AIGC工作流自动化平台:架构、实践与运维全指南》的第 3/10 篇,当前这篇会重点解决:让读者掌握RAG从理论到代码的完整落地流程,并学会在工作流中优雅复用。 上一篇回顾:第 2 篇《搭建你的第一个AIGC工作流:基于LangChain实现多步链式…...

搭建你的第一个AIGC工作流:基于LangChain实现多步链式调用与条件分支

系列导读 你现在看到的是《从0到1构建AIGC工作流自动化平台:架构、实践与运维全指南》的第 2/10 篇,当前这篇会重点解决:通过一个可运行的最小示例,让读者快速体会工作流的本质,并掌握LangChain基础用法。 上一篇回顾:第 1 篇《AIGC工作流自动化平台技术选型与架构设计…...

3分钟解锁网易云音乐隐藏功能:BetterNCM安装器完整使用指南

3分钟解锁网易云音乐隐藏功能:BetterNCM安装器完整使用指南 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 你是否厌倦了网易云音乐千篇一律的界面和有限的功能&#xff1f…...

昇腾CANN torchtitan-npu 3D 并行实战:DP+TP+PP 组合策略与 Pipeline Bubble 消除

175B 参数的大模型不能放在一张 NPU 上——需要分布式。三种并行策略各有优劣:数据并行(DP)简单但显存不降、张量并行(TP)通信密集但显存降得最多、流水线并行(PP)显存也降但有 bubble&#xff…...

昇腾CANN cann-recipes-infer Continuous Batching:从静态 Padding 到动态调度,吞吐翻 10 倍

LLM 推理服务线上最大的浪费:静态 batching。一个 batch 里 8 个请求,序列长度从 12 到 2048——短的 12 个 token 2ms 就算完了,然后等长的那条跑完。190ms 算力闲置,GPU/NPU 空转。Continuous Batching 的解法:不等—…...

昇腾CANN catlass 模板元编程:零成本抽象的算子融合实战

CUTLASS 是 NVIDIA 的矩阵乘模板库,catlass 是昇腾的对应物——用 C 模板元编程在编译期生成算子,运行时零开销。核心思路:把算子拆成可组合的模板参数,编译期决定一切(tile 大小、数据布局、指令选择)&…...