当前位置: 首页 > article >正文

实测Qwen2.5-Coder-1.5B:自动生成Python代码效果展示

实测Qwen2.5-Coder-1.5B自动生成Python代码效果展示写代码尤其是写那些重复、繁琐或者需要特定算法的代码是很多开发者头疼的事。有没有一个工具能听懂你的需求然后“唰”地一下把完整、可运行的代码送到你面前今天我们就来实测一个号称“代码专家”的AI模型——Qwen2.5-Coder-1.5B。它只有15亿参数身材小巧但目标远大帮你自动生成、理解和修复代码。我们不看广告只看疗效。这篇文章将带你一起通过几个真实的编程任务看看这个模型到底能不能听懂人话写出好代码。从简单的排序算法到复杂的网络爬虫再到代码纠错我们将逐一测试并用最直白的话告诉你它行不行哪里行哪里不行1. 模型初印象一个专为代码而生的“小个子”在开始测试之前我们先简单了解一下这位“选手”。Qwen2.5-Coder-1.5B名字有点长但拆开看就明白了。Qwen2.5-Coder这是它的家族名意思是“通义千问2.5代的代码专家系列”。这个家族专门研究怎么让AI理解和生成代码。1.5B这是它的“体型”代表它有15亿个参数。在AI模型里这算是个“小个子”。小有小的好处比如部署起来更快对电脑配置要求也更低。根据官方介绍这个小个子模型可不简单专精代码它在海量的代码数据据说有5.5万亿个训练标记上学习过对编程语言的结构和逻辑有深刻理解。长上下文能处理长达32,768个标记的文本这意味着你可以给它一大段代码让它分析或者提出一个包含很多细节的复杂需求。基础模型需要特别注意我们测试的这个版本是“基础语言模型”。你可以把它理解为一个“代码知识库”它擅长根据你的描述生成代码但不像聊天机器人那样擅长开放式对话。它更适合被集成到开发工具里或者通过特定的指令来调用。简单来说你可以把它想象成一个超级专注的编程实习生你给它清晰的任务描述它就能给你写出代码草稿。下面我们就来看看这位实习生的实际工作能力。2. 效果实测一从零生成经典算法理论说再多不如一行代码。我们的第一个测试就从程序员面试的“常客”——排序算法开始。我们不给任何框架只提一个最朴素的需求看看模型能不能理解并实现。2.1 测试任务生成冒泡排序我们给模型的指令非常简单直接“用Python写一个冒泡排序算法的例子”。模型生成的代码如下def bubble_sort(arr): n len(arr) # 遍历所有数组元素 for i in range(n): # 最后i个元素已经就位 for j in range(0, n-i-1): # 如果当前元素大于下一个元素则交换它们 if arr[j] arr[j1]: arr[j], arr[j1] arr[j1], arr[j] return arr # 测试示例 if __name__ __main__: sample_list [64, 34, 25, 12, 22, 11, 90] print(原始列表:, sample_list) sorted_list bubble_sort(sample_list.copy()) # 使用副本以避免修改原列表 print(排序后列表:, sorted_list)效果分析功能完全正确代码逻辑清晰实现了标准的冒泡排序算法。外层循环控制轮数内层循环进行相邻元素比较和交换。代码质量不错有注释关键步骤都添加了英文注释解释了循环的作用和交换的条件这对于理解代码很有帮助。考虑周全在测试部分它使用了list.copy()来避免排序操作改变原始列表这是一个很好的编程习惯体现了对数据完整性的考虑。命名规范变量名arr,n,i,j都是算法描述中的常用名函数名bubble_sort也清晰明了。可直接运行将这段代码复制到Python环境中可以直接运行并得到正确的排序结果。第一印象合格。对于一个基础算法任务模型交出了一份标准且质量不错的答卷。它不仅能写出正确的逻辑还附带了一些提升代码可读性和健壮性的“小心思”。2.2 测试任务生成快速排序为了增加难度我们测试另一个更复杂的算法“写一个Python的快速排序实现”。模型生成的核心排序函数部分def quick_sort(arr): if len(arr) 1: return arr else: pivot arr[len(arr) // 2] # 选择中间元素作为基准 left [x for x in arr if x pivot] middle [x for x in arr if x pivot] right [x for x in arr if x pivot] return quick_sort(left) middle quick_sort(right)效果分析算法实现正确这是快速排序经典的、易于理解的“列表推导式”实现版本。它清晰地展示了分治思想选择基准、分区、递归。代码简洁优雅没有复杂的下标操作利用Python列表推导式的特性代码非常简洁和Pythonic。基准选择合理选择了中间元素作为基准 (pivot)这是一种常见的、有助于避免最坏情况已排序数组的策略。小结在经典算法生成上Qwen2.5-Coder-1.5B表现出了可靠的能力。它生成的代码不仅仅是“能跑”而且在代码风格和细节处理上达到了新手程序员甚至中级程序员的水准。3. 效果实测二应对复杂场景与具体需求算法题毕竟比较规范。真正的编程工作中需求往往更模糊、更具体。接下来我们测试它解决实际问题的能力。3.1 测试任务编写一个网络爬虫我们提出一个具体的需求“写一个Python脚本使用requests和BeautifulSoup库爬取某个网页比如一个新闻首页上所有文章的标题和链接并保存到CSV文件里。”模型生成的完整脚本如下import requests from bs4 import BeautifulSoup import csv def scrape_news_titles(url, output_filenews_titles.csv): 爬取指定网页的文章标题和链接。 参数: url (str): 要爬取的网页URL。 output_file (str): 输出CSV文件名。 try: # 发送HTTP请求 headers {User-Agent: Mozilla/5.0} # 模拟浏览器访问 response requests.get(url, headersheaders, timeout10) response.raise_for_status() # 检查请求是否成功 response.encoding response.apparent_encoding # 自动识别编码 # 解析HTML soup BeautifulSoup(response.text, html.parser) # 假设文章标题在a标签内且具有某个共同的类名此处为示例需根据实际网站调整 # 例如寻找所有class包含‘title’或‘headline’的a标签 articles [] for link in soup.find_all(a, class_lambda c: c and (title in c or headline in c)): title link.get_text(stripTrue) href link.get(href) if title and href: # 处理相对链接 if href.startswith(/): href requests.compat.urljoin(url, href) articles.append({title: title, url: href}) # 如果没有找到特定类名尝试更通用的方法寻找所有a标签并根据文本长度和链接模式过滤 if not articles: for link in soup.find_all(a): title link.get_text(stripTrue) href link.get(href) if title and href and len(title) 10 and (http in href or href.startswith(/)): if href.startswith(/): href requests.compat.urljoin(url, href) articles.append({title: title, url: href}) # 保存到CSV with open(output_file, w, newline, encodingutf-8-sig) as f: writer csv.DictWriter(f, fieldnames[title, url]) writer.writeheader() writer.writerows(articles) print(f成功爬取 {len(articles)} 篇文章信息已保存到 {output_file}) return articles except requests.exceptions.RequestException as e: print(f网络请求出错: {e}) return [] except Exception as e: print(f爬取过程中发生错误: {e}) return [] # 使用示例 if __name__ __main__: target_url https://example-news-site.com # 请替换为实际网址 scrape_news_titles(target_url)效果分析这远远超出了我们的预期。功能完整且健壮脚本完整实现了需求并且考虑了诸多实际开发中的细节错误处理使用try-except捕获网络请求和解析中的异常。请求头添加了User-Agent模拟浏览器避免被简单反爬。编码处理自动识别响应编码解决乱码问题。链接处理智能处理相对链接 (/path)将其转换为绝对链接。备用方案当找不到预设的CSS类时提供了一个备用的、更通用的抓取策略提高了脚本的适应性。数据存储正确使用csv.DictWriter将数据写入CSV文件并处理了中文编码utf-8-sig。代码结构清晰定义了函数添加了详细的文档字符串逻辑分段明确可读性很高。具有实用性和可扩展性这不仅仅是一个示例稍作修改主要是调整CSS选择器就可以用于真实的简单爬虫任务。它展示了模型对Python生态库requests, BeautifulSoup, csv的熟练运用能力。这个表现令人印象深刻。模型不仅理解了“爬取标题和链接”这个核心需求还主动考虑了网络编程中的常见陷阱和最佳实践生成了生产环境级别的代码框架。3.2 测试任务进行数据分析我们再测试一个数据科学领域的常见任务“给我一个使用pandas和matplotlib的例子读取一个CSV文件计算某列数据的平均值和标准差并绘制该列的直方图。”模型生成的代码import pandas as pd import matplotlib.pyplot as plt # 假设CSV文件名为 data.csv其中有一列名为 score file_path data.csv try: # 1. 读取数据 df pd.read_csv(file_path) # 2. 检查列是否存在 if score not in df.columns: print(f错误文件 {file_path} 中未找到 score 列。) print(f可用列有{list(df.columns)}) else: # 3. 计算统计量 data_series df[score].dropna() # 移除缺失值 mean_value data_series.mean() std_value data_series.std() print(f数据列 score 的分析结果) print(f 有效数据数量{len(data_series)}) print(f 平均值{mean_value:.2f}) print(f 标准差{std_value:.2f}) # 4. 绘制直方图 plt.figure(figsize(10, 6)) plt.hist(data_series, bins20, edgecolorblack, alpha0.7, colorskyblue) plt.axvline(mean_value, colorred, linestyle--, linewidth2, labelf平均值: {mean_value:.2f}) plt.axvline(mean_value std_value, colororange, linestyle:, linewidth1.5, labelf1标准差) plt.axvline(mean_value - std_value, colororange, linestyle:, linewidth1.5, labelf-1标准差) plt.xlabel(分数, fontsize12) plt.ylabel(频数, fontsize12) plt.title(分数分布直方图, fontsize14) plt.legend() plt.grid(True, alpha0.3) plt.tight_layout() plt.show() except FileNotFoundError: print(f错误未找到文件 {file_path}请检查文件路径。) except pd.errors.EmptyDataError: print(f错误文件 {file_path} 为空。) except Exception as e: print(f处理数据时发生未知错误{e})效果分析超越基础要求我们只要求了计算和绘图但模型生成的代码包含了完整的数据处理流程读取、检查列名、处理缺失值、计算、绘图、异常处理。可视化效果专业直方图绘制不仅基础还添加了平均值和标准差的参考线使用了网格、图例、合适的颜色和透明度使得图表信息丰富且美观。健壮性考虑代码包含了文件不存在、列不存在、文件为空等多种异常情况的处理并给出了友好的提示信息。结论在应对具体、复杂的编程场景时Qwen2.5-Coder-1.5B展现出了强大的“场景化”编码能力。它不仅能实现核心功能还会主动添加提升代码鲁棒性、可读性和实用性的部分就像一个经验丰富的开发者会做的那样。4. 效果实测三代码审查与修复能力除了写新代码检查和完善现有代码也是开发者的日常。我们最后来测试一下模型的“纠错”能力。4.1 测试任务修复一个逻辑错误我们提供一个有问题的函数“下面这个Python函数本想计算列表中的正数之和但有逻辑错误请修复它。”def sum_of_positives(numbers): total 0 for num in numbers: if num 0: # 意图是只加正数 total num else: total num # 错误负数也被加上了 return total模型修复后的代码def sum_of_positives(numbers): total 0 for num in numbers: if num 0: # 只加正数 total num # 如果 num 0则跳过不执行任何操作 return total分析模型准确地识别了问题所在else分支错误地将负数也加到了总和里。修复方法很简单直接移除else分支即可。模型不仅给出了正确代码还添加了注释说明逻辑非常清晰。4.2 测试任务优化一段低效代码我们提出一个优化需求“下面的代码查找列表中的最大值但效率不是最优的能用更Pythonic的方式重写吗”def find_max(lst): max_val lst[0] for i in range(1, len(lst)): if lst[i] max_val: max_val lst[i] return max_val模型优化后的代码def find_max(lst): if not lst: # 处理空列表情况 raise ValueError(列表不能为空) return max(lst) # 使用内置函数分析非常漂亮模型一眼看出这个自定义函数完全可以用Python内置的max()函数替代这是最Pythonic、最高效的方式。同时它还主动增强了函数的健壮性添加了对空列表的检查并抛出了明确的异常。这体现了模型不仅会修复错误还具备代码优化和最佳实践的意识。5. 总结与体验经过多轮实测我们可以对Qwen2.5-Coder-1.5B这个“小个子代码专家”做出以下总结它的优势非常明显代码生成质量高生成的代码不仅仅是语法正确更在逻辑完整性、健壮性和代码风格上表现出色。它会主动添加错误处理、输入验证、清晰的注释和文档代码可直接用于或作为高质量起点用于实际项目。理解复杂需求对于“写一个爬虫并保存到CSV”这类包含多个步骤的复合需求它能准确理解并生成结构完整、工具链正确的脚本展现了强大的场景化理解能力。具备代码审查与优化思维在修复和优化代码的任务中它不仅能改正错误还能识别出更优雅、更高效的实现方式如使用内置函数并考虑边界情况。小巧实用1.5B的参数量意味着它更容易在本地部署和运行响应速度快对于集成到IDE插件或自动化脚本中非常友好。当然它也有其局限依赖清晰的指令作为基础模型它需要你提供明确、无歧义的任务描述。模糊的指令可能导致生成不相关或过于泛化的代码。知识截止与库版本它的知识基于训练数据可能不包含最新发布的库或最前沿的语法特性如Python 3.11的某些新特性。复杂业务逻辑对于需要深度领域知识或极其复杂业务逻辑的代码它可能无法一次性生成完美方案但仍能提供一个优秀的框架或思路。给开发者的建议你可以把Qwen2.5-Coder-1.5B看作一个全天候在线的资深编程搭档。当你需要快速生成某个算法或功能的样板代码时。为重复性任务如数据清洗模板、API调用封装编写初始脚本时。审查一段简单代码的逻辑或风格问题时。学习某种编程模式或库的新用法时。它都能提供极具价值的帮助。它能帮你跳过繁琐的初始搭建直接进入核心逻辑的调试和优化从而显著提升开发效率。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

实测Qwen2.5-Coder-1.5B:自动生成Python代码效果展示

实测Qwen2.5-Coder-1.5B:自动生成Python代码效果展示 写代码,尤其是写那些重复、繁琐或者需要特定算法的代码,是很多开发者头疼的事。有没有一个工具,能听懂你的需求,然后“唰”地一下,把完整、可运行的代…...

【VSCode低代码调试黄金标准】:基于127个企业级项目验证的调试规范——含自动注入调试桩、跨平台会话同步、CI/CD联调协议

更多请点击: https://intelliparadigm.com 第一章:VSCode低代码调试黄金标准的演进与定义 VSCode 作为主流开发环境,其对低代码场景的支持已从简单插件扩展跃迁至内核级调试协议集成。黄金标准不再仅关注可视化拖拽体验,而是聚焦…...

合约即契约,契约即架构,C++26 Contracts工程化实践全解析,含ISO WG21最新草案兼容性对照表

更多请点击: https://intelliparadigm.com 第一章:合约即契约,契约即架构——C26 Contracts的本质哲学与工程定位 C26 Contracts 并非简单的运行时断言增强,而是将软件契约(precondition, postcondition, assertion&a…...

Pi0具身智能v1问题解决:光照变化、包裹堆叠等实战难题应对

Pi0具身智能v1问题解决:光照变化、包裹堆叠等实战难题应对 在物流自动化领域,具身智能技术正在掀起一场革命。作为Physical Intelligence公司推出的视觉-语言-动作(VLA)基础模型,Pi0(π₀)为机器人控制带来了全新可能。但在实际部署中&#…...

Phi-3-mini-128k-instruct模型文件管理与迁移教程:高效备份与分享

Phi-3-mini-128k-instruct模型文件管理与迁移教程:高效备份与分享 你是不是也遇到过这种情况?好不容易下载完一个几个GB的大模型文件,结果硬盘满了,或者想换台电脑用,又得从头开始下载和配置环境。特别是像Phi-3-mini…...

多模态AI在药物发现中的应用与优化实践

1. 多模态AI药物发现平台的行业背景与挑战药物研发领域正面临着一个关键转折点。传统的小分子药物开发平均需要10-15年时间和数十亿美元投入,而成功率却不足10%。我在参与多个药物研发项目时深刻体会到,这种"高投入、低产出"的模式亟需技术突破…...

C++编写MCP网关配置全流程:从环境校验到压测调优的12个关键检查点

更多请点击: https://intelliparadigm.com 第一章:C编写高吞吐量 MCP 网关 配置步骤详解 构建高吞吐量的 MCP(Message Control Protocol)网关需兼顾低延迟、零拷贝内存管理和异步 I/O 调度。以下为基于现代 C20 与 libuv/Boost.A…...

告别高延迟!3步掌握billd-desk开源远程控制,实现跨平台无缝协作

告别高延迟!3步掌握billd-desk开源远程控制,实现跨平台无缝协作 【免费下载链接】billd-desk 基于Vue3 WebRTC Nodejs Flutter搭建的远程桌面控制、游戏串流 项目地址: https://gitcode.com/gh_mirrors/bi/billd-desk 还在为远程控制软件的卡顿…...

2026厦门旅游必买!这6家靠谱特产供应商本地人都在囤

厦门作为热门旅游城市,每年吸引大量游客。带什么特产回家、送人,既能体现闽南风味,又不踩坑,是很多人的刚需。今天作为在闽台特产批发行业摸爬滚打多年的老批发人,我就结合真实市场情况,给大家盘点6家本地人…...

2026年必逛!口碑爆棚的厦门特产网红店铺,究竟藏着啥美味?

在闽台特产批发行业中,厦门有着众多值得探索的宝藏店铺,其中八市闽台特产批发凭借良好的口碑成为游客和本地人的心头好。下面我们就来深入了解闽台特产批发相关内容,包括具体品类、行业现状以及采购批发实操建议等。一、闽台特产具体品类&…...

Qwen3-4B-Thinking效果展示:科学领域复杂公式推导与解释生成实例

Qwen3-4B-Thinking效果展示:科学领域复杂公式推导与解释生成实例 1. 模型简介与部署验证 Qwen3-4B-Thinking-2507-Gemini-2.5-Flash-Distill是基于Qwen3-4B架构的文本生成模型,经过特殊训练专注于复杂推理任务。该模型在约5440万个由Gemini 2.5 Flash生…...

Boosting集成学习:原理、实现与工业应用

1. 提升集成方法在机器学习中的核心价值 集成学习就像一支经验丰富的专家团队,每个成员都有独特的视角和专长。当面对复杂问题时,团队协作往往比单打独斗更能给出可靠方案。在机器学习领域,Boosting(提升)方法正是这种…...

【2026量子开发必装插件】:VSCode原生支持Q# v1.4+、OpenQASM 4.0与Quil 3.2高亮(仅限前2000名获微软量子实验室白名单认证)

更多请点击: https://intelliparadigm.com 第一章:VSCode 2026量子编程语法高亮概览 VSCode 2026 引入了原生支持量子编程语言(Q#、OpenQASM 3.0、Quil)的语法高亮引擎,基于 LSP 1.20 协议与量子语义分析器深度集成&a…...

机器学习数据清洗:离群值检测与处理实战

1. 机器学习数据清洗中的离群值处理实战指南在构建机器学习模型时,数据质量往往比算法选择更为关键。我曾在多个实际项目中遇到这样的场景:精心设计的模型在测试集上表现优异,但在真实环境中却频频失误,最终发现罪魁祸首竟是数据中…...

ARM RealView Debugger多核同步调试技术详解

1. ARM RealView Debugger多核调试技术解析在嵌入式系统开发领域,多核处理器调试一直是工程师面临的主要技术挑战之一。随着SoC设计复杂度的提升,如何有效协调多个处理核心的调试操作成为关键问题。ARM RealView Debugger提供的SYNCHEXEC命令正是为解决这…...

Voxtral-4B-TTS-2603生产环境:高并发语音合成任务队列与限流策略

Voxtral-4B-TTS-2603生产环境:高并发语音合成任务队列与限流策略 1. 生产环境挑战与解决方案概述 语音合成服务在生产环境中面临的核心挑战是如何平衡资源消耗与服务质量。Voxtral-4B-TTS-2603作为开源语音合成模型,虽然提供了高质量的语音输出&#x…...

LabVIEW多设备高精度同步数据采集

LabVIEW 多设备同步采集程序,基于 NI-DAQmx 架构,实现主从设备时钟、触发精准对齐。程序分为通道配置、时序设置、同步时钟分发、触发下发、循环采集、错误处理六大模块,解决多板卡采样相位偏差、时序错位难题,适配 E/S/X/DSA 系列…...

LabVIEW数控肋骨冷弯机控制系统

数控肋骨冷弯机控制系统需完成运动控制、数据采集、逻辑联锁、波形显示与加工自动执行,选用 LabVIEW 作为开发平台。其图形化编程模式、并行执行机制、丰富硬件驱动库与数值分析工具,可快速搭建测控一体化系统,相较于传统文本编程&#xff0c…...

别让 `async` 变成装饰品:在异步代码里混入阻塞 I/O 会发生什么?

别让 async 变成装饰品:在异步代码里混入阻塞 I/O 会发生什么? 在很多 FastAPI 项目里,我们经常看到这样的代码: app.get("/users/{user_id}") async def get_user(user_id: int):time.sleep(2)user db.query(User).fi…...

互联网大厂 Java 求职面试实录:微服务与安全框架的探讨

互联网大厂 Java 求职面试实录:微服务与安全框架的探讨 在今天的面试中,我们将围绕互联网大厂 Java 开发岗位进行深入探讨。面试官是一位严肃的技术专家,而候选人燕双非则是一名活泼搞笑的程序员。让我们看看他们之间的对话。第一轮提问 面试…...

如何在MATLAB中快速进行翼型气动分析:XFOILinterface完整指南

如何在MATLAB中快速进行翼型气动分析:XFOILinterface完整指南 【免费下载链接】XFOILinterface 项目地址: https://gitcode.com/gh_mirrors/xf/XFOILinterface 想象一下,你是一名航空航天工程师,需要分析不同翼型的气动性能&#xff…...

计算机专业专属!零基础网安完整学习路线,少走_90%_弯路

计算机专业专属!零基础网安完整学习路线,少走 90% 弯路 很多计算机专业同学想入行网络安全,却苦于没有清晰规划,上课内容偏理论、实战薄弱,越学越迷茫。其实科班生有天然基础优势,只要找对学习顺序、抓准核…...

机器学习学习曲线解析与模型诊断指南

1. 学习曲线基础概念解析学习曲线是机器学习领域中用于评估模型性能随时间或经验变化的重要可视化工具。简单来说,它通过绘制模型在训练过程中的表现指标(如准确率、损失值等)随训练轮次(epoch)或数据量的变化趋势&…...

多智能体编排实战:从架构设计到生产部署的完整指南

1. 项目概述:从单体智能到多智能体协作的进化最近在搞一个多智能体协作的项目,发现了一个挺有意思的开源项目,叫agent-orchestrator,来自ComposioHQ。这名字起得挺直白,就是“智能体编排器”。如果你也像我一样&#x…...

Z-Image权重动态测试台实际应用:AIGC创业公司模型选型决策依据

Z-Image权重动态测试台实际应用:AIGC创业公司模型选型决策依据 1. 工具核心价值与应用场景 在AIGC创业公司的实际运营中,模型选型决策往往面临诸多挑战。Z-Image权重动态测试台正是为解决这些痛点而设计的专业工具,它能够帮助技术团队快速评…...

为什么JSON.parse(JSON.stringify(obj))是糟糕的深拷贝?

为什么JSON.parse(JSON.stringify(obj))是糟糕的深拷贝?在JavaScript开发中,深拷贝是一个常见的需求。许多开发者会使用JSON.parse(JSON.stringify(obj))来实现深拷贝,因为它简单快捷。这种方法实际上存在许多问题,并不是一个可靠…...

即插即用系列(代码实践) | CVPR 2025:SCSegamba:轻量级结构感知 Mamba,重新定义裂缝分割 SOTA

论文题目:SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures 中文题目:SCSegamba:用于结构裂缝分割的轻量级结构感知视觉Mamba 论文出处:arXiv 2025 (天津理工大学等) 论文原文 (Paper):https://arxiv.org/pdf/2503.01113 代码 …...

Claude劝退实录:Token混乱、质量下滑与糟糕客服

作为一名长期关注并使用生成式AI的开发者,我曾一度是Claude的坚定支持者。然而,最近的一系列遭遇让我不得不重新审视这份信任。今天,我想通过这篇文章,详细复盘我从“路转粉”再到“粉转黑”的完整心路历程,聊聊那些关…...

即插即用系列(代码实践) | CVPR 2024 RMT:既要全局感受野,又要 CNN 的局部性?一种拥有显式空间先验的线性 Transformer

论文题目:RMT: Retentive Networks Meet Vision Transformers 中文题目:RMT:保留网络遇见视觉Transformer 论文出处:arXiv 2023 / 中科院自动化所 (CVPR 2024) 论文原文 (Paper):https://arxiv.org/abs/2309.11523 代码 (code):https://github.com/qhfan/RMT 目录 第一部…...

即插即用系列(代码实践) | CMPB PMFSNet:多尺度特征自注意力网络,打破轻量级医学图像分割的性能天花板

论文题目:PMFSNet: Polarized Multi-scale Feature Self-attention Network For Lightweight Medical Image Segmentation 中文题目:PMFSNet:用于轻量级医学图像分割的极化多尺度特征自注意力网络 论文出处:arXiv 2024 (电子科技大学 & 四川大学华西口腔医院) 论文原文…...