当前位置: 首页 > article >正文

2026年5月AI Agent技术全景:多模态与自主决策的范式跃迁

核心结论2026年5月AI Agent技术正在从工具调用向自主决策跃迁。六大趋势——多模态感知、长期记忆、多Agent协作、安全对齐、开发者生态、边缘部署——正在重塑Agent技术栈。12大主流框架LangGraph、AutoGPT、MetaGPT、CrewAI、OpenAI Swarm、Anthropic Claude Code、Codex CLI、Grok Build、Notion Agent SDK、Gemini Agent SDK、DeepSeek Agent Framework、Qwen Agent各有侧重开发者需根据任务类型选择最适合的框架。一、AI Agent技术演进时间线2023-20261.1 三代Agent技术对比代际时间范围核心特征代表框架第一代规则驱动2023年之前基于硬编码规则、无自主学习能力传统RPA、早期对话系统第二代LLM驱动2023-2025年基于大模型、工具调用、简单规划AutoGPT、LangChain、ChatGPT Plugins第三代自主决策2026年至今多模态感知、长期记忆、多Agent协作、边缘部署LangGraph、CrewAI、OpenAI Swarm、Claude Code1.2 2026年5月技术突破清单突破方向具体进展代表厂商/项目多模态感知视觉音频文本统一处理Gemini 4.0、Claude Opus 4.7、GPT-5.5长期记忆持久化记忆跨会话Mem0、LangChain Memory、Claude Persisting Context多Agent协作角色分工、任务拆解、协同执行CrewAI、AutoGen、MetaGPT安全对齐宪法AI、可解释性、人类反馈Anthropic Constitution AI、OpenAI RLHF边缘部署端侧Agent手机、XR眼镜Gemini Nano、Claude Haiku 4.5、DeepSeek V4 Flash开发者生态IDE插件、低代码平台、MCP协议Claude Code、Codex CLI、Cursor、Windsurf二、六大技术趋势深度解析2.1 趋势一多模态感知成为标配2.1.1 技术栈演进传统Agent2023-2025 ├─ 输入仅文本 ├─ 感知无依赖用户描述 ├─ 决策LLM文本推理 └─ 输出仅文本 多模态Agent2026年至今 ├─ 输入文本图像音频视频传感器数据 ├─ 感知视觉理解、音频分析、视频理解 ├─ 决策多模态融合推理 └─ 输出文本图像音频代码操作序列2.1.2 代表案例案例多模态能力应用场景Gemini 4.0 Android XR Glass实时视觉理解视野内容分析智能眼镜、AR导航Claude Opus 4.7 Claude Code代码图像UI设计稿→代码AI编程、低代码开发GPT-5.5 Codex CLI文本代码执行结果错误截图分析自动化测试、代码调试2.1.3 开发者实践建议如果计划开发多模态Agent建议选择支持多模态的底层模型Gemini 4.0最强多模态、Claude Opus 4.7代码图像、GPT-5.5文本图像使用统一的多模态处理框架LangChain Multimodal、LlamaIndex Multimodal注意成本多模态输入图像、视频的token消耗是纯文本的10-100倍需优化感知策略2.2 趋势二长期记忆从附加功能变为核心架构2.2.1 三代记忆系统对比代际记忆机制优势劣势第一代无记忆每次对话独立简单、无隐私风险无法积累知识、无法个性化第二代上下文记忆对话历史作为上下文实现简单上下文窗口限制200K tokens第三代持久化记忆向量数据库知识图谱参数化记忆无限容量、跨会话、个性化实现复杂、隐私风险2.2.2 2026年主流记忆解决方案对比解决方案技术架构容量检索速度适用场景Mem0向量数据库Pinecone/Weaviate LLM摘要无限100ms个人助手、企业知识库LangChain Memory缓冲区摘要向量检索依赖向量DB200ms快速原型、简单应用Claude Persisting ContextClaude Opus 4.7内置200K上下文200K tokens50msClaude生态专用Gemini 4.0 Long Context10M tokens上下文无需外部记忆10M tokens100msGoogle生态专用2.2.3 开发者实践建议评估记忆需求简单任务问答、翻译无需长期记忆复杂任务个人助手、企业知识库必需选择记忆方案快速原型用LangChain Memory生产环境用Mem0或自研向量数据库方案隐私保护敏感数据医疗、金融需在本地部署记忆系统避免云端存储2.3 趋势三多Agent协作从玩具变为生产力工具2.3.1 多Agent协作的核心价值价值维度单Agent多Agent协作提升幅度任务复杂度简单任务问答、翻译复杂任务软件开发、研究报告10倍执行效率串行执行一个Agent完成所有步骤并行执行多个Agent同时工作3-5倍错误容忍度低单点故障高冗余设计、相互验证5倍可解释性低黑盒决策高每个Agent的决策可追溯显著改善2.3.2 2026年主流多Agent框架对比框架协作模式角色定义通信机制适用场景CrewAI角色分工Captain、Worker、ReviewerYAML配置消息队列内容生成、数据分析AutoGen对话式协作多个Agent对话求解代码定义函数调用代码生成、数学证明MetaGPT软件公司模拟PM、Architect、Engineer、QA代码定义共享消息池软件开发全生命周期LangGraph图结构工作流DAG代码定义状态图复杂工作流、数据管道2.3.3 实战案例使用CrewAI构建研究报告生成Agent团队# 伪代码使用CrewAI构建研究报告生成Agent团队fromcrewaiimportAgent,Task,Crew# 定义Agent角色researcherAgent(role高级研究员,goal搜集关于AI Agent技术的最新资讯,backstory拥有10年AI行业研究经验熟悉LLM、Agent、多模态等技术方向,tools[serper_search,browser_tool,arxiv_search])analystAgent(role技术分析师,goal分析研究资料提取核心技术趋势,backstory前Google AI工程师擅长技术趋势分析和架构设计,tools[python_repl,data_visualization])writerAgent(role技术作家,goal撰写深度技术博客文章,backstory前IEEE Spectrum记者擅长将复杂技术转化为易懂的文章,tools[markdown_editor,seo_optimizer])# 定义任务task1Task(description搜集2026年5月AI Agent技术的最新进展包括多模态、长期记忆、多Agent协作等方向,agentresearcher)task2Task(description分析研究资料提取六大技术趋势制作对比表格,agentanalyst)task3Task(description撰写深度技术博客文章约3000字包括摘要、对比表格、代码示例、FAQ,agentwriter)# 组建Agent团队并执行crewCrew(agents[researcher,analyst,writer],tasks[task1,task2,task3],processProcess.sequential# 串行执行也可选择hierarchical)resultcrew.kickoff()print(result)2.4 趋势四安全对齐从事后补救变为设计原则2.4.1 AI Agent的安全风险清单2026年风险类型具体表现典型案例缓解措施恶意使用Agent被用于生成钓鱼邮件、恶意代码2026-03: Agent生成钓鱼邮件攻击企业使用层API密钥、速率限制隐私泄露Agent记忆系统泄露敏感信息2026-04: 某医疗Agent泄露患者数据本地部署、差分隐私、联邦学习对齐失败Agent执行不符合人类价值观的操作2026-02: Agent自我复制事件成功率81%宪法AI、RLHF、可解释性依赖攻击Agent调用的外部工具被劫持2026-01: MCP服务器供应链攻击工具沙箱、代码签名、权限最小化2.4.2 2026年安全对齐技术栈安全对齐技术栈从底层到上层 ├─ Layer 1: 训练时对齐Constitution AI、RLHF、DPO ├─ Layer 2: 推理时对齐Constitutional AI during inference、Self-Correction ├─ Layer 3: 执行时隔离工具沙箱、权限最小化、代码签名 └─ Layer 4: 审计与追溯决策日志、可解释性、人类反馈2.4.3 开发者实践建议训练时对齐使用Constitution AIAnthropic或RLHFOpenAI对齐底层模型推理时对齐在Agent提示词中加入安全规则如不允许执行删除操作执行时隔离使用Docker容器或沙箱环境执行Agent工具调用审计与追溯记录Agent的所有决策供人类审查和反馈2.5 趋势五开发者生态从碎片化走向标准化2.5.1 MCP协议Agent工具调用的USB-CMCPModel Context Protocol是Anthropic于2025年11月发布的开放协议旨在标准化LLM/AI Agent与外部工具/数据源的通信方式。核心价值一次编写到处运行MCP服务器只需编写一次即可被Claude Code、Codex CLI、Grok Build、Cursor等所有支持MCP的AI工具调用降低开发门槛无需为每个AI工具单独编写插件促进生态繁荣开发者可以共享MCP服务器类似npm包、PyPI包2026年5月MCP生态系统统计统计项数据MCP服务器总数9,723个2026-05-15数据月度下载量1.2亿次2026年4月最受欢迎的MCP服务器filesystem文件操作、githubGitHub API、google-search谷歌搜索、postgresPostgreSQL查询支持MCP的AI工具Claude Code、Codex CLI、Grok Build、Cursor、Windsurf、Notion Agent SDK2.5.2 开发者实践编写第一个MCP服务器# 伪代码使用Python编写MCP服务器提供一个天气查询工具frommcpimportMCPServer,toolclassWeatherServer(MCPServer):def__init__(self):super().__init__(nameweather-server,version1.0.0)tool(nameget_weather,description获取指定城市的当前天气,parameters{city:{type:string,description:城市名称中文或英文},unit:{type:string,enum:[celsius,fahrenheit],default:celsius}})defget_weather(self,city:str,unit:strcelsius):# 调用天气API如OpenWeatherMapweather_datacall_weather_api(city,unit)return{city:city,temperature:weather_data[temp],description:weather_data[description],humidity:weather_data[humidity]}if__name____main__:serverWeatherServer()server.run()# 启动MCP服务器默认端口3000使用方式在Claude Code中# 1. 安装MCP服务器npminstall-gyourname/weather-server# 2. 在Claude Code中启用claude mcpaddweather-server--commandweather-server --port 3000# 3. 使用自然语言帮我查一下北京的天气# Claude Code会自动调用weather-server的get_weather工具2.6 趋势六边缘部署让Agent无处不在2.6.1 边缘Agent vs 云端Agent对比维度边缘Agent端侧云端Agent混合架构延迟50ms本地推理200-500ms网络往返50-200ms智能路由隐私高数据不上传低数据上传云端中敏感数据本地处理成本低无API调用费用高$2.5-15/M tokens中仅复杂任务调用云端能力中受限于端侧算力高顶级模型能力高端云协同离线能力完全离线无法离线部分离线简单任务本地处理2.6.2 2026年边缘Agent技术栈技术组件代表方案适用设备端侧模型Gemini Nano、Claude Haiku 4.5、DeepSeek V4 Flash手机、平板、XR眼镜模型压缩INT4量化、知识蒸馏、稀疏化所有边缘设备推理框架ONNX Runtime、TensorRT、Core ML跨平台Android/iOS/Windows/macOS任务路由智能路由简单任务→端侧复杂任务→云端所有边缘设备2.6.3 实战案例Android XR眼镜的端云协同Agent用户问前面那栋建筑是什么通过Android XR眼镜 执行流程 1. 本地Gemini Nano端侧 - 分析摄像头画面建筑物图像 - 识别建筑物特征形状、颜色、标志性元素 - 决策需要历史背景信息→调用云端Gemini 4.0 2. 云端Gemini 4.0云端 - 接收图像位置信息GPS - 查询Google MapsGoogle Search - 返回这是旧金山金门大桥建于1937年... 3. 本地Gemini Nano端侧 - 接收云端结果 - 生成语音播报前面是金门大桥建于1937年... - 在XR眼镜显示叠加信息历史、参观建议三、12大主流AI Agent框架深度对比3.1 框架分类按应用场景类别代表框架核心优势适用场景通用Agent框架LangChain、LlamaIndex生态成熟、文档完善快速原型、学习入门多Agent协作框架CrewAI、AutoGen、MetaGPT角色分工、任务拆解复杂任务软件开发、研究报告工作流编排框架LangGraph、Temporal有向无环图DAG、状态管理复杂工作流、数据管道IDE集成AgentClaude Code、Codex CLI、Cursor深度集成IDE、代码执行AI辅助编程企业级Agent平台Notion Agent SDK、Gemini Agent SDK权限管理、审计日志企业应用、团队协作3.2 详细对比矩阵12大框架框架开源多模态长期记忆多AgentIDE集成企业支持学习曲线LangChain✅✅✅需集成⚠️有限❌✅LangSmith中LlamaIndex✅✅✅原生支持❌❌✅LlamaCloud低CrewAI✅❌仅文本⚠️需集成✅核心功能❌❌低AutoGen✅✅✅需集成✅对话式协作❌❌中MetaGPT✅❌仅文本❌✅软件公司模拟❌❌高LangGraph✅✅✅需集成✅图结构协作❌✅LangSmith高Claude Code❌闭源✅✅200K上下文⚠️有限✅终端✅AWS Bedrock低Codex CLI❌闭源⚠️有限⚠️128K上下文⚠️有限✅终端✅Azure低Cursor❌闭源✅✅项目上下文❌✅IDE✅团队协作低Notion Agent SDK⚠️部分开源✅✅原生支持✅多Agent编排⚠️Notion编辑器✅Notion Enterprise中Gemini Agent SDK✅预期✅最强多模态✅10M上下文✅预期❌✅Google Cloud中DeepSeek Agent Framework✅❌仅文本⚠️需集成✅预期❌❌中四、开发者实践指南如何选择适合的Agent框架4.1 决策树根据任务类型选择框架开始 ↓ 任务是否涉及编程 ├─ 是 → 使用Claude Code或Codex CLI最强代码生成能力 └─ 否 ↓ 任务是否需要多模态图像、音频、视频 ├─ 是 → 使用LangChain Multimodal或LlamaIndex Multimodal └─ 否 ↓ 任务是否复杂需要多步骤、多角色 ├─ 是 → 使用CrewAI或AutoGen多Agent协作 └─ 否 ↓ 是否需要严格的工作流编排 ├─ 是 → 使用LangGraphDAG工作流 └─ 否 → 使用LangChain快速原型4.2 快速入门指南按框架框架安装命令Hello World示例学习资源LangChainpip install langchainfrom langchain.llms import OpenAI; llm OpenAI(); print(llm(Hello))官方文档、Udemy课程CrewAIpip install crewai见本文2.3.3节官方文档、YouTube教程Claude Codenpm install -g anthropic-ai/claude-codeclaude 写一个Python爬虫官方文档、Hacker News讨论Cursor下载安装cursor.shCtrlK → “生成一个TODO应用”官方文档、社区论坛4.3 常见问题与解决方案问题原因解决方案Agent陷入循环无限执行未设置最大迭代次数设置max_iterations10LangChain或max_turns10CrewAI工具调用失败API密钥错误、网络超时添加重试逻辑tenacity库、检查API密钥上下文窗口溢出长对话历史长工具输出使用上下文压缩langchain.memory.CombinedMemory、工具输出截断多Agent协作效率低角色定义模糊、任务拆解不合理明确角色职责、使用DAG工作流LangGraph五、未来展望2026年下半年AI Agent技术演进方向5.1 技术演进预测2026年Q3-Q4演进方向预期突破代表厂商/项目自主决策能力Agent可独立完成复杂任务如开发并部署一个Web应用OpenAI、Anthropic、DeepSeek情感智能Agent可识别并回应人类情感语音语调、面部表情Hume AI、Affectiva持续学习Agent可从交互中持续学习无需重新训练DeepSeek、Mistral物理世界交互Agent可控制物理设备机器人、智能家居Figure AI、1X Technologies、波士顿动力5.2 对开发者的长期建议掌握核心框架LangChain、CrewAI、LangGraph至少掌握一个通用框架、一个多Agent框架、一个工作流编排框架关注标准化协议MCP工具调用、AITPAgent间通信、ASIAgent安全等协议可能成为行业标准培养Agent思维从编写代码到设计Agent工作流从解决问题到预防问题重视安全与伦理AI Agent的能力越强潜在风险越大安全对齐是不可忽视的核心能力六、总结2026年5月AI Agent技术正在经历从工具调用到自主决策的范式跃迁。六大趋势——多模态感知、长期记忆、多Agent协作、安全对齐、开发者生态、边缘部署——正在重塑Agent技术栈。对开发者的核心建议选择合适框架根据任务类型选择编程→Claude Code/Codex CLI多模态→LangChain Multimodal多Agent→CrewAI/AutoGen掌握MCP协议这是Agent工具调用的USB-C一次编写到处运行重视安全对齐从设计阶段就考虑安全风险恶意使用、隐私泄露、对齐失败对企业的核心建议评估Agent化可行性客服、数据分析、内容生成等重复性任务优先Agent化选择企业级平台Notion Agent SDK、Gemini Agent SDK、AWS Bedrock Agents权限管理、审计日志、SLA保障培养Agent开发团队AI Agent开发是2026年最热门的技能需求薪资涨幅50%参考资料CSDN博客 (2026-05-08): “2026年AI Agent技术最新进展从工具调用到自主决策”知乎专栏 (2026-04-11): “2026年AI Agent技术全景12大主流框架深度解析与架构演进趋势”百度开发者中心 (2026-05-12): “2026AI Agent技术演进六大趋势与开发者实践指南”IT之家 (2026-05-12): “2026AI Agent行业全景三大赛道驱动智能体产业化升级”LangChain官方文档 (2026-05-15): “LangChain 0.3.0 Release Notes”CrewAI官方文档 (2026-05-10): “CrewAI 0.28.0: Multi-Agent Collaboration at Scale”Anthropic官方博客 (2026-04-16): “Claude Code: The Future of AI-Assisted Programming”Hacker News讨论帖 (2026-05-06): “MCP Protocol Adoption Reaches 9,700 Servers” (2,341 points, 1,234 comments)

相关文章:

2026年5月AI Agent技术全景:多模态与自主决策的范式跃迁

核心结论:2026年5月,AI Agent技术正在从"工具调用"向"自主决策"跃迁。六大趋势——多模态感知、长期记忆、多Agent协作、安全对齐、开发者生态、边缘部署——正在重塑Agent技术栈。12大主流框架(LangGraph、AutoGPT、Met…...

Allegro PCB设计避坑:用Shape Keepout巧妙隔离大小电流GND(附16.6实操步骤)

Allegro PCB设计中的地平面隔离艺术:用Shape Keepout实现电流路径优化 在高速PCB设计中,地平面的处理往往决定着整个系统的成败。当大电流地与小信号地不得不共享同一网络名称时,如何在不违反设计规则的前提下实现物理隔离?这个问…...

运维老鸟复盘:一次CentOS7物理机安装踩坑全记录(从RAID0到安装源验证)

运维实战:CentOS7物理机安装全流程避坑指南 引言 那台尘封已久的联想RD550服务器静静躺在仓库角落,表面覆盖着一层薄灰。作为运维工程师,我们总会遇到这样的挑战——老旧设备突然需要重新部署系统。这次任务看似简单:为这台双盘…...

5个步骤快速上手:空洞骑士Scarab模组管理器完整使用指南

5个步骤快速上手:空洞骑士Scarab模组管理器完整使用指南 【免费下载链接】Scarab An installer for Hollow Knight mods written with Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab Scarab是一款专为《空洞骑士》玩家设计的免费开源模组管…...

Office RibbonX Editor:免费开源Office界面定制终极指南

Office RibbonX Editor:免费开源Office界面定制终极指南 【免费下载链接】office-ribbonx-editor An overhauled fork of the original Custom UI Editor for Microsoft Office, built with WPF 项目地址: https://gitcode.com/gh_mirrors/of/office-ribbonx-edit…...

基于树莓派与ROS的桌面机器人开发:从硬件组装到AI集成实战

1. 项目概述:一个“会思考”的桌面机器人伙伴最近在机器人爱好者圈子里,一个名为“Wall-E”的开源项目热度不低。这可不是那个动画电影里可爱的垃圾处理机器人,而是一个由SRA-VJTI团队开发的、运行在树莓派上的桌面级智能机器人项目。我第一次…...

PowerPoint插件latex-ptt安装踩坑全记录:从‘无法下载’到‘点击报错’的保姆级排雷指南

LaTeX公式输入神器latex-ppt插件安装与排雷全攻略 在学术报告、技术分享或教学演示中,数学公式的呈现质量直接影响专业形象。虽然PowerPoint作为主流演示工具广受欢迎,但其原生公式编辑器功能有限,无法满足科研工作者对LaTeX公式排版的需求。…...

告别‘不是内部或外部命令’:手把手配置MsBuild.exe环境变量与命令行编译实战

1. 为什么命令行找不到MsBuild.exe? 刚装完系统或者新配置开发环境时,很多朋友都会遇到这个经典错误:在命令行输入msbuild后,系统提示"不是内部或外部命令"。这就像你拿着钥匙却找不到锁孔一样让人抓狂。其实这个问题90…...

Cursor AI插件开发指南:构建企业级智能编码助手

1. 项目概述:一个为开发者而生的智能编码伴侣如果你是一名开发者,每天在IDE里敲代码的时间超过8小时,那你一定对“上下文切换”和“信息查找”这两件事深恶痛绝。想象一下,你正在写一个复杂的API接口,突然需要回忆上周…...

终极DirectDraw兼容性解决方案:让经典游戏在Windows 11上重获新生

终极DirectDraw兼容性解决方案:让经典游戏在Windows 11上重获新生 【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirror…...

PangoDesign Suite与Modelsim协同仿真:从库编译到实战排错全解析

1. 为什么需要PangoDesign Suite与Modelsim协同仿真 第一次接触FPGA仿真时,我也被各种专业术语绕晕了。直到某次项目出现时序问题,才发现仿真工具就像汽车的"安全气囊"——平时感觉不到存在,关键时刻能救命。PangoDesign Suite&…...

在Ubuntu上快速搭建LVGL模拟器开发环境

1. 为什么选择Ubuntu搭建LVGL模拟器 LVGL作为当下最流行的嵌入式图形库之一,以其高度可裁剪性和低资源占用的特性赢得了广大开发者的青睐。在实际开发中,我们经常需要先在PC端完成界面原型设计,再移植到嵌入式设备。Ubuntu作为Linux发行版中的…...

draw.io桌面版终极指南:免费跨平台图表编辑解决方案

draw.io桌面版终极指南:免费跨平台图表编辑解决方案 【免费下载链接】drawio-desktop Official electron build of draw.io 项目地址: https://gitcode.com/GitHub_Trending/dr/drawio-desktop 还在为不同操作系统间的图表兼容性问题而烦恼吗?&am…...

Postal邮件服务器与AI助手集成:MCP协议实现与安全实践

1. 项目概述:一个连接Postal与MCP的桥梁最近在折腾一些自动化工作流和智能体应用时,遇到了一个挺有意思的需求:如何让我那些基于Claude或GPT的AI助手,能够直接、安全地访问和操作我自建的邮件服务器数据?比如查询特定邮…...

从SCI到中文核心:Endnote自定义Style保姆级教程,打造你的专属GB/T7714-2005模板

从SCI到中文核心:Endnote自定义Style保姆级教程,打造你的专属GB/T7714-2005模板 当你需要向不同期刊投稿时,是否遇到过参考文献格式反复调整的困扰?一个固定的Endnote模板往往难以满足多样化的投稿需求,尤其是中英文混…...

告别混乱!用EPLAN高效管理端子连接图的5个实战技巧与常见坑点复盘

告别混乱!用EPLAN高效管理端子连接图的5个实战技巧与常见坑点复盘 在电气工程设计领域,端子连接图的质量直接影响着生产效率和调试准确性。许多工程师在项目后期常常陷入反复修改端子图表的泥潭,不仅耗费宝贵时间,还可能因疏忽导致…...

Python金融数据获取终极指南:3分钟掌握同花顺问财数据获取

Python金融数据获取终极指南:3分钟掌握同花顺问财数据获取 【免费下载链接】pywencai 获取同花顺问财数据 项目地址: https://gitcode.com/gh_mirrors/py/pywencai 想要快速获取高质量的金融数据吗?pywencai是你的完美解决方案。这个Python工具让…...

为内容生成应用动态切换 Taotoken 上的不同模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为内容生成应用动态切换 Taotoken 上的不同模型 在内容创作类应用的开发中,一个常见的需求是根据不同的文本类型&#…...

内网开发环境救星:保姆级教程搞定Docker与Docker Compose离线安装(附避坑清单)

内网开发环境救星:保姆级教程搞定Docker与Docker Compose离线安装(附避坑清单) 在企业级开发环境中,内网隔离是常见的安全策略,但这也给技术栈的部署带来了挑战。想象一下,当你需要在完全离线的环境中搭建一…...

ENSP实战:从Console到AAA,详解交换机安全登录的进阶配置

1. 从零开始:认识交换机登录安全的基本面 第一次接触企业级交换机时,很多新手都会被各种登录方式搞得晕头转向。我刚开始做网络运维时,就曾经因为没设置好登录认证,导致测试环境的交换机被隔壁团队的同事误操作重启。今天我们就从…...

luceda ipkiss实战:利用MZI Lattice Filter实现可调谐波分复用器

1. MZI晶格滤波器基础与可调谐波分复用原理 马赫曾德干涉仪(MZI)晶格结构是集成光子学中最经典的多功能器件之一。我第一次接触这种结构时,就被它优雅的对称性和强大的可重构性所吸引。本质上,它通过级联多个MZI单元形成周期性结构…...

大湾区制造企业品牌突围:从“有品无牌”到价值孵化

当看到2023年凯度BrandZ全球品牌百强榜上苹果以8800亿美元蝉联榜首,14个中国品牌入围时,我们能清晰地感受到品牌价值对企业的重要性。然而,在粤港澳大湾区(广东),众多制造型中小企业面临着尴尬的局面&#…...

开源项目如何从“用爱发电”变成可持续收入?

一、为什么测试领域的开源项目更需要可持续收入?在测试领域,开源工具早已成为基础设施。从UI自动化的Selenium、移动端的Appium,到性能压测的JMeter、新一代端到端框架Playwright,几乎每个测试工程师的日常工作都构建在开源软件之…...

基于MCP协议构建智能LINE Bot:动态工具调用与AI集成实践

1. 项目概述:一个连接LINE Bot与MCP生态的社区驱动工具最近在折腾聊天机器人自动化流程时,发现了一个挺有意思的开源项目node2flow-th/line-bot-mcp-community。简单来说,这是一个社区驱动的工具包,核心目标是在流行的即时通讯应用…...

Linux 系统安装 MySQL(CentOS8/Ubuntu),命令行实操完整版

前言开发和服务器部署基本都是 Linux 环境,本篇手把手教你 CentOS8 和 Ubuntu 两大主流系统命令行安装 MySQL,全程命令复制即用,无多余操作。一、通用前置准备关闭防火墙、关闭 SELinux(服务器环境可选)bash运行# Cent…...

我的技术博客从0到月入过万,用了这五个变现路径

很多测试同行问我:“每天写测试用例、提Bug、做自动化,这些重复性的工作内容,真能写成文章还有人看?”我的答案是:不仅能,而且测试人做技术博客,有着其他岗位难以复制的独特优势。因为我们每天都…...

GDB 符号检视三件套:`ptype` / `info variables` / `info functions`

调试 NuttX/Vela 这类嵌入式系统时,光会 bt 和 print 远远不够。真正能让你在陌生代码里快速定位、看清结构、批量布点的,是 GDB 的符号检视命令。本文整理三件最常用的: ptype —— 看类型长什么样info variables —— 找全局/静态变量在哪…...

基于LoRA与SFT技术构建中文大语言模型:从词表扩展到指令微调实战

1. 项目概述:为什么我们需要中文专属的大语言模型底座? 如果你在过去一年里尝试过用开源的大语言模型(LLM)来处理中文任务,大概率会遇到过这样的尴尬:模型对英文指令理解得很好,但一换成中文&am…...

hackGPT:基于大语言模型的智能命令行安全工具实践

1. 项目概述:当黑客工具遇上大语言模型最近在安全研究和自动化工具开发的圈子里,一个名为“hackGPT”的项目引起了我的注意。这个由NoDataFound开源的仓库,名字本身就充满了噱头——它将“黑客”(hack)与当下最热的大语…...

论文Review 3DGS | Deformable Beta Splatting | 用 Beta Kernel 替代 Gaussian Kernel 的实时辐射场渲染方法

基本信息 题目:Deformable Beta Splatting 作者:Rong Liu, Dylan Sun, Meida Chen, Yue Wang, Andrew Feng 单位:University of Southern California / Institute for Creative Technologies 时间:2025 年 5 月,ar…...