2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元
2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元
目录
- 2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元
- 一、本周热点回顾
- 1. 百度发布全球首个千亿参数多模态大模型文心·灵眸 重塑AI交互范式
- 2. 特斯拉Optimus 2.0机器人量产下线 具身智能进入规模化应用阶段
- 3. 英伟达发布新一代AI训练芯片H1000 算力密度再创新高
- 二、技术进展深度解析
- (一)大模型与多模态技术
- (二)AI芯片与算力基础设施
- (三)具身智能与机器人技术
- (四)生成式AI与内容创作
- (五)AI安全与伦理治理
- 三、产业动态全景扫描
- (一)全球产业战略布局
- (二)行业应用深度渗透
- 四、行业生态与政策风向
- (一)国际标准进展
- (二)国内政策动向
- 五、专业术语解释
- 六、资料引用声明
- 七、免责声明
一、本周热点回顾
1. 百度发布全球首个千亿参数多模态大模型文心·灵眸 重塑AI交互范式
2025年5月21日,百度在万象AI开发者大会上正式推出文心·灵眸多模态大模型,标志着AI从单一模态理解迈向全场景智能交互:
- 技术突破:采用2800亿参数混合架构,集成视觉Transformer、语音编码器与语义理解模块,支持图像生成、视频理解、3D场景建模等12种模态处理
- 交互创新:推出灵眸智能体交互系统,通过眼动追踪与语音语义协同,实现看即所想的自然交互,在智能家居场景指令识别准确率达98.7%
- 行业落地:与美团合作打造智能配送大脑,通过多模态分析实时路况、订单图像与用户语音,配送路径规划效率提升40%,异常订单处理时间缩短至15秒
- 生态开放:开放灵眸API平台,提供图像生成、视频摘要等30+能力接口,已接入携程、贝壳等200+企业,日均调用量突破10亿次
2. 特斯拉Optimus 2.0机器人量产下线 具身智能进入规模化应用阶段
5月23日,特斯拉上海超级工厂宣布Optimus 2.0机器人正式量产,首批1000台将交付上海洋山港智能码头:
- 硬件升级:搭载特斯拉自研D1 AI芯片,算力达200TOPS,全身部署42个力矩传感器,抓取精度提升至0.1mm,可搬运20kg重物
- 算法突破:引入神经辐射场(NeRF)环境建模技术,机器人动态定位误差小于5cm,在复杂仓库场景自主导航成功率达99.2%
- 行业应用:洋山港项目中,Optimus 2.0承担集装箱巡检任务,通过视觉-惯性融合定位,日均巡检里程达50公里,故障识别率较人工提升3倍
- 生态布局:开放Tesla Bot开发者平台,提供运动控制、环境感知等SDK,已吸引ABB、发那科等机器人厂商加入生态
3. 英伟达发布新一代AI训练芯片H1000 算力密度再创新高
5月20日,英伟达在Computex大会上推出H1000 AI训练芯片,采用14层CoWoS先进封装技术:
- 性能参数:集成5.3万亿个晶体管,单芯片算力达5PetaFLOPS(FP16),相比H100提升3倍,算力密度达2.1TOPS/mm²
- 架构创新:引入三维张量核心,支持稀疏矩阵运算加速,大模型训练效率提升40%,GPT-5训练时间从7天缩短至48小时
- 能效优化:采用台积电3nm工艺,功耗控制在400W以内,单位算力能耗比提升2.5倍,适配数据中心低碳化需求
- 生态协同:同步推出Blackwell多芯片互联系统,支持1024颗H1000集群部署,总算力达5EFLOPS,已被微软Azure、阿里云等云厂商预订
二、技术进展深度解析
(一)大模型与多模态技术
-
千亿级多模态模型架构突破
- 微软联合OpenAI发布Gemini 2.0多模态模型,采用动态路由架构,可根据任务自动分配视觉、语言、音频处理单元,在VQA(视觉问答)任务中准确率达94.3%,超越人类表现2.1个百分点
- 复旦大学团队提出神经符号融合框架,将知识图谱与大模型结合,在医疗诊断场景中疾病推理准确率提升至97.8%,解决大模型幻觉问题
-
具身智能大模型进展
- 谷歌DeepMind推出RT-2E具身智能模型,通过100万小时机器人操作数据训练,可在陌生环境中自主规划拆箱、分拣等复杂任务,泛化能力较前代提升3倍
- 字节跳动发布火山具身大模型,集成视觉-运动-语言模态,支持远程操控机器人完成烹饪、维修等任务,指令理解延迟降至80ms
-
大模型压缩与边缘部署
- 华为推出泰山轻量化大模型引擎,通过知识蒸馏与量化技术,将130亿参数模型压缩至1GB以内,在手机端实现实时语音翻译,准确率达92%
- 高通发布AI引擎Hexagon 790,集成张量加速器,支持70亿参数大模型本地运行,在AR眼镜中实现实时字幕生成,功耗控制在1.5W以内
(二)AI芯片与算力基础设施
-
存算一体芯片技术突破
- 清华大学团队研发出二维半导体存算一体芯片,利用二硫化钼材料实现存储与计算单元集成,算力密度达50TOPS/mm²,能效比提升10倍,适用于边缘AI设备
- 三星电子量产14nm存算一体DRAM芯片,单芯片算力达1TOPS,数据搬运能耗降低90%,已用于自研AI服务器,训练效率提升35%
-
光子AI芯片商用化加速
- 光驭科技发布100Gbps光子AI芯片天枢,采用硅光集成技术,在矩阵乘法运算中能耗仅为电子芯片的1/20,已接入阿里云智算中心,支撑大模型训练
- 英特尔推出光量子混合AI加速器,利用光子传输与量子隧穿效应,实现10PetaFLOPS算力,适用于药物分子对接等量子化学计算场景
-
算力网络与智能调度
- 阿里云发布洛神算网大脑,基于自研盘古调度大模型,实现跨地域算力资源池化管理,任务调度效率提升40%,算力利用率从30%提升至65%
- 中国电信建成全国首个AI算力交易平台,支持GPU、FPGA等异构算力按需租赁,已接入20万卡算力资源,服务中小企业AI研发需求
(三)具身智能与机器人技术
-
人形机器人运动控制突破
- 波士顿动力推出Atlas 3.0人形机器人,搭载32个液压驱动关节,引入强化学习算法,可在碎石路面稳定行走,爬坡角度达35°,摔倒后自主站立时间缩短至8秒
- 优必选发布Walker X2医疗机器人,配备六轴机械臂,手术器械操控精度达0.05mm,已在深圳儿童医院完成50例微创手术,创口愈合速度提升15%
-
自主移动机器人(AMR)技术升级
- 旷视科技推出昆仑AMR集群系统,通过多机器人协同算法,在仓储场景实现200台机器人无冲突调度,拣货效率提升50%,路径规划时间缩短至200ms
- 科沃斯研发灵犀清洁机器人,搭载固态激光雷达与视觉SLAM,在复杂家居环境中导航成功率达99.6%,清洁覆盖率提升至98.3%
-
脑机接口与生物机器人
- 脑陆科技完成第二代植入式脑机接口临床试验,通过96通道电极阵列,实现意念控制机械臂准确率达95%,已帮助3名渐冻症患者恢复部分肢体功能
- 哈佛医学院开发生物杂交机器人,利用心肌细胞驱动微型机器人,可在血管中自主游动,靶向输送药物,在动物实验中肿瘤抑制率达82%
(四)生成式AI与内容创作
-
多模态生成技术革新
- Adobe发布Firefly 3.0生成式AI套件,新增3D场景生成功能,用户通过文本描述即可创建 photorealistic 三维模型,材质渲染时间从2小时缩短至15分钟
- 腾讯互娱推出光启游戏场景生成系统,基于游戏引擎与扩散模型,48小时内可生成1000+游戏地图,美术成本降低60%,已应用于《和平精英》新赛季开发
-
数字人生成与驱动技术
- 商汤科技发布如影数字人平台2.0,引入神经辐射场(NeRF)重建技术,数字人建模时间从72小时缩短至4小时,面部表情捕捉延迟降至15ms
- 网易互娱开发AI虚拟偶像引擎,支持用户通过语音与动作实时驱动数字人,在直播场景中虚拟偶像动作自然度评分达4.8/5分,互动转化率提升30%
-
代码生成与软件开发
- GitHub Copilot X推出多语言代码生成功能,支持Python、Java、C++等20+编程语言,代码补全准确率达92%,在复杂算法场景开发效率提升50%
- 华为开发者联盟上线CodeArts AI助手,基于华为自研大模型,提供代码审查、漏洞检测等功能,在鸿蒙应用开发中bug修复时间缩短60%
(五)AI安全与伦理治理
-
大模型安全防护技术
- 奇安信发布天枢大模型安全平台,集成对抗样本检测、数据投毒防御等模块,在金融大模型场景中抵御钓鱼攻击成功率达99.5%
- 360集团研发AI威胁狩猎系统,通过行为分析与知识图谱,实时识别AI模型被恶意操控风险,已在政务云平台拦截2000+次攻击
-
生成式AI内容溯源技术
- 微软推出Azure AI Content Credentials,为AI生成内容添加数字水印,支持文本、图像、视频溯源,已接入Bing搜索,虚假信息识别率提升40%
- 中国信通院牵头制定《生成式AI内容标识规范》,要求AI生成内容添加机器可识别标签,已在抖音、快手等平台试点应用
-
AI伦理治理框架进展
- 欧盟委员会通过《AI法案》最终版本,将面部识别、自主武器等列为高风险AI应用,要求企业实施严格风险评估,2026年起正式生效
- 中国人工智能学会发布《AI伦理治理白皮书(2025)》,提出可信AI三维度评估体系,涵盖技术可控性、社会适应性、法律合规性
三、产业动态全景扫描
(一)全球产业战略布局
-
AI大模型生态竞争加剧
- Meta启动大模型开源联盟,联合英伟达、AWS等企业推出开源大模型系列Llama 3,支持医疗、教育等垂直领域定制,目标吸引10万+开发者
- 华为云发布盘古大模型行业版,推出金融、制造、能源等8个行业大模型,已服务工商银行、国家能源集团等500+企业,项目交付周期缩短50%
-
AI+机器人产业融合加速
- 软银集团收购波士顿动力剩余股权,整合Pepper服务机器人与Atlas工业机器人技术,计划2026年推出AI+机器人行业解决方案,聚焦养老、物流领域
- 小米生态链成立具身智能实验室,联合北京航空航天大学研发消费级人形机器人,预计2025年底推出家庭服务机器人原型机,定价低于1万元
-
AI算力基础设施投资热潮
- 字节跳动在上海临港建设飞桨智算中心,规划10万卡GPU算力,支撑抖音、TikTok的推荐算法与生成式AI应用,预计2026年投入运营
- 沙特阿美石油公司投资50亿美元建设NEOM AI超级数据中心,采用液冷技术与可再生能源,算力达1EFLOPS,服务中东地区AI科研与产业需求
(二)行业应用深度渗透
-
智慧医疗领域
- 瑞金医院部署扁鹊AI诊断系统,基于医疗大模型分析CT、MRI等影像,肺癌早期筛查准确率达97.3%,较人工阅片效率提升10倍
- 联影医疗推出AI+放疗计划系统,通过大模型优化放疗剂量分布,在前列腺癌治疗中肿瘤控制率提升至92%,正常组织损伤降低30%
-
智能金融领域
- 工商银行推出AI数字员工客服系统,支持多轮对话与复杂业务办理,日均处理咨询量达200万次,人工客服需求减少40%,客户满意度提升至96%
- 蚂蚁集团研发蚁鉴AI风控平台,利用图神经网络分析交易网络,实时拦截电信诈骗成功率达99.2%,2025年一季度挽回用户损失3.2亿元
-
智慧农业领域
- 北大荒集团应用神农AI种植大脑,通过卫星遥感与田间传感器数据,实现水稻精准灌溉施肥,每亩地用水量减少25%,产量提升15%
- 极飞科技发布AI农业机器人套装,包含植保无人机、巡检机器人与AI决策系统,在新疆棉田实现病虫害识别准确率95%,农药使用量降低30%
-
智能教育领域
- 好未来推出AI双师课堂3.0,通过多模态大模型分析学生表情、语音与答题数据,实时调整教学策略,在数学课程中知识掌握率提升20%
- 网易有道发布AI学习 companion,基于教育大模型提供作业批改、错题分析等功能,在初中英语场景中学习效率提升35%,用户续费率提高至75%
四、行业生态与政策风向
(一)国际标准进展
-
ISO发布AI伦理国际标准
- ISO/IEC 42001《人工智能系统伦理设计指南》正式发布,规定AI系统需满足可解释性、非歧视性、人类监督等12项伦理原则,全球50+国家已采用
-
IEEE更新AI芯片性能测试标准
- IEEE 2941.1标准新增能效比、稀疏计算效率等指标,针对AI训练与推理芯片制定统一测试方法,英伟达、AMD等企业已参与标准验证
(二)国内政策动向
-
发改委发布《AI算力基础设施建设指南》
- 提出2025年全国AI算力规模达300EFLOPS,建设10个左右国家级智算中心,重点支持东数西算工程中AI算力资源调度
-
《生成式AI服务管理暂行办法》修订版出台
- 新增算法备案白名单制度,对符合伦理标准的生成式AI服务简化备案流程,支持医疗、教育等领域深度应用
-
十四五AI创新专项启动
- 科技部公示20亿元专项预算,支持多模态大模型基础理论、具身智能关键技术等6个攻关方向,鼓励企业与科研院所联合申报
五、专业术语解释
术语 | 解释 |
---|---|
具身智能 | 指AI系统通过与物理环境交互获得智能的能力,强调感知、运动与认知的协同,是机器人实现自主操作的核心技术 |
神经辐射场(NeRF) | 一种基于神经网络的三维场景表示方法,通过多视角图像学习场景几何与外观,广泛应用于数字人建模、机器人环境感知 |
存算一体 | 将存储单元与计算单元集成的芯片架构,解决传统冯·诺依曼架构中存储墙问题,大幅提升算力效率与能耗比 |
多模态大模型 | 能够同时处理文本、图像、语音等多种模态信息的AI模型,通过跨模态对齐与融合实现更全面的智能理解与生成 |
AI算力网络 | 整合分散的AI算力资源,通过网络技术实现算力的统一调度与按需分配,类似算力版云计算,提升资源利用率 |
生成式AI | 指能够自主生成文本、图像、视频等内容的AI技术,基于扩散模型、Transformer等架构,改变内容创作生产方式 |
六、资料引用声明
- 百度《文心·灵眸多模态大模型技术白皮书》(2025)
- 特斯拉Optimus 2.0量产技术报告(2025)
- 英伟达H1000芯片架构文档(2025)
- ISO/IEC 42001《人工智能系统伦理设计指南》(2025)
- 发改委《AI算力基础设施建设指南》(2025)
- 麦肯锡《全球AI机器人产业白皮书》(2025)
七、免责声明
- 本文信息来源于公开渠道,可能存在信息滞后或不完全准确的情况
- 技术参数与性能指标基于企业公开资料整理,实际表现可能因应用场景不同存在差异
- 企业合作与商用计划可能随市场环境变化而调整,不构成投资决策依据
- 部分技术描述进行了通俗化处理,专业读者请参考原始技术文档
- 本文不代表任何机构立场,仅供行业研究与交流使用
- 数据如无特殊说明,均来源于企业官网或第三方研究报告
- 本报告由AI辅助生成,核心观点经人工审核但仍可能存在疏漏
文档最后更新时间:2025年5月26日
相关文章:
2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元
2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元 目录 2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元一、本周热点回顾1. 百度发布全球首…...

某航后缀混淆逆向与顶像风控分析
文章目录 1. 写在前面2. 接口分析3. 加密分析4. 风控分析 【🏠作者主页】:吴秋霖 【💼作者介绍】:擅长爬虫与JS加密逆向分析!Python领域优质创作者、CSDN博客专家、阿里云博客专家、华为云享专家。一路走来长期坚守并致…...

[Protobuf]常见数据类型以及使用注意事项
[Protobuf]常见数据类型以及使用注意事项 水墨不写bug 文章目录 一、基本数据类型1、字段2、字段的修饰规则 二、自定义数据类型1、message类型2、enum类型3、Any类型4、oneof类型5、map类型 三、小工具1.hexdump2.decode 四、注意事项 一、基本数据类型 protobuf 支持多种基础…...
【C/C++】面试基础题目收集
C 软件开发面试中常见的刷题题目通常可分为以下几大类:数据结构与算法、系统编程、面向对象设计、C 语言特性、并发编程等。 🧠 一、数据结构与算法(力扣/牛客经典题) 掌握 STL 和底层结构实现能力: 📌 数…...

模拟实现线程池(线程数目为定值)和定时器
前言 昨天学习关于定时器的相关知识。今天花时间去模拟实现了一个定时器,同时也去模拟实现了一个线程池(线程数目为定值)。我感觉我收获了很多,对于线程的理解加深了。跟大家分享一下~ 线程池和定时器(这个是主要)的实现 代码 线程池 import java.ut…...

数据结构之队列实验
引言 在计算机科学中,进制转换是基础但重要的操作。例如将一个十进制数转换为二进制或八进制表示时,我们通常使用“短除法”——即不断用目标进制去除当前数,记录余数,直到商为0为止。 这种方法得到的是低位先产生的结果&#x…...
Java求职者面试题详解:计算机网络、操作系统、设计模式与数据结构
Java求职者面试题详解:计算机网络、操作系统、设计模式与数据结构 第一轮:基础概念问题 1. 请解释什么是HTTP协议? HTTP(HyperText Transfer Protocol)是一种用于传输超文本的协议,它定义了客户端和服务…...
每日八股文6.1
每日八股-6.1 Go1.Sync.map的底层实现2.结构体的tag如何获取?3.Go实现单例模式(使用sync.Once)4.Go实现单例模式(不使用sync.Once)5.make和new的区别6.Go项目引用包为什么用_以及包的init()函数7.如何判断一个结构体是…...

【Ubuntu】摸鱼技巧之虚拟机环境复制
前言 提示:所有的操作都需要关闭虚拟机 如何快速在其它电脑布置,linux环境,如果我们有一个环境直接拷贝就有时间摸鱼呀。 1.直接复制简单粗暴 不做赘述,如果不会复制,那么请右击鼠标压缩复制 2.克隆虚拟机 2.1 …...

室内VR全景助力房产营销及装修
在当今的地产行业,VR全景已成为不可或缺的应用工具。从地产直播到楼市VR地图,从效果图到水电家装施工记录,整个地产行业的上下游生态中,云VR全景的身影无处不在。本文将探讨VR全景在房产营销及装修领域的应用,并介绍众…...

jenkins集成gitlab实现自动构建
jenkins集成gitlab实现自动构建 前面我们已经部署了Jenkins和gitlab,本文介绍将二者结合使用 项目源码上传至gitee提供公网访问:https://gitee.com/ye-xiao-tian/my-webapp 1、创建一个群组和项目 2、添加ssh密钥 #生成密钥 [rootgitlab ~]# ssh-keyge…...
【C语言练习】070. 编写代码处理C语言中的异常情况
070. 编写代码处理C语言中的异常情况 070. 编写代码处理C语言中的异常情况C语言异常处理的基本思路返回值检查示例errno使用示例setjmp/longjmp示例最佳实践建议1. 使用返回值检查错误2. 使用全局变量记录错误状态3. 使用回调函数或信号处理程序4. 使用`setjmp`和`longjmp`示例…...
Java基本数据类型、抽象类和接口、枚举、时间类、String类全面介绍
JAVA基本数据类型知识总结 基本数据类型(Primitive Types) 类型占用字节默认值范围示例byte10-128 ~ 127byte a 100;short20-32,768 ~ 32,767short b 2000;int40-2 ~ 2-1int c 100000;long80L-2⁶ ~ 2⁶-1long d 10000000000L;float40.0f~7位小数f…...

Spring Boot微服务架构(八):开发之初就引入APM工具监控
使用 APM(Application Performance Management)工具监控 Spring Boot 应用,可以帮助开发者实时追踪性能瓶颈、分析调用链路、监控资源使用情况,并快速定位故障。以下是详细的步骤和常用工具的选择指南: 一、常用 A…...

大规模真实场景 WiFi 感知基准数据集
一段话总结 本文提出CSI-Bench,首个大规模真实场景WiFi感知基准数据集,覆盖26个室内环境、35名用户、16种商用设备,包含461小时有效数据,支持跌倒检测、呼吸监测、定位、运动源识别等单任务及用户身份、活动、 proximity联合标注的多任务学习。通过标准化评估协议和基线模…...

Python实现HPSO-TVAC优化算法优化支持向量机SVC分类模型项目实战
说明:这是一个机器学习实战项目(附带数据代码文档),如需数据代码文档可以直接到文章最后关注获取。 1.项目背景 在当今数据驱动的时代,支持向量机(SVM)作为一种经典的机器学习算法,…...

ck-editor5的研究 (3):初步使用 CKEditor5 的事件系统和API
前言 在上一篇文章中—— ck-editor5的研究(2):对 CKEditor5 进行设计,并封装成一个可用的 vue 组件 ,我已经把 CKEditor5 封装成了一个通用vue组件,并且成功在nuxt中运行,并具备一定的通用性&…...
使用ReactNative加载HarmonyOS Svga动画
这是一款使用ReactNative 加载HarmonyOS Svga动画的播放器插件 三端Svga动画统一使用点击这里 版本:v1.1.5 react-native-ohos-svgaplayer [!TIP] Github 地址 安装与使用 npm npm install react-native-ohos-svgaplayer yarn yarn add react-native-ohos-svgaplayer下面…...

WPS快速排版
论文包括(按顺序):封面(含题目)、摘 要、关键词、Abstract(英文摘要)、Keywords、目录、正文、参考文献、在读期间发表的学术论文及研究成果,致 谢 题目(黑小一加粗&…...

Java实现命令行图书管理系统(附完整源码)
一、项目概述 本文将介绍如何使用Java实现一个基于命令行的图书管理系统。系统支持管理员和普通用户两种角色,提供图书的增删改查、借阅归还等功能。项目采用面向对象设计原则,代码结构清晰,适合Java初学者学习。 二、系统功能架构 graph T…...
使用Docker-NVIDIA-GPU开发配置:解决 Docker NVIDIA 运行时错误方法
问题描述 运行 Docker 命令时,系统提示 docker: Error response from daemon: unknown or invalid runtime name: nvidia,表明 Docker 无法识别 NVIDIA 运行时。这一错误通常出现在使用 --runtime=nvidia 和 --gpus 参数时,意味着 NVIDIA 容器运行时未正确安装或配置。NVID…...
如何更好的理解云计算和云原生?
本文介绍什么是云计算、什么是云原生、怎么理解云相关概念,如有问题,欢迎指正。 一、云计算 定义:云计算是通过互联网(即“云”)按需提供计算资源(如服务器、存储、数据库、网络、软件等)的服…...

【数据结构】顺序表和链表详解(上)
前言:上期我们介绍了算法的复杂度,知道的算法的重要性同时也了解到了评判一个算法的好与坏就去看他的复杂度(主要看时间复杂度),这一期我们就从顺序表和链表开始讲起。 文章目录 一,顺序表1,线性表2,顺序表…...

唯创WT2606B TFT显示灵动方案,重构电子锁人机互动界面,赋能智能门锁全场景交互!
在智能家居的浪潮中,门锁搭载显示屏已成为行业创新的焦点。据行业数据显示,2023年全球智能门锁出货量中,搭载显示屏的型号占比已突破40%,且年复合增长率达25%。而2024年国内智能门锁销量突破2200万套,预计2025年市场规…...
WPF的UI交互基石:数据绑定基础
数据绑定基础 1 Binding的Path属性2 ElementName绑定3 DataContext的作用4 绑定模式(Binding Mode)5 实用技巧集合1. 默认值处理2. 设计时数据3. 绑定验证4. 多级路径监控 6 常见错误排查 数据绑定是WPF的核心特性之一,它实现了界面ÿ…...

智能穿戴新标杆:SD NAND (贴片式SD卡)与 SOC 如何定义 AI 眼镜未来技术路径
目录 一、SD NAND:智能眼镜的“记忆中枢”突破空间限制的存储革命性能与可靠性的双重保障 二、SOC芯片:AI眼镜的“智慧大脑”从性能到能效的全面跃升多模态交互的底层支撑 三、SD NANDSOC:11>2的协同效应数据流水线的高效协同端侧…...
TCP/IP四层模型
TCP/IP四层模型 TCP/IP四层模型将网络通信分为四个层次: 1. 网络接口层:负责计算机与网络硬件间的数据传输,在物理网络上发送/接收数据帧(如以太网、Wi-Fi协议)。 2. 互联网层(网络层)&…...
深入浅出Nacos:微服务架构中的服务发现与配置管理利器
在当今的软件开发领域,随着微服务架构的普及,如何有效地进行服务治理和服务配置管理成为了开发者面临的重要挑战之一。阿里巴巴开源的 Nacos(Dynamic Naming and Configuration Service)应运而生,旨在帮助开发者更轻松地构建云原生应用。本文将详细介绍 Nacos 的核心功能、…...

node_modules包下载不下来
如果项目里面的package-lock.json有resolved ,就指向了包的下载来源,如果这个网址挂了,那npm i 就会一直卡着。而且,在终端去修改 npm的镜像是没有用的 解决办法是:把项目里面的 lock文件 .npmrc都删了 然后重新下载就可以了...

yolo个人深入理解
卷积层的理解,通过云端服务器训练模型,模型构建的重要性,针对极低像素的处理,模型训练召回率提高技巧,卷积层2,4,8,16,32的小模型与大模型的理解 一.关于backbone,neck,head深入理解 1,backbone的主要组成部分是sppf和conv,这是backbone的核心,其中yolov5和yolov8…...