当前位置: 首页 > article >正文

DeepSeek V4 正式发布:1.6万亿参数、百万上下文,开源大模型进入新阶段

DeepSeek V4 正式发布1.6万亿参数、百万上下文开源大模型进入新阶段2026年4月24日深度求索DeepSeek正式发布了新一代旗舰模型DeepSeek-V4并同步开源模型权重。这是距 V3 发布484天之后的一次重大版本迭代。和 V3 一样V4 依然走的是全开源路线。但这一次DeepSeek 把参数规模、上下文长度、架构设计都推到了一个新的量级上。本文不吹不捧只把这次更新的真实内容梳理清楚。这次发布了什么V4 系列包含两个版本版本参数量激活参数上下文V4-Pro1.6 万亿1.6T~490 亿100万 tokenV4-Flash2840 亿284B130 亿13B100万 token两者的定位有明确区分V4-Pro满血版本面向复杂推理、代码架构、数理等高难度任务V4-Flash轻量版本主打高吞吐和低价格适合日常和规模化场景亮点一100万 token 上下文成标配如果说 V3 之前的长上下文还是高配能力V4 直接把它变成了标配。两个版本都原生支持 100万 token1M的上下文窗口。这意味着你可以直接把一个大型代码仓库、一部长篇技术文档完整丢给模型处理不需要做分段切割。当然这里需要说明一个实际限制虽然上下文窗口是100万 token但模型的实际有效理解范围并不等于窗口上限。超长上下文下模型对开头和结尾内容的关注度通常高于中间部分这是 Transformer 架构本身的特性100万窗口解决的是放得下的问题理解得到位还取决于后续优化。亮点二稀疏注意力机制让长上下文真正可用100万 token 上下文如果用传统全注意力机制计算量和显存开销是天文数字。V4 为此引入了DSADeepSeek Sparse Attention稀疏注意力机制具体采用了CSA HCA 混合结构CSA压缩稀疏注意力将每 m 个 token 的 Key-Value 信息压缩成一个块用轻量 indexer 计算相关性分数只在 top-k 压缩块上做精细注意力。适合 token 级别的精确检索。HCA深度压缩注意力更激进地将 128 个 token 压缩成一个块。适合长距离的全局信息汇总。实测效果在 100万 token 场景下V4-Pro 的单 token FLOPs 降至 V3.2 的 27%KV Cache 压缩到原来的约10%。这个数字的意义在于——它让百万上下文从理论上可行变成了实际跑得动。亮点三mHC 架构残差连接的10年来首次升级这是 V4 技术报告中被讨论最多的创新之一。自 2016 年 ResNet 提出残差连接Residual Connection以来这个机制一直是深度学习的基础组件但随着模型越来越深其信号传递不稳定的问题也逐渐显现。V4 引入的mHC流形约束超连接机制做了这样一件事将残差流的混合矩阵约束到Birkhoff 多面体的流形上使矩阵的行列都归一化为1。这个设计带来了两个实际好处谱范数天然不超过1为残差传播设置了硬上限信号传递更稳定乘法封闭性保证堆叠多层如 V4-Pro 的61层时依然保持数值稳定同时mHC 带来的额外开销被控制在 wall-time 的 6.7% 以内实际影响很小。亮点四预训练数据量翻倍版本预训练数据量V314.8T tokenV4-Flash32T tokenV4-Pro33T tokenV4 的预训练数据量较 V3翻了一倍以上。数据量增长带来的直接收益是世界知识的覆盖面扩大。V4-Pro 在各项知识 benchmark 上逼近 Gemini-Pro-3.1而 V4-Flash 在简单 Agent 任务上与 Pro 版本表现相当。亮点五开源权重 昇腾适配V4 延续了 DeepSeek 一贯的开源策略模型权重以Apache 2.0许可证开源可商用。另外值得关注的是V4 实现了华为昇腾 SuperNode 的首日零日适配。这意味着在国产算力生态中V4 是目前适配最快的万亿参数级别开源模型。亮点六价格有诚意也有差异根据官方 API 文档V4 的完整定价如下单位元/百万 tokens版本缓存命中输入缓存未命中输入输出V4-Flash0.2 元1 元2 元V4-Pro1 元限时 0.25 元12 元24 元V4-Flash 的定价确实刷新了性价比认知0.2 元/百万 token 的输入成本已经大幅低于市场同类产品。另外值得注意的是V4-Pro 目前有限时优惠缓存命中输入价格降至 0.25 元原价 1 元优惠截止至2026年5月5日。优惠期后 V4-Pro 的日常价格并不低选择时需要结合实际需求。旧接口deepseek-chat与deepseek-reasoner将于2026年7月24日停用届时将统一路由至 V4 系列。性能表现什么水平V4-Pro 在几个关键 benchmark 上的表现基准V4-Pro 成绩对比SWE-bench80.6%Agent 代码能力开源模型榜首数理推理超越所有已公开评测的开源模型逼近顶级闭源世界知识逼近 Gemini-Pro-3.1仍有差距需要注意的是benchmark 成绩反映的是特定测试集上的表现与实际使用体验不一定完全对应。模型在真实场景中的效果还取决于任务类型、提示词设计、具体场景匹配度等多种因素。两个版本怎么选根据目前的官方信息建议如下选 V4-Pro代码架构设计、SWE 类任务多步复杂推理需要最强数理和代码能力替代 Claude Sonnet / GPT-5 类的复杂任务选 V4-Flash日常对话、文档总结高并发、高吞吐场景规则明确的自动化任务成本敏感的规模化部署几点客观说明写这篇文章的过程中有几个点我特意想提一下1. 关于参数规模1.6万亿参数听起来很大但这是总参数量。V4 采用了 MoE混合专家架构每次推理只激活约490亿参数V4-Pro。所以实际推理开销远没有1.6T看起来那么夸张。2. 关于 benchmark 成绩这些数字是官方公布的各家厂商的 benchmark 成绩往往经过精心配比和测试集选择不同模型之间直接对比存在口径差异。参考可以别当成绝对标尺。3. 关于长上下文的真实体验100万 token 窗口是技术突破但实际使用中能放进去和理解得好是两件事。模型在超长上下文中的中间位置往往存在注意力衰减这是 Transformer 架构的特性不是 V4 独有的问题。4. 关于开源的持续性DeepSeek 之前的模型也有开源但社区维护、更新节奏、长期支持等都需要观察。开源模型的价值不只是发布那一刻取决于后续社区生态的跟进。总结DeepSeek V4 是一次实打实的升级——参数规模更大、上下文更长、架构有新意、价格有诚意。对于开源社区来说V4 的发布确实是这个春天值得关注的一件事。但作为从业者我更愿意保持一个客观的态度大模型的能力是真实的进步但落地效果因场景而异是否适合自己还是那句话看任务看场景看成本。参考来源DeepSeek 官方 API 文档platform.deepseek.comDeepSeek 开放平台定价platform.deepseek.com/pricingHuggingFacehuggingface.co/deepseek-ai/DeepSeek-V4-FlashDeepSeek 公众号发布于 2026年4月24日36氪《DeepSeek 正式发布 V4 APIFlash/Pro 双版本齐发百万上下文成标配》2026年4月24日原创内容转载需授权。

相关文章:

DeepSeek V4 正式发布:1.6万亿参数、百万上下文,开源大模型进入新阶段

DeepSeek V4 正式发布:1.6万亿参数、百万上下文,开源大模型进入新阶段 2026年4月24日,深度求索(DeepSeek)正式发布了新一代旗舰模型 DeepSeek-V4,并同步开源模型权重。这是距 V3 发布484天之后的一次重大版…...

Agent 项目如何写 PRD:任务边界、风险清单与验收口径

Agent 项目如何写 PRD:任务边界、风险清单与验收口径 1. 引入:90%的Agent项目失败,都始于一份不合格的PRD 2024年某AI咨询公司发布的《企业Agent落地调研报告》显示:全年国内企业上马的Agent类项目中,72%最终未能落地,其中48%的失败原因可以归结为「需求定义模糊」——…...

框架篇第3节:PyTorch C++扩展(一)——环境搭建与一个简单的add算子

引言 当PyTorch内置算子不够用时,你可以用C++和CUDA扩展它——这是通往高性能自定义算子的必经之路 前两节我们学习了PyTorch的GPU加速原理和算子底层机制。但实际开发中,你可能会遇到PyTorch没有提供的高效算子,或者需要融合多个操作以减少内存访问。这时,你就需要自定义算…...

深入Rockchip Android分区表:揭秘‘logo分区’的创建与定制化配置

Rockchip Android分区表深度解析:logo分区的定制化设计与工程实践 在工业自动化设备、数字标牌和定制化终端领域,开机第一屏的品牌标识展示往往承载着重要的商业价值和技术内涵。不同于消费级设备千篇一律的厂商Logo,专业设备通常需要根据应用…...

告别硬件IIC:STM32F103用软件模拟IIC读写AT24C02/04/16全攻略(含地址计算详解)

STM32软件模拟IIC驱动AT24C系列EEPROM实战指南 1. 为什么选择软件模拟IIC? 在嵌入式开发中,IIC总线因其简单的两线制(SDA和SCL)和灵活的多设备连接特性,成为连接各类传感器的首选方案。然而,STM32的硬件IIC…...

Phi-4-mini-flash-reasoning多场景:从单题求解到批量PRD分析的扩展路径

Phi-4-mini-flash-reasoning多场景:从单题求解到批量PRD分析的扩展路径 1. 轻量级推理模型的核心价值 Phi-4-mini-flash-reasoning是一款专为结构化思维任务设计的轻量级文本推理模型。与通用大模型不同,它在数学推导、逻辑分析和长文本推理等场景展现…...

06华夏之光永存:电磁弹射+一次性火箭航天入轨方案【第六篇:电磁弹射核心电池组参数与供配电优化方案】

华夏之光永存:电磁弹射一次性火箭航天入轨方案【第六篇:电磁弹射核心电池组参数与供配电优化方案】核心备注:本文为该系列第六篇核心电池组供配电篇,系列共计10篇保姆式开源落地白皮书,全文基于大功率储能电化学、电力…...

完整网页截图终极指南:如何一键保存超长网页的完美副本

完整网页截图终极指南:如何一键保存超长网页的完美副本 【免费下载链接】full-page-screen-capture-chrome-extension One-click full page screen captures in Google Chrome 项目地址: https://gitcode.com/gh_mirrors/fu/full-page-screen-capture-chrome-exte…...

网络受限环境下的OOTDiffusion虚拟试衣AI完整部署实战指南

网络受限环境下的OOTDiffusion虚拟试衣AI完整部署实战指南 【免费下载链接】OOTDiffusion [AAAI 2025] Official implementation of "OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on" 项目地址: https://gitcode.com/Gi…...

五大免费大语言模型(LLM)课程推荐与学习指南

1. 大语言模型(LLMs)学习资源概览过去两年,大语言模型(LLMs)的发展速度令人咋舌。从最初的文本补全到现在的多模态交互,这些模型正在重塑我们与数字世界的互动方式。作为一名长期跟踪AI技术发展的从业者&am…...

机器学习中矩阵类型与应用实践指南

1. 矩阵类型在机器学习线性代数中的核心价值第一次接触机器学习时,我被各种矩阵运算绕得头晕眼花,直到发现不同类型的矩阵其实对应着特定的数学特性和应用场景。就像木匠需要了解不同木材的特性才能打造好家具,理解矩阵类型能让我们更高效地构…...

机器学习k折交叉验证:k值选择与性能评估指南

1. 机器学习中的k折交叉验证配置指南在机器学习实践中,评估模型性能是项目流程中的关键环节。k折交叉验证(k-Fold Cross-Validation)作为最常用的评估技术之一,其核心思想是将数据集划分为k个大小相似的互斥子集,每次用…...

MCP 2026多租户隔离配置全链路解析,从vCPU亲和性到TLS 1.3租户证书绑定,覆盖7层隔离面

更多请点击: https://intelliparadigm.com 第一章:MCP 2026多租户隔离架构全景概览 MCP 2026(Multi-Tenant Control Plane 2026)是新一代云原生控制平面标准,专为超大规模混合云环境设计。其核心设计理念是“零信任边…...

【2026年AI DevOps分水岭】:Docker AI Toolkit全新Agent编排框架上线,支持AutoGen/MetaGPT原生集成——现在不装,下周CI/CD流水线将自动拒绝旧版镜像

更多请点击: https://intelliparadigm.com 第一章:Docker AI Toolkit 2026 最新版功能 Docker AI Toolkit 2026 是面向 AI 工程化部署的下一代容器化工具链,深度集成模型编译、量化推理、分布式训练监控与合规性审计能力。相比 2025 版本&a…...

全网最全的医药数据库挖掘教学专栏,只需要399元,不断更新,欢迎订阅!

当前的医药数据科学和R语言领域,网络上和书籍市面上一大堆资料,表面看起来琳琅满目,价格从几十元的书籍到动辄几千元一次的线下培训班都有。但绝大多数培训或书籍都受限于时间和篇幅,浅尝辄止,很多仅仅是基础入门&…...

VS Code插件生态失控危机(MCP时代成本暴雷预警):从日均$23.6运维损耗到零预算优化的完整路径

更多请点击: https://intelliparadigm.com 第一章:VS Code插件生态失控危机的本质诊断 VS Code 插件生态的爆发式增长已悄然演变为一场系统性风险——表面繁荣之下,是权限泛滥、依赖污染、更新失序与兼容性黑洞的叠加。其本质并非工具冗余&a…...

终极指南:用BthPS3驱动让PS3控制器在Windows上重获新生

终极指南:用BthPS3驱动让PS3控制器在Windows上重获新生 【免费下载链接】BthPS3 Windows kernel-mode Bluetooth Profile & Filter Drivers for PS3 peripherals 项目地址: https://gitcode.com/gh_mirrors/bt/BthPS3 还记得那些年,你满怀期待…...

DeepXDE技术架构深度解析:多后端科学机器学习框架的设计哲学与实践指南

DeepXDE技术架构深度解析:多后端科学机器学习框架的设计哲学与实践指南 【免费下载链接】deepxde A library for scientific machine learning and physics-informed learning 项目地址: https://gitcode.com/gh_mirrors/de/deepxde DeepXDE是一款面向科学机…...

探索OpenCore Legacy Patcher:让2008-2017年老款Mac重获新生的终极方案

探索OpenCore Legacy Patcher:让2008-2017年老款Mac重获新生的终极方案 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 在苹果生态系统中&#xf…...

Cursor Pro免费激活解决方案:三步解锁AI编程完整功能

Cursor Pro免费激活解决方案:三步解锁AI编程完整功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your tria…...

5分钟掌握:百度网盘直链解析工具完全手册

5分钟掌握:百度网盘直链解析工具完全手册 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘那蜗牛般的下载速度而抓狂吗?😫 每…...

Plex媒体库如何自动获取YouTube视频元数据:插件配置与命名规范详解

1. 项目概述:为你的本地YouTube视频库注入灵魂 如果你和我一样,是个喜欢把YouTube上喜欢的频道、系列视频下载到本地,然后用Plex搭建个人媒体库的“松鼠党”,那你一定遇到过这个痛点:辛辛苦苦下载下来的视频&#xff…...

Java的CompletableFuture链式调用与异常处理

Java异步编程利器:CompletableFuture链式调用与异常处理 在现代Java开发中,异步编程已成为提升系统性能的关键手段。CompletableFuture作为Java 8引入的异步编程工具,通过链式调用和灵活的异常处理机制,显著简化了多线程任务编排…...

Squad:构建持久化AI智能体团队,革新软件开发协作模式

1. 项目概述:当AI开发团队成为你的代码库“原住民”如果你和我一样,经常在深夜对着一个全新的项目目录发呆,心里盘算着“前端用什么框架?后端API怎么设计?测试用例怎么写?”,然后开始在各种文档…...

政府引导基金数据(2001-2023年)

01、数据介绍自2001年以来,我国政府引导基金在推动经济增长、促进产业升级方面发挥了重要作用。政府引导基金的投资领域十分广泛,涵盖了高新技术产业、战略性新兴产业、现代服务业等多个领域。通过引导社会资本投向这些领域,政府引导基金有效…...

5分钟快速上手:用WebToEpub将网页小说一键转为电子书永久保存

5分钟快速上手:用WebToEpub将网页小说一键转为电子书永久保存 【免费下载链接】WebToEpub A simple Chrome (and Firefox) Extension that converts Web Novels (and other web pages) into an EPUB. 项目地址: https://gitcode.com/gh_mirrors/we/WebToEpub …...

中国高铁航线数据库CRAD(2003-2022年)

01、数据介绍中国高铁航线数据库CRAD(Chinese High-speed Rail and Airline Database)是一个专门收集和管理航空公司和高铁公司交通航线信息的数据仓库。它详细记录了中国各省、市、县所开通的列车站和飞机场的情况,如铁路线路、车站和列车等…...

MusicPlayer2:你的Windows音乐管家,三步打造专属音乐空间

MusicPlayer2:你的Windows音乐管家,三步打造专属音乐空间 【免费下载链接】MusicPlayer2 MusicPlayer2是一款功能强大的本地音乐播放软件,旨在为用户提供最佳的本地音乐播放体验。它支持歌词显示、歌词卡拉OK样式显示、歌词在线下载、歌词编辑…...

TMSpeech终极指南:5分钟配置Windows本地实时语音转文字工具

TMSpeech终极指南:5分钟配置Windows本地实时语音转文字工具 【免费下载链接】TMSpeech 腾讯会议摸鱼工具 项目地址: https://gitcode.com/gh_mirrors/tm/TMSpeech 你是否厌倦了需要联网才能使用的语音转文字工具?担心会议内容被上传到云端泄露隐私…...

c++如何获取目录下的文件数量(不包括子文件夹)_iterator计数【实战】

最直接可靠的方法是使用 std::filesystem::directory_iterator(C17 起),它仅遍历当前目录一层、自动跳过 . 和 ..,配合 is_regular_file() 可精准统计普通文件数,且跨平台、无需手动处理路径细节或系统 API 差异。用 s…...