当前位置: 首页 > article >正文

DeepSeek悄悄干了一件大事,但所有人的目光都在OpenAI身上

DeepSeek悄悄干了一件大事但所有人的目光都在OpenAI身上AI观察社 · 2026年4月24日今天的AI圈所有人都在讨论GPT-5.5。我也是。早上起来刷了一圈推特满屏都是GPT-5.5来了最强模型Agent时代正式开启。热热闹闹的像过年。然后我看到一条推送DeepSeek的官方公众号。点进去一看——V4来了。不是小更新。是全新的架构直接把上下文干到了百万级别Agent能力据说已经超过Sonnet 4.5。我愣了一下。然后想这消息放今天怎么看都有点大雾天放烟花的意思。────────────────先说V4-Pro到底强在哪1.6万亿参数。MoE架构384个专家每次只激活6个。听着很大但DeepSeek一贯如此大但不笨。关键是Agent能力。DeepSeek自己内部已经把V4当主力编码模型在用了据反馈体验优于Sonnet 4.5交付质量接近Opus 4.6的非思考模式。说人话就是让它帮你写代码、改bug、做项目它干得比Claude还好使。世界知识仅逊Gemini-Pro-3.1数学、STEM、竞赛型代码超过所有已公开的开源模型。换句话说在开源圈子里它没有对手。另外还有个V4-Flash。参数更小推理能力接近Pro简单任务旗鼓相当。但便宜很多适合对成本敏感的场景。────────────────百万上下文成标配了这个我觉得才是最值得说的。以前上下文128K就算大了现在DeepSeek直接把100万token做成所有服务的标配。不是Pro独享Flash也有。怎么做到的他们搞了一种新的注意力机制在token维度做压缩再结合自研的DSA2稀疏注意力。效果是计算量和显存需求大幅降低。100万token是什么概念大概相当于一次性塞进去一本500页的技术手册外加几万行代码外加你的整个项目历史。然后让AI从头到尾读一遍还能记住。以前只能翻到哪页记到哪现在能整本书背下来再跟你聊。────────────────还有个大新闻融资DeepSeek一直有个态度——不拿外部钱。梁文锋DeepSeek创始人以前说过好几次不引入外部资金自己能扛得住。但这次改主意了。腾讯和阿里争着投。估值从100亿美元一路涨到超过200亿美元折合人民币大概1365亿。我个人的判断V4的技术水平已经到了不拿钱反而不正常的阶段。训练成本摆在那再扛一轮可能就扛不住了。────────────────几个需要注意的事第一API名字变了。新模型叫deepseek-v4-pro和deepseek-v4-flash。旧名字deepseek-chat和deepseek-reasoner三个月后停用2026年7月24日。用DeepSeek API的注意改接口。别到时候突然挂了才想起来。第二开源了。权重已经上了HuggingFace和ModelScope技术报告也发了。想本地部署的可以直接下。第三适配国产芯片。他们专门针对寒武纪做了优化。这点我觉得挺重要的——不是嘴上说支持国产是真的做了底层适配。1.2元 / 百万tokensAPI最低输入价格────────────────我怎么看说实话今天GPT-5.5确实抢了风头。OpenAI凌晨发布全网刷屏这是人家的主场优势。但DeepSeek V4有几个点让我觉得更值得关注一是百万上下文标配这意味着以后所有用DeepSeek的应用都能处理超长文档了不是旗舰版特权。二是开源。GPT-5.5再强你不花钱就摸不到。V4-Pro的权重在HuggingFace上躺着谁都能下。三是国产芯片适配。在这个节骨眼上这比任何benchmark都重要。我不知道V4能不能打过GPT-5.5。但我觉得DeepSeek正在走一条不一样的路——不是比谁贵是比谁能用得起。今天是GPT-5.5的场子。但DeepSeek V4告诉我一件事最好的模型不一定是最贵的那个。关注AI观察社带你看清技术趋势

相关文章:

DeepSeek悄悄干了一件大事,但所有人的目光都在OpenAI身上

DeepSeek悄悄干了一件大事,但所有人的目光都在OpenAI身上AI观察社 2026年4月24日 今天的AI圈,所有人都在讨论GPT-5.5。 我也是。早上起来刷了一圈推特,满屏都是"GPT-5.5来了""最强模型""Agent时代…...

保姆级教程:用ESP32和MicroPython驱动1.8寸ST7735S彩屏,5分钟显示你的第一张图片

零基础玩转ESP32:5分钟点亮ST7735S彩屏全攻略 第一次接触ESP32和MicroPython的硬件爱好者们,是否曾被复杂的SPI接线和驱动配置劝退?今天我们将用最直观的方式,带你绕过所有坑点,从零开始驱动1.8寸ST7735S彩屏。不同于常…...

告别重复劳动!5分钟掌握taskt:Windows平台最强免费自动化工具

告别重复劳动!5分钟掌握taskt:Windows平台最强免费自动化工具 【免费下载链接】taskt taskt (pronounced tasked and formely sharpRPA) is free and open-source robotic process automation (rpa) built in C# powered by the .NET Framework 项目地…...

Pandas分位数quantile()避坑指南:为什么你的计算结果和教科书不一样?

Pandas分位数计算差异全解析:从理论到实践的深度避坑指南 当你第一次在Pandas中使用quantile()函数时,可能会惊讶地发现它与统计学教科书中的结果不同。这种差异不是bug,而是设计选择。本文将带你深入理解这种差异背后的原理,并掌…...

4GB显存也能跑SDXL?Fooocus低配置AI绘图终极指南

4GB显存也能跑SDXL?Fooocus低配置AI绘图终极指南 【免费下载链接】Fooocus Focus on prompting and generating 项目地址: https://gitcode.com/GitHub_Trending/fo/Fooocus 你是否曾因为电脑配置不够而放弃了AI绘画的梦想?当其他AI绘画工具动辄需…...

服务器设计细节 之 【缓冲区模块】(memXXX接口、std::cpoy)

目录 2.实现思想 2.4.简单实现 3.memXXX接口 3.1.memcpy — 内存拷贝 3.2.memmove — 内存移动 3.3.memset — 内存填充 3.4.memchr — 内存查找 3.5.memcmp — 内存比较 4.std::copy -- 范围拷贝 1.模块概述 Buffer 模块是一个基于线性内存空间的缓冲区组件&#xff…...

阅读 String 源代码之后的收获

在学习 Java 的过程中,String 是最常用的类之一。表面上看,它只是一个保存字符串的对象,但阅读部分源代码后,我发现它背后其实有很多值得学习的设计思想。 1. String 是不可变的 这是我阅读源代码后最深刻的认识之一。 在日常编程…...

AI Agent Harness Engineering 成本与收益的真相:企业投入产出比全景分析与 ROI 计算方法论

AI Agent Harness Engineering 成本与收益的真相:企业投入产出比全景分析与 ROI 计算方法论副标题:从盲目跟风到数据驱动决策——拆解百万到十亿级Agent项目的真实投入、可量化收益与可持续增长模型第一部分:引言与基础 (Introduction & …...

【限时开源】企业级AI沙箱框架v1.0发布:支持自动策略生成、实时syscall拦截、GPU设备级隔离——仅开放前500名开发者申请白名单

更多请点击: https://intelliparadigm.com 第一章:Docker Sandbox 运行 AI 代码隔离技术 实战案例 在 AI 模型快速迭代与第三方代码频繁集成的场景下,运行不可信推理脚本存在严重安全风险。Docker Sandbox 提供轻量级、强隔离的容器化执行环…...

【AI大模型】国内外主流大语言模型(LLM)全面对比解析

目录 一、国际主流大语言模型(LLM)详解 1. GPT-4o(OpenAI)—— 全能型旗舰标杆 2. Claude 3系列(Anthropic)—— 安全合规与长文本专家 3. Llama 3(Meta)—— 开源界的性能黑马 …...

Cursor Pro永久免费使用终极指南:3步解锁AI编程助手完整功能

Cursor Pro永久免费使用终极指南:3步解锁AI编程助手完整功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached yo…...

14万+下载量!为什么Tavily Search是OpenClaw必装的第一技能?

没有它,你的AI Agent就是"瞎子" 一、先问一个问题 你用过ChatGPT吗? 那你一定遇到过这种情况:问它"2026年最新AI趋势",它告诉你"我的知识截止到2024年4月"。 这就是大模型的先天缺陷——知识有截…...

设备预测性维护在物联网中的技术革新与应用实践

物联网技术的快速发展为工业设备管理带来了革命性变化,预测性维护(Predictive Maintenance, PdM)作为其核心应用之一,正在改变传统被动维修模式。通过实时数据采集、智能分析和故障预警,企业能够显著降低停机时间与维护…...

终极IDM激活方案:开源脚本实现永久免费使用的完整指南

终极IDM激活方案:开源脚本实现永久免费使用的完整指南 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 想要永久免费使用Internet Download Manager&a…...

VLOOKUP到XLOOKUP的正确打开方式

先说结论VLOOKUP是Excel里被用得最多也被骂得最多的函数,而XLOOKUP是它的全面升级版,能解决VLOOKUP几乎所有的痛点。如果你还在用VLOOKUP,是时候认识XLOOKUP了。这个东西是什么你一定遇到过这种场景,两张表,一张是员工…...

VSCode-reinstall-remote-extension备份重装vscodeextension

远端vscode环境出现莫名其妙卡顿频繁重启,根据重装解决99%问题定律的原则,决定删除vscode-server重装。但是机器上,随着时间推移,vscode安装了n多extension,一时之间难以取舍。那就先备份再重装吧,好在code…...

解密OpenHand机械手:从实验室原型到工业级抓取系统的实战演进

解密OpenHand机械手:从实验室原型到工业级抓取系统的实战演进 【免费下载链接】openhand-hardware CAD files for the OpenHand hand designs 项目地址: https://gitcode.com/gh_mirrors/op/openhand-hardware 面对机器人抓取任务中的自适应挑战,…...

终极明日方舟自动化助手:5分钟快速上手MAA完整指南

终极明日方舟自动化助手:5分钟快速上手MAA完整指南 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://gitcod…...

BiliRoamingX:解锁B站完整观影体验的3大核心解决方案

BiliRoamingX:解锁B站完整观影体验的3大核心解决方案 【免费下载链接】BiliRoamingX-integrations BiliRoamingX integrations and patches powered by ReVanced. 项目地址: https://gitcode.com/gh_mirrors/bi/BiliRoamingX-integrations 你是否曾因地区限制…...

仰望U8真牛,老戏骨都忍不住夸

2026北京车展看点还真不少!王志飞和宁理两位老师,特意来到仰望展台体验了仰望U8。两人亲自坐进车里,体验了车内空间和智能配置,整体体验下来评价都很不错。王志飞分享说,仰望U8车内静谧性很好,行驶起来特别…...

C 语言控制流完全指南

在 C 语言编程中,控制流是程序的核心骨架,决定了代码的执行顺序与逻辑分支。本文将系统讲解 C 语言中的分支、循环、跳转语句,帮你彻底掌握程序控制的核心技巧。一、二路分支:if 与 if-else逻辑:程序中某段代码需要在满…...

100人以内中小工厂ERP怎么选?好用不贵的系统看这里

很多几十人到百人的中小工厂,都面临同样的管理难题: 库存不准,盘点麻烦,积压浪费多 生产进度不透明,天天追着车间问 订单易出错,漏单错发时有发生 财务对账慢,成本利润算不清 想用系统又怕&…...

卡梅德生物技术快报|探针定制:媒介探针 qPCR 体系原理、设计规范与工程化实现

摘要本文聚焦基于媒介探针的 qPCR 定制体系,详解探针定制的技术原理、序列设计、体系优化、工程化要点与性能验证方法,提供可直接落地的实验方案与参数配置,面向生物信息、分子诊断、实验开发工程师,助力快速搭建高性能、低成本的…...

2025届毕业生推荐的六大AI辅助论文网站推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek DeepSeek系列论文,系统讲解了混合专家模型也就是MoE与多头潜在注意力即MLA机制的…...

2026年Hermes Agent/OpenClaw如何部署?常见问题解答

2026年Hermes Agent/OpenClaw如何部署?常见问题解答。OpenClaw和Hermes Agent是什么?OpenClaw和Hermes Agent怎么部署?如何部署OpenClaw/Hermes Agent?2026年还在为部署OpenClaw和Hermes Agent到处找教程踩坑吗?别再瞎…...

如何快速批量下载ASMR音频资源:asmr-downloader完整使用指南

如何快速批量下载ASMR音频资源:asmr-downloader完整使用指南 【免费下载链接】asmr-downloader A tool for download asmr media from asmr.one(Thanks for the asmr.one) 项目地址: https://gitcode.com/gh_mirrors/as/asmr-downloader 如果你是一位ASMR爱好…...

BES2800BP_nuttx编译环境搭建方法

1BES2800BP_nuttx编译环境搭建方法0开发环境搭建先安装WSL执行指令指令1: sudo apt install bison flex gettext texinfo libncurses5-dev libncursesw5-dev xxd git gperf automake libtool pkg-config build-essential gperf genromfsv libmpc-dev libmpfr-dev li…...

基于MCP协议为AI助手构建持久记忆层:Reattend配置与实战指南

1. 项目概述:为AI助手构建持久记忆层 如果你和我一样,每天都要和Claude、Cursor这类AI助手打交道,那你一定对下面这个场景深恶痛绝:每次打开一个新的对话窗口,AI都像一张白纸,你得把项目背景、技术决策、会…...

如何5分钟搞定Steam清单下载?Onekey免费工具终极指南

如何5分钟搞定Steam清单下载?Onekey免费工具终极指南 【免费下载链接】Onekey Onekey Steam Depot Manifest Downloader 项目地址: https://gitcode.com/gh_mirrors/one/Onekey 你是不是曾经为了获取Steam游戏的Depot清单而头疼?那些复杂的API调用…...

GEO 实战教程:企业生成式引擎优化的完整实现方案

生成式引擎优化(GEO)正在成为企业获取 AI 搜索流量的核心技术。本文将从工程实现的角度,讲解如何从零构建企业的 GEO 体系。一、GEO 技术架构总览GEO 的核心技术栈包含三个层面:语料采集层、知识处理层、内容优化层。语料采集层负…...