当前位置：首页 > article >正文

OpenAI大神教你如何榨干Codex

article 2026/5/24 9:16:02

闻乐发自凹非寺量子位 | 公众号 QbitAI新晋员工确实毫无保留。Jason Liu13k星开源库Instructor的作者刚被OpenAI招进Codex团队没多久不仅在社交平台大方发API额度还写了篇Codex-maxxing把自己的Codex玩法全抖出来了。而且是让Codex自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats在你洗澡的时候帮你干活的那种。Codex周活用户4月底已经破了400万终于来了份“官方使用指南”。正好这两天Codex又更新了一波Appshots截图直喂、Goal模式正式转正、锁屏后也能远程干活。跟Jason的使用心法叠在一起看会发现现在大家比拼的是谁能持续工作更久谁能真正上岗了……让它自己跑起来Jason整套玩法的核心是把Codex改造成了一个能长期运行、持续接管任务的工作系统。多数人习惯单次问答结束就关闭会话但Jason是开着一堆跨月存活的巨型线程不会随意终止。他给每个工作流一个置顶线程管日程的一个、管开源项目的一个、监控社交平台的一个……通过Command-1到Command-9一键跳转。线程里积累了几个月的对话历史、偏好和决策再次使用时不用重新交代背景Agent就能自动承接进度。当线程生命周期被拉长后项目背景、沟通习惯和历史决策都会自然沉淀进去Agent开始具备连续性。而且Jason下任务不打字主要靠说。在他看来口述能完整保留原始思路不需要刻意优化Prompt可以直接把模糊、跳跃、带溯源需求的想法原样丢给Agent。再配合Codex的Steering功能还能在Agent执行任务时插队追加指令说完就走不用干等。不过真正让Codex从工具变员工的是Heartbeatscomputer这套组合拳。Heartbeats本质上相当于给Agent加了一层定时任务调度。Jason有个Chief of Staff线程每30分钟跑一次——扫一遍Slack和Gmail看看有没有需要回复的消息判断优先级需要回复的先起草一份草稿但不发送最终由人来决定是否发出。他还举了一个更复杂的例子是做动画项目时他会先把视频发到Slack审阅线程然后让Codex每15分钟检查一次线程。如果同事提了反馈Codex就重新渲染一个新版本并回复到线程里。因为Slack MCP服务器还不支持文件上传Agent甚至会自己调用computer去点“Add file”按钮把渲染好的文件传上去。还有一次Jason在洗澡前让Codex盯着亚马逊客服排队状态结果等他洗完澡出来退款已经到账了。类似的流程现在已经能扩展到Google Docs评论、GitHub PR Review等场景只要有反馈就自动推进下一步。Jason最强调的一点是验证机制可以判断任务什么时候终止。他试过让Codex把Python的Rich库完整迁移到Rust硬性要求是必须通过原Python库的所有单元测试。测试能不能通过决定了任务是否完成失败了Agent就继续修。用他的话说没有验证机制的野心顶多算个愿望而已。而在最新的这次更新中OpenAI已经把Goal模式从实验版本转正了。你只要明确一个最终目标和验收标准Codex会自主持续推进短则几小时长则数天中途可以查进度、调方向也可以直接暂停。但前提是任务本身必须存在清晰、可验证的反馈闭环。记忆放在自己手里Jason这套用法的另一大核心思路是个人工作记忆不应该托管在平台内部。他所有的长期线程都从一个Obsidian vault起步目录划分为TODO、people、projects、agent、notes等板块。在顶层AGENTS.md里写明规则人员信息更新、项目推进、待办办结等变动都要同步更新知识库对应内容。也就是说他几乎放弃了Codex的内置记忆系统把核心记忆数据存放在本地可控文件中既能随时查阅手动修改也能通过版本对比查看变动出现问题还能一键roll back。原因是AI承载的记忆体量越大就越不该把数据锁死在单一平台。而文件是完全属于用户自己的后续想换工具、迁平台拎着知识库就能走毫无顾虑。他也提到了Codex自带的记忆功能Chronicle通过截取屏幕内容来构建上下文。但这是需要手动开启的实验预览功能在权限、速率和隐私方面存仍在短板整体方向可行但还不够成熟。所以在他看来文件系统仍然是最可靠的记忆基础设施。而且Codex工作台本身也在升级。Codex的侧边栏不再局限聊天交互可直接渲染Markdown、筛选表格、阅览PDF与PPT。Agent还能通过内置浏览器用JavaScript控制网页用户可以边看边标注不用来回切窗口。Jason说他经常在侧边面板里同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。而他最喜欢的交付形式就是一个带JS和CSS的单文件index.html不用部署不用服务器打开就能跑。另外他还把Connectors和Skills作为可复用工作流模版。只要成功做完一件有用的事就把流程打包起来下次Codex不用重新学直接调用就行。最近Codex还补了一手远程能力电脑锁屏后Codex可以继续工作手机端也能实时查看、审批甚至接管任务。现在好了你下班它加班你锁屏它干活超额KPI这不就来了……不过当AI可以持续接管工作人自己倒是越来越轻松了doge。参考链接https://x.com/jxnlco/status/2057153744630890620一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—专属AI产品从业者的实名社群只聊AI产品最落地的真问题扫码添加小助手发送「姓名公司职位」申请入群进群后你将直接获得最新最专业的AI产品信息及分析不定期发放的热门产品内测码内部专属内容与专业讨论点亮星标科技前沿进展每日见

OpenAI大神教你如何榨干Codex

相关文章：

OpenAI大神教你如何榨干Codex

arXiv开始拒收综述，CS新人发论文得找人背书

DeepSeek V4价格打骨折，宁王京东网易抢着入场，梁文锋：目标是AGI

刚刚，马斯克第三代星舰首飞成功！

Steam创意工坊模组下载终极指南：WorkshopDL跨平台模组自由教程

VMware Workstation Pro 17免费许可证密钥完整指南：快速激活专业虚拟化工具

HAR模型调优实战：为何精心调优的线性模型能击败复杂机器学习？

算法公平性评估：如何用自洽性与方差分析区分真实偏见与随机噪声

模型不确定性下的公平性评估：自一致性指标与集成弃权策略

如何快速提升电脑性能：5个终极系统调优技巧指南

魔兽争霸3终极优化指南：5分钟解决画面拉伸、帧率限制与中文兼容问题

实战揭秘：3步解锁你的微信聊天记忆宝库

BabelDOC：解决学术文档翻译三大痛点的智能PDF翻译工具

RAG：终结AI“一本正经胡说八道”，让AI回答问题不再答非所问！

Anthropic为何如此反华

终极指南：如何用OpenCore Legacy Patcher让旧Mac焕发新生，完美运行最新macOS

ncmdump终极指南：3分钟学会网易云音乐NCM格式免费解密

BabelDOC终极指南：如何完美保留PDF格式的专业文档翻译工具

Thorium浏览器：基于Chromium的终极性能优化与隐私保护深度解析

5分钟快速上手：AMD Ryzen处理器硬件调试完整指南

机器学习赋能心电图分析：探索神经认知障碍的早期筛查新路径

量子机器学习可解释性：从经典XAI到XQML的挑战与创新方法

高斯混合期望传播算法：突破高阶MIMO检测性能瓶颈

贝叶斯分层建模与机器学习插补：应对经济数据稀疏性的稳健分析框架

ICA与NMF算法详解：从盲源分离到矩阵分解的数学原理与工程实践

高基数分类变量编码实战：均值、低秩与多项式逻辑回归方法解析

基于强化学习与LLM的在线讨论不当言论自动改写技术

Claude医学文献分析准确率实测：对比GPT-4o、Gemini 2.0与专业文献数据库（n=1,847篇RCT，Kappa=0.91）

DOTT-Carbon：一种新型二维金属性多孔碳负极材料的理论设计与性能预测

别再死记硬背了！用Python手把手拆解卡尔曼滤波的5个核心公式（附filterpy/OpenCV两种实现）