当前位置: 首页 > article >正文

OpenAI大神教你如何榨干Codex

闻乐 发自 凹非寺量子位 | 公众号 QbitAI新晋员工确实毫无保留。Jason Liu13k星开源库Instructor的作者刚被OpenAI招进Codex团队没多久不仅在社交平台大方发API额度还写了篇Codex-maxxing把自己的Codex玩法全抖出来了。而且是让Codex自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats在你洗澡的时候帮你干活的那种。Codex周活用户4月底已经破了400万终于来了份“官方使用指南”。正好这两天Codex又更新了一波Appshots截图直喂、Goal模式正式转正、锁屏后也能远程干活。跟Jason的使用心法叠在一起看会发现现在大家比拼的是谁能持续工作更久谁能真正上岗了……让它自己跑起来Jason整套玩法的核心是把Codex改造成了一个能长期运行、持续接管任务的工作系统。多数人习惯单次问答结束就关闭会话但Jason是开着一堆跨月存活的巨型线程不会随意终止。他给每个工作流一个置顶线程管日程的一个、管开源项目的一个、监控社交平台的一个……通过Command-1到Command-9一键跳转。线程里积累了几个月的对话历史、偏好和决策再次使用时不用重新交代背景Agent就能自动承接进度。当线程生命周期被拉长后项目背景、沟通习惯和历史决策都会自然沉淀进去Agent开始具备连续性。而且Jason下任务不打字主要靠说。在他看来口述能完整保留原始思路不需要刻意优化Prompt可以直接把模糊、跳跃、带溯源需求的想法原样丢给Agent。再配合Codex的Steering功能还能在Agent执行任务时插队追加指令说完就走不用干等。不过真正让Codex从工具变员工的是Heartbeatscomputer这套组合拳。Heartbeats本质上相当于给Agent加了一层定时任务调度。Jason有个Chief of Staff线程每30分钟跑一次——扫一遍Slack和Gmail看看有没有需要回复的消息判断优先级需要回复的先起草一份草稿但不发送最终由人来决定是否发出。他还举了一个更复杂的例子是做动画项目时他会先把视频发到Slack审阅线程然后让Codex每15分钟检查一次线程。如果同事提了反馈Codex就重新渲染一个新版本并回复到线程里。因为Slack MCP服务器还不支持文件上传Agent甚至会自己调用computer去点“Add file”按钮把渲染好的文件传上去。还有一次Jason在洗澡前让Codex盯着亚马逊客服排队状态结果等他洗完澡出来退款已经到账了。类似的流程现在已经能扩展到Google Docs评论、GitHub PR Review等场景只要有反馈就自动推进下一步。Jason最强调的一点是验证机制可以判断任务什么时候终止。他试过让Codex把Python的Rich库完整迁移到Rust硬性要求是必须通过原Python库的所有单元测试。测试能不能通过决定了任务是否完成失败了Agent就继续修。用他的话说没有验证机制的野心顶多算个愿望而已。而在最新的这次更新中OpenAI已经把Goal模式从实验版本转正了。你只要明确一个最终目标和验收标准Codex会自主持续推进短则几小时长则数天中途可以查进度、调方向也可以直接暂停。但前提是任务本身必须存在清晰、可验证的反馈闭环。记忆放在自己手里Jason这套用法的另一大核心思路是个人工作记忆不应该托管在平台内部。他所有的长期线程都从一个Obsidian vault起步目录划分为TODO、people、projects、agent、notes等板块。在顶层AGENTS.md里写明规则人员信息更新、项目推进、待办办结等变动都要同步更新知识库对应内容。也就是说他几乎放弃了Codex的内置记忆系统把核心记忆数据存放在本地可控文件中既能随时查阅手动修改也能通过版本对比查看变动出现问题还能一键roll back。原因是AI承载的记忆体量越大就越不该把数据锁死在单一平台。而文件是完全属于用户自己的后续想换工具、迁平台拎着知识库就能走毫无顾虑。他也提到了Codex自带的记忆功能Chronicle通过截取屏幕内容来构建上下文。但这是需要手动开启的实验预览功能在权限、速率和隐私方面存仍在短板整体方向可行但还不够成熟。所以在他看来文件系统仍然是最可靠的记忆基础设施。而且Codex工作台本身也在升级。Codex的侧边栏不再局限聊天交互可直接渲染Markdown、筛选表格、阅览PDF与PPT。Agent还能通过内置浏览器用JavaScript控制网页用户可以边看边标注不用来回切窗口。Jason说他经常在侧边面板里同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。而他最喜欢的交付形式就是一个带JS和CSS的单文件index.html不用部署不用服务器打开就能跑。另外他还把Connectors和Skills作为可复用工作流模版。只要成功做完一件有用的事就把流程打包起来下次Codex不用重新学直接调用就行。最近Codex还补了一手远程能力电脑锁屏后Codex可以继续工作手机端也能实时查看、审批甚至接管任务。现在好了你下班它加班你锁屏它干活超额KPI这不就来了……不过当AI可以持续接管工作人自己倒是越来越轻松了doge。参考链接https://x.com/jxnlco/status/2057153744630890620一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—专属AI产品从业者的实名社群只聊AI产品最落地的真问题扫码添加小助手发送「姓名公司职位」申请入群进群后你将直接获得 最新最专业的AI产品信息及分析 不定期发放的热门产品内测码 内部专属内容与专业讨论 点亮星标 科技前沿进展每日见

相关文章:

OpenAI大神教你如何榨干Codex

闻乐 发自 凹非寺量子位 | 公众号 QbitAI新晋员工确实毫无保留。Jason Liu,13k星开源库Instructor的作者,刚被OpenAI招进Codex团队没多久,不仅在社交平台大方发API额度;还写了篇Codex-maxxing,把自己的Codex玩法全抖出…...

arXiv开始拒收综述,CS新人发论文得找人背书

一水 发自 凹非寺量子位 | 公众号 QbitAI坏了!在arXiv发综述的门,已经被关上了。arXiv接收门槛收紧后,最新受害者已急哭:arXiv的审核越来越严格了。综述论文已经不再被允许发表了,计算机科学领域彻底完蛋了&#xff0c…...

DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI

听雨 发自 凹非寺量子位 | 公众号 QbitAI同一天,DeepSeek又发生两件大事。一边,DeepSeek-V4-Pro API宣布永久降价。从 6月1日起,V4 Pro的API价格将正式调整为当前促销价,不再恢复原价。另一边,The Information爆料&…...

刚刚,马斯克第三代星舰首飞成功!

克雷西 发自 凹非寺量子位 | 公众号 QbitAI刚刚,马斯克的第十二次星舰试验,也是第三代星舰的首次飞行,顺利完成!当地时间昨天下午5点30分(北京时间今早6点30分),33台猛禽3发动机同时点火&#x…...

Steam创意工坊模组下载终极指南:WorkshopDL跨平台模组自由教程

Steam创意工坊模组下载终极指南:WorkshopDL跨平台模组自由教程 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 还在为Epic Games或GOG平台上的游戏无法使用Steam创意…...

VMware Workstation Pro 17免费许可证密钥完整指南:快速激活专业虚拟化工具

VMware Workstation Pro 17免费许可证密钥完整指南:快速激活专业虚拟化工具 【免费下载链接】VMware-Workstation-Pro-17-Licence-Keys Free VMware Workstation Pro 17 full license keys. Weve meticulously organized thousands of keys, catering to all major …...

HAR模型调优实战:为何精心调优的线性模型能击败复杂机器学习?

1. 项目概述:当HAR模型遇上机器学习,一场关于“调优”的较量在金融计量和量化交易领域,预测明天的市场波动率,就像试图预测一场风暴的强度,充满了挑战但也至关重要。无论是为了给衍生品定价、管理投资组合风险&#xf…...

算法公平性评估:如何用自洽性与方差分析区分真实偏见与随机噪声

1. 项目概述:为什么我们需要关注算法评估中的“噪声”?在算法公平性研究领域,我们常常看到这样的结论:“模型在A群体上的误报率(FPR)比B群体高X个百分点,因此存在不公平。” 然而,作…...

模型不确定性下的公平性评估:自一致性指标与集成弃权策略

1. 项目概述:当公平性评估遭遇模型不确定性在机器学习,尤其是公平性评估这个领域,我们常常会陷入一种“确定性幻觉”。我们训练一个模型,在某个测试集上计算其误判率、假阳性率、假阴性率,然后得出一个结论&#xff1a…...

如何快速提升电脑性能:5个终极系统调优技巧指南

如何快速提升电脑性能:5个终极系统调优技巧指南 【免费下载链接】Universal-x86-Tuning-Utility Unlock the full potential of your Intel/AMD based device. 项目地址: https://gitcode.com/gh_mirrors/un/Universal-x86-Tuning-Utility 你是否遇到过这样的…...

魔兽争霸3终极优化指南:5分钟解决画面拉伸、帧率限制与中文兼容问题

魔兽争霸3终极优化指南:5分钟解决画面拉伸、帧率限制与中文兼容问题 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为经典游戏魔兽争…...

实战揭秘:3步解锁你的微信聊天记忆宝库

实战揭秘:3步解锁你的微信聊天记忆宝库 【免费下载链接】WechatDecrypt 微信消息解密工具 项目地址: https://gitcode.com/gh_mirrors/we/WechatDecrypt 你是否曾因为手机丢失或更换设备,眼睁睁看着珍贵的微信聊天记录消失无踪?那些承…...

BabelDOC:解决学术文档翻译三大痛点的智能PDF翻译工具

BabelDOC:解决学术文档翻译三大痛点的智能PDF翻译工具 【免费下载链接】BabelDOC Yet Another Document Translator 项目地址: https://gitcode.com/GitHub_Trending/ba/BabelDOC 你是否曾经面对一份重要的英文科研论文,需要快速理解却苦于语言障…...

RAG:终结AI“一本正经胡说八道”,让AI回答问题不再答非所问!

本文用通俗易懂的方式解释了RAG技术,即“检索增强生成”,它通过为AI构建专属知识库,在回答问题时先检索相关信息再生成答案,有效解决AI“答非所问”和“幻觉”问题。文章详细介绍了RAG的工作原理、核心价值及实用场景,…...

Anthropic为何如此反华

美国政客对中国进行科技封锁,本不是什么新闻。但一个商业公司宁可损失上亿美元的收入也要禁止中国人访问他们的AI就有点魔症了。我们不禁要问:为什么我们现在看到Anthropic的CEO Dario Amodei在所有场合都持强硬的反华立场,不免感觉有些奇怪。…...

终极指南:如何用OpenCore Legacy Patcher让旧Mac焕发新生,完美运行最新macOS

终极指南:如何用OpenCore Legacy Patcher让旧Mac焕发新生,完美运行最新macOS 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 你是否拥…...

ncmdump终极指南:3分钟学会网易云音乐NCM格式免费解密

ncmdump终极指南:3分钟学会网易云音乐NCM格式免费解密 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经下载了网易云音乐的歌曲,却发现它们都是无法在其他播放器打开的NCM格式?别担心&am…...

BabelDOC终极指南:如何完美保留PDF格式的专业文档翻译工具

BabelDOC终极指南:如何完美保留PDF格式的专业文档翻译工具 【免费下载链接】BabelDOC Yet Another Document Translator 项目地址: https://gitcode.com/GitHub_Trending/ba/BabelDOC 你是否曾为翻译PDF文档而烦恼?格式错乱、公式变形、排版混乱—…...

Thorium浏览器:基于Chromium的终极性能优化与隐私保护深度解析

Thorium浏览器:基于Chromium的终极性能优化与隐私保护深度解析 【免费下载链接】thorium Chromium fork named after radioactive element No. 90. Source code and Linux releases. Windows/MacOS/ARM builds served in different repos, links are towards the to…...

5分钟快速上手:AMD Ryzen处理器硬件调试完整指南

5分钟快速上手:AMD Ryzen处理器硬件调试完整指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcode…...

机器学习赋能心电图分析:探索神经认知障碍的早期筛查新路径

1. 项目概述:当心电图遇见机器学习,为大脑健康“把脉”作为一名长期关注医疗AI交叉应用的从业者,我常常思考一个问题:我们能否从那些看似常规、无处不在的临床检查中,挖掘出超越其传统用途的深层价值?心电图…...

量子机器学习可解释性:从经典XAI到XQML的挑战与创新方法

1. 项目概述:当量子机器学习遇上“黑盒”挑战作为一名长期关注前沿技术交叉领域的从业者,我最近花了大量时间研究一个既烧脑又极具潜力的方向:如何让量子机器学习(QML)模型变得“透明”。我们都知道,经典深…...

高斯混合期望传播算法:突破高阶MIMO检测性能瓶颈

1. 项目概述与核心挑战在无线通信系统的演进中,多输入多输出(MIMO)技术早已不是新鲜概念,它通过部署多根天线,在相同的频带内同时传输多个独立的数据流,从而成倍地提升了频谱效率和系统容量。然而&#xff…...

贝叶斯分层建模与机器学习插补:应对经济数据稀疏性的稳健分析框架

1. 项目概述:当数据稀缺成为常态,我们如何看清经济转型的脉络?在低收入和中等收入国家(LMICs)从事经济研究或政策分析,最常遇到的困境不是模型不够先进,而是数据“不够用”。你手头的数据集可能…...

ICA与NMF算法详解:从盲源分离到矩阵分解的数学原理与工程实践

1. 项目概述:从数据噪音中“听”出独立的声音在信号处理、神经科学、金融数据分析等领域,我们常常会遇到一个经典的“鸡尾酒会问题”:在一个嘈杂的房间里,多个声源(比如不同人的谈话、背景音乐)的声音混合在…...

高基数分类变量编码实战:均值、低秩与多项式逻辑回归方法解析

1. 项目概述:高基数分类变量的编码困局与破局思路在数据科学和机器学习的日常建模工作中,分类变量(Categorical Variables)的处理是绕不开的一环。从用户ID、邮政编码到产品SKU,这些变量往往携带了丰富的信息&#xff…...

基于强化学习与LLM的在线讨论不当言论自动改写技术

1. 项目概述与核心挑战 在社交媒体和在线论坛上,我们每天都能看到海量的讨论。其中,不乏一些言辞激烈、充满攻击性或者逻辑混乱的“不当言论”。传统的平台治理手段,比如关键词过滤、基于分类器的自动检测加上人工审核,更像是一个…...

Claude医学文献分析准确率实测:对比GPT-4o、Gemini 2.0与专业文献数据库(n=1,847篇RCT,Kappa=0.91)

更多请点击: https://codechina.net 第一章:Claude医学文献分析案例 在临床研究与循证医学实践中,研究人员常需从海量PubMed、NEJM或Lancet等来源的PDF或HTML格式文献中快速提取关键信息。Claude系列大模型凭借其长上下文(最高20…...

DOTT-Carbon:一种新型二维金属性多孔碳负极材料的理论设计与性能预测

1. 项目概述:从石墨烯到DOTT-Carbon的探索之路在能源存储领域,尤其是锂离子电池技术中,负极材料的性能瓶颈一直是制约电池能量密度和快充能力的关键。石墨作为商业主流,其理论容量(372 mAh/g)已接近天花板&…...

别再死记硬背了!用Python手把手拆解卡尔曼滤波的5个核心公式(附filterpy/OpenCV两种实现)

别再死记硬背了!用Python手把手拆解卡尔曼滤波的5个核心公式(附filterpy/OpenCV两种实现)卡尔曼滤波就像一位隐形的数据调酒师,它能将嘈杂的观测数据与不完美的预测模型混合,调制出一杯接近真实状态的"鸡尾酒&quo…...