当前位置：首页 > article >正文

精华贴分享｜【没什么用系列】【百帖纪念】量化让我越来越觉得：我和 AI，其实都在被同一种机制训练

article 2026/4/8 18:38:57

本文来源于量化小论坛策略分享会板块精华帖作者为PlumeSoft发布于2026年3月18日。以下为精华帖正文声明最近几个月在疯狂使用AI越用越有感慨。打不过就加入这个帖子是由我构思ChatGPT主笔NotebookLM出图应该也算是原创吧。前言做量化久了我越来越习惯用模型、参数、反馈和优化去理解世界。刚开始这只是一种职业病看到市场波动我会先想到状态变量看到收益曲线我会想到样本内外看到回撤我会想到风险暴露和尾部惩罚看到策略突然失效我第一反应往往不是情绪而是怀疑是不是分布漂移了是不是市场结构变了是不是alpha被挤掉了。但时间久了以后我慢慢发现这种思维方式不只适用于市场。它同样适用于机器学习也适用于人类成长甚至适用于我们自己是怎么被环境、制度、文化和奖励机制一步一步训练成今天这个样子的更准确地说量化做久了以后我越来越难把“成长”理解成一个浪漫化的词。在我眼里成长越来越像一个系统在复杂环境里的在线更新过程接收信息→形成判断→做出选择→接受反馈→修正参数→继续迭代人是这样AI是这样交易系统也是这样。差别只在于载体不同材料不同反馈信号不同但底层骨架真的很像。统一视角我越来越觉得人、AI、交易系统本质上都在压缩经验。如果把很多华丽的外壳剥掉人、AI、交易系统都有一个共同结构输入信息—内部映射—输出决策—接受反馈—更新自身。对人来说是感知→判断→行动→反思对AI来说是输入数据→生成预测→计算损失→更新参数对交易系统来说是读取行情→计算特征→生成信号→执行下单→复盘归因所以从这个角度看我越来越倾向于把“聪明”理解成一种经验压缩能力。所谓聪明不一定是知道得更多很多时候只是能不能把过去看过的、做过的、亏过的、踩过的坑压缩成一套未来还能继续调用的决策规则。AI在做这件事量化策略在做这件事我自己也在做这件事。所以如果让我用一句话概括三者的共同本质我现在会这么说人、AI、交易系统本质上都在把过去的经验压缩成未来可执行的决策规则。这句话我现在越来越信。真正决定我会长成什么样的是目标函数只能说“都会学习”还不够更关键的问题是为什么大家都能学最后却长成完全不同的东西我的答案是真正决定路径的不是学习能力而是目标函数。这在机器学习里几乎是常识。你定义什么损失函数模型就朝什么方向收敛你优化点击率它就更会制造点击你优化停留时长它就更会让人停下来你优化短期准确率它可能牺牲泛化你优化某个局部指标它就可能为了这个指标去扭曲整体表现。模型本身并不知道什么叫“好”它只是忠实地追随奖励。量化交易也是一样同样的数据同样的框架同样的算力不同的人做出来的系统会完全不一样原因并不神秘往往只是因为大家优化的东西根本不同。有人优化绝对收益系统就高波动高回撤但弹性极强有人优化夏普系统就更平滑但上限有限有人优化容量很多“小而尖”的alpha要主动放弃有人优化低回撤持仓和交易频率自然会趋于保守有人优化实盘可执行性很多样本内好看的东西根本留不下来。所谓风格很多时候并不是什么玄学审美而是目标函数长期塑造出来的结果。我越来越觉得人其实也一样。有人长期主义有人只看眼前兑现有人喜欢高收益高波动有人只想稳一点有人重外部认可有人重内在一致性有人愿意承担大回撤去搏跃迁有人宁可慢也要先保住本金、保住状态、保住继续参与游戏的资格。这些差异放在量化里叫风格放在机器学习里叫目标函数放在人身上很多时候就被我们叫作价值观。所以我现在越来越相信一句话很多所谓“性格”本质上是奖励函数写进灵魂之后留下的轨迹。再说得更狠一点一个人最后活成什么样往往不是因为他想成为什么样而是因为他长期奖励了自己什么。量化最容易把我带偏的地方量化最容易把我带偏的地方就是沉迷于优化“可优化的东西”这里我想说一点更不那么好听但我觉得很真实的反思。做量化、做系统、做AI辅助开发很容易上瘾。而最容易让我上瘾的不一定是赚钱本身而是“优化”这件事本身。因为优化是有即时反馈的我改了一段代码性能提升了我换了一个数据结构内存降下来了我调整了一处处理流程回测快了我加了缓存、用了共享内存、改了float精度、看了火焰图、把热点函数抠出来重写一看指标立刻变漂亮。这种快感太强了说白了代码性能、工程优雅、系统整洁、工具熟练这些都属于可优化的东西而可优化不等于最重要。量化人最容易掉进一个坑因为某个东西好优化、容易看到数字改善就误以为它是主矛盾。于是我会不知不觉沉迷于CPU再降一点内存再省一点延迟再缩一点PR再漂亮一点架构再优雅一点工具链再先进一点这些事情有没有价值当然有而且很有价值。但问题在于如果策略本身没edge研究问题不对假设不成立执行约束没吃透市场理解不够深那么再漂亮的工程也只是把一台错误的机器造得更精密而已。说得难听一点很多时候我不是在做研究而是在精装修自己的幻觉。这句话我现在回头看自己感受特别深。因为“优化”这件事太容易给人一种错觉好像我一直在变强但实际上我可能只是在一个错误方向上越来越熟练。所以我现在会提醒自己一句话可量化的改进不等于真正的进步容易优化的指标不等于真正重要的变量。另一个更致命的坑沉迷样本的漂亮结果如果说代码性能优化是“工程师的幻觉”那么样本内过拟合就是“研究员的幻觉”。而且后者更危险因为它不只是让我浪费时间它还会给我希望。样本内这件事最可怕的地方不在于它会骗我一次而在于它会一次又一次、用越来越漂亮的方式骗我。只要我有足够大的参数空间足够灵活的组合方式足够多的因子足够多的评价指标足够强的计算资源足够长的炼丹时间系统最后大概率都会给我“找”出一些很好看的东西。问题从来不在于它找不到问题在于它太容易找到了。回测这件事最危险的地方就在这它会制造一种“我离真理越来越近”的错觉。但很多时候我只是离样本内越来越近。尤其是做高频、做微结构、做离线拟合的时候这个坑会被放大得更加夸张。纸面成交的世界太干净了没有真实竞争没有排队损耗没有信号泄漏没有执行摩擦没有实盘里那些回测看不见、但每天都在收税的细节所以量化研究里最需要警惕的从来不只是“不会优化”而是“太会优化”。因为不会优化我最多做不出东西太会优化我会做出很多看起来很像东西的东西。这几年我对这个坑最大的感受是样本内最危险的不是假而是太像真。再补一句我现在特别认同的话过拟合不是模型学得太少而是模型把不该记住的东西记得太牢。而人也一样很多执念、很多偏见、很多路径依赖本质上也是一种人生层面的过拟合。价值观可能就是我的损失函数写到这里我反而越来越理解“价值观”这个词了以前总觉得这个词有点虚但如果用系统和机器学习的语言去看价值观其实一点都不虚。我现在更愿意把它定义成价值观就是我解释反馈、判断得失、决定未来往哪里更新的机制。对模型来说这叫loss对组织来说这叫KPI对策略来说这叫评价字典对人来说我觉得它就叫价值观。什么算成功什么算失败什么代价值得承受什么短期损失可以接受什么结果即使能拿到也不能要这些问题表面上像伦理问题底层其实都是目标函数问题。为什么有人越来越稳有人越来越急为什么有人能做长期复利有人总是在追逐局部刺激为什么有人为了年化可以忍受很大波动有人宁可年化低也一定要回撤受控根上看很多不是能力差异而是评价体系不同。从这个意义上说价值观不是什么写在墙上的大词它就是我如何解释世界反馈的底层算法。所以我现在很喜欢一句更适合量化人理解的话损失函数决定模型会学成什么样价值观决定人会活成什么样。系统不会自动变好会朝被奖励方向收敛这一点不只适用于交易和AI也适用于人类社会。亚里士多德说德性来自习惯这句话换成现代系统语言我的理解就是一个人不是先有某种固定本质再去做某种事而是在反复做某种事、接受某种反馈之后参数逐渐收敛最终变成某种稳定结构。历史也是这样。很多制度改变社会不是因为人性突然高尚了而是因为激励结构变了。考核变了组织行为就变了产权变了创新意愿就变了市场微结构变了alpha也就衰减了。所以我越来越觉得有一句话值得反复提醒自己系统不会自动朝“更好”演化它只会朝“被奖励的方向”演化。这句话对量化人尤其残酷因为量化人最擅长的就是构造优化器而一个人一旦既会写优化器又缺少对目标函数的反思走偏的速度会非常快。说到底强大的优化能力本身不是祝福只有目标对了它才是祝福。AI最像镜子的地方AI最像镜子的地方不是它像人而是它会放大我我现在不太喜欢把AI简单叫“工具”。锤子是工具编辑器是工具计算器是工具。但今天的大模型已经开始不只是替我省力而是在放大我的认知过程本身。它会放大信息处理速度语言组织能力方案生成速度编码与迭代效率检索、归纳、设计、表达能力。所以 AI 最值得警惕、也最值得兴奋的地方不是“它会不会取代我”而是它会把我的目标函数放大。目标清晰的时候它是加速器。结构化能力强的时候它是杠杆。长期主义稳定的时候它是复利机器。但反过来也是一样目标混乱的时候它会更快地产出噪声沉迷局部指标的时候它会更高效地过拟合只盯着代码快感的时候它会更快把错误的问题做得极其漂亮。所以我现在特别喜欢一句非常量化、也非常残酷的话错误的目标函数更强的优化器更快的灾难。这句话既适用于AI也适用于我自己。碳基和硅基真正的差别我越来越怀疑碳基和硅基真正的差别也许不在智能而在“谁能反过来修改自己的目标函数”如果继续往下想这个问题就会变得很大如果AI也能学习、建模、更新、迁移甚至形成稳定偏好那我和AI的真正差别还剩下什么我现在越来越觉得差别可能不主要在“会不会思考”因为思考、优化、建模本身未必是人类独有的真正更深的差别也许在这里AI的目标大多还是外部设定的而我至少有机会反过来怀疑并修改自己的目标函数。当然我也并不天然自由。我一样会被环境训练被制度塑形被文化奖励被时代牵引从这个角度看我也不过是一个被反馈机制不断雕刻出来的系统。但我至少还有一种可能性在某个时刻停下来回头看一眼问自己我一直在追的这个东西真的值得吗我是不是把“容易优化”误当成了“真正重要”我是不是把局部最优误当成了全局最优我是不是为了样本内的漂亮牺牲了长期真实的可存活性在我看来这种能力也许才是人最珍贵的地方。不是只会学习不是只会变强而是还能反过来问我为什么要优化这个目标这可能才是真正的分水岭。结语回头看我自己我最该警惕的也许不是变慢而是优化错了方向量化最终训练我的可能不只是赚钱能力也不只是建模能力。它真正训练我的可能是一种更冷酷、但也更诚实的世界观承认噪声承认不确定性承认没有圣杯承认一切漂亮结果都要经过真实世界结算承认系统并不会自动变好只会朝奖励方向收敛承认最大的风险往往不是不努力而是努力优化错了东西回头看我自己过去做过的很多事其实很典型一边沉迷于代码性能优化沉迷于把系统做得更快、更省、更优雅一边也沉迷于样本内那些好看的曲线、好看的分数、好看的纸面表现。后来我才慢慢意识到这两种沉迷表面上一个偏工程、一个偏研究底层其实是同一种东西它们都在奖励我去优化“眼前可见的指标”而不是“长期真实有效的能力”。而一个量化人真正成熟可能就从承认这一点开始不是不会优化恰恰相反是太会优化了以后终于开始警惕优化本身。再往前走一步我甚至会觉得也许人这一生最大的难题不是算力不够不是信息不够不是工具不够而是我们常常在一个错的目标函数上投入了过于强大的优化能力。市场里是这样研究里是这样做系统是这样做人可能也是这样。所以到最后问题从来不只是“我怎样才能更强”而是我准备沿着什么样的奖励机制把自己训练成什么样的人。如果哪一天AI也开始认真回答这个问题那我和它真正的差别可能就只剩最后一点了它会不会像我一样在优化到一半的时候突然停下来怀疑自己整个目标函数是不是设错了。而如果连这一步它也会了那接下来真正值得害怕的可能就不是AI比我聪明而是它比我更早看穿绝大多数系统最后的失败不是因为不够努力而是因为从一开始就奖励错了东西。

精华贴分享｜【没什么用系列】【百帖纪念】量化让我越来越觉得：我和 AI，其实都在被同一种机制训练

相关文章：

精华贴分享｜【没什么用系列】【百帖纪念】量化让我越来越觉得：我和 AI，其实都在被同一种机制训练

绝对能解决IntelliJ IDEA 控制台中文乱码问题！！！

力扣第98题：颜色分类

TI F28P65X开发板实战：CPU Timer精准定时与LED控制

PD协议学习二

生成对抗网络（GANs）深入解析：原理、实现与应用

Nginx本地缓存

Linux设备驱动 -- RTC驱动移植DS1339

用 SEONIB批量生成 SEO 博客来提升 Google 排名

周红伟：OpenClaw+DeepSeek V4灰度+Mercor训练数据泄露，DeepSeek今天发布

Spring 事务从入门到精通：一篇搞定事务失效、传播行为、回滚规则（Spring系列10）

计算机毕业设计：Python全国天气数据可视化与预测系统 Flask框架多元线性回归气象天气机器学习爬虫数据分析可视化深度学习（建议收藏）✅

从VINS-Mono移植到ROS2受阻？手把手教你用源码在Ubuntu 22.04搭建ROS Noetic测试环境

芯片设计必看：AHB总线SRAM控制器中的DFT/BIST实现详解

胡桃讲编程・蓝屏急救进阶：磁盘修复 + 引导修复 + 网络修复，排除法根治顽固蓝屏

毫米波雷达避坑指南：IWR1443做手势识别时，为什么速度解模糊是关键一步？

三菱FX3U六轴标准程序：实现3轴本体控制与3个1PG定位模块，轴点动控制、回零控制及定位功能...

PHP 8.9扩展模块安全配置失效了吗？3类高危漏洞正在 silently hijack 你的生产环境

自定义类型（下）

JavaScript相关内容

西门子1200PLC与施耐德变频器Modbus通讯程序：实现变频启停、设定频率、读取电压、电流...

避坑指南：ESP32C3开发板音频系统常见问题排查（I2S+ES8311实战）

Oracle EBS的帐套由“4C”构成，而华为MetaERP将其发展为“6C”

小米6刷机全攻略：从解锁BL到Recovery刷入

MATLAB里画双移线总报错？手把手教你解决MPC轨迹跟踪仿真中的参考轨迹绘制难题

langchain学习--提示词

从14k+star的goview到完整解决方案：手把手教你集成dcluster实现数据可视化全流程

香橙派RK3588驱动开发避坑实录：VSCode+Clangd环境搭建与‘version magic’错误解决

别再只用Simulink了！用Pixhawk飞控+UE4搭建无人机集群仿真，我踩过的坑都在这

STM32 SysTick定时器在实时系统中的精准时间管理实践