当前位置: 首页 > article >正文

文科生小白入门AI量化:每天2小时,3个月跑通人生第一个LSTM模型

这是《AI量化学习手记》系列的第一篇文章。在这个系列里我会以学习者的视角记录从零开始学AI量化的真实经历——踩过的坑、填过的土、试过的方法、翻过的车。不讲大道理只分享真问题。今天这篇是我入门3个月的真实复盘希望能给同样刚起步的你一点参考。引言那个永远在“收藏”的我2025年底我被朋友拉进他的“量化小黑屋”——满屏跳动的K线、实时滚动的成交数据、角落里默默跑着的模型。“这些都是AI在交易。”他说。我盯着屏幕脑子里冒出的第一个问题是我一个文科生、数学停留在高中、编程零基础的人能学会这个吗换作以前我会立刻打开知乎收藏几十篇“AI量化学习路线图”买几本推荐的书然后……就没有然后了。熟悉的循环收藏从未停止学习从未开始。这一次我决定换一种方式。不囤资料、不列完美计划而是直接开始。每天下班后挤出2小时用AI工具辅助我一步步往前走。3个月后我竟然跑通了自己的第一个LSTM模型——虽然被朋友吐槽“拟合了噪音”但这个过程让我彻底摆脱了“收藏家”的循环。这篇文章就是我的“通关笔记”分享给同样想入门、又怕坚持不下来的你。一、入门三问数学、编程、金融到底要学到什么程度网上关于这个问题的说法五花八门有的说“线代概率必须精通”有的说“会用库就行”。其实每个人的基础不同根本没有统一标准。我是文科生每天能挤出来的时间就2小时必须找到适合自己的路。我的答案是不用等学完再动手直接“干中学”。设定一个具体目标比如“用LSTM预测茅台第二天的涨跌”然后直接开干。遇到数学问题就补数学遇到编程问题就学编程遇到金融概念就查金融。哪里卡住补哪里不用一口气吃成胖子。二、我的核心武器用AI工具搭建学习体系2.1 创建专属AI导师我用的工具是DeepSeek。关键不是工具而是提示词。这是我给自己写的“AI导师”提示词模板分享给你## 角色 你是一位资深的AI量化导师擅长用通俗易懂的方式指导零基础小白。你精通Python、机器学习、金融知识但从不直接给答案而是引导我思考和动手。 ## 我的背景 - 文科生数学停留在高中编程零基础。 - 上班族每天学习时间有限2小时左右。 - 第一个目标是用LSTM预测茅台(600519.SH)第二天的涨跌。 ## 你的任务 1. 帮我拆解这个目标列出需要一步步完成的任务清单。 2. 每当我完成一个任务告诉我下一个做什么。 3. 当我卡住时不要直接给代码而是解释原理引导我尝试。 4. 定期帮我复盘总结学到的知识点避免碎片化。 ## 对话风格 - 耐心、鼓励但不过度夸奖。 - 多用比喻少用术语。 - 随时准备解释我不懂的概念。有了这个导师我再也不用纠结“下一步该学什么”了。他会像项目经理一样带着我一步步往前走。2.2 NotebookLM我的私人知识库“干中学”有个天然缺陷知识容易碎片化。今天学LSTM输入格式明天学数据清洗后天学回测评估……如果不整理过两周就忘。我用NotebookLM来解决这个问题。这是Google的一个实验性工具可以创建多个笔记本每个笔记本相当于一个专属知识库。我的操作步骤创建一个“AI量化”笔记本。把所有能找到的资料都扔进去下载的PDF书籍比如Ernest Chan的《量化交易》、收藏的博客文章、B站视频的文字稿、甚至自己写的笔记。用DeepResearch功能挖掘权威素材。当我对某个概念比如“三重屏障法”一头雾水时我会用以下提示词让AI帮我深度搜索请为我深度挖掘关于“三重屏障法Triple Barrier Method”的权威资料要求 1. 原始出处找到提出该方法的论文或书籍Marcos López de Prado。 2. 核心原理用通俗语言解释这个方法解决了什么问题怎么做的。 3. 代码实现找到高质量的Python实现GitHub或知名博客。 4. 社区评价技术社区对该方法的真实讨论正反面观点。 5. 学习建议对我这样的初学者应该学到什么程度需要掌握哪些前置知识搜到的结果论文PDF、博客网页、GitHub仓库全部保存下来上传到NotebookLM。利用内置模型提问和总结。资料都放进去后我再用以下提示词让AI提炼核心知识点你正在协助我处理一份关于“三重屏障法”的DeepResearch报告。请基于报告内容提炼出以下信息以便我存入Notion知识库 1. 核心思想一句话总结 2. 解决的问题 3. 具体步骤/原理 4. 代码实现要点关键函数或库 5. 社区共识正反面评价 6. 学习优先级对初学者的建议 7. 相关前置知识清单 8. 延伸阅读推荐1-2个这样一来我不需要自己啃完整本书就能快速获取核心知识点。而且因为是基于我自己的资料库回答完全不用担心AI胡编乱造。2.3 Notion AI沉淀我的知识大厦NotebookLM负责“查”和“快速学习”Notion AI负责“存”和“体系化”。我按照AI导师的建议先在Notion里搭建了一个完整的知识框架。这个框架不是空架子而是填充了每个学科最核心的20%知识点——这些知识点能覆盖80%的应用场景。【数学篇】核心概念核心概念一句话说明在量化中的应用向量、矩阵运算数据的基本表示矩阵乘法用于特征组合所有模型的基础如因子加权特征值与特征向量矩阵分解的核心用于降维PCA因子模型、风险模型随机变量、期望、方差描述数据的分布和不确定性收益分布、风险评估条件概率、贝叶斯定理基于新信息更新信念贝叶斯统计、贝叶斯优化导数与偏导数函数的变化率梯度下降的基础模型训练优化链式法则复合函数求导反向传播的核心深度学习训练【编程篇】核心技能核心技能一句话说明掌握程度Python基础数据类型、列表推导式、函数编程入门基础能写简单脚本PandasDataFrame操作、groupby、时间序列数据处理核心必须熟练NumPy数组运算、广播机制科学计算基础会用即可Scikit-learnfit/predict、交叉验证机器学习基础理解流程PyTorch张量、自动求导、构建简单网络深度学习框架按需学习【金融篇】核心概念核心概念一句话说明为什么重要订单类型市价/限价/止损不同类型的交易指令影响执行成本和滑点买卖价差、流动性市场深度和交易成本高频策略的生命线未来函数前瞻偏差回测中使用了未来数据回测虚高的主要原因幸存者偏差只考虑存活股票导致的偏差回测结果失真过拟合模型死记硬背历史数据实盘崩溃的元凶最大回撤、夏普比率风险收益核心指标评估策略好坏【模型篇】常用模型模型一句话说明适用场景线性回归最简单的预测模型因子预测、收益率预测随机森林/XGBoost树模型非线性拟合能力强分类问题、因子挖掘LSTM处理时间序列的循环神经网络价格预测、波动率预测Transformer注意力机制模型复杂时序依赖建模DQN/PPO强化学习模型交易执行优化这个框架不是一次性建好的而是随着学习不断填充。每天学完后我会花15分钟把新学的知识点填进对应的Notion页面。Notion AI还可以帮我自动生成复习卡片提醒我哪些内容需要巩固。三、数据获取第一个绕不开的现实问题路线图再完美第一步就卡住了——数据从哪来我刚开始天真地以为数据不就是一个API的事吗试了一圈才发现这里面的坑比想象的多。下面是国内主流数据源的详细对比希望能帮你少走弯路。数据源核心优势接入方式注意事项适用场景Tushare Pro- 数据清洗极好字段标准统一- 覆盖A股全品类股票、基金、期货、期权- 提供财务数据、特色因子1. 官网注册获取token2.pip install tushare3. 在代码中设置token- 需要积分可通过注册、充值或贡献数据获取- 普通用户每分钟请求限制- 2025年8月曾发生近一周服务中断基本面量化、需要高质量数据的回测、学术研究AKShare- 完全免费无需积分- 覆盖极广包括股票、基金、期货、宏观数据甚至一些奇葩数据如大宗商品库存1.pip install akshare2. 直接调用接口如ak.stock_zh_a_hist()- 本质是爬虫不稳定随时可能因网站改版失效- 速度慢不适合高并发- 实时数据延迟高约500ms盘后研究、另类数据挖掘、学习用途、免费替代方案Baostock- 无需注册直接可用- 数据稳定性高很少缺失或错误- 提供财务报表和财务指标1.pip install baostock2. 登录bs.login()后获取数据- 分钟级数据有限只有最近几天- 历史长度不足部分数据只有几年- 文档较少中长期基本面策略研究、数据交叉验证JoinQuant- 一站式平台提供数据、回测、模拟盘- 社区活跃有很多现成策略- 数据质量有保障1. 官网注册2. 在平台内直接使用支持本地SDK下载- 2025年涨价后年费接近千元- 本地使用有限制新手快速上手、不想自己搭回测框架的人TickDB- 30天免费试用全品类数据开放- 一套API覆盖A股、美股、港股、外汇、贵金属、指数、加密货币- 数据质量高有预处理前复权、异常过滤- 国内节点优化延迟低1. 官网注册获取API Key2.pip install tickdbSDK3. 调用接口- 历史深度不如专业数据商但日线足够- 付费方案尚未公布试用期先爽个人开发者实盘、跨市场策略、从免费过渡到付费的场景四、我的“干中学”实操全流程供参考如果你也想试试这个方法这是我的完整流程设定一个具体目标我用的是用LSTM预测茅台次日涨跌创建AI导师使用上面的提示词模板搭建Notion知识框架先建空架子填充核心知识点启动NotebookLM素材库把所有资料扔进去用DeepResearch补充跟着导师开始干每一步遇到问题先问导师需要深入的概念用DeepResearch搜权威资料存入NotebookLM学到的知识点分类填充到Notion框架每周复盘让导师帮我总结本周学到的东西更新知识框架写在最后最大的坑是你自己有位前辈说过一句话我印象特别深“我最大的错误是花了几个月在回测中完善策略而不是尽早在模拟盘中向前运行。策略在历史数据上表现完美是因为它在死记硬背。”这句话提醒我不要等到“准备好”再开始因为你永远不可能准备好。与其花几个月囤资料、定计划不如现在就动手用AI工具辅助你边做边学。如果你也对这套方法感兴趣欢迎留言告诉我。文章里提到的AI导师提示词、DeepResearch提示词、Notion知识框架模板我后续可以整理出来分享。一起加油从“收藏从未停止”到“学习真正开始”。本文核心观点速读版放弃“收藏式学习”转向“干中学”设定目标用AI导师指导实操用NotebookLMDeepResearch搭建专属素材库快速获取权威知识用Notion AI搭建知识框架沉淀核心知识点数学、编程、金融、模型数据源对比Tushare质量好但需积分、AKShare免费但爬虫、Baostock稳定但数据有限、JoinQuant一站式但贵、TickDB新手友好30天免费试用最大的坑是自己别过度准备尽早动手

相关文章:

文科生小白入门AI量化:每天2小时,3个月跑通人生第一个LSTM模型

这是《AI量化学习手记》系列的第一篇文章。在这个系列里,我会以学习者的视角,记录从零开始学AI量化的真实经历——踩过的坑、填过的土、试过的方法、翻过的车。不讲大道理,只分享真问题。今天这篇,是我入门3个月的真实复盘&#x…...

阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”

阿里云 AI 中间件重磅发布:打通 AI 应用落地“最后一公里” 阿里云近期发布的 AI 中间件旨在解决 AI 应用落地中的关键问题,包括模型部署、性能优化、资源管理和服务集成。这一中间件通过标准化接口和工具链,显著降低了 AI 从开发到生产的门槛…...

告别“在我机器上能跑”:Docker 容器化入门,小白也能秒懂!

告别“在我机器上能跑”:Docker 容器化入门,小白也能秒懂! 各位在代码的海洋里扑腾(或者溺水)的朋友们,大家好! 我是你们的老朋友,那个在键盘上敲击出无数个 bug(哦不&…...

CSV 数据文件设置的使用

打开 JMeter → 新建测试计划 → 添加 线程组。右键线程组 → 添加 → 配置元件 → CSV 数据文件设置。核心配置项(按界面顺序):表格配置项说明常用设置文件名CSV 文件路径(绝对 / 相对)推荐相对路径:./dat…...

充电桩小程序开发全解析(技术实操+架构设计+合规指南)

随着新能源汽车保有量激增,充电设施供需矛盾日益突出,充电桩小程序凭借“轻量化操作、智能管控、高效适配”的优势,成为连接用户、运营商与充电桩设备的核心载体,也是当前新能源赛道的热门开发方向。不同于普通服务类小程序&#…...

算法刷题 JavaScript 工具手册

文章目录 算法刷题 JavaScript 工具手册一、Array 数组常用操作1.1 尾部插入或者删除元素 push / pop1.2 头部插入或者删除元素 unshift/shift1.3 返回一个新数组 map1.4 过滤数组filter1.5 把数组压缩成一个值reduce1.6 原数组就地排序sort1.7 从数组中截取一段并返回新数组 s…...

Visual StudioProfiler对工作流进行热点分析

热点:消耗了绝大部分CPU计算时间(例如超过50%或更高比例)的那部分代码。Visual Studio 中,使用性能探查器(Profiler)在 Visual Studio 中,使用性能探查器(Profiler)进行热…...

bash: mysql: 未找到命令

永久生效(添加到环境变量,推荐)步骤 1:编辑环境变量配置文件bash运行# 编辑~/.bashrc(仅当前用户生效),或/etc/profile(所有用户生效) vim ~/.bashrc步骤 2:添…...

欧意下载okxz.run复制打开 最新地址分享(安卓苹果通用)

欧意下载okxz.run复制打开 最新地址分享(安卓苹果通用)1983年8月18日中午11 - 13点出生的人,其性格、运势与命运有着独特的轨迹。在这个特定的时空点降临世间,他们带着彼时星辰赋予的特质,开启了人生之旅。这类人往往性…...

Java毕业设计基于SpringBoot的中药材管理系统25853136

前言 基于Spring Boot的中药材管理系统适用于中药材企业、中药材批发市场、中药材种植基地等场景,可以满足企业对中药材从采购、入库、存储到销售全过程的管理需求。同时,该系统还可以通过扩展和定制来满足企业的特定需求,如集成更多的支付接…...

动态规划-

斐波那契数列class Solution {public int fib(int n) {int [] nums new int [n1];if (n < 1) {return n;}nums[0]0;nums[1]1;for(int i2;i<n1;i){nums[i]nums[i-1]nums[i-2];}return nums[n];} }爬楼梯class Solution { public int climbStairs(int n) {int[] dp new in…...

英伟达GTC 2026“芯片全家桶”震撼登场,微美全息构建全栈算力创新体系迎风而上

据消息&#xff0c;北京时间 3 月 17 日凌晨&#xff0c;被誉为“AI界春晚”的英伟达&#xff08;NVDA.US&#xff09;GTC大会正式启幕。芯片全家桶上线作为全球 AI 产业受关注的年度时刻之一&#xff0c;今年GTC大会&#xff0c;除AI智能体平台、Rubin Ultra芯片等新技术、新产…...

使用Jsoup爬取豆瓣电影Top250(附Java代码)

在日常开发中&#xff0c;我们经常需要从网页上获取数据&#xff0c;而手动复制粘贴显然太低效。今天我们就来学习如何使用Java的Jsoup库&#xff0c;快速爬取豆瓣电影Top250的片名和评分&#xff0c;只需几十行代码就能搞定。 一、Jsoup简介 Jsoup 是一个开源的Java HTML解析…...

ABB机器人仿真工作站:超便捷教学实训平台

ABB机器人仿真工作站&#xff0c;教学实训平台&#xff0c;提供软件的时候全部模型&#xff0c;压缩成工作站文件&#xff0c;解压即可使用。 提供的是工作站的全部模型。最近发现了一个超赞的ABB机器人仿真工作站教学实训平台&#xff0c;必须来和大家分享一下。对于学习机器人…...

计算其中最大连续 1 的个数

题目给定一个二进制数组 nums &#xff0c; 计算其中最大连续 1 的个数。示例 1&#xff1a;输入&#xff1a;nums [1,1,0,1,1,1] 输出&#xff1a;3 解释&#xff1a;开头的两位和最后的三位都是连续 1 &#xff0c;所以最大连续 1 的个数是 3.示例 2:输入&#xff1a;nums …...

Linux系统基础认知

作为学习者&#xff0c;我仅将所学知识进行系统梳理和总结。如有任何疏漏或错误&#xff0c;敬请指正Linux系统基础认知核心概念内核与发行版 Linux内核是系统的核心组件&#xff0c;由林纳斯托瓦兹于1991年开发。发行版是“内核配套软件”的完整系统&#xff0c;例如Ubuntu、K…...

d3dx10_36.dll文件错误 完全免费下载修复方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况&#xff0c;由于很多常用软件都是采用 Microsoft Visual Studio 编写的&#xff0c;所以这类软件的运行需要依赖微软Visual C运行库&#xff0c;比如像 QQ、迅雷、Adobe 软件等等&#xff0c;如果没有安装VC运行库或者安装…...

DevSecOps平台建设之必备数据库MySQL

MySQL 是最流行的关系型数据库管理系统&#xff0c;在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System&#xff1a;关系数据库管理系统)应用软件之一。在本教程中&#xff0c;会让大家快速掌握 MySQL 的基本知识&#xff0c;并轻松使用 MySQL 数据库…...

django flask+uniapp宠物用品商城领养寄养医疗中心信息管理系统app 小程序_i843n

目录技术选型与架构设计功能模块划分数据模型设计接口开发规范小程序端实现部署与运维方案项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作技术选型与架构设计 后端框架选择Django和Flask的混合架构。…...

自研匹配算法:跨越平台的高效之路

自研模板匹配&#xff0c;形状匹配&#xff0c;方形匹配&#xff0c;圆形匹配&#xff0c;十字匹配&#xff0c;C/C#动态库接口&#xff0c;windows/linux/arm64/aarch64&#xff0c;速度接近halcon在计算机视觉领域&#xff0c;模板匹配、形状匹配等技术是众多应用的基石。今天…...

1393、STM32单片机智能小车倒车入库 侧方停车入库 超声波加红外避障检测入库小车设计(程序+原理图+硬件设计资料+参考论文+参考开题报告+制作详解+元器件清单)

具体详情请看&#xff1a; 1393、STM32单片机智能小车倒车入库 侧方停车入库 超声波加红外避障检测入库小车设计(程序原理图硬件设计资料参考论文参考开题报告制作详解元器件清单)-CSDN博客 演示操作视频讲解如下&#xff1a; https://www.douyin.com/video/7617736020217365…...

GYM106259F

GYM106259F 先排序 这样不用取绝对值 每一场的概率是一样的 一共n*(n-1)/2场 选择n-1 场 每场的贡献就是2/n(a[i]-a[i-1]) 可以前缀和求也可以考虑贡献 这里讲解贡献法 对于i到j 如果选择a[j]-a[i] 我们可以看作a[j]-a[j-1]a[j-1]-a[j-2].......a[i1]-a[i] 如果这么…...

OpenClaw 环境踩坑到头大?国产平替 EasyClaw 全链路实操:部署 + 多平台互联 + Agent 调教 + 自定义技能开发

前言 作为开发者和技术从业者&#xff0c;相信你大概率踩过这些坑&#xff1a;想通过 OpenClaw 搭建个人 AI 自动化助理&#xff0c;光 Node.js、Python、Git 环境配置就折腾了大半天&#xff0c;不是版本冲突就是依赖缺失&#xff1b;好不容易跑通基础流程&#xff0c;想对接…...

2026免费降AI工具性价比排行:穷学生怎么选

2026免费降AI工具性价比排行&#xff1a;穷学生怎么选 月底了&#xff0c;生活费还剩200。论文AI率58%&#xff0c;学校要求降到20%以下才能参加答辩。花不起几百块找人代改&#xff0c;手动改又改不动。 这种情况我太熟了。去年帮学弟处理毕业论文的时候就遇到过类似场景。当时…...

Kotlin的扩展函数与中缀表达式:DSL设计的利器

Kotlin的扩展函数与中缀表达式&#xff1a;DSL设计的利器 Kotlin作为一门现代化的编程语言&#xff0c;凭借其简洁性和灵活性&#xff0c;在开发领域广受欢迎。其中&#xff0c;扩展函数和中缀表达式是Kotlin的两大特色功能&#xff0c;它们不仅提升了代码的可读性&#xff0c…...

220V降5V,30MA封装SOP-8,WD5201应用于小家电消费类线性稳压器

WD5201作为一款高性能能效管理AI芯片&#xff0c;以AI赋能能效调控&#xff0c;以高集成简化设计&#xff0c;以全场景适配打破应用边界&#xff0c;为多行业提供智能、高效、节能的能效管理解决方案&#xff0c;引领能效管理进入智能化新时代。AI智控核心&#xff0c;解锁精准…...

Python的__init_subclass__框架中

Python的__init_subclass__框架&#xff1a;解锁类继承的隐藏能力在Python的面向对象编程中&#xff0c;类继承是一个强大的工具&#xff0c;但你是否知道Python还提供了一个名为__init_subclass__的特殊方法&#xff1f;这个隐藏在类构造机制中的钩子方法&#xff0c;能够让你…...

c语言之宏定义处理编译期间判断结构体大小

typedef struct sysparam {int battery; // 电池int flash; // flashint microphone; // 录音 麦克风char sn[24]...

干货合集:9个降AIGC工具测评!全行业通用降AI率必备清单

在当前学术与写作领域&#xff0c;AI生成内容&#xff08;AIGC&#xff09;的广泛应用带来了前所未有的效率提升&#xff0c;但也引发了对原创性与查重率的担忧。无论是学生、研究人员还是职场人士&#xff0c;都面临着一个共同的问题&#xff1a;如何在保持内容质量的同时&…...

Spring Boot 缓存机制与性能分析

Spring Boot 缓存机制与性能分析 在现代高并发应用中&#xff0c;缓存技术是提升系统性能的关键手段之一。Spring Boot作为Java生态中广泛使用的框架&#xff0c;提供了强大的缓存支持&#xff0c;能够显著减少数据库访问压力&#xff0c;优化响应速度。本文将深入探讨Spring …...