Appearance
你这个判断基本是对的:你现在最缺的不是“再看一门课”,而是“能持续跑代码、复现实验、产出作品”的训练环境和路径。
而且我直接说结论:
如果你的目标是量化研究员 + 找工作 + 发论文 + 打 Kaggle,最优路线不是先啃最难的理论,也不是先学一堆金融专用模型。最优路线是:
先把通用机器学习实验能力练出来
再把时间序列/预测做成你的主赛道
最后再迁移到金融数据和量化研究
因为量化里很多人死在这几件事上:
理论看了很多,不会搭可复现实验框架
模型知道很多,不会做严格回测和防泄漏
跑了很多代码,没有形成作品、论文、比赛结果
一上来做金融高频/因子/盘口,结果数据清洗和评估体系都没立住
所以你要找的资源,核心标准不是“讲得全不全”,而是这 4 点:
第一,代码能直接跑。
第二,教程和代码是对齐的。
第三,最好自带 notebook / baseline / leaderboard / benchmark。
第四,能直接迁移到 Kaggle、论文复现、求职作品集。
一、最适合你的资源类型
1)入门到中级:Kaggle Learn + Kaggle Notebooks
这是最贴合你“边学边跑代码”的起点。Kaggle 官方的 Learn 页面就是为了快速上手实战,包含 Python、Pandas、机器学习、数据可视化、特征工程、时间序列、深度学习等课程;它的 Intro to Deep Learning 课程是直接用代码训练神经网络。Kaggle Notebooks 则可以直接在线跑,不用自己先折腾环境。(Kaggle)
为什么适合你:
上手阻力低
数据、代码、提交都在一个平台
你可以立刻开始做比赛和作品
很适合训练“从 notebook 到 leaderboard”的闭环
但缺点也得说清楚:
Kaggle Learn 偏快餐,适合起步,不够系统
很多人停留在“会调包”,不会做严谨研究
只刷 Kaggle,不补实验设计和论文复现,后面会卡住
所以它适合当第一阶段启动器,不适合当唯一主线。
2)系统学深度学习:Dive into Deep Learning
如果你想要“教程对照代码来讲”,这本非常契合。D2L 是交互式深度学习教材,明确强调代码、数学、讨论结合,而且支持 PyTorch 等实现。(Dive into Deep Learning)
它的价值在于:
不只是 API 教程
会把模型原理和实现连起来
比零散视频/博客更系统
适合建立你之后读论文、改模型的能力
但我也提醒你:
它不是最贴近 Kaggle 的资源
有些实现风格偏教材化,不一定是你以后项目里最常写的风格
学的时候一定要边学边“自己重写简化版”
所以 D2L 适合作为系统主线教材,不是唯一实战平台。
3)看代码学模型:UvA Deep Learning Notebooks
UvA 的教程是非常典型的“理论旁边就是 notebook 实现”,涵盖优化、Transformer、GNN 等,而且官方说明这些 notebooks 就是帮助你把理论和对应实现对上。很多 notebook 还设计成普通笔记本电脑也能运行。(UvA Deep Learning Notebooks)
适合你的点:
非常适合“照着代码学”
代码风格比教材更接近研究复现
对以后读论文、自己复现模型特别有帮助
如果你未来想发论文,这类资源比纯课程视频更值钱。
4)论文和代码对应:Papers with Code
这个你基本必须常驻。Papers with Code 的核心价值就是:论文、任务、榜单、代码仓库绑在一起。你要做预测、做实验、想发论文,就不能只看 arXiv 标题党,要能迅速找到:
这个任务现在常用 benchmark 是什么
哪些 paper 真有开源实现
SOTA 和强 baseline 是什么
代码仓库是否活跃
Papers with Code 现在依然持续整理 time series forecasting 等任务和相关论文代码。(Papers with Code)
一句话:
它不是拿来“学习基础”的,是拿来选题、复现、找 baseline、做论文调研的。
二、如果你主攻“预测 / 时间序列 / 量化”,哪些库最值得盯
你这条路,迟早要进入时间序列。这里别自己从零造轮子,先用成熟库把实验框架搭起来。
1)NeuralForecast
Nixtla 的 NeuralForecast 收录了大量神经时间序列模型,包括 RNN、TCN、DeepAR、NBEATS、NHITS、TFT、PatchTST、iTransformer、TimeLLM 等,重点是统一接口、可扩展、偏实战。(GitHub)
这东西非常适合你做三件事:
快速比较多个模型
搭 forecasting baseline
做比赛/论文前期筛模型
它对“做预测实验”很友好,比你自己从零实现一堆模型高效得多。
2)GluonTS
GluonTS 是老牌时间序列库,强调概率预测,文档里明确说它聚焦于时间序列概率建模,而且有完整教程。(GluonTS)
它特别适合:
你想做更研究味一点的 forecasting
你想认真理解 probabilistic forecasting
你后面想往论文和严肃评估走
3)Darts
Darts 的优势是统一、好用、像 sklearn。官方介绍里就强调从 ARIMA 到深度学习模型都能统一用 fit() / predict(),还方便 backtest、集成、使用外生变量。(GitHub)
适合你快速做:
baseline 对比
回测
小型研究原型
作品集项目
如果你现在重心是“赶紧做出结果”,Darts 很省时间。
三、最适合你练手的 Kaggle 方向
你说你想打 Kaggle、做预测,这就别乱打。要按赛型筛选。
第一档:先打 Playground
Kaggle 官方就写得很清楚,Playground Series 是介于 Titanic 这类入门题和 Featured Competition 之间,适合新手逐步进入比赛。(Kaggle)
这类比赛的好处:
数据量通常可控
baseline 容易搭
很适合练完整流程
你能更快拿到可展示结果
第二档:时间序列预测比赛
你重点看这几类:
Store Sales - Time Series Forecasting:官方就是“预测杂货销售”。这是标准的预测题,适合练时间特征、外生变量、节假日、交叉验证、误差分析。(Kaggle)
M5 Forecasting:这是时间序列竞赛里的经典,尤其适合训练你对 hierarchical forecasting、多序列预测、评估指标、概率预测的理解。官方也明确说 M5 Uncertainty 是关于不确定性分布估计。(Kaggle)
这两类比赛对你以后做量化很有帮助,因为它们训练的不是单个模型技巧,而是:
数据切分
防泄漏
时序特征工程
回测式验证
多模型集成
误差归因
第三档:更贴近量化/市场微观结构
Optiver Realized Volatility Prediction 非常值得看。Kaggle 官方介绍里直接说这个比赛会让你获得关于波动率和市场结构的理解,数据还涉及 order book 结构。(Kaggle)
这个比普通表格题更贴近量化研究,但难度也明显更高。
我的建议是:别拿它做第一场比赛,拿它做你第二阶段项目。
四、你真正该怎么学:不是“按课程目录学”,而是按产出链路学
你最应该建立的是下面这条链路:
数据读取 → EDA → baseline → 特征工程 → 严格验证 → 模型对比 → 调参 → 误差分析 → 报告/复现
这条链路比“我会 CNN / Transformer 公式”更重要。
找量化研究岗、做 Kaggle、发应用类论文,本质都在看你是不是能把这条链路稳定跑通。
五、给你的最优学习顺序
阶段 1:先把“通用机器学习实战能力”打牢
先用 Kaggle Learn 把这些过一遍:
Python
Pandas
Intro to Machine Learning
Intermediate Machine Learning
Feature Engineering
Time Series
Intro to Deep Learning
这些资源都在 Kaggle Learn 官方页里。(Kaggle)
目标不是学会所有概念,而是能独立做出一个完整 notebook。
阶段 2:同时开 D2L,但只学高收益部分
别从头到尾全啃。你更需要这些:
MLP
optimization
regularization
CNN(知道就行)
RNN/LSTM/GRU
attention / transformer
training tricks
D2L 适合你补“为什么这样写模型”。(Dive into Deep Learning)
阶段 3:开始做 2~3 个预测项目
项目比刷课重要。建议按这个顺序:
Kaggle Playground / Store Sales
M5 一个复现项目
Optiver 或类金融时间序列项目
每个项目都要留下:
README
可复现实验脚本
baseline 与改进对比表
CV 设计说明
泄漏风险说明
结果图表
这就是你以后找工作、申研、写论文最有用的资产。
阶段 4:开始系统做“论文复现”
这时再用 Papers with Code。你要挑的是:
有公开数据
有公开代码
任务明确
baseline 清晰
你能在 1~2 周内复现出一个结果
从 forecasting 开始最合适。(Papers with Code)
六、你要打 Kaggle、做论文,最该练的不是“更深的模型”,而是这几个能力
1)严格验证
尤其你要做预测、量化,这个是命门。
你必须习惯:
时间切分,不乱用随机 KFold
防未来信息泄漏
训练/验证/测试边界清楚
指标和业务目标一致
很多初学者不是模型差,是验证做错了。
2)baseline 思维
做论文和比赛,第一件事都不是上 Transformer,而是先做:
均值/移动平均
线性模型
LightGBM / XGBoost
简单 MLP / LSTM
很多比赛里,先把特征、验证、集成做好,树模型就能狠狠干翻“随便上的深度学习”。
3)误差分析
你以后面试量化岗,别人很可能不关心你会不会背 Transformer 公式,更关心:
哪些样本预测差
为什么差
是否 regime shift
是否非平稳
是否目标分布变了
是否某些特征在不同时间段失效
4)实验管理
你要尽早养成:
固定 random seed
记录参数
保存 OOF / CV 分数
模型版本命名
结果表格化
否则你跑 50 次实验,最后自己都不知道哪次有效。
七、如果你的目标是“量化研究员”,要避免一个大坑
不要把 Kaggle 能力直接等同于量化能力。
两者有重叠,但不一样。
Kaggle 更偏:
leaderboard 优化
feature engineering
集成
竞赛型验证
量化更偏:
时序因果/非因果边界
交易成本
滑点
稳健性
regime change
样本外泛化
信号衰减
风险调整收益
所以正确做法不是只打 Kaggle,而是:
用 Kaggle 练工程和实验能力,用时间序列项目练研究能力,用金融数据项目练量化迁移能力。
八、给你一个最实际的资源清单
立刻可用
Kaggle Learn:快速补齐基础和直接上手 notebook。(Kaggle)
Kaggle Winning Solutions 汇总:学习冠军解法结构、特征工程、CV、集成套路。(Kaggle)
Kaggle Playground / Store Sales / M5 / Optiver:按难度逐级打。(Kaggle)
系统教材
Dive into Deep Learning:系统学模型 + 对照代码。(Dive into Deep Learning)
UvA DL Notebooks:研究型 notebook 教程。(UvA Deep Learning Notebooks)
时间序列/预测实验
NeuralForecast:大量深度时间序列模型统一实验。(GitHub)
GluonTS:概率预测和更偏研究的时序框架。(GluonTS)
Darts:快速 baseline、backtest、对比实验。(GitHub)
论文复现
- Papers with Code:按任务找论文、代码、榜单。(Papers with Code)
九、如果我是你,我会这样走 6 个月
第 1 个月
Kaggle Learn 过完 ML / Feature Engineering / Time Series / Deep Learning
每学完一个模块,自己重写 1 个 notebook
开 GitHub 仓库,统一整理项目
第 2~3 个月
做 2 个 Kaggle 预测项目
至少 1 个用树模型,1 个用神经网络
学会 OOF、CV、特征重要性、误差分析
第 4 个月
系统看 D2L 的时序/序列/attention 相关章节
开始用 Darts / NeuralForecast 跑多模型对比
第 5 个月
复现 1 篇 forecasting 论文
写清楚:数据、模型、验证、结果、失败点、改进点
第 6 个月
做 1 个金融时间序列项目
最好带:
walk-forward validation
多时期回测
风险指标
ablation
与简单 baseline 对比
到这一步,你已经不是“学过机器学习”,而是开始像一个会做实验的人了。
十、最后给你最直接的建议
你现在最该做的,不是继续广泛搜资源,而是只保留这 4 个主入口:
1. Kaggle Learn
2. D2L
3. Papers with Code
4. 一个时间序列库(NeuralForecast / Darts / GluonTS 三选一先上手)
然后遵守一个原则:
每学一个知识点,必须落到一个能跑的 notebook;每做一个 notebook,必须留下可展示结果。
这是你通往:
Kaggle 成绩
求职作品集
论文复现
量化研究能力
最短、最稳、最不空转的路。
如果你愿意,我下一条可以直接给你列一个**“面向量化研究员/Kaggle/论文”的 12 周代码型学习路线图**,按周拆到具体资源和项目。