Skip to content

可以。你现在最需要的不是“再看一堆方向讨论”,而是一个能跑代码、能积累作品、能转成竞赛和论文的执行路线。

我先给结论:

对你最合适的主线是:

  1. 用代码驱动学 ML/DL

  2. 先打 tabular / time-series / structured data 的 Kaggle

  3. 同时做一个“可论文化”的研究项目

  4. 不要一开始就冲纯金融预测论文

  5. 先把自己练成“会做实验、会复现、会验证”的人

因为 Quant Researcher 招聘里,真正值钱的是:统计/ML基础、在 noisy data 上做严谨实验、写得出像样代码、能把研究讲清楚。不是“会背很多模型名”。公开岗位也持续强调 probability/statistics、machine learning、large noisy datasets、research-to-production 这套能力。(NeurIPS)


一、资源怎么找:按“代码优先”选,不按“名气优先”选

你这种目标,最适合的资源不是纯理论书,而是下面这四类。

1. 入门主线:D2L

Dive into Deep Learning 是很适合你这种“教程对照代码来学”的资源:它本身就是交互式深度学习教材,带代码、数学和讨论,而且支持 PyTorch。(Dive into Deep Learning)

你可以把它当成:

  • 第一本完整 DL 代码教材

  • 练 PyTorch 基本功的主线

  • 后面复现实验时的“查手册”资源

2. 实战主线:fast.ai

fast.ai 的 Practical Deep Learning for Coders 本来就是给“有一些编程经验,想把 DL 用到实际问题上”的人设计的,而且课程明确强调 hands-on,很多 notebook 直接可以在 Kaggle 跑。(Practical Deep Learning for Coders)

这对你特别合适,因为你不是去当纯理论研究员,你是要:

  • 快速做实验

  • 快速搭 baseline

  • 快速形成项目作品

3. 框架主线:PyTorch 官方教程

PyTorch 官方教程有完整的基础学习路线,包括数据加载、建模、训练、保存模型这些完整 workflow。(PyTorch Documentation)

这个资源的作用不是“看得爽”,而是:

  • 让你以后写实验代码更标准

  • 知道 Dataset / DataLoader / training loop / checkpoint 该怎么写

  • 减少你后面做 Kaggle 和论文时的低级工程错误

4. Transformer / LLM 扩展:Hugging Face Course

Hugging Face 的课程是免费开源的,课程内容就是让你学会 transformers、datasets、tokenizers、accelerate 这些生态。(Hugging Face)

这个对你不是立刻最关键,但如果你后面想做:

  • 另类数据

  • 文本信号

  • LLM / NLP for quant
    那会很有用。


二、你该怎么学,才适合 Kaggle + 论文 + 找工

最优顺序

不是“先把理论全学完再动手”,那样大概率拖死。
而是:

教程 + 跑代码 + 小复现 + 小比赛 + 项目化整理

具体是:

  1. 学一个模块

  2. 跑一遍教程代码

  3. 改 2~3 个超参数

  4. 自己重写一次训练流程

  5. 做一个小 notebook

  6. 把它整理成 GitHub repo

你真正的目标不是“学完课程”,而是留下能展示的东西

  • 3~5 个干净 repo

  • 2~3 个 Kaggle 比赛 notebook

  • 1 个可论文化项目

  • 1 份像样的简历叙事


三、Kaggle 怎么打,才对 Quant 有帮助

别一开始碰太重的比赛

你现在最需要的是“形成闭环”,不是赌一个神仙榜单。

Kaggle 现在仍有持续的 Playground Series,官方就说它们是有趣、容易上手、适合练手的轻量级 tabular 比赛,而且是每月 1 号开启、为期一个月。当前 2026 年 4 月的 Playground 比赛就是 Predicting Irrigation Need。(Kaggle)

这类比赛很适合你前期练:

  • EDA

  • CV 设计

  • leakage 检查

  • LightGBM / XGBoost / CatBoost baseline

  • 简单 NN tabular baseline

  • ensemble

  • 写 submission pipeline

你现在不该把 Kaggle 当成什么

不是:

  • 一上来就冲金牌

  • 一上来就做最炫模型

  • 一上来就只盯金融题

你应该把 Kaggle 当成:

  • 工程训练场

  • 验证训练场

  • notebook 表达训练场

比赛选择顺序

对你来说,顺序建议是:

第一阶段:Playground / tabular
第二阶段:有时序或 ranking 味道的 structured competitions
第三阶段:能做出研究分析的比赛,不一定非得是金融

因为 Quant 面试官不会因为你打过“金融名字的比赛”就直接高看你。
他们更看你有没有:

  • 严谨 CV

  • 稳定实验

  • 特征和误差分析

  • 不作弊的意识

  • 可复现代码


四、论文怎么做,才不和 Kaggle 脱节

你最怕走到两条死路:

死路 1:只打比赛,不做研究抽象

这样你会变成“会调包的参赛者”,论文很难写。

死路 2:只想论文,不做实验闭环

这样你会变成“只会看 paper 的学生”,落地能力弱。

正解

你要做的是:
把 Kaggle 式实验能力,转成一个“研究问题 + 对比实验 + 误差分析 + 稳健性验证”的项目。

比较适合你的论文题类型是:

  • 非平稳数据上的稳健建模

  • tabular / time-series 的表示学习

  • 序列数据上的 drift / adaptation

  • ranking / signal extraction,不只是 point forecasting

  • 多模态信号,尤其文本 + 结构化数据

这个思路前面我已经说过:
你该做的是“会在 noisy non-stationary data 上做严谨研究”,不是“只会刷 forecasting benchmark”。


五、从今天开始的时间表

今天是 2026 年 4 月 3 日
按你要找工作、打 Kaggle、冲论文的目标,我建议你按 12 个月 规划,而不是幻想 2 个月全拿下。


阶段 0:现在到 2026/04/15

目标:搭好环境,定主线,不再摇摆

你要完成:

  • 安装并熟悉 conda / uv / pip

  • 配好 Jupyter / VS Code / Git / GitHub

  • 建一个统一 repo 模板

  • 确定主框架:PyTorch + scikit-learn + LightGBM/CatBoost

  • 确定主学习材料:D2L + fast.ai + PyTorch 官方教程

截止建议:2026/04/15

产出:

  • 1 个环境配置文档

  • 1 个你自己的训练脚手架 repo

  • 1 个最简单的 MNIST / tabular baseline repo


阶段 1:2026/04/15 到 2026/05/31

目标:完成 ML/DL 基础闭环,能独立跑 baseline

你要完成:

  • D2L 前半部分

  • PyTorch basics 全跑一遍

  • fast.ai 至少前 3~4 课

  • 自己从头写 2 个项目:

    • 一个 tabular classification/regression

    • 一个简单 MLP/CNN 训练流程

截止建议:2026/05/31

你应该达到的能力:

  • 会自己写 Dataset / training loop

  • 会做 train/valid split

  • 会记录实验

  • 会保存模型和提交结果

产出:

  • GitHub 上 至少 3 个干净 repo

  • 每个 repo 都有 README、结果、复现实验步骤

这一步没做完,别急着想论文。


阶段 2:2026/05/01 到 2026/07/31

目标:认真打 2~3 个 Kaggle 比赛,练实验完整性

你可以直接打 Kaggle 的月度 Playground。官方说明它就是轻量、适合练手、每月一场。(Kaggle)

建议你在这个阶段完成:

  • 至少 2 场 Playground

  • 每场都做:

    • baseline notebook

    • feature engineering notebook

    • model comparison notebook

    • 简短复盘文档

截止建议:2026/07/31

量化目标:

  • 至少一次进 前 20%

  • 至少一次做出完整 ensemble

  • 至少一篇像样的 discussion / writeup

你真正要练出来的是:

  • CV 设计

  • leakage 防范

  • feature importance / SHAP / error analysis

  • notebook 表达能力


阶段 3:2026/06/15 到 2026/09/15

目标:从“比赛选手”转成“研究项目作者”

你要做的不是另起炉灶,而是从你的比赛经验里抽一个研究问题。

推荐你从下面挑一个:

  • 非平稳 tabular/time-series 上的稳健训练

  • 时序 split 下的模型失效检测

  • 表示学习对 structured data 的帮助

  • ranking objective vs regression objective 的对比

  • 漂移环境下的 online recalibration

截止建议:2026/09/15

到这个时间点,你应该有:

  • 题目

  • baseline

  • 相关工作列表

  • 初步实验

  • 失败案例分析

产出:

  • 一份 4~6 页的内部 draft

  • 一份实验日志

  • 一份图表初稿


阶段 4:2026/09/15 到 2026/11/15

目标:把项目写成第一版论文

你要完成:

  • 引言

  • 相关工作

  • 方法

  • 实验

  • ablation

  • failure analysis

  • 局限性

截止建议:2026/11/15

这时候你要先把论文当成“能发 arXiv/能投 workshop/能给导师看”的版本。
别一开始就幻想顶会 oral。


阶段 5:2026/11/15 到 2027/02/15

目标:投稿、改稿、并行准备求职材料

你要完成:

  • 一版公开可展示的论文稿

  • 一个配套代码仓库

  • 一页项目总结 slide

  • 简历里的量化研究叙事

  • 再打 1~2 个比赛,补充作品集

截止建议:2027/02/15

到这时,你手里最好有:

  • 1 篇在投/已公开预印本

  • 3~5 个强 repo

  • 3 场以上比赛经历

  • 1 个非常能讲的研究项目


六、论文投稿时间怎么判断

你现在这个时间点,ICLR 2026 和 ICML 2026 的主会截止都已经过去了
NeurIPS 2026 的官方主会摘要截止是 2026/05/04 AOE,全文截止是 2026/05/06 AOE。(ICLR)

所以我直接说实话:

如果你现在还没有成熟项目,NeurIPS 2026 对你基本不现实。

别强投。
仓促赶出来的稿,大概率质量不够,还把你节奏打乱。

你更合理的做法

  • 先做出一个像样项目

  • 先公开预印本

  • 然后盯官方 CFP 和 OpenReview

  • 看主会、workshop、专题会议、应用型会议是否匹配

你怎么找会

最稳的方式不是到处问人,而是:

  1. 官方 conference site

  2. OpenReview

  3. 看官方的 Call for Papers / Dates

  4. 按 deadline 倒推 3~4 个月准备

目前官方页面可以直接确认的 2026 节奏是:

  • ICLR 2026:摘要 2025/09/19,全文 2025/09/24 AOE。(ICLR)

  • ICML 2026:摘要 2026/01/23,全文 2026/01/28 AOE。(ICML)

  • NeurIPS 2026:摘要 2026/05/04,全文 2026/05/06 AOE。(NeurIPS)

你以后就按这个节奏感去安排项目,而不是等 deadline 快到了才开始想题。


七、你最该执行的“每周模板”

给你一个最实用的节奏。

每周 6 天版本

2 天:教程学习 + 跑官方代码
2 天:Kaggle 比赛实验
1 天:复现论文 / 改 baseline
1 天:整理 README / 画图 / 写总结

每周硬指标

  • 新增 1 个 notebook

  • 记录 3 个以上实验

  • 1 篇简短实验总结

  • 至少做 1 次失败分析

你真正需要的是“稳定输出”,不是一时热血。


八、最适合你的具体执行方案

如果我替你定一个最实际的主线,我会这样定:

2026/04–05

主线:D2L + PyTorch 官方 + fast.ai 前半段
目标:打通基础 + 能自己写训练代码。(Dive into Deep Learning)

2026/05–07

主线:每月一个 Playground + 一个复现项目
目标:形成 Kaggle 闭环,至少 2 场比赛。(Kaggle)

2026/07–09

主线:确定研究题 + 做第一版实验
目标:从比赛能力转成研究能力。

2026/09–11

主线:写论文初稿 + 开源代码
目标:能给导师/面试官看的项目。

2026/11–2027/02

主线:投稿 + 求职准备 + 补一个更强项目
目标:形成完整 portfolio。


九、最后给你的直话

你现在最需要的不是“找到最完美教程”,而是:

选一套足够好的资源,然后连续 6 个月把代码跑起来。

对你这种要冲 Quant Researcher 的人,最危险的不是资源不够好,
而是:

  • 看了很多

  • 跑得很少

  • repo 很少

  • 比赛没打完

  • 论文也没写出来

所以你的策略应该很硬:

资源只留 3 套:D2L、PyTorch 官方、fast.ai。
比赛只打 2~3 场:先 Playground。
项目只抓 1 个:能论文化的。
截止时间一旦定了,就按月交付产出。

你要的话,我下一条直接给你一版更细的:
“从 2026/04/03 开始的 16 周学习—竞赛—论文周计划表”