Appearance
可以。你现在最需要的不是“再看一堆方向讨论”,而是一个能跑代码、能积累作品、能转成竞赛和论文的执行路线。
我先给结论:
对你最合适的主线是:
用代码驱动学 ML/DL
先打 tabular / time-series / structured data 的 Kaggle
同时做一个“可论文化”的研究项目
不要一开始就冲纯金融预测论文
先把自己练成“会做实验、会复现、会验证”的人
因为 Quant Researcher 招聘里,真正值钱的是:统计/ML基础、在 noisy data 上做严谨实验、写得出像样代码、能把研究讲清楚。不是“会背很多模型名”。公开岗位也持续强调 probability/statistics、machine learning、large noisy datasets、research-to-production 这套能力。(NeurIPS)
一、资源怎么找:按“代码优先”选,不按“名气优先”选
你这种目标,最适合的资源不是纯理论书,而是下面这四类。
1. 入门主线:D2L
Dive into Deep Learning 是很适合你这种“教程对照代码来学”的资源:它本身就是交互式深度学习教材,带代码、数学和讨论,而且支持 PyTorch。(Dive into Deep Learning)
你可以把它当成:
第一本完整 DL 代码教材
练 PyTorch 基本功的主线
后面复现实验时的“查手册”资源
2. 实战主线:fast.ai
fast.ai 的 Practical Deep Learning for Coders 本来就是给“有一些编程经验,想把 DL 用到实际问题上”的人设计的,而且课程明确强调 hands-on,很多 notebook 直接可以在 Kaggle 跑。(Practical Deep Learning for Coders)
这对你特别合适,因为你不是去当纯理论研究员,你是要:
快速做实验
快速搭 baseline
快速形成项目作品
3. 框架主线:PyTorch 官方教程
PyTorch 官方教程有完整的基础学习路线,包括数据加载、建模、训练、保存模型这些完整 workflow。(PyTorch Documentation)
这个资源的作用不是“看得爽”,而是:
让你以后写实验代码更标准
知道 Dataset / DataLoader / training loop / checkpoint 该怎么写
减少你后面做 Kaggle 和论文时的低级工程错误
4. Transformer / LLM 扩展:Hugging Face Course
Hugging Face 的课程是免费开源的,课程内容就是让你学会 transformers、datasets、tokenizers、accelerate 这些生态。(Hugging Face)
这个对你不是立刻最关键,但如果你后面想做:
另类数据
文本信号
LLM / NLP for quant
那会很有用。
二、你该怎么学,才适合 Kaggle + 论文 + 找工
最优顺序
不是“先把理论全学完再动手”,那样大概率拖死。
而是:
教程 + 跑代码 + 小复现 + 小比赛 + 项目化整理
具体是:
学一个模块
跑一遍教程代码
改 2~3 个超参数
自己重写一次训练流程
做一个小 notebook
把它整理成 GitHub repo
你真正的目标不是“学完课程”,而是留下能展示的东西:
3~5 个干净 repo
2~3 个 Kaggle 比赛 notebook
1 个可论文化项目
1 份像样的简历叙事
三、Kaggle 怎么打,才对 Quant 有帮助
别一开始碰太重的比赛
你现在最需要的是“形成闭环”,不是赌一个神仙榜单。
Kaggle 现在仍有持续的 Playground Series,官方就说它们是有趣、容易上手、适合练手的轻量级 tabular 比赛,而且是每月 1 号开启、为期一个月。当前 2026 年 4 月的 Playground 比赛就是 Predicting Irrigation Need。(Kaggle)
这类比赛很适合你前期练:
EDA
CV 设计
leakage 检查
LightGBM / XGBoost / CatBoost baseline
简单 NN tabular baseline
ensemble
写 submission pipeline
你现在不该把 Kaggle 当成什么
不是:
一上来就冲金牌
一上来就做最炫模型
一上来就只盯金融题
你应该把 Kaggle 当成:
工程训练场
验证训练场
notebook 表达训练场
比赛选择顺序
对你来说,顺序建议是:
第一阶段:Playground / tabular
第二阶段:有时序或 ranking 味道的 structured competitions
第三阶段:能做出研究分析的比赛,不一定非得是金融
因为 Quant 面试官不会因为你打过“金融名字的比赛”就直接高看你。
他们更看你有没有:
严谨 CV
稳定实验
特征和误差分析
不作弊的意识
可复现代码
四、论文怎么做,才不和 Kaggle 脱节
你最怕走到两条死路:
死路 1:只打比赛,不做研究抽象
这样你会变成“会调包的参赛者”,论文很难写。
死路 2:只想论文,不做实验闭环
这样你会变成“只会看 paper 的学生”,落地能力弱。
正解
你要做的是:
把 Kaggle 式实验能力,转成一个“研究问题 + 对比实验 + 误差分析 + 稳健性验证”的项目。
比较适合你的论文题类型是:
非平稳数据上的稳健建模
tabular / time-series 的表示学习
序列数据上的 drift / adaptation
ranking / signal extraction,不只是 point forecasting
多模态信号,尤其文本 + 结构化数据
这个思路前面我已经说过:
你该做的是“会在 noisy non-stationary data 上做严谨研究”,不是“只会刷 forecasting benchmark”。
五、从今天开始的时间表
今天是 2026 年 4 月 3 日。
按你要找工作、打 Kaggle、冲论文的目标,我建议你按 12 个月 规划,而不是幻想 2 个月全拿下。
阶段 0:现在到 2026/04/15
目标:搭好环境,定主线,不再摇摆
你要完成:
安装并熟悉
conda/uv/pip配好 Jupyter / VS Code / Git / GitHub
建一个统一 repo 模板
确定主框架:PyTorch + scikit-learn + LightGBM/CatBoost
确定主学习材料:D2L + fast.ai + PyTorch 官方教程
截止建议:2026/04/15
产出:
1 个环境配置文档
1 个你自己的训练脚手架 repo
1 个最简单的 MNIST / tabular baseline repo
阶段 1:2026/04/15 到 2026/05/31
目标:完成 ML/DL 基础闭环,能独立跑 baseline
你要完成:
D2L 前半部分
PyTorch basics 全跑一遍
fast.ai 至少前 3~4 课
自己从头写 2 个项目:
一个 tabular classification/regression
一个简单 MLP/CNN 训练流程
截止建议:2026/05/31
你应该达到的能力:
会自己写 Dataset / training loop
会做 train/valid split
会记录实验
会保存模型和提交结果
产出:
GitHub 上 至少 3 个干净 repo
每个 repo 都有 README、结果、复现实验步骤
这一步没做完,别急着想论文。
阶段 2:2026/05/01 到 2026/07/31
目标:认真打 2~3 个 Kaggle 比赛,练实验完整性
你可以直接打 Kaggle 的月度 Playground。官方说明它就是轻量、适合练手、每月一场。(Kaggle)
建议你在这个阶段完成:
至少 2 场 Playground
每场都做:
baseline notebook
feature engineering notebook
model comparison notebook
简短复盘文档
截止建议:2026/07/31
量化目标:
至少一次进 前 20%
至少一次做出完整 ensemble
至少一篇像样的 discussion / writeup
你真正要练出来的是:
CV 设计
leakage 防范
feature importance / SHAP / error analysis
notebook 表达能力
阶段 3:2026/06/15 到 2026/09/15
目标:从“比赛选手”转成“研究项目作者”
你要做的不是另起炉灶,而是从你的比赛经验里抽一个研究问题。
推荐你从下面挑一个:
非平稳 tabular/time-series 上的稳健训练
时序 split 下的模型失效检测
表示学习对 structured data 的帮助
ranking objective vs regression objective 的对比
漂移环境下的 online recalibration
截止建议:2026/09/15
到这个时间点,你应该有:
题目
baseline
相关工作列表
初步实验
失败案例分析
产出:
一份 4~6 页的内部 draft
一份实验日志
一份图表初稿
阶段 4:2026/09/15 到 2026/11/15
目标:把项目写成第一版论文
你要完成:
引言
相关工作
方法
实验
ablation
failure analysis
局限性
截止建议:2026/11/15
这时候你要先把论文当成“能发 arXiv/能投 workshop/能给导师看”的版本。
别一开始就幻想顶会 oral。
阶段 5:2026/11/15 到 2027/02/15
目标:投稿、改稿、并行准备求职材料
你要完成:
一版公开可展示的论文稿
一个配套代码仓库
一页项目总结 slide
简历里的量化研究叙事
再打 1~2 个比赛,补充作品集
截止建议:2027/02/15
到这时,你手里最好有:
1 篇在投/已公开预印本
3~5 个强 repo
3 场以上比赛经历
1 个非常能讲的研究项目
六、论文投稿时间怎么判断
你现在这个时间点,ICLR 2026 和 ICML 2026 的主会截止都已经过去了;
NeurIPS 2026 的官方主会摘要截止是 2026/05/04 AOE,全文截止是 2026/05/06 AOE。(ICLR)
所以我直接说实话:
如果你现在还没有成熟项目,NeurIPS 2026 对你基本不现实。
别强投。
仓促赶出来的稿,大概率质量不够,还把你节奏打乱。
你更合理的做法
先做出一个像样项目
先公开预印本
然后盯官方 CFP 和 OpenReview
看主会、workshop、专题会议、应用型会议是否匹配
你怎么找会
最稳的方式不是到处问人,而是:
看 官方 conference site
看 OpenReview
看官方的 Call for Papers / Dates
按 deadline 倒推 3~4 个月准备
目前官方页面可以直接确认的 2026 节奏是:
ICLR 2026:摘要 2025/09/19,全文 2025/09/24 AOE。(ICLR)
ICML 2026:摘要 2026/01/23,全文 2026/01/28 AOE。(ICML)
NeurIPS 2026:摘要 2026/05/04,全文 2026/05/06 AOE。(NeurIPS)
你以后就按这个节奏感去安排项目,而不是等 deadline 快到了才开始想题。
七、你最该执行的“每周模板”
给你一个最实用的节奏。
每周 6 天版本
2 天:教程学习 + 跑官方代码
2 天:Kaggle 比赛实验
1 天:复现论文 / 改 baseline
1 天:整理 README / 画图 / 写总结
每周硬指标
新增 1 个 notebook
记录 3 个以上实验
写 1 篇简短实验总结
至少做 1 次失败分析
你真正需要的是“稳定输出”,不是一时热血。
八、最适合你的具体执行方案
如果我替你定一个最实际的主线,我会这样定:
2026/04–05
主线:D2L + PyTorch 官方 + fast.ai 前半段
目标:打通基础 + 能自己写训练代码。(Dive into Deep Learning)
2026/05–07
主线:每月一个 Playground + 一个复现项目
目标:形成 Kaggle 闭环,至少 2 场比赛。(Kaggle)
2026/07–09
主线:确定研究题 + 做第一版实验
目标:从比赛能力转成研究能力。
2026/09–11
主线:写论文初稿 + 开源代码
目标:能给导师/面试官看的项目。
2026/11–2027/02
主线:投稿 + 求职准备 + 补一个更强项目
目标:形成完整 portfolio。
九、最后给你的直话
你现在最需要的不是“找到最完美教程”,而是:
选一套足够好的资源,然后连续 6 个月把代码跑起来。
对你这种要冲 Quant Researcher 的人,最危险的不是资源不够好,
而是:
看了很多
跑得很少
repo 很少
比赛没打完
论文也没写出来
所以你的策略应该很硬:
资源只留 3 套:D2L、PyTorch 官方、fast.ai。
比赛只打 2~3 场:先 Playground。
项目只抓 1 个:能论文化的。
截止时间一旦定了,就按月交付产出。
你要的话,我下一条直接给你一版更细的:
“从 2026/04/03 开始的 16 周学习—竞赛—论文周计划表”。