My VitePress Site

机器学习与深度学习

这是目前 Quant 行业最火的领域，无论是高频交易还是中长期预测，都在疯狂尝试 AI 模型。

具体方向：时间序列预测：研究 LSTM, GRU, Transformer 等模型如何预测股价、波动率。这和 Quant 的工作内容重合度高达 90%。强化学习：模拟交易员做决策的过程。这在算法交易中非常前沿。图神经网络（GNN）：比如用来分析股票之间的关联关系（产业链、供应链金融）。为什么适合你：结果导向：模型好不好，跑一下准确率就知道，不需要扯皮。有规律：调参虽然有随机性，但背后有严谨的数学原理（梯度下降、损失函数）。就业通用：就算以后不做 Quant，去互联网大厂做算法也是通用的，进可攻退可守。

要做：研究算法层、模型层。专注于设计损失函数、优化算法、网络架构。

稀缺性：传统 Quant 很多只会用简单的线性回归或树模型。如果你懂如何用 Transformer 架构来处理时序决策数据，你是市场上极稀缺的复合型人才。

虽然名字叫“具身智能”，但你的研究重点可以是纯算法。你可以专注于研究：如何设计网络架构来处理 Action Token？如何设计 Reward Function 让模型收敛更快？如何利用海量离线数据进行预训练？这些都是抽象层面的数学和代码工作，不需要你去管具体的机器人会不会撞墙，也不用管生成的视频清不清晰。你面对的是张量，是数字，是概率分布。

要做：研究 VLA（Vision-Language-Action）模型的架构设计、研究 RL 的优化算法、研究 Data Mixing 的策略。这些是通用的 AI 技术，面试 Quant 时含金量极高。不要做：负责机器人的硬件调试、传感器驱动、数据采集清洗（这些是脏活累活）。借口可以是“我擅长数学推导和模型架构设计，我想专注于算法优化部分”。

额外的加分项：异常检测虽然我推荐方向 2，但方向 1 里有一个小点值得你注意，那就是 “异常检测” 。在 Quant 领域，风控和监管非常需要异常检测算法。如果你在研究 RL 决策的过程中，能顺便研究一下“如何判断 Agent 的决策是否异常”或者“环境状态是否异常”，这也是一个很好的加分项，但这只能作为副线。

强化学习是量化研究里非常重要的工具，做过RL相关研究的人在量化面试里有显著优势，两个方向的数学语言是相通的——马尔可夫决策过程、策略优化、奖励建模，这些概念在量化策略研究里直接用得上。问题结构更清晰。具身智能的核心问题是数据+模型+泛化，逻辑链条清晰，有明确的评估指标，更接近你喜欢的"有规律、有逻辑依据"的研究范式。具身智能方向的RL研究经历，是你简历上连接AI背景和Quant Researcher目标最有说服力的桥梁。选它。

具身智能RL研究

三个任务的分析任务1（运控RL后训练）最推荐。对你来说价值最高。核心是RL在transformer上的应用，数学含量最高——优化动态、收敛效率、sim2real这些问题本质上是数学和统计问题，不是纯工程问题。ablation study和评测范式的工作直接锻炼你的科研逻辑，出论文路径最清晰。最重要的是，RL优化和收敛效率的经验，迁移到量化策略优化是最直接的，面试时说得清楚。任务2（操作基础模型）次推荐。模仿学习+RL的组合也不错，数学含量够，但工程量更大——整理数据、训练基座这些工作偏工程琐碎，和你的特质有一定冲突。如果能专注在RL后训练那个子任务上（2c），价值接近任务1。任务3（灵巧手数采）不推荐。数采、重建、生成模型这个方向偏工程和视觉，数学含量相对低，和量化的迁移价值最弱，而且"正在搞"的状态说明基础设施还不完善，论文产出风险高。

去找导师谈，明确表达想参与任务1，切入点是复现locoformer和做ablation，这是最容易上手的起点，同时数学含量够高。做好了自然过渡到sim2real的评测范式，这是可以独立发论文的子问题。

Minisql

Log

Tmp