Appearance
机器学习与深度学习
这是目前 Quant 行业最火的领域,无论是高频交易还是中长期预测,都在疯狂尝试 AI 模型。
具体方向: 时间序列预测: 研究 LSTM, GRU, Transformer 等模型如何预测股价、波动率。这和 Quant 的工作内容重合度高达 90%。 强化学习: 模拟交易员做决策的过程。这在算法交易中非常前沿。 图神经网络(GNN): 比如用来分析股票之间的关联关系(产业链、供应链金融)。 为什么适合你: 结果导向: 模型好不好,跑一下准确率就知道,不需要扯皮。 有规律: 调参虽然有随机性,但背后有严谨的数学原理(梯度下降、损失函数)。 就业通用: 就算以后不做 Quant,去互联网大厂做算法也是通用的,进可攻退可守。
要做: 研究算法层、模型层。专注于设计损失函数、优化算法、网络架构。
稀缺性: 传统 Quant 很多只会用简单的线性回归或树模型。如果你懂如何用 Transformer 架构来处理时序决策数据,你是市场上极稀缺的复合型人才。
虽然名字叫“具身智能”,但你的研究重点可以是纯算法。你可以专注于研究: 如何设计网络架构来处理 Action Token? 如何设计 Reward Function 让模型收敛更快? 如何利用海量离线数据进行预训练? 这些都是抽象层面的数学和代码工作,不需要你去管具体的机器人会不会撞墙,也不用管生成的视频清不清晰。你面对的是张量,是数字,是概率分布。
要做: 研究 VLA(Vision-Language-Action)模型的架构设计、研究 RL 的优化算法、研究 Data Mixing 的策略。这些是通用的 AI 技术,面试 Quant 时含金量极高。 不要做: 负责机器人的硬件调试、传感器驱动、数据采集清洗(这些是脏活累活)。借口可以是“我擅长数学推导和模型架构设计,我想专注于算法优化部分”。
- 额外的加分项:异常检测 虽然我推荐方向 2,但方向 1 里有一个小点值得你注意,那就是 “异常检测” 。 在 Quant 领域,风控和监管非常需要异常检测算法。如果你在研究 RL 决策的过程中,能顺便研究一下“如何判断 Agent 的决策是否异常”或者“环境状态是否异常”,这也是一个很好的加分项,但这只能作为副线。
强化学习是量化研究里非常重要的工具,做过RL相关研究的人在量化面试里有显著优势,两个方向的数学语言是相通的——马尔可夫决策过程、策略优化、奖励建模,这些概念在量化策略研究里直接用得上。 问题结构更清晰。 具身智能的核心问题是数据+模型+泛化,逻辑链条清晰,有明确的评估指标,更接近你喜欢的"有规律、有逻辑依据"的研究范式。 具身智能方向的RL研究经历,是你简历上连接AI背景和Quant Researcher目标最有说服力的桥梁。选它。
具身智能RL研究
三个任务的分析 任务1(运控RL后训练)最推荐。 对你来说价值最高。核心是RL在transformer上的应用,数学含量最高——优化动态、收敛效率、sim2real这些问题本质上是数学和统计问题,不是纯工程问题。ablation study和评测范式的工作直接锻炼你的科研逻辑,出论文路径最清晰。最重要的是,RL优化和收敛效率的经验,迁移到量化策略优化是最直接的,面试时说得清楚。 任务2(操作基础模型)次推荐。 模仿学习+RL的组合也不错,数学含量够,但工程量更大——整理数据、训练基座这些工作偏工程琐碎,和你的特质有一定冲突。如果能专注在RL后训练那个子任务上(2c),价值接近任务1。 任务3(灵巧手数采)不推荐。 数采、重建、生成模型这个方向偏工程和视觉,数学含量相对低,和量化的迁移价值最弱,而且"正在搞"的状态说明基础设施还不完善,论文产出风险高。
去找导师谈,明确表达想参与任务1,切入点是复现locoformer和做ablation,这是最容易上手的起点,同时数学含量够高。做好了自然过渡到sim2real的评测范式,这是可以独立发论文的子问题。