Skip to content

复现论文

复现论文= 配环境、处理数据、调参、对齐指标、写复现实验报告

选题标准:

优先级条件原因
官方代码开源、README 完整最容易跑通
数据集公开且下载方便避免卡在数据
有 requirements / conda / Docker降低环境风险
有 pretrained checkpoint可以先验证评测流程
论文任务规模不大适合有限时间
只开源模型结构,没有训练细节容易踩坑
避免代码多年未维护、issue 很多、依赖老旧时间不可控

先找有官方代码和 checkpoint 的论文 第一天只做一件事:把官方结果评测跑出来。如果第一步都跑不通,这篇论文就不适合作为低风险复现对象。

数学就要推一推公式、算一算答案。 计算机就要写一写代码、跑一跑实验。 把学到的概念实现一下。

要看具体的例子、具体的应用

看书的时候要跳步,不要卡在一个地方。Overview有问题时先放着,给个Recovery然后接着看后面的内容,看看后面的例子,看的例子、图多了就形成Overview了。