Appearance
复现论文
复现论文= 配环境、处理数据、调参、对齐指标、写复现实验报告
选题标准:
| 优先级 | 条件 | 原因 |
|---|---|---|
| 高 | 官方代码开源、README 完整 | 最容易跑通 |
| 高 | 数据集公开且下载方便 | 避免卡在数据 |
| 高 | 有 requirements / conda / Docker | 降低环境风险 |
| 中 | 有 pretrained checkpoint | 可以先验证评测流程 |
| 中 | 论文任务规模不大 | 适合有限时间 |
| 低 | 只开源模型结构,没有训练细节 | 容易踩坑 |
| 避免 | 代码多年未维护、issue 很多、依赖老旧 | 时间不可控 |
先找有官方代码和 checkpoint 的论文 第一天只做一件事:把官方结果评测跑出来。如果第一步都跑不通,这篇论文就不适合作为低风险复现对象。
数学就要推一推公式、算一算答案。 计算机就要写一写代码、跑一跑实验。 把学到的概念实现一下。
要看具体的例子、具体的应用
看书的时候要跳步,不要卡在一个地方。Overview有问题时先放着,给个Recovery然后接着看后面的内容,看看后面的例子,看的例子、图多了就形成Overview了。