My VitePress Site

可以。以 “复现一个 Tiny CLIP” 为例。

目标不是一周做完整项目，而是 4 周围绕同一个问题持续推进：

问题：我能不能用小数据集训练一个最小版图文对比学习模型，并理解 CLIP 的关键机制？

第 1 周：论文分析

本周产出：一篇 paper analysis

标题：

text

CLIP from First Principles: What Is Actually Being Optimized?

内容包括：

text

1. CLIP 解决什么问题？
2. image encoder 和 text encoder 分别做什么？
3. contrastive loss 为什么能对齐图像和文本？
4. temperature 参数有什么作用？
5. 论文实验真正证明了什么？
6. 我认为最值得复现的最小版本是什么？

本周证据：

text

- 一篇英文/中文文章
- 一张方法结构图
- 一个阅读笔记 repo

这周不要求跑实验。

第 2 周：实现核心模块

本周产出：一个最小可运行代码仓库

你实现：

text

- dataset loader
- image encoder：小型 CNN / ViT tiny
- text encoder：简单 Transformer / embedding + pooling
- contrastive loss
- training loop

文章或 progress note 标题：

text

Building a Minimal CLIP Training Pipeline in PyTorch

内容写：

text

1. 代码结构
2. 我简化了哪些部分
3. 当前能跑通什么
4. 还没解决什么
5. 下一步实验计划

本周证据：

text

- GitHub repo
- README
- 能运行的 training script
- 一次 loss curve 截图

这周不要求结果好，只要求 pipeline 跑通。

第 3 周：做小规模实验

本周产出：一次实验记录

你跑几个变量：

text

实验 A：batch size = 32 / 64 / 128
实验 B：temperature = 0.01 / 0.07 / 0.1
实验 C：不同 text encoder 简化方式

文章标题：

text

Tiny CLIP Experiments: Batch Size, Temperature, and Failure Modes

内容写：

text

1. 实验设置
2. 数据集
3. 超参数
4. 指标
5. 结果表格
6. 哪些结果符合预期
7. 哪些结果失败
8. 我怀疑失败原因是什么

本周证据：

text

- 实验表格
- loss curve
- retrieval examples
- config 文件
- 训练日志

这周重点是记录实验，而不是追求漂亮结果。

第 4 周：复盘和整理

本周产出：一篇较完整 reproduction note

标题：

text

Reproducing Tiny CLIP on a Small Dataset: Lessons and Limitations

内容包括：

text

1. 原论文目标
2. 我的最小复现范围
3. 实现细节
4. 实验结果
5. 失败点
6. 和原论文差距
7. compute / dataset 限制
8. 下一步可以怎么改

本周证据：

text

- 整理后的 GitHub repo
- 完整 README
- 实验结果表格
- 一篇长文

这周才形成一个可以展示的东西。

最终 4 周成果

你最后不是得到 4 个零散东西，而是得到一个完整链条：

text

第 1 周：我理解了论文
第 2 周：我实现了核心模块
第 3 周：我做了实验
第 4 周：我复盘了结果

最终公开资产是：

text

1 篇论文分析
1 个 GitHub repo
1 篇实验记录
1 篇完整复现文章

这比“每周换一个新项目”强很多。

换成 Kaggle 也一样

比如你做一个 Kaggle 表格数据比赛：

text

第 1 周：理解任务、数据、评价指标，写 EDA note
第 2 周：做 baseline，提交一次，写 baseline note
第 3 周：做特征工程和模型对比，写 experiment note
第 4 周：写完整复盘：哪些方法有效，哪些无效，为什么

最终不是“一周打一场 Kaggle”，而是：

text

一个月认真做一个小比赛 / 小任务
每周公开一次阶段性证据

核心就是：

每周产出一个“研究过程切片”，每月产出一个“完整成果”。

不要把每周产出理解成每周完成一个大东西。

Minisql

Log

Tmp

第 1 周：论文分析

第 2 周：实现核心模块

第 3 周：做小规模实验

第 4 周：复盘和整理

最终 4 周成果

换成 Kaggle 也一样

Log

第 1 周：论文分析 ​

第 2 周：实现核心模块 ​

第 3 周：做小规模实验 ​

第 4 周：复盘和整理 ​

最终 4 周成果 ​

换成 Kaggle 也一样 ​

第 1 周：论文分析

第 2 周：实现核心模块

第 3 周：做小规模实验

第 4 周：复盘和整理

最终 4 周成果

换成 Kaggle 也一样