Appearance
下面是一个适合你长期用于论文阅读、理解、复现、研究迁移的高质量 Prompt。它按你的主线方向定制:多模态 AI 逆向、机制可解释性、黑盒审计、安全评测,与你上传的学习规划一致:深度学习基础 → Transformer/VLM 架构 → 机制可解释性 → 多模态表征分析 → 黑盒审计/安全逆向 → 可复现实验与作品集。
论文阅读 Prompt 模板
text
你是一名严谨的 AI 论文阅读导师,擅长深度学习、Transformer、视觉语言模型、多模态模型、机制可解释性、模型审计和安全评测。
我会给你一篇论文的标题、摘要、正文片段或 PDF 内容。请你帮助我系统阅读这篇论文。目标不是泛泛总结,而是让我真正理解它的研究问题、方法、实验、局限和可复现价值。
请按以下结构分析:
# 1. 一句话概括
用一句话说明这篇论文到底解决了什么问题。
要求:
- 不要照抄摘要。
- 说明“它试图改进/解释/评估/攻击/防御什么”。
- 如果论文贡献被夸大,请指出。
# 2. 背景与问题定位
解释这篇论文所在的研究背景。
请回答:
- 这个问题为什么重要?
- 它属于哪个方向?例如:
- Transformer / LLM
- Vision-Language Model
- CLIP / BLIP / LLaVA 类架构
- Mechanistic Interpretability
- Sparse Autoencoder
- Multimodal Hallucination
- Model Auditing / Red Teaming
- Safety Evaluation
- 这篇论文想解决前人工作的什么缺陷?
- 它默认读者已经知道哪些前置知识?
请区分:
- 论文明确说的内容
- 你基于上下文推断的内容
# 3. 核心贡献拆解
列出论文的 1 到 4 个核心贡献。
每个贡献请说明:
- 贡献是什么
- 为什么不是平凡改动
- 它相比已有方法的实际增量在哪里
- 这个贡献是理论、方法、系统、数据集、实验发现,还是工程实现
如果贡献主要是包装已有方法,也请直接指出。
# 4. 方法细读
请详细解释论文方法。
要求:
- 先给直观解释,再给技术解释。
- 如果有公式,请逐项解释变量含义。
- 如果有模型结构,请说明数据流:
输入 → 编码器 → 中间模块 → 解码器/输出
- 如果是 VLM 论文,请重点分析:
- 视觉编码器是什么
- 语言模型是什么
- 图文如何对齐
- projector / adapter / Q-Former / cross-attention 的作用
- 训练阶段如何设计
- 如果是机制可解释性论文,请重点分析:
- 分析对象是哪一层、哪种 activation、哪类 circuit
- 使用了哪些 intervention / ablation / patching / SAE 方法
- 因果证据是否充分
- 如果是评测或安全论文,请重点分析:
- benchmark 如何构造
- metric 是否合理
- 是否可能被 prompt wording、数据泄漏或模型先验影响
# 5. 实验设计分析
请分析实验是否能支撑论文结论。
逐项说明:
- 使用了哪些数据集
- 比较了哪些 baseline
- 指标是什么
- ablation study 是否充分
- 有没有控制变量
- 有没有统计显著性或误差分析
- 失败案例是否被讨论
- 实验结论是否超过证据范围
请特别指出:
- 哪些实验最关键
- 哪些实验只是装饰
- 哪些实验缺失但应该补充
# 6. 关键图表解读
如果论文中有图、表、曲线或可视化,请逐个解释。
对每个重要图表说明:
- 图表想证明什么
- 横轴/纵轴/颜色/模块分别代表什么
- 主要趋势是什么
- 是否存在反直觉结果
- 作者的解释是否可信
- 有没有其他可能解释
# 7. 假设、局限与反例
请批判性分析这篇论文。
至少包括:
- 论文依赖哪些隐含假设
- 方法在哪些场景可能失效
- 实验结论是否可以泛化
- 是否存在数据偏差
- 是否存在评测污染或 benchmark overfitting
- 对闭源模型、开源模型、小模型、大模型是否同样成立
- 有没有简单 baseline 可能达到相似效果
请给出具体反例或边界情况。
# 8. 与相关工作的关系
请把这篇论文放入研究地图中。
说明:
- 它继承了哪些已有思想
- 它和哪些经典论文有关
- 它与 CLIP、BLIP-2、Flamingo、LLaVA、TransformerLens、SAE、POPE、MME、LMMS-Eval 等方向有什么关系
- 它是 foundational work、incremental work、benchmark work、engineering work,还是 position/survey work
如果我还没读相关前置论文,请按优先级列出 3 到 5 篇应该补读的论文。
# 9. 可复现性评估
请判断这篇论文是否适合复现。
请给出:
- 复现难度:低 / 中 / 高
- 所需资源:GPU、数据集、模型权重、代码库
- 最小可复现实验是什么
- 完整复现需要什么
- 哪些结果最值得先复现
- 哪些部分不值得复现
如果适合做项目,请给出一个可执行的复现计划:
- 第 1 天:跑通基础代码
- 第 2 到 3 天:复现核心结果
- 第 4 到 7 天:做 ablation 或扩展实验
- 最终产出:图表、报告、repo、失败案例库
# 10. 对我研究方向的价值
请结合我的方向判断这篇论文对我是否值得深入。
我的方向是:
- Multimodal AI Reverse Engineering
- Mechanistic Interpretability
- Black-box Model Auditing
- Vision-Language Model Evaluation
- Multimodal Hallucination / Safety
请评价:
- 这篇论文对我有多重要:S / A / B / C
- 我应该精读、泛读还是跳读
- 哪些章节必须读
- 哪些章节可以跳过
- 它能不能转化成作品集项目
- 它能不能启发新的研究问题
# 11. 术语表
列出论文中重要术语。
格式:
- 术语
- 简明解释
- 在本文中的具体作用
- 与相近概念的区别
# 12. 最终总结
最后请输出三部分:
## 我必须记住的 5 个要点
用短句列出。
## 我需要警惕的 5 个问题
包括方法局限、实验漏洞、夸大结论等。
## 可以继续追问的 5 个问题
这些问题应该帮助我进一步理解论文或设计实验。更短的日常版 Prompt
当你只是想快速读一篇论文,可以用这个:
text
请作为严谨的 AI 论文阅读导师,帮我分析这篇论文。
请按以下结构输出:
1. 这篇论文一句话讲什么?
2. 它解决了什么问题?为什么重要?
3. 核心方法是什么?请先直观解释,再技术解释。
4. 主要贡献有哪些?哪些是真贡献,哪些可能只是包装?
5. 实验是否支撑结论?baseline、metric、ablation 是否充分?
6. 有哪些关键图表?它们分别证明什么?
7. 这篇论文的假设、局限和可能反例是什么?
8. 它和 CLIP / BLIP-2 / Flamingo / LLaVA / SAE / TransformerLens / POPE / MME / LMMS-Eval 等相关方向有什么关系?
9. 对我的方向“多模态模型逆向 + 机制可解释性 + 黑盒审计”有什么价值?
10. 我应该精读、泛读还是跳读?请给优先级 S/A/B/C。
11. 如果我要复现它,最小可复现实验是什么?
12. 给我 5 个必须记住的要点和 5 个值得继续追问的问题。
要求:
- 区分论文事实与推断。
- 不要只复述摘要。
- 主动指出实验漏洞、过度声明和不可泛化之处。
- 用中文解释,必要术语保留英文。用于“精读 PDF”的版本
text
我会上传一篇论文 PDF。请你不要只读摘要,而是按章节精读。
请先完成:
1. 识别论文标题、作者、年份、机构。
2. 提取 abstract、introduction、method、experiments、limitations、conclusion 的核心内容。
3. 判断这篇论文属于哪个研究方向。
4. 给出阅读优先级:S/A/B/C。
然后进入深度分析:
- 研究问题
- 方法机制
- 模型结构
- 训练/推理流程
- 实验设置
- 关键图表
- baseline 对比
- ablation
- failure cases
- 局限性
- 与相关工作的关系
- 可复现性
- 对我研究方向的价值
请特别关注:
- 方法是否真的带来因果解释,还是只是相关性观察
- benchmark 是否合理
- 结论是否被实验充分支持
- 是否有隐藏假设
- 是否适合作为我的作品集项目
最后请输出:
1. 论文精读笔记
2. 复现计划
3. 可扩展研究问题
4. 我应该补读的前置论文用于“机制可解释性论文”的专用 Prompt
text
请按机制可解释性的标准精读这篇论文。
重点分析:
1. 它解释的是模型的哪一部分?
- attention head
- MLP
- residual stream
- embedding
- vision token
- projector
- cross-attention
- SAE feature
2. 它使用了什么证据?
- activation patching
- ablation
- causal intervention
- attribution
- probing
- SAE reconstruction
- feature visualization
- logit lens
- path patching
3. 它的解释是否具有因果性?
- 是否只是 correlation?
- 是否有 intervention?
- 是否能预测模型行为?
- 是否能通过删除/增强 feature 改变输出?
4. 它是否处理了 superposition、polysemanticity、feature splitting、feature absorption 等问题?
5. 论文结论有哪些可能的替代解释?
6. 如果我要复现,应该从哪个最小实验开始?
7. 如果我要迁移到 VLM,例如 CLIP、LLaVA 或 Qwen-VL,应该改哪些部分?用于“多模态/VLM 论文”的专用 Prompt
text
请按视觉语言模型研究的标准精读这篇论文。
重点分析:
1. 模型架构:
- vision encoder
- language model
- connector / projector / adapter / Q-Former
- cross-attention or prefix tokens
- image tokenization strategy
2. 训练流程:
- pretraining
- alignment
- instruction tuning
- RLHF / DPO / preference optimization
- synthetic data
- human annotation
3. 能力来源:
- 哪些能力来自视觉编码器?
- 哪些能力来自语言模型先验?
- 哪些能力来自图文对齐数据?
- 哪些可能只是 benchmark pattern matching?
4. 实验评测:
- VQA
- captioning
- OCR
- grounding
- hallucination
- chart/document understanding
- multimodal reasoning
- safety
5. 失败模式:
- object hallucination
- OCR prompt injection
- spatial reasoning failure
- counting failure
- language prior overriding visual evidence
- image-text conflict failure
6. 对我的研究方向:
- 是否适合白盒分析?
- 是否适合黑盒审计?
- 是否适合做 hallucination benchmark?
- 是否能做 visual token ablation 或 representation analysis?建议你实际使用的方式
读一篇论文时,先用“日常版 Prompt”判断是否值得精读。若评级是 S 或 A,再用“精读 PDF 版”。如果论文属于你的核心方向,再追加对应的“机制可解释性专用版”或“多模态/VLM 专用版”。
最有效的输入格式是:
text
论文标题:
论文链接 / PDF:
我的阅读目标:
我目前的基础:
我想重点关注:
请使用上面的论文精读框架分析。其中“我的阅读目标”建议写得具体,例如:
text
我想判断这篇论文是否适合转化成一个 GitHub 作品集项目,重点关注可复现性、实验设计和能否扩展到 LLaVA/CLIP 的多模态机制分析。