AI | Jeanphilo Blog

Attention

推荐阅读先读注意力机制公式与直观解释再看 Self-Attention/Transformer 结构最后看多头、稀疏与线性注意力变体

推荐阅读先从分类/检测/分割等基础任务入门再看 backbone 选择与训练技巧最后看应用场景与评测指标

推荐阅读先读 Transformer 与预训练-微调范式再看提示工程、对齐与评测方法最后看推理部署、成本优化与安全控制

推荐阅读先梳理多模态系统的模块划分与数据流再看训练/推理流水线与资源配置最后看扩展性、成本与可靠性权衡

推荐阅读先理解图文匹配与 captioning 任务再看 BLIP 架构与预训练目标最后看 VQA/检索等应用与局限

推荐阅读先掌握正负样本构造与对比损失（InfoNCE）再看主流框架（SimCLR/MoCo）与表征学习最后看跨模态与检索场景的迁移

推荐阅读先理解图文对齐与对比学习的直觉再看 CLIP 架构与训练细节最后看零样本分类/检索等应用与限制