推荐阅读
- 先了解任务版图与模型谱系(NLP/CV/多模态)
- 再看训练流程、数据处理与评测方法
- 最后阅读落地案例与工程化部署
推荐阅读 先读注意力机制公式与直观解释 再看 Self-Attention/Transformer 结构 最后看多头、稀疏与线性注意力变体
推荐阅读 先从分类/检测/分割等基础任务入门 再看 backbone 选择与训练技巧 最后看应用场景与评测指标
推荐阅读 先读 Transformer 与预训练-微调范式 再看提示工程、对齐与评测方法 最后看推理部署、成本优化与安全控制
推荐阅读 先梳理多模态系统的模块划分与数据流 再看训练/推理流水线与资源配置 最后看扩展性、成本与可靠性权衡
推荐阅读 先理解图文匹配与 captioning 任务 再看 BLIP 架构与预训练目标 最后看 VQA/检索等应用与局限
推荐阅读 先掌握正负样本构造与对比损失(InfoNCE) 再看主流框架(SimCLR/MoCo)与表征学习 最后看跨模态与检索场景的迁移
推荐阅读 先理解图文对齐与对比学习的直觉 再看 CLIP 架构与训练细节 最后看零样本分类/检索等应用与限制