Pairwise

副标题 / 摘要对比损失是度量学习最经典的成对目标：拉近同类、推远异类。本文用公式、几何直觉与最小可运行实验，帮你建立对比学习的第一块基石。预计阅读时长：15~18 分钟标签：contrastive-loss、metric-learning、pairwise SEO 关键词：对比损失, Contrastive Loss, 度量学习, 嵌入空间元描述：讲清对比损失的数学形式、训练细节与工程应用场景。系列导航（1/4）对比损失 Contrastive Loss（本文）（2/4）三元组损失 Triplet Loss （3/4）InfoNCE + SimCLR （4/4）CLIP 对比学习目标目标读者想入门对比学习/度量学习的初学者需要在工程中构建相似度模型的开发者希望通过小实验理解公式含义的实践派背景 / 动机在推荐、检索、验证类任务里，我们往往不关心“分类标签”，而关心“相似度”。对比损失用成对样本表达“相似/不相似”，是把语义关系映射到向量空间的基础方法。核心概念嵌入空间：把样本映射为向量，距离代表语义相近程度。正负样本对：正样本对应“相似”，负样本对对应“不相似”。 Margin：负样本需要被推远的最小距离阈值。 A — Algorithm（题目与算法）用通俗语言说明主题内容对比损失做的事很简单：同类样本对要靠得更近。异类样本对要至少分开一个 margin。基础示例（1）两张同一人的人脸：距离应该变小。两个不同人的人脸：距离至少大于 margin。基础示例（2）同类商品图片：嵌入距离小。异类商品图片：嵌入距离大。实践指南 / 步骤选择特征编码器（如 MLP/CNN）。构造正负样本对，并标记 y=1/0。计算成对距离并应用对比损失。观察正负样本平均距离是否分离。可运行示例（最小对比损失实验） import random import torch import torch.nn as nn import torch.nn.functional as F random.seed(42) torch.manual_seed(42) def make_data(n=200): c1 = torch.randn(n, 2) * 0.4 + torch.tensor([0.0, 0.0]) c2 = torch.randn(n, 2) * 0.4 + torch.tensor([3.0, 3.0]) x = torch.cat([c1, c2], dim=0) y = torch.cat([torch.zeros(n), torch.ones(n)]).long() return x, y def make_pairs(x, y, num_pairs=1000): pairs = [] labels = [] for _ in range(num_pairs): if random.random() < 0.5: cls = random.randint(0, 1) idx = (y == cls).nonzero().flatten() i, j = idx[torch.randint(len(idx), (2,))] labels.append(1) else: i = (y == 0).nonzero().flatten()[torch.randint((y == 0).sum(), (1,))] j = (y == 1).nonzero().flatten()[torch.randint((y == 1).sum(), (1,))] labels.append(0) pairs.append((x[i], x[j])) return torch.stack([p[0] for p in pairs]), torch.stack([p[1] for p in pairs]), torch.tensor(labels) def contrastive_loss(z1, z2, y, margin=1.0): d = F.pairwise_distance(z1, z2) pos = y * d.pow(2) neg = (1 - y) * F.relu(margin - d).pow(2) return (pos + neg).mean() class Encoder(nn.Module): def __init__(self): super().__init__() self.net = nn.Sequential( nn.Linear(2, 32), nn.ReLU(), nn.Linear(32, 2), ) def forward(self, x): return self.net(x) x, y = make_data() x1, x2, pair_y = make_pairs(x, y, num_pairs=2000) model = Encoder() opt = torch.optim.Adam(model.parameters(), lr=1e-2) for epoch in range(1, 201): z1 = model(x1) z2 = model(x2) loss = contrastive_loss(z1, z2, pair_y.float(), margin=1.0) opt.zero_grad() loss.backward() opt.step() if epoch % 50 == 0: with torch.no_grad(): d = F.pairwise_distance(z1, z2) pos_d = d[pair_y == 1].mean().item() neg_d = d[pair_y == 0].mean().item() print(f"epoch={epoch} loss={loss.item():.4f} pos_d={pos_d:.3f} neg_d={neg_d:.3f}") C — Concepts（核心思想）方法类型对比损失属于度量学习 / 表示学习范式，使用成对样本将语义关系映射到向量距离。 ...