Post-Processing

副标题 / 摘要 NMS（Non-Maximum Suppression）是目标检测后处理的核心步骤。本文用 ACERS 框架拆解 NMS 的原理、流程与工程实践，并提供可运行的 PyTorch 示例。预计阅读时长：14~18 分钟标签：nms、object-detection、iou SEO 关键词：NMS, 非极大值抑制, IoU, 目标检测元描述：讲清 NMS 的核心算法、复杂度与工程取舍。目标读者想理解目标检测后处理的初学者需要调参 IoU 阈值的工程实践者关注推理速度与精度平衡的开发者背景 / 动机检测模型通常会输出多个重叠框。如果不做抑制，会出现“同一目标被重复检测”。 NMS 用最简单的规则实现去重，是工业界的标准方案。核心概念 IoU（Intersection over Union）：衡量两个框重叠程度。 score：置信度分数，决定优先保留的框。阈值：IoU 超过阈值则抑制。 A — Algorithm（题目与算法）用通俗语言说明主题内容 NMS 的逻辑很直观：选出最高分的框。删除与它重叠度过高的框。重复直到没有框。基础示例（1）两个高度重叠的人脸框，只保留分数更高的一个。基础示例（2）多个类别的检测结果，先按类别分开再做 NMS（class-wise）。实践指南 / 步骤对检测框按 score 排序。取最高分框作为保留结果。计算 IoU，过滤高重叠框。重复直到框集合为空。可运行示例（最小 PyTorch NMS） import torch def iou(box, boxes): x1 = torch.maximum(box[0], boxes[:, 0]) y1 = torch.maximum(box[1], boxes[:, 1]) x2 = torch.minimum(box[2], boxes[:, 2]) y2 = torch.minimum(box[3], boxes[:, 3]) inter = torch.clamp(x2 - x1, min=0) * torch.clamp(y2 - y1, min=0) area1 = (box[2] - box[0]) * (box[3] - box[1]) area2 = (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1]) union = area1 + area2 - inter return inter / (union + 1e-6) def nms(boxes, scores, thresh=0.5): idx = scores.argsort(descending=True) keep = [] while idx.numel() > 0: i = idx[0] keep.append(i.item()) if idx.numel() == 1: break rest = idx[1:] ious = iou(boxes[i], boxes[rest]) idx = rest[ious <= thresh] return keep boxes = torch.tensor([ [0.0, 0.0, 1.0, 1.0], [0.1, 0.1, 1.1, 1.1], [2.0, 2.0, 3.0, 3.0], ]) scores = torch.tensor([0.9, 0.8, 0.7]) print(nms(boxes, scores, thresh=0.5)) 解释与原理 NMS 的核心是“先保留最可信框”。 IoU 阈值越大，保留框越多；越小，抑制越强。 C — Concepts（核心思想）方法类型 NMS 属于后处理过滤算法，用局部贪心策略去重。 ...