Atrous

副标题 / 摘要空洞卷积通过插入“空洞”扩大感受野，在不显著增加参数的情况下捕获长距离上下文。本文按 ACERS 结构解析原理、复杂度与工程场景，并提供最小可运行示例。预计阅读时长：14~18 分钟标签：dilated-convolution、segmentation、vision SEO 关键词：空洞卷积, Dilated Convolution, Atrous 元描述：解释空洞卷积的原理、复杂度与工程应用，含最小示例。目标读者想理解感受野扩大策略的入门读者从事语义分割、时序建模的工程实践者需要在算力与效果间权衡的开发者背景 / 动机传统卷积增大感受野通常靠加深网络或增大核尺寸，但这会带来更多参数与计算。空洞卷积用“稀疏采样”的方式扩大感受野，是更高效的替代方案。核心概念空洞率（dilation）：卷积核元素之间的间隔。感受野：输出特征与输入区域的覆盖范围。稀疏采样：在输入上跳步取样。 A — Algorithm（题目与算法）用通俗语言说明主题内容空洞卷积就是“把卷积核撑开”，让核的元素之间有空洞，从而覆盖更大的输入范围。基础示例（1） 3x3 卷积，dilation=2 → 覆盖 5x5 的感受野。基础示例（2）不增加参数数量，但能捕捉更大上下文。实践指南 / 步骤选择基础卷积核（如 3x3）。设置 dilation（常用 2、4、8）。观察感受野与特征分辨率变化。避免过大 dilation 导致“栅格效应”。可运行示例（最小 PyTorch 空洞卷积） import torch import torch.nn as nn x = torch.randn(1, 3, 32, 32) conv = nn.Conv2d(3, 8, kernel_size=3, dilation=2, padding=2) out = conv(x) print(out.shape) 解释与原理有效感受野：k_eff = k + (k-1) * (d-1)。参数量与标准卷积相同，计算量近似不变。 C — Concepts（核心思想）方法类型空洞卷积属于扩大感受野的卷积变体，常用于分割与时序模型。 ...