稳定性 | Jeanphilo Blog

副标题 / 摘要缓存大小不是拍脑袋，而是命中率、成本与稳定性之间的平衡。本文给出确定缓存大小的工程方法。目标读者负责缓存系统和性能优化的工程师做容量规划与成本控制的团队需要提升命中率与稳定性的开发者背景 / 动机缓存太小会导致频繁穿透，太大则成本高且失效风险增加。正确做法是用数据驱动的方式确定缓存大小。核心概念命中率（Hit Rate）：缓存命中 / 总请求工作集（Working Set）：短期内频繁访问的数据集合淘汰策略：LRU/LFU 等成本曲线：边际命中率收益逐渐降低实践指南 / 步骤采集访问分布（热度、访问频率）估算工作集大小用不同容量做离线回放评估命中率与成本曲线预留安全余量（波峰期、突发流量）可运行示例下面模拟不同缓存容量的命中率： from collections import OrderedDict def lru_hit_rate(requests, capacity): cache = OrderedDict() hits = 0 for key in requests: if key in cache: hits += 1 cache.move_to_end(key) else: if len(cache) >= capacity: cache.popitem(last=False) cache[key] = True return hits / len(requests) if __name__ == "__main__": reqs = [1,2,3,1,2,4,1,2,3,5,1,2,3,4] for cap in [1, 2, 3, 4]: print(cap, lru_hit_rate(reqs, cap)) 解释与原理缓存大小的收益是递减的：容量越大，新增命中率提升越小。因此需要找到“边际收益开始下降”的拐点，而不是盲目扩容。 ...