系统设计 | Jeanphilo Blog

缓存大小如何确定：命中率、成本与稳定性

副标题 / 摘要缓存大小不是拍脑袋，而是命中率、成本与稳定性之间的平衡。本文给出确定缓存大小的工程方法。目标读者负责缓存系统和性能优化的工程师做容量规划与成本控制的团队需要提升命中率与稳定性的开发者背景 / 动机缓存太小会导致频繁穿透，太大则成本高且失效风险增加。正确做法是用数据驱动的方式确定缓存大小。核心概念命中率（Hit Rate）：缓存命中 / 总请求工作集（Working Set）：短期内频繁访问的数据集合淘汰策略：LRU/LFU 等成本曲线：边际命中率收益逐渐降低实践指南 / 步骤采集访问分布（热度、访问频率）估算工作集大小用不同容量做离线回放评估命中率与成本曲线预留安全余量（波峰期、突发流量）可运行示例下面模拟不同缓存容量的命中率： from collections import OrderedDict def lru_hit_rate(requests, capacity): cache = OrderedDict() hits = 0 for key in requests: if key in cache: hits += 1 cache.move_to_end(key) else: if len(cache) >= capacity: cache.popitem(last=False) cache[key] = True return hits / len(requests) if __name__ == "__main__": reqs = [1,2,3,1,2,4,1,2,3,5,1,2,3,4] for cap in [1, 2, 3, 4]: print(cap, lru_hit_rate(reqs, cap)) 解释与原理缓存大小的收益是递减的：容量越大，新增命中率提升越小。因此需要找到“边际收益开始下降”的拐点，而不是盲目扩容。 ...

什么是流式处理（Streaming）：概念与实现方式

副标题 / 摘要流式处理的核心是“边到边算”，避免一次性加载全部数据。本文解释流的概念、适用场景与实现方式。目标读者需要处理大数据或实时数据的工程师想理解流式模型的开发者对性能优化有兴趣的团队背景 / 动机在数据量大或实时性要求高的场景中，一次性加载全部数据会导致内存浪费与延迟。流式处理通过“逐条处理”降低内存占用与延迟。核心概念流（Stream）：数据项按时间或顺序到达管道（Pipeline）：处理步骤串联惰性计算：只有需要时才计算下一项实践指南 / 步骤把数据源转换为迭代器/生成器用管道组合处理步骤避免全量加载，只保留必要状态为每一步设定可观测指标可运行示例 def source(): for i in range(1, 11): yield i def filter_even(stream): for x in stream: if x % 2 == 0: yield x def map_square(stream): for x in stream: yield x * x def sink(stream): for x in stream: print(x) if __name__ == "__main__": stream = source() stream = filter_even(stream) stream = map_square(stream) sink(stream) 解释与原理流式模型通过“惰性迭代”把计算拆成小块。这样既降低了内存占用，也能更快得到部分结果。 ...

什么是实时系统：与普通系统的关键区别

副标题 / 摘要实时系统的核心不是“快”，而是“可预测”。本文解释实时系统与普通系统的差异，并给出工程落地要点。目标读者做嵌入式、自动控制、工业系统的工程师需要理解时限约束的后端开发者想区分“高性能”与“实时性”的技术负责人背景 / 动机很多系统不只要求快，还要求“按时”。比如刹车控制、心电监测、工业自动化等，错过时限比“慢一点”更危险。核心概念硬实时（Hard RT）：错过时限等同失败软实时（Soft RT）：偶尔错过仍可接受确定性（Determinism）：执行时间可预测时限（Deadline）：任务必须完成的时间点实践指南 / 步骤定义时限与容忍度（硬实时/软实时）测量最坏情况执行时间（WCET）选择合适调度策略（如固定优先级）限制不可预测行为（GC、动态分配、锁竞争）建立监控与超时策略可运行示例下面示例用简单的“任务+时限”判断是否满足实时要求： from typing import List, Tuple def is_schedulable(tasks: List[Tuple[int, int]]) -> bool: # (runtime, deadline) time = 0 for runtime, deadline in tasks: time += runtime if time > deadline: return False return True if __name__ == "__main__": print(is_schedulable([(2, 3), (1, 5), (2, 7)])) # True print(is_schedulable([(2, 3), (3, 4)])) # False 解释与原理普通系统关注平均吞吐和响应时间，而实时系统关注“最坏情况”。只要存在无法预测的延迟（GC 停顿、锁竞争、I/O 抖动），就会破坏实时性。 ...

实时语言与堆内存分配：为什么动态分配会破坏实时性

副标题 / 摘要实时系统追求可预测性，而堆分配与 GC 往往引入不可控延迟。本文解释二者关系，并提供工程替代策略。目标读者做实时/嵌入式系统的工程师关注性能与确定性的开发者需要制定内存策略的技术负责人背景 / 动机在实时系统里，“偶尔慢”也可能是灾难。堆分配和垃圾回收会带来不可预测的暂停和抖动，这与实时性天然冲突。核心概念堆分配：运行期动态申请内存 GC 暂停：回收时的停顿导致时延不可控确定性：最坏情况可预测静态分配：编译期或启动期分配实践指南 / 步骤避免运行期频繁分配使用对象池/环形缓冲关键路径使用栈或静态内存把 GC 影响隔离在非实时线程做最坏情况延迟测试可运行示例下面对比“堆分配”与“静态数组”的模式： #include <stdio.h> #include <stdlib.h> #define N 1024 static int buffer[N]; int main(void) { // 静态分配：可预测 for (int i = 0; i < N; ++i) buffer[i] = i; // 动态分配：可能触发不可预测延迟 int *heap = (int *)malloc(sizeof(int) * N); if (!heap) return 1; for (int i = 0; i < N; ++i) heap[i] = i; free(heap); printf("done\n"); return 0; } 解释与原理堆分配需要维护分配器状态，可能引发锁竞争与碎片整理。 GC 会在不确定的时间触发暂停。这些都让最坏时延不可预测，因此实时语言往往限制或避免堆分配。 ...