系统 | Jeanphilo Blog

80 年代后的 CPU 变化与编程影响

副标题 / 摘要 CPU 不再靠单核频率无限提升，而是通过多核、缓存层级与指令并行提升性能。本文解释编程影响。目标读者关注性能优化的工程师学习系统与硬件基础的开发者需要理解并发趋势的人背景 / 动机 “频率增长带来的免费午餐”已经结束。现代 CPU 的性能提升更多来自并行与缓存，这改变了编程方式。核心概念缓存层级：L1/L2/L3 影响访问延迟多核与并行：性能来自并发执行分支预测与流水线：影响指令效率实践指南 / 步骤关注内存访问局部性优化缓存友好数据结构利用并行，但避免过度同步关注分支与热点路径可运行示例 # 简单示意：顺序访问 vs 随机访问 import random def sequential(n): data = list(range(n)) s = 0 for x in data: s += x return s def random_access(n): data = list(range(n)) idx = list(range(n)) random.shuffle(idx) s = 0 for i in idx: s += data[i] return s if __name__ == "__main__": print(sequential(10000)) print(random_access(10000)) 解释与原理现代 CPU 更依赖缓存与并行。顺序访问通常比随机访问更快，因为缓存命中率更高。 ...

CPU 空闲时在做什么：调度、节能与后台任务

副标题 / 摘要 CPU 空闲并不等于“什么都不做”。本文解释空闲时的调度、节能状态与后台维护任务。目标读者学习操作系统的开发者关注性能与能耗的工程师想理解系统行为的读者背景 / 动机很多人以为空闲 CPU 就完全停转。实际上系统会执行空闲线程、功耗管理与后台维护。核心概念空闲线程：调度器的占位任务省电状态（C-States）：降低功耗后台任务：GC、日志刷新、索引更新实践指南 / 步骤理解空闲线程的作用了解 CPU 省电状态切换监控后台任务对性能影响设置合适的电源管理策略可运行示例 # Linux 查看 CPU 空闲与节能状态 cat /proc/stat | head -n 1 # 观察 CPU 频率 cat /proc/cpuinfo | grep MHz | head -n 1 解释与原理当没有可运行任务时，调度器切换到空闲线程。系统可能进入更深的节能状态，以降低功耗与温度。常见问题与注意事项空闲是否能执行系统维护？是的，很多后台任务利用空闲时间。频率降低会影响响应吗？会，因此系统会在负载上升时迅速升频。为什么电池设备更敏感？因为功耗管理直接影响续航。最佳实践与建议在服务器上关注空闲时的后台任务对延迟敏感场景设置性能模式用监控观察功耗与频率变化小结 / 结论 CPU 空闲时仍有调度与节能行为。理解这些细节有助于性能调优与能耗控制。 ...

内存泄漏示例：为什么不释放会出问题

副标题 / 摘要内存泄漏会让程序“越跑越慢”。本文用 C 示例展示泄漏原因，并给出基本规避方法。目标读者写过 C/C++ 的开发者关注资源管理与稳定性的工程师学习系统编程的读者背景 / 动机在手动内存管理语言中，忘记释放会导致内存逐渐耗尽。长期运行服务最容易遭遇此类问题。核心概念内存分配：malloc/new 释放：free/delete 泄漏：分配后没有释放且失去引用实践指南 / 步骤所有分配都必须有对应释放明确资源的所有权使用工具检测泄漏（valgrind）用 RAII 或智能指针减少风险可运行示例 #include <stdlib.h> #include <stdio.h> int main() { for (int i = 0; i < 100000; i++) { char *p = (char *)malloc(1024); if (p == NULL) return 1; // 忘记 free(p); -> 内存泄漏 } printf("done\n"); return 0; } 解释与原理每次 malloc 都会向堆申请内存，如果不释放，内存不会回收。循环中持续泄漏最终会导致内存耗尽。常见问题与注意事项垃圾回收语言就不会泄漏吗？也可能“逻辑泄漏”，比如全局容器无限增长。为什么泄漏很难发现？因为短期运行可能看不出问题。工具有用吗？非常有用，建议上线前检查。最佳实践与建议用智能指针或 RAII 自动释放对长期运行服务做内存监控建立内存泄漏回归测试小结 / 结论内存泄漏是资源管理失控的典型问题。通过明确所有权与工具检测，可以显著降低风险。 ...

如何排序 10GB 文件：外部排序的工程方案

副标题 / 摘要内存无法容纳 10GB 数据时，外部排序是标准方案。本文介绍分块排序与多路归并。目标读者需要处理大文件的工程师学习外部排序算法的读者关注磁盘 I/O 优化的人背景 / 动机当数据量超过内存容量，传统内存排序会失败。外部排序通过“分块 + 多路归并”解决问题。核心概念分块排序：把大文件拆成可放入内存的小块多路归并：合并多个有序块磁盘 I/O：顺序读写优于随机读写实践指南 / 步骤按内存容量分块读取每块内存排序并写回磁盘多路归并所有有序块尽量顺序读写减少随机 I/O 可运行示例 # 简化示例：分块排序 + 归并 import heapq def merge_sorted(chunks): heap = [] for i, chunk in enumerate(chunks): if chunk: heapq.heappush(heap, (chunk[0], i, 0)) result = [] while heap: val, i, j = heapq.heappop(heap) result.append(val) if j + 1 < len(chunks[i]): heapq.heappush(heap, (chunks[i][j + 1], i, j + 1)) return result if __name__ == "__main__": chunks = [sorted([3, 1, 2]), sorted([9, 7, 8])] print(merge_sorted(chunks)) 解释与原理外部排序的核心是把“大问题拆成小问题”，每块可在内存中排序。最后通过多路归并生成整体有序序列。 ...

手写一个最小的垃圾回收器：标记-清除模型

副标题 / 摘要标记-清除是最基础的垃圾回收模型。本文用简化示例解释“可达性”与回收过程。目标读者想理解 GC 原理的开发者系统编程与语言设计学习者关注内存管理的工程师背景 / 动机手动内存管理容易出错，而 GC 通过“可达性”自动回收对象。理解基础模型有助于调试内存问题。核心概念根集合（Roots）：直接可达的对象可达性：从根出发可访问到的对象标记-清除：标记存活对象，清除不可达对象实践指南 / 步骤构建对象图与引用关系从根集合进行标记遍历清除未被标记的对象输出回收结果可运行示例 class Obj: def __init__(self, name): self.name = name self.refs = [] self.marked = False def mark(obj): if obj.marked: return obj.marked = True for r in obj.refs: mark(r) def sweep(heap): return [o for o in heap if o.marked] if __name__ == "__main__": a = Obj("a") b = Obj("b") c = Obj("c") a.refs.append(b) heap = [a, b, c] roots = [a] for r in roots: mark(r) heap = sweep(heap) print([o.name for o in heap]) # c 被回收解释与原理 GC 的核心是假设“不可达对象可以回收”。标记阶段找到存活对象，清除阶段释放其他对象。 ...