80 年代后的 CPU 变化与编程影响

副标题 / 摘要 CPU 不再靠单核频率无限提升,而是通过多核、缓存层级与指令并行提升性能。本文解释编程影响。 目标读者 关注性能优化的工程师 学习系统与硬件基础的开发者 需要理解并发趋势的人 背景 / 动机 “频率增长带来的免费午餐”已经结束。 现代 CPU 的性能提升更多来自并行与缓存,这改变了编程方式。 核心概念 缓存层级:L1/L2/L3 影响访问延迟 多核与并行:性能来自并发执行 分支预测与流水线:影响指令效率 实践指南 / 步骤 关注内存访问局部性 优化缓存友好数据结构 利用并行,但避免过度同步 关注分支与热点路径 可运行示例 # 简单示意:顺序访问 vs 随机访问 import random def sequential(n): data = list(range(n)) s = 0 for x in data: s += x return s def random_access(n): data = list(range(n)) idx = list(range(n)) random.shuffle(idx) s = 0 for i in idx: s += data[i] return s if __name__ == "__main__": print(sequential(10000)) print(random_access(10000)) 解释与原理 现代 CPU 更依赖缓存与并行。 顺序访问通常比随机访问更快,因为缓存命中率更高。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

CPU 空闲时在做什么:调度、节能与后台任务

副标题 / 摘要 CPU 空闲并不等于“什么都不做”。本文解释空闲时的调度、节能状态与后台维护任务。 目标读者 学习操作系统的开发者 关注性能与能耗的工程师 想理解系统行为的读者 背景 / 动机 很多人以为空闲 CPU 就完全停转。 实际上系统会执行空闲线程、功耗管理与后台维护。 核心概念 空闲线程:调度器的占位任务 省电状态(C-States):降低功耗 后台任务:GC、日志刷新、索引更新 实践指南 / 步骤 理解空闲线程的作用 了解 CPU 省电状态切换 监控后台任务对性能影响 设置合适的电源管理策略 可运行示例 # Linux 查看 CPU 空闲与节能状态 cat /proc/stat | head -n 1 # 观察 CPU 频率 cat /proc/cpuinfo | grep MHz | head -n 1 解释与原理 当没有可运行任务时,调度器切换到空闲线程。 系统可能进入更深的节能状态,以降低功耗与温度。 常见问题与注意事项 空闲是否能执行系统维护? 是的,很多后台任务利用空闲时间。 频率降低会影响响应吗? 会,因此系统会在负载上升时迅速升频。 为什么电池设备更敏感? 因为功耗管理直接影响续航。 最佳实践与建议 在服务器上关注空闲时的后台任务 对延迟敏感场景设置性能模式 用监控观察功耗与频率变化 小结 / 结论 CPU 空闲时仍有调度与节能行为。 理解这些细节有助于性能调优与能耗控制。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

内存泄漏示例:为什么不释放会出问题

副标题 / 摘要 内存泄漏会让程序“越跑越慢”。本文用 C 示例展示泄漏原因,并给出基本规避方法。 目标读者 写过 C/C++ 的开发者 关注资源管理与稳定性的工程师 学习系统编程的读者 背景 / 动机 在手动内存管理语言中,忘记释放会导致内存逐渐耗尽。 长期运行服务最容易遭遇此类问题。 核心概念 内存分配:malloc/new 释放:free/delete 泄漏:分配后没有释放且失去引用 实践指南 / 步骤 所有分配都必须有对应释放 明确资源的所有权 使用工具检测泄漏(valgrind) 用 RAII 或智能指针减少风险 可运行示例 #include <stdlib.h> #include <stdio.h> int main() { for (int i = 0; i < 100000; i++) { char *p = (char *)malloc(1024); if (p == NULL) return 1; // 忘记 free(p); -> 内存泄漏 } printf("done\n"); return 0; } 解释与原理 每次 malloc 都会向堆申请内存,如果不释放,内存不会回收。 循环中持续泄漏最终会导致内存耗尽。 常见问题与注意事项 垃圾回收语言就不会泄漏吗? 也可能“逻辑泄漏”,比如全局容器无限增长。 为什么泄漏很难发现? 因为短期运行可能看不出问题。 工具有用吗? 非常有用,建议上线前检查。 最佳实践与建议 用智能指针或 RAII 自动释放 对长期运行服务做内存监控 建立内存泄漏回归测试 小结 / 结论 内存泄漏是资源管理失控的典型问题。 通过明确所有权与工具检测,可以显著降低风险。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

如何排序 10GB 文件:外部排序的工程方案

副标题 / 摘要 内存无法容纳 10GB 数据时,外部排序是标准方案。本文介绍分块排序与多路归并。 目标读者 需要处理大文件的工程师 学习外部排序算法的读者 关注磁盘 I/O 优化的人 背景 / 动机 当数据量超过内存容量,传统内存排序会失败。 外部排序通过“分块 + 多路归并”解决问题。 核心概念 分块排序:把大文件拆成可放入内存的小块 多路归并:合并多个有序块 磁盘 I/O:顺序读写优于随机读写 实践指南 / 步骤 按内存容量分块读取 每块内存排序并写回磁盘 多路归并所有有序块 尽量顺序读写减少随机 I/O 可运行示例 # 简化示例:分块排序 + 归并 import heapq def merge_sorted(chunks): heap = [] for i, chunk in enumerate(chunks): if chunk: heapq.heappush(heap, (chunk[0], i, 0)) result = [] while heap: val, i, j = heapq.heappop(heap) result.append(val) if j + 1 < len(chunks[i]): heapq.heappush(heap, (chunks[i][j + 1], i, j + 1)) return result if __name__ == "__main__": chunks = [sorted([3, 1, 2]), sorted([9, 7, 8])] print(merge_sorted(chunks)) 解释与原理 外部排序的核心是把“大问题拆成小问题”,每块可在内存中排序。 最后通过多路归并生成整体有序序列。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

手写一个最小的垃圾回收器:标记-清除模型

副标题 / 摘要 标记-清除是最基础的垃圾回收模型。本文用简化示例解释“可达性”与回收过程。 目标读者 想理解 GC 原理的开发者 系统编程与语言设计学习者 关注内存管理的工程师 背景 / 动机 手动内存管理容易出错,而 GC 通过“可达性”自动回收对象。 理解基础模型有助于调试内存问题。 核心概念 根集合(Roots):直接可达的对象 可达性:从根出发可访问到的对象 标记-清除:标记存活对象,清除不可达对象 实践指南 / 步骤 构建对象图与引用关系 从根集合进行标记遍历 清除未被标记的对象 输出回收结果 可运行示例 class Obj: def __init__(self, name): self.name = name self.refs = [] self.marked = False def mark(obj): if obj.marked: return obj.marked = True for r in obj.refs: mark(r) def sweep(heap): return [o for o in heap if o.marked] if __name__ == "__main__": a = Obj("a") b = Obj("b") c = Obj("c") a.refs.append(b) heap = [a, b, c] roots = [a] for r in roots: mark(r) heap = sweep(heap) print([o.name for o in heap]) # c 被回收 解释与原理 GC 的核心是假设“不可达对象可以回收”。 标记阶段找到存活对象,清除阶段释放其他对象。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]