性能 | Jeanphilo Blog

线程饿死（Starvation）：为什么有线程永远拿不到资源

副标题 / 摘要线程饿死并不是死锁，但同样会让系统“挂住”。本文解释饿死的原因与工程解决办法。目标读者处理高并发系统的后端工程师需要理解调度与锁的开发者负责性能与稳定性的技术负责人背景 / 动机在多线程系统中，即使没有死锁，某些线程也可能长期得不到资源。这会造成延迟暴涨、任务超时与系统不公平。核心概念饿死（Starvation）：线程长期无法获得所需资源不公平锁：没有公平队列的锁优先级反转：低优先级阻塞高优先级实践指南 / 步骤优先使用公平锁或限时锁避免长时间占有锁在关键路径引入超时与降级监控等待队列长度与等待时间可运行示例 # 简化“饿死”示意：高优先级任务不断插队 def scheduler(high_tasks, low_tasks, steps=6): done = [] for _ in range(steps): if high_tasks: done.append(high_tasks.pop(0)) # 高优任务持续补充 high_tasks.append("H") elif low_tasks: done.append(low_tasks.pop(0)) return done if __name__ == "__main__": print(scheduler(["H", "H"], ["L1", "L2", "L3"])) 解释与原理当调度策略持续优先处理高优任务时，低优任务可能永远排不到。这不是死锁，而是不公平调度导致的饥饿现象。常见问题与注意事项饿死一定是 bug 吗？可能是设计问题，比如不公平调度策略。公平锁就一定没问题吗？不一定，公平锁可能降低吞吐。如何定位饿死问题？观察锁等待时间、队列长度与任务超时。 ...

什么是栈与堆：内存模型的关键区别

副标题 / 摘要栈与堆是两种常见的内存分配模型。本文解释它们在生命周期、分配成本与适用场景上的差异。目标读者想理解内存模型的开发者需要优化性能与内存的工程师学习语言底层机制的同学背景 / 动机很多性能问题来自对内存模型的误解。理解栈与堆能帮助你写出更稳定、更高效的代码。核心概念栈（Stack）：函数调用时自动分配，LIFO 堆（Heap）：运行期动态分配，需要显式释放或 GC 生命周期：栈随作用域结束自动释放实践指南 / 步骤局部临时数据优先放栈需要跨作用域共享的对象放堆避免频繁堆分配关注 GC 或释放成本在性能关键路径上减少堆对象可运行示例 #include <stdio.h> #include <stdlib.h> int main(void) { int a = 10; // 栈上 int *p = malloc(sizeof(int)); // 堆上 *p = 20; printf("%d %d\n", a, *p); free(p); return 0; } 解释与原理栈分配快、释放自动，但生命周期短。堆分配更灵活，但成本高且需要额外管理（GC 或 free）。常见问题与注意事项栈一定更快吗？一般更快，但栈空间有限。堆对象一定要手动释放吗？取决于语言，有 GC 的语言会自动回收。栈溢出是什么？递归过深或局部变量过大导致栈空间耗尽。最佳实践与建议频繁创建对象时考虑对象池对大对象避免放在栈上监控 GC 压力与分配热点小结 / 结论栈与堆的差异决定了性能与内存管理策略。理解内存模型是写出稳定系统的基础。 ...

如何设计高可扩展系统：从瓶颈到弹性

副标题 / 摘要高可扩展系统不是堆机器，而是从瓶颈识别、解耦与弹性设计开始。本文给出设计步骤与工程要点。目标读者负责架构设计的工程师做容量规划与扩展策略的团队需要提升系统弹性的开发者背景 / 动机系统的“扩展性”往往在业务增长后才被重视，但此时再改成本巨大。提前建立可扩展性思维能显著降低后期风险。核心概念瓶颈识别：CPU/IO/网络/数据库解耦：服务边界与异步化弹性：自动扩缩容、快速恢复可观测性：指标、日志、追踪实践指南 / 步骤识别系统的主瓶颈拆分服务边界（高耦合点优先）引入缓存与异步队列设计无状态服务建立自动扩缩容与容错机制可运行示例 # 简化示意：用队列解耦请求处理 import queue q = queue.Queue() def enqueue(task): q.put(task) def worker(): while not q.empty(): task = q.get() # 处理任务 q.task_done() 解释与原理扩展性来自“资源增加后系统效率保持”。这需要解耦、无状态、分布式与观测能力。常见问题与注意事项拆分越多越好吗？不，过度拆分会增加协作成本。缓存就能解决扩展性吗？缓存只能缓解读压力。如何评估扩展性？用压测与扩展曲线验证。最佳实践与建议先找到瓶颈再拆分不要为了扩展性牺牲过多简单性保持可观测性小结 / 结论高可扩展系统是“识别瓶颈 + 解耦 + 弹性”的结果。扩展性不是特性，而是长期工程纪律。 ...

输入网址回车后发生了什么：从 DNS 到渲染

副标题 / 摘要从输入 URL 到页面渲染，涉及 DNS、TCP/TLS、HTTP、渲染管线等多个步骤。本文给出清晰流程与排查思路。目标读者想理解浏览器工作流程的开发者需要排查网络与渲染问题的工程师前后端协作人员背景 / 动机 “打开网页很慢”可能源自 DNS、连接、服务器、渲染等任何环节。理解全链路流程，才能有效定位性能瓶颈。核心概念 DNS 解析：域名 -> IP TCP/TLS 握手：建立安全连接 HTTP 请求/响应：获取资源渲染管线：解析 HTML/CSS/JS -> 绘制实践指南 / 步骤 DNS 解析：缓存/递归解析 TCP/TLS 握手：建立连接 HTTP 请求：请求 HTML 与静态资源渲染流程：构建 DOM/CSSOM -> Layout -> Paint JS 执行：可能阻塞渲染可运行示例用 curl 查看网络层信息： curl -v https://example.com 解释与原理浏览器加载过程的瓶颈可能发生在“连接层”（DNS/TCP/TLS），也可能在“渲染层”（JS 阻塞、DOM 过大）。分层分析是定位问题的关键。常见问题与注意事项 HTTPS 比 HTTP 慢吗？会多一次 TLS 握手，但可通过复用与缓存降低。为什么首屏慢？可能是渲染阻塞或资源过大。 ...

C10k 问题怎么解决：高并发连接的策略

副标题 / 摘要 C10k 指单机处理 1 万连接时的瓶颈问题。本文解释成因并给出工程策略。目标读者负责高并发服务的工程师需要优化网络服务的开发者对内核与网络性能感兴趣的团队背景 / 动机传统阻塞模型在连接数大时会消耗大量线程与内存。 C10k 迫使系统从“线程 per 连接”转向“事件驱动”。核心概念事件驱动：epoll/kqueue 非阻塞 IO：减少线程等待连接复用：减少线程数量内核调优：文件描述符、队列长度实践指南 / 步骤使用事件驱动模型（epoll/kqueue）设置非阻塞 IO 调优内核参数（fd 上限、backlog）限制连接数（防止资源耗尽）监控连接指标（活跃连接、TIME_WAIT）可运行示例 # 简化示例：高并发通常依赖事件循环框架 import asyncio async def handle(reader, writer): data = await reader.read(100) writer.write(data) await writer.drain() writer.close() async def main(): server = await asyncio.start_server(handle, "0.0.0.0", 9000) async with server: await server.serve_forever() # asyncio.run(main()) 解释与原理事件驱动通过单线程管理大量连接，避免线程爆炸。 C10k 的关键在于把“等待”从线程中剥离。常见问题与注意事项 C10k 还重要吗？仍重要，高并发场景依旧常见。 ...

性能与可扩展性的关系：别把快当成能扩

副标题 / 摘要性能关注“当前快不快”，可扩展性关注“增长后还能否保持”。本文拆解两者关系与常见误区。目标读者负责性能与扩展性决策的工程师做容量规划与架构设计的团队经常被“性能优化”困扰的开发者背景 / 动机很多系统在小规模很快，但规模一上来就崩。因为性能优化和可扩展性是不同维度，需要不同策略。核心概念性能：单点/单实例的响应与吞吐可扩展性：负载增加后系统维持服务能力瓶颈：CPU / IO / 网络 / 数据库规模曲线：负载增加时性能曲线是否线性实践指南 / 步骤先测基线性能（单机极限）观察扩展曲线（1x -> 2x -> 4x）定位瓶颈组件区分纵向与横向扩展策略用容量规划指导架构可运行示例 # 伪负载模型：用简单函数模拟扩展曲线 def capacity(instances, single_qps, overhead=0.1): return instances * single_qps * (1 - overhead) if __name__ == "__main__": for n in [1, 2, 4, 8]: print(n, capacity(n, 1000)) 解释与原理性能是“单位资源的效率”，可扩展性是“资源增加后效率是否保持”。如果瓶颈在共享组件（如数据库），扩容应用实例并不会线性提升整体性能。常见问题与注意事项性能好就代表可扩展吗？不一定，可能只是单点强。扩展性差就需要重构吗？不一定，先定位瓶颈。缓存能解决扩展性问题吗？只能缓解部分读压力。最佳实践与建议用压测画出扩展曲线关注共享瓶颈（DB、锁、网络）设计可扩展性优先的系统边界小结 / 结论性能解决“当前快”，可扩展性解决“增长后还能快”。两者相关但不等价，必须分别优化。 ...

如何找出最耗时的查询：从日志到指标

副标题 / 摘要慢查询不是靠猜，而是靠数据。本文给出从日志、监控到执行计划的完整定位路径。目标读者负责数据库性能的工程师需要定位瓶颈的开发者 SRE / DBA 背景 / 动机性能问题常常被误判为“代码慢”，其实可能是数据库查询失控。系统化的慢查询定位流程能节省大量时间。核心概念慢查询日志：记录超过阈值的 SQL 执行计划（EXPLAIN）：查看索引与扫描方式 P95/P99：关注尾部延迟查询归因：把 SQL 与请求链路对应起来实践指南 / 步骤开启慢查询日志统计高频/高耗 SQL 用 EXPLAIN 分析执行计划补齐索引或重写 SQL 验证优化效果（对比指标）可运行示例 EXPLAIN SELECT * FROM orders WHERE user_id = 123; 解释与原理慢查询可能来自全表扫描、索引失效、JOIN 不合理。通过 EXPLAIN 可以看到查询是否走索引、扫描行数等关键指标。常见问题与注意事项索引越多越好吗？不是，索引会增加写入成本。慢查询一定是 SQL 写错吗？不一定，也可能是统计信息过期或数据分布变化。只看平均值会漏问题吗？会，要看 P95/P99。最佳实践与建议建立慢查询告警结合 APM 定位调用链优化后回归测试小结 / 结论定位慢查询需要从日志、指标、执行计划三层入手。找到瓶颈后再谈优化，才是高效路径。参考与延伸阅读 MySQL Slow Query Log PostgreSQL pg_stat_statements EXPLAIN 使用指南元信息阅读时长：7~9 分钟标签：慢查询、数据库性能 SEO 关键词：Slow Query, EXPLAIN, 索引元描述：系统化定位慢查询的方法与流程。行动号召（CTA）打开一次慢查询日志，挑出 TOP 3 SQL 先优化。

什么是 N+1 查询问题：成因、检测与优化

副标题 / 摘要 N+1 问题是 ORM 中最常见的性能陷阱。本文解释其成因，并给出可落地的优化方法。目标读者使用 ORM 的后端工程师关注性能与成本的开发者需要优化数据库访问的团队背景 / 动机 N+1 问题会让一次请求变成大量 SQL，导致响应变慢和数据库压力暴涨。它常在数据量增大后才暴露，因此必须提前识别。核心概念 N+1 查询：先查 N 条主记录，再为每条查询子记录延迟加载：触发隐式查询预加载：一次性拿到相关数据实践指南 / 步骤在日志中统计 SQL 数量识别循环内的 ORM 查询用 JOIN / 预加载替代逐条查询使用批量查询引入性能基准测试可运行示例 # 伪代码：展示 N+1 模式 users = db.query("SELECT * FROM users") for u in users: orders = db.query("SELECT * FROM orders WHERE user_id = ?", u.id) 优化： SELECT u.*, o.* FROM users u LEFT JOIN orders o ON o.user_id = u.id; 解释与原理 N+1 的本质是“隐式循环查询”。 ORM 的延迟加载机制在循环中触发，导致查询数量指数级增长。 ...

延迟加载（Lazy Loading）是什么：适用场景与代价

副标题 / 摘要延迟加载可以减少初始加载成本，但也可能引发 N+1 和不可预期的查询。本文给出适用场景与风险。目标读者使用 ORM 的后端工程师需要优化查询策略的开发者关注性能与成本的团队背景 / 动机延迟加载让你“用到才查”，在数据量大时可以避免一次性加载过多。但如果使用不当，会触发 N+1 查询和隐式性能问题。核心概念 Lazy Loading：访问关联数据时才触发查询 Eager Loading：一次性加载相关数据隐式查询：调用属性触发 SQL 实践指南 / 步骤默认使用延迟加载，但关键路径要显式控制在批量访问前使用预加载监控 SQL 数量与慢查询避免在循环中触发懒加载可运行示例 # 伪代码：访问属性触发 SQL user = session.query(User).first() orders = user.orders # 这里触发查询解释与原理延迟加载把查询时机推迟到真正访问数据时。如果访问发生在循环内，就可能触发 N+1。常见问题与注意事项延迟加载一定更快吗？不一定，频繁访问时反而更慢。可以完全禁用延迟加载吗？可以，但会增加初始化成本。如何判断是否该用？看访问路径与数据规模。最佳实践与建议对高频接口禁用隐式懒加载明确预加载策略使用 ORM 的加载策略配置小结 / 结论延迟加载是性能优化工具，但必须与访问模式匹配。不加控制的懒加载会造成严重性能问题。参考与延伸阅读 SQLAlchemy / Hibernate Loading Strategies ORM 性能优化实践元信息阅读时长：7~9 分钟标签：延迟加载、ORM、性能 SEO 关键词：Lazy Loading, ORM 元描述：解释延迟加载的适用场景与缺陷。行动号召（CTA）找一个慢接口，检查是否存在隐式懒加载，再考虑预加载优化。

为什么需要并发：吞吐、延迟与资源利用率

副标题 / 摘要并发不是为了“更快”，而是为了更好地利用等待时间。本文解释并发的价值，并给出工程实践的判断与示例。目标读者希望提升系统吞吐的后端工程师经常处理 I/O 等待的开发者需要做性能与架构决策的技术负责人背景 / 动机很多程序在等待 I/O（磁盘、网络、数据库）时并不占用 CPU。并发让 CPU 在等待期间去做别的事，从而提高吞吐、降低整体延迟。核心概念吞吐（Throughput）：单位时间内处理的请求数量延迟（Latency）：单个请求完成的时间 I/O 等待：CPU 空闲但任务阻塞并行与并发：并行是同时执行，并发是交错执行实践指南 / 步骤判断瓶颈是否来自 I/O 优先使用异步或多线程处理 I/O 对 CPU 计算使用并行限制并发度，避免过度上下文切换监控吞吐与尾延迟可运行示例下面对比串行与并发请求： import time import threading def io_task(i): time.sleep(0.2) return i def serial(n): start = time.time() for i in range(n): io_task(i) return time.time() - start def concurrent(n): start = time.time() threads = [] for i in range(n): t = threading.Thread(target=io_task, args=(i,)) t.start() threads.append(t) for t in threads: t.join() return time.time() - start if __name__ == "__main__": print("serial:", serial(5)) print("concurrent:", concurrent(5)) 解释与原理串行执行时，5 个 I/O 等待累加。并发执行时，等待时间重叠，整体耗时接近单个 I/O 的时间。 ...