可变值 vs 不可变值:优缺点、成本与工程选择

副标题 / 摘要 可变值带来性能与直觉操作,不可变值带来安全与可预测性。本文从工程角度给出取舍指南。 目标读者 需要做语言/架构选型的开发者 经常处理共享状态与并发的工程师 想降低 bug 成本的团队负责人 背景 / 动机 “用可变还是不可变”常被当成风格问题,但本质是成本问题: 可变值降低了短期编码成本,却提高了长期维护成本;不可变值相反。 核心概念 可变值:对象可被修改,引用指向同一状态 不可变值:对象创建后不可变,修改通过创建新值 别名问题:多个引用指向同一对象导致隐式副作用 实践指南 / 步骤 核心业务规则优先用不可变 性能敏感且局部范围内用可变 共享数据优先不可变 用类型或约定明确边界 在接口处转换:可变在边界层,不可变在核心层 可运行示例 下面展示共享可变带来的副作用: nums = [1, 2, 3] ref = nums ref.append(4) print(nums) # [1, 2, 3, 4] 不可变方式: nums = (1, 2, 3) ref = nums ref = ref + (4,) print(nums) # (1, 2, 3) print(ref) # (1, 2, 3, 4) 解释与原理 可变值让“状态变化”隐式发生,易产生别名问题; 不可变值把变化变成显式的新值,便于推理与测试。 常见问题与注意事项 不可变一定更慢吗? 不一定。结构共享与持久化数据结构可以降低成本。 可变值是不是更直观? 对局部数据更直观,但对共享状态更危险。 如何混用? 常见做法是“核心域不可变,边界层可变”。 最佳实践与建议 在并发场景优先不可变 在性能关键、局部封闭场景用可变 给团队建立明确的可变/不可变规范 小结 / 结论 可变值适合局部与性能场景,不可变值适合共享与核心逻辑。 真正的工程实践不是二选一,而是分层与约束。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

让 FastAPI 异步真正‘不卡’:asyncio.create_task + to_thread 并发实践(含 MySQL 写入)

让 FastAPI 异步真正“不卡”:asyncio.create_task + to_thread 并发实践(含 MySQL 写入) 副标题 / 摘要 把同步重活丢给线程、把可并行的子流程拆出来并发执行,让你的 FastAPI WebSocket/HTTP 服务在高并发文件处理场景下保持流畅与可靠。适合需要在事件循环中混合 CPU 计算与阻塞 I/O 的工程团队。 目标读者 中级后端工程师、服务端架构师 正在用 FastAPI/asyncio 落地异步工作流、混合 I/O/CPU 任务的开发者 背景 / 动机 常见痛点: 在异步服务里不小心执行了同步 CPU/数据库操作,单个请求“卡住”事件循环,导致同一 worker 上的其它请求/WebSocket 心跳/进度推送都被拖慢。 CPU/数据库步骤彼此本无强依赖,却被串行放到一条链上,整体时延被“关键路径”拖长。 目标: 不改变外部行为的前提下,消除事件循环阻塞。 让独立步骤并发执行,缩短关键路径。 核心概念 线程(Thread):同一进程内共享内存,切换开销低;CPython 受 GIL 限制,纯 Python CPU 计算难并行,但适合并发等待阻塞 I/O。 进程(Process):独立内存、无 GIL 约束,CPU 计算可多核并行;切换/通信成本更高,参数/结果需可序列化。 异步(async/await):单线程事件循环的协作式调度;只有在 await 时让出控制权,同步阻塞会“卡死”循环。 asyncio.to_thread:把同步函数放到后台线程,释放事件循环;不等于多核加速,但对阻塞 I/O 有实效。 asyncio.create_task:并发启动一个协程,让它和当前协程重叠运行;用于编排并发,而非解除阻塞。 实践指南 / 步骤 识别阻塞点(示例项目) CPU 构树/展平/序列化:HeaderTree.from_documents、flatten_dfs、FlatHeaderTree.to_dict 同步 MySQL 写入:file_tree_table.upsert_tree 用 to_thread 包裹同步重活(释放事件循环) 在 build_file_tree 中,将 CPU/DB 步骤放入 await asyncio.to_thread(...)。 并发编排,缩短关键路径 在 full_pipeline_async:在 split 后立即 create_task(build_file_tree(...)),并发执行图片/表格处理、重组、存储;返回前再 await 构树结果。 可选:事件屏障与互斥 如需“保证某步骤不早于构树完成”,用 asyncio.Event。 多协程修改共享状态,用 asyncio.Lock 保护原子更新。 观测与参数 MySQL 连接池每进程默认较小(示例为 2),必要时调大。 Uvicorn workers 控制进程数,提升隔离与吞吐。 可运行示例 非阻塞构树与持久化(替换 build_file_tree 内部): ...

2025年11月19日 · 2 分钟 · map[name:Jeanphilo]