写一个基础 Web 服务器:最小可用实现

副标题 / 摘要 从 socket 到 HTTP 响应,最小 Web 服务器可以帮助理解网络协议的关键流程。本文给出可运行示例。 目标读者 想理解 HTTP 与 socket 的开发者 学习网络编程的工程师 需要构建服务端基础的人 背景 / 动机 很多 Web 框架屏蔽了底层细节。 写一个最小服务器能帮助理解请求解析、响应构造与连接管理。 核心概念 Socket:网络通信的基础接口 HTTP 请求/响应:文本协议 监听/接受连接:服务端循环 实践指南 / 步骤 监听端口 接受连接并读取请求 构造 HTTP 响应并返回 关闭连接 可运行示例 import socket def run(host="127.0.0.1", port=8080): s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) s.bind((host, port)) s.listen(1) print("listening on", port) conn, _ = s.accept() data = conn.recv(1024) if data: body = "Hello" resp = ( "HTTP/1.1 200 OK\r\n" f"Content-Length: {len(body)}\r\n" "Content-Type: text/plain\r\n\r\n" f"{body}" ) conn.sendall(resp.encode("utf-8")) conn.close() s.close() if __name__ == "__main__": run() 解释与原理 服务器需要:监听 → 接受连接 → 读取请求 → 返回响应。 HTTP 是文本协议,因此构造响应字符串即可。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

分布式计算的八大谬论:你真的能相信网络吗?

副标题 / 摘要 “网络可靠”“延迟为零”是分布式系统的经典谬论。本文用工程案例解释这些误区的代价。 目标读者 架构与后端工程师 需要设计跨服务系统的团队 学习分布式系统的新手 背景 / 动机 系统设计中最危险的错误是假设“网络就是本地”。 理解这些谬论能避免隐蔽的线上故障。 核心概念 网络不可靠:必须处理失败与重试 延迟不为零:跨地域延迟显著 带宽有限:批量传输会放大延迟 实践指南 / 步骤 所有网络调用都设置超时 重试必须有退避与幂等 对跨区域调用做缓存或异步化 监控延迟分布而不是平均值 可运行示例 import random import time def remote_call(): # 模拟网络不可靠 if random.random() < 0.3: raise TimeoutError("network timeout") time.sleep(0.05) return "ok" def call_with_retry(retries=3): for i in range(retries): try: return remote_call() except TimeoutError: time.sleep(0.02 * (i + 1)) return "failed" if __name__ == "__main__": print(call_with_retry()) 解释与原理 分布式系统中,网络可能失败、延迟可变、带宽有限。 因此所有远程调用都必须假设“会失败”。 常见问题与注意事项 重试会不会放大故障? 会,因此要有退避与限流。 网络延迟是固定的吗? 不是,长尾延迟才是主要风险。 本地调用和远程调用能等同吗? 不能,成本差异巨大。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

封闭网络 vs 开放网络:分布式系统的不同设计重点

副标题 / 摘要 在封闭网络中,你可以更依赖内网信任;在开放网络中必须假设一切不可信。本文对比两者的设计差异。 目标读者 设计跨网络系统的工程师 需要制定安全策略的团队 架构与安全负责人 背景 / 动机 封闭网络强调效率与内部可信,开放网络强调安全与边界控制。 混用设计思路会带来严重风险。 核心概念 信任边界:封闭 vs 零信任 身份与认证:强身份验证是开放网络的前提 加密与审计:保护数据与可追溯性 实践指南 / 步骤 明确系统是否跨公网 开放网络必须使用强认证与加密 封闭网络也需最小权限原则 建立审计与异常检测 可运行示例 import hmac import hashlib def sign(secret, payload): return hmac.new(secret, payload.encode("utf-8"), hashlib.sha256).hexdigest() def verify(secret, payload, sig): return hmac.compare_digest(sign(secret, payload), sig) if __name__ == "__main__": secret = b"k" msg = "order=1" sig = sign(secret, msg) print(verify(secret, msg, sig)) 解释与原理 开放网络下的核心假设是“任何节点都不可信”。 因此必须依赖身份验证、加密与审计来保证安全。 常见问题与注意事项 封闭网络就不需要安全吗? 不,内部攻击与误操作同样危险。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]

C10k 问题怎么解决:高并发连接的策略

副标题 / 摘要 C10k 指单机处理 1 万连接时的瓶颈问题。本文解释成因并给出工程策略。 目标读者 负责高并发服务的工程师 需要优化网络服务的开发者 对内核与网络性能感兴趣的团队 背景 / 动机 传统阻塞模型在连接数大时会消耗大量线程与内存。 C10k 迫使系统从“线程 per 连接”转向“事件驱动”。 核心概念 事件驱动:epoll/kqueue 非阻塞 IO:减少线程等待 连接复用:减少线程数量 内核调优:文件描述符、队列长度 实践指南 / 步骤 使用事件驱动模型(epoll/kqueue) 设置非阻塞 IO 调优内核参数(fd 上限、backlog) 限制连接数(防止资源耗尽) 监控连接指标(活跃连接、TIME_WAIT) 可运行示例 # 简化示例:高并发通常依赖事件循环框架 import asyncio async def handle(reader, writer): data = await reader.read(100) writer.write(data) await writer.drain() writer.close() async def main(): server = await asyncio.start_server(handle, "0.0.0.0", 9000) async with server: await server.serve_forever() # asyncio.run(main()) 解释与原理 事件驱动通过单线程管理大量连接,避免线程爆炸。 C10k 的关键在于把“等待”从线程中剥离。 常见问题与注意事项 C10k 还重要吗? 仍重要,高并发场景依旧常见。 ...

2026年1月24日 · 1 分钟 · map[name:Jeanphilo]