在之前的博客中,我们分享了如何通过 FastAPI 包装器来解决 MCP Server 的鉴权和路径重写问题。然而,随着项目的发展,我们发现传统的SSE (Server-Sent Events)模式在复杂的云原生网络环境(GCP LB + Envoy)中显得越来越力不从心。
今天,我们将分享一次重大的架构升级:迁移到 Streamable HTTP 模式。
为什么要迁移?SSE 的阿喀琉斯之踵
SSE (Server-Sent Events) 是 MCP 协议早期的默认传输方式。它通过一个 GET 长连接接收事件,再通过 POST 请求发送指令。
痛点 1:复杂的路径依赖
SSE 模式下,Server 需要告诉 Client 一个“回调地址” (endpoint)。如果 Server 躲在层层代理(Envoy, Nginx)后面,它很难知道自己对外的真实 URL 是什么。我们之前为了解决这个问题,不得不引入了复杂的root_path和mount逻辑,结果还是在 URL 拼接上栽了跟头。
痛点 2:长连接的脆弱性
负载均衡器(Load Balancer)通常不喜欢长连接。如果没有心跳包,或者网络稍有波动,连接就会断开。
什么是 Streamable HTTP?
Streamable HTTP(JSON-RPC over HTTP) 是 MCP 协议的现代化传输方式。
- 单一连接:所有的通信(请求和响应)都通过标准的 HTTP POST 请求完成。
- 无状态:不需要维护一个长连接,每个请求都是独立的(虽然为了性能可以复用 TCP 连接)。
- 简单:Client 只需要知道一个 URL (e.g.,
/mcp),不需要 Server 返回回调地址。
这简直就是为无服务器架构(Serverless, 如 Cloud Run)量身定做的!
代码改造:做减法
我们的迁移策略不是增加代码,而是删除代码。我们废弃了复杂的 FastAPI 包装层,回归 FastMCP 原生支持。
1. 升级 FastMCP
Streamable HTTP 是新特性,首先要确保依赖包是最新的。
fastmcp>=2.14.32. Server 代码重构 (mcp_github_tool_server.py)
我们移除了 FastAPI,直接使用fastmcp启动。
旧代码 (FastAPI Wrapper):
app=FastAPI()mcp_app=mcp.sse_app()app.mount("/mcp",mcp_app)# ... 还有复杂的 Middleware 和 uvicorn 启动逻辑新代码 (Streamable HTTP):
fromstarlette.middlewareimportMiddlewarefromstarlette.middleware.baseimportBaseHTTPMiddleware# 定义鉴权中间件 (依然可以使用!)classAuthMiddleware(BaseHTTPMiddleware):asyncdefdispatch(self,request,call_next):token=request.headers.get("X-Github-Token")iftoken:user_token_ctx.set(token)returnawaitcall_next(request)if__name__=="__main__":# 直接使用 mcp.run,指定 transport="http"mcp.run(transport="http",host="0.0.0.0",port=8000,middleware=[Middleware(AuthMiddleware)],# 关键:指定监听路径,匹配 Envoy 的转发规则path="/mcp-github-tools-svc/mcp")3. Client 测试代码更新 (test_client.py)
客户端也需要切换到 HTTP 传输层。
fromfastmcp.client.transportsimportStreamableHttpTransport# 注意这里不是 SSETransport 了# URL 直接指向端点,不需要 /sse 后缀url="https://www.jpgcp.cloud/mcp-github-tools-svc/mcp"transport=StreamableHttpTransport(url=url,headers={"X-Github-Token":"sk-xxxx"# Header 鉴权依然完美支持})鉴权黑科技:Header 传递
迁移到 Streamable HTTP 后,我们最担心的就是鉴权功能会丢失。
好消息是:FastMCP 的 HTTP 模式底层依然是 Starlette,它允许我们在run()方法中注入 Middleware。
我们保留了ContextVars的设计,中间件从 Header 提取 Token,存入 ContextVar,Tool 函数再从 ContextVar 读取。
效果:
- 用户在 Cline 配置里填入 Token。
- Token 随 HTTP 请求头发送。
- Server 自动捕获并使用。
- 全程无感,且并发安全。
总结
通过这次迁移,我们获得了一个更简单、更健壮、更符合云原生理念的系统。
- 代码量减少了 50%:删除了
server.py。 - 部署更自信:不再担心 Envoy 的路径重写会导致回调 URL 错误。
- 兼容性更好:HTTP 协议是互联网的通用语言,穿透任何防火墙和代理都不在话下。
如果你的 MCP Server 也要上云,Streamable HTTP绝对是你的首选。