P50 延迟
128ms
SUB&SUB 把你的 ChatGPT、Claude、Bedrock 等订阅汇成一个 OpenAI 兼容入口。改一行 base_url,原有 SDK 直接复用,包括流式响应。
架构
客户端 → 边缘 CDN → 源站 → sub2api → 号池 → 上游模型,流式响应原路返回。没有专有协议,不绑定任何厂商。
特性
SSE 长连接、proxy_buffering 关闭、边缘智能路由 —— 不会出现"卡一阵 → 一次性吐出"。每一层的行为都和上游官方 API 一致。
边缘 CDN 带 WAF、TLS 终结、智能链路选择。对 SSE 友好:不压缩、不 rocket-loader、不缓存。
全球边缘Nginx 关闭 proxy_buffering、超时调长、启用 HTTP/2。长生成不会触发网关超时。
SSE 长连接把 ChatGPT / Claude 网页会话转成 OpenAI 兼容 API。号池目录挂载 /data,自动轮询。
CPU、内存、流量、失败率全部可视化。单 Key 配额、单模型用量、号池健康度一览无余。
Prometheus + Grafana边缘按 IP 限流:默认 30 req / 10 s。明显爬虫 UA(python-requests、默认 curl)直接拦截。
边缘规则一个 Key 同时调用 GPT-4o、Claude 4.7、Bedrock 反代。模型名透传,客户端无需改动。
42 个模型上游供应商
快速接入
OpenAI / Anthropic 兼容协议。改一行 base_url,原有 SDK 直接复用。
proxy_buffering off,否则流式响应会被缓存成一次性吐出。CDN 那边要把 Auto-Minify、Rocket Loader、Polish 全关掉,否则会破坏 SSE。价格
预付费充值,按上游官方价 × 当前阶梯倍率扣费。无月费,余额永久有效。