P50 延遲
128ms
SUB&SUB 把你的 ChatGPT、Claude、Bedrock 等訂閱整合到單一 OpenAI 相容端點。改一行 base_url,既有 SDK 直接沿用,包含串流回應。
架構
用戶端 → 邊緣 CDN → 來源站 → sub2api → 帳號池 → 上游模型,串流回應原路返回。沒有專屬協定,不綁定任何廠商。
特色
SSE 長連線、proxy_buffering 關閉、邊緣智慧路由 —— 不會出現「卡一陣 → 一次吐光」。每一層都跟上游官方 API 行為一致。
邊緣 CDN 含 WAF、TLS 終止、智慧路徑挑選。對 SSE 友善:不壓縮、不 rocket-loader、不快取。
全球邊緣Nginx 關閉 proxy_buffering、逾時拉長、啟用 HTTP/2。長生成不會觸發閘道逾時。
SSE 長連線把 ChatGPT / Claude 網頁會話轉成 OpenAI 相容 API。帳號池目錄掛載 /data,自動輪詢。
CPU、記憶體、流量、失敗率全部視覺化。單 Key 額度、單模型用量、帳號池健康一目了然。
Prometheus + Grafana邊緣依 IP 限流:預設 30 req / 10 s。明顯爬蟲 UA(python-requests、curl 預設)直接擋下。
邊緣規則一把 Key 同時叫用 GPT-4o、Claude 4.7、Bedrock 反代。模型名透傳,用戶端不必改動。
42 個模型上游供應商
快速接入
相容 OpenAI / Anthropic。改一行 base_url,既有 SDK 直接沿用。
proxy_buffering off,否則串流回應會被緩衝成一次吐光。CDN 那邊請把 Auto-Minify、Rocket Loader、Polish 全部關閉,以免破壞 SSE。價格
預付儲值,以上游官方價 × 當前級距倍率扣抵。無月費,餘額永久有效。