1 つのキーで、あなたのすべての AI サブスクを集約
SUB&SUB は ChatGPT、Claude、Bedrock などのサブスクを 1 つの OpenAI 互換エンドポイントに統合します。base_url を 1 行変えるだけで、既存の SDK がそのまま動作 — ストリーミングも含めて。
アーキテクチャ
透過的なルーティング、エンドツーエンド
クライアント → エッジ CDN → オリジン → sub2api → アカウントプール → 上流モデル。ストリーミング応答は同じ経路を逆向きに戻ります。
機能
ストリーミング向けに全層チューニング
SSE keep-alive、proxy_buffering off、エッジ・スマートルーティング — 「止まってから一気に出す」挙動はありません。各層が上流 API と同じ振る舞いをします。
Anycast エッジ + スマートルーティング
WAF、TLS 終端、最適経路選択を備えたエッジ CDN。SSE 互換:minify・rocket-loader・キャッシュなし。
グローバルエッジオリジンを SSE 用に最適化
Nginx の proxy_buffering off、長めのタイムアウト、HTTP/2。長時間の生成でもゲートウェイタイムアウトが発生しません。
SSE keep-alivesub2api 変換層
ChatGPT / Claude のウェブセッションを OpenAI 互換 API に変換。アカウントプールは /data にマウントされ自動ローテート。
リアルタイム可観測性
CPU・メモリ・トラフィック・失敗率を可視化。キー単位のクォータ、モデル別の使用量、プールの健全性が一目で分かります。
Prometheus + GrafanaWAF + レート制限
IP 単位のスロットリング(既定 30 req / 10 秒)。明らかなスクレイパー UA は即遮断。
エッジルール1 つのキーで全モデル
1 つの API キーで GPT-4o、Claude 4.7、Bedrock 経由モデルへ。モデル名はそのまま透過 — クライアント変更不要。
42 モデル上流プロバイダー
現在集約中
クイックスタート
30 秒で接続
OpenAI / Anthropic 互換。base_url を 1 行変えるだけで既存 SDK がそのまま動きます。
proxy_buffering off 必須。さもないとストリーミング応答が一括返却になります。CDN 側の Auto-Minify・Rocket Loader・Polish はすべて無効化してください — どれも SSE を壊します。料金
従量課金、明朗会計
プリペイド方式。月額なし、残高は無期限。上流の公式価格 × プラン倍率で課金。