Agent Gateway operational · 14ms
claude + codex native gateway · 2026

Claude + Codex 双生态原生接入
独享专线,token 透明,协议不变形

为 Claude Code、Claude Desktop、Codex CLI、Codex Desktop 与 OpenAI-compatible clients 提供稳定的双生态网关。Claude 走 Anthropic 原生链路,Codex 走 Responses 原生链路,按 token 精确计费,长期不涨价。

联系报价 看原生通道
CLIENTS
4
Claude / Codex · CLI / Desktop
PROTO
2
Anthropic · Responses
UPTIME
99.9%
monthly target
REGIONS
multi
auto-failover
MARKUP
1.0×
per-token · no hidden ratio
core

为开发者
设计的五项
硬指标

Agent Gateway 不是共享账号方案。通过企业直采、独享专线、智能调度,把"便宜"和"稳定"做到不互斥;同时提供桌面端一键配置,把 Claude / Codex 双生态接入门槛压到最低。

01 // stability

双生态独享专线 · 7×24 不抖动

Claude 与 Codex 两条原生协议链路统一接入。多区域健康探测每秒级,单线路异常自动切换,不限速、不降级、不排队、不共享。

uptime
99.9% target
failover
< 1s
protocols
2 native
02 // pricing

按 token 精确计价

企业直采价透传到你。无 1.2× / 2× 隐藏倍率,cache_read 折扣按官方计算,取消请求按已生成部分计费。Claude 与 Codex 共用同一套透明账本。

markup
1.0×
granularity
single token
cache
official rate
03 // models

Claude + Codex 顶级模型入口

Claude 侧覆盖 Opus 4.8 / Sonnet 4.6 / Haiku 4.5;Codex 侧保持 Responses 原生链路,兼容 Codex CLI / Desktop 与 OpenAI-compatible clients。

claude
top-tier
codex
responses
release
same-day
04 // cli

CLI / IDE 原生支持

Claude Code 走 Anthropic 原生协议;Codex CLI 走 Responses 原生协议。tool_use、streaming、sub-agents、background tasks 与 Codex 原生工作流分别按各自协议直通。

claude
1:1 passthrough
codex
responses native
streaming
SSE native
05 // desktop

桌面端一键配置 + 双桌面支持

我们专门做了 Agent Gateway 桌面软件,帮助用户一键写入 Claude 与 Codex 所需配置;Claude Desktop 的 Cowork / 部署模式与 Codex Desktop 的 `/v1` 网关接入也都已打通。

desktop
Agent Gateway app
setup
one-click
clients
4 surfaces
native channel

不是兼容层
是原生通道

多数中转服务在协议适配层做翻译——结果是 tool_use 缺字段、会话被截断、cache 命中失效。

Agent Gateway 不把所有客户端硬塞进同一种兼容层。Claude 生态走 Anthropic 原生协议,Codex 生态走 Responses 原生协议,请求与响应按各自协议字节级透传。

// request path round-trip · 14ms · sg-edge
your machine
Claude Code · Claude Desktop · Codex CLI · Codex Desktop
Agent Gateway
edge · sg / tk / us · auto-failover
upstream
Anthropic API · OpenAI Responses
— inside the gateway
regional routing · sg / tk / us
protocol dispatch · Anthropic / Responses native
token accounting · per-token · cache_read
01 Claude 会话语义保真
对话历史、上下文压缩、记忆窗口与官方完全一致
02 工具调用全兼容
tool_use / function_calling 全字段透传,零行为差异
03 Codex Responses 直通
`/v1/responses` 请求与 SSE 事件原样透传,不做协议改写
04 Prompt Cache
缓存命中按官方 cache_read 价计算
05 Thinking / Reasoning
extended_thinking / reasoning 字段完整保留
06 Sub-agent / Background
Claude Code sub-agents 与后台任务链路保持可用
token accounting · bench
维度 行业常见做法 Agent Gateway
计费颗粒 按整千 token 取整 精确到单 token
Cache 命中 不计折扣 按官方 cache_read 价
取消请求 仍按预估计费 已生成部分计费
隐藏倍率 1.2× ~ 2× 无 · 1.0×
cache hit rate

80%+ 缓存命中
省下的全部还给你

Agent Coding 与 Cowork 工作流天然适合 Prompt Cache:工程上下文反复访问,前缀稳定。Agent Gateway 把缓存命中按官方 cache_read 价透传,绝不当满价计

// daily coding
83 % cache hit

Sonnet 4.6 · 日常编码

重复读取的代码、工程上下文、规则提示词,自动命中 Prompt Cache。一次冷启之后,大部分回合都按 cache_read 价格结算。

// cowork
88 % cache hit

Desktop Cowork · 协同会话

Cowork 模式下多人共享同一份工程上下文,缓存复用率最高。文件、工具调用、上下文窗口反复访问几乎零冷启。

// long-context
71 % cache hit

Opus 4.8 · 长上下文工程

1M context 长会话里的稳定前缀全部缓存,超长上下文仍能按 1/10 价格计费。

客户分享 — 14d window · daily coding profile
peak 88% · floor 67% · avg 79%
65% 70% 75% 80% 85% 90% target 70% 67 d−13 72 d−12 76 d−11 71 d−10 78 d−9 75 d−8 80 d−7 85 d−6 76 d−5 81 d−4 82 d−3 85 d−2 88 d−1 83 d−0
cache_hit_rate · billed at 0.1× input · passthrough · no markup · source: 客户分享 · Agent Coding workload
model catalog

Claude 顶级模型
Codex 原生入口

Claude 侧提供顶级模型直采;Codex 侧保持 /v1/responses 原生链路与 /v1/chat/completions 兼容入口。新模型与新客户端能力上线当日同步。

updated
2026-05
tracking
Anthropic + Codex clients · same-day
deprecated
none in current set
Opus 4.8
claude-opus-4-8
TOP
CONTEXT 1M
极复杂推理 · 长上下文工程 · 关键任务
thinkingtoolscachevision
Sonnet 4.6
claude-sonnet-4-6
DAILY
CONTEXT 1M
日常 Agent Coding 主力 · 性价比之选
thinkingtoolscachevision
Haiku 4.5
claude-haiku-4-5
EDGE
CONTEXT 200K
高频小任务 · 流式响应 · 极速
toolscachevision
questions

把可能
有疑问的
都摆出来

比官方便宜的逻辑是什么?是不是有坑?
我们做的是企业级直采 + 智能调度,省下的是规模化议价空间与调度优化,不是在用户侧砍质量。Claude 与 Codex 都走各自原生协议链路,无多余翻译层、无暗降级。
Claude Code 和 Codex CLI 都能接吗?需要改代码吗?
都能接。Claude 生态通过 `~/.claude/settings.json` 切换 `ANTHROPIC_BASE_URL`;Codex 生态通过 `~/.codex/config.toml` 指向网关 `/v1`。客户端配置改完即可,业务代码不用动。
稳定性怎么保障?SLA 是多少?
多区域独享专线 + 健康探测 + 自动故障切换。生产档承诺 99.9% 月度可用性,详细 SLA 在合同中明确。
token 计费精确吗?会不会虚标?
按 token 精确到 1 计费。Claude 对齐 Anthropic usage;Codex 对齐上游 Responses usage。每次调用都可在控制台核对;Prompt Cache 按官方折扣计,不当满价计。
数据安全 / 隐私如何?
请求字节透传,无内容侧记录与训练。可签 DPA / NDA。如需私有部署,请通过下方联系方式咨询。
支持发票吗?支持企业付款?
支持开具增值税专票、对公付款、合同采购。月结、年付方案见报价。
contact

联系报价
从你的实际用量算起

告诉我们团队规模、月调用量、目标场景。我们会在 1 个工作日内回信,给出方案与起步价。

联系我们
channels · typical response tz · UTC+8
email 邮件咨询 ≤ 4h
wechat 微信咨询 ≤ 30min · 工作日
feishu 扫码加入团队工作群 ≤ 30min · 工作日
enterprise 对公采购 · 合同 · 发票 ≤ 1 workday
— eof —