Agent Gateway

Claude + Codex
双生态 Agent Gateway

为 Claude Code、Claude Desktop、Codex CLI、Codex Desktop 与 OpenAI-compatible clients 提供稳定的双生态网关。原生协议、独享专线、token 透明计费,把企业 AI Coding 交付成一个可管理的入口。

CLIENTS
4
Claude / Codex · CLI / Desktop
PROTO
2
Anthropic · Responses
UPTIME
99.9%
monthly target
REGIONS
multi
auto-failover
MARKUP
1.0×
per-token · no hidden ratio

为开发者设计的
五项硬指标

Agent Gateway 不是共享账号方案。通过企业直采、独享专线、智能调度,把"便宜"和"稳定"做到不互斥;同时提供桌面端一键配置,把 Claude / Codex 双生态接入门槛压到最低。

01

双生态独享专线 · 7×24 不抖动

Claude 与 Codex 两条原生协议链路统一接入。多区域健康探测每秒级,单线路异常自动切换,不限速、不降级、不排队、不共享。

uptime
99.9% target
failover
< 1s
protocols
2 native
02

按 token 精确计价

企业直采价透传到你。无 1.2× / 2× 隐藏倍率,cache_read 折扣按官方计算,取消请求按已生成部分计费。Claude 与 Codex 共用同一套透明账本。

markup
1.0×
granularity
single token
cache
official rate
03

Claude + Codex 顶级模型入口

Claude 侧覆盖 Opus 4.8 / Sonnet 4.6 / Haiku 4.5;Codex 侧保持 Responses 原生链路,兼容 Codex CLI / Desktop 与 OpenAI-compatible clients。

claude
top-tier
codex
responses
release
same-day
04

CLI / IDE 原生支持

Claude Code 走 Anthropic 原生协议;Codex CLI 走 Responses 原生协议。tool_use、streaming、sub-agents、background tasks 与 Codex 原生工作流分别按各自协议直通。

claude
1:1 passthrough
codex
responses native
streaming
SSE native
05

桌面端一键配置 + 双桌面支持

我们专门做了 Agent Gateway 桌面软件,帮助用户一键写入 Claude 与 Codex 所需配置;Claude Desktop 的 Cowork / 部署模式与 Codex Desktop 的 `/v1` 网关接入也都已打通。

desktop
Agent Gateway app
setup
one-click
clients
4 surfaces

不是兼容层
是原生通道

多数中转服务在协议适配层做翻译——结果是 tool_use 缺字段、会话被截断、cache 命中失效。

Agent Gateway 不把所有客户端硬塞进同一种兼容层。Claude 生态走 Anthropic 原生协议,Codex 生态走 Responses 原生协议,请求与响应按各自协议字节级透传。

Claude / Codex 请求路径 14ms 平均往返
your machine
Claude / Codex clients
Agent Gateway
区域专线 · 自动调度
upstream
Anthropic API · OpenAI Responses
regional routing · sg / tk / us
protocol dispatch · Anthropic / Responses native
token accounting · per-token · cache_read
01 Claude 会话语义保真
对话历史、上下文压缩、记忆窗口与官方完全一致
02 工具调用全兼容
tool_use / function_calling 全字段透传,零行为差异
03 Codex Responses 直通
`/v1/responses` 请求与 SSE 事件原样透传,不做协议改写
04 Prompt Cache
缓存命中按官方 cache_read 价计算
05 Thinking / Reasoning
extended_thinking / reasoning 字段完整保留
06 Sub-agent / Background
Claude Code sub-agents 与后台任务链路保持可用
维度 行业常见做法 Agent Gateway
计费颗粒 按整千 token 取整 精确到单 token
Cache 命中 不计折扣 按官方 cache_read 价
取消请求 仍按预估计费 已生成部分计费
隐藏倍率 1.2× ~ 2× 无 · 1.0×

80%+ 缓存命中
省下的全部还给你

Agent Coding 与 Cowork 工作流天然适合 Prompt Cache:工程上下文反复访问,前缀稳定。Agent Gateway 把缓存命中按官方 cache_read 价透传,绝不当满价计

83 %

Sonnet 4.6 · 日常编码

重复读取的代码、工程上下文、规则提示词,自动命中 Prompt Cache。一次冷启之后,大部分回合都按 cache_read 价格结算。

88 %

Desktop Cowork · 协同会话

Cowork 模式下多人共享同一份工程上下文,缓存复用率最高。文件、工具调用、上下文窗口反复访问几乎零冷启。

71 %

Opus 4.8 · 长上下文工程

1M context 长会话里的稳定前缀全部缓存,超长上下文仍能按 1/10 价格计费。

peak 88% · floor 67% · avg 79%
65% 70% 75% 80% 85% 90% target 70% 67 d−13 72 d−12 76 d−11 71 d−10 78 d−9 75 d−8 80 d−7 85 d−6 76 d−5 81 d−4 82 d−3 85 d−2 88 d−1 83 d−0
官方 cache_read 价透传,命中越高,账单越低。

Claude 顶级模型
Codex 原生入口

Claude 侧提供顶级模型直采;Codex 侧保持 /v1/responses 原生链路与 /v1/chat/completions 兼容入口。新模型与新客户端能力上线当日同步。

Anthropic 与 Codex 客户端能力同日跟进;当前推荐模型全部可用。

Opus 4.8
TOP
1M

极复杂推理 · 长上下文工程 · 关键任务

thinkingtoolscachevision
Sonnet 4.6
DAILY
1M

日常 Agent Coding 主力 · 性价比之选

thinkingtoolscachevision
Haiku 4.5
EDGE
200K

高频小任务 · 流式响应 · 极速

toolscachevision

企业采购前
最常问的
21 个问题

从交付物、激活 Key、模型授权,到长任务稳定性、隐私、私有化部署和对账方式,集中回答在同一个可扫描的 Q&A 模块里。

01 Agent Gateway 是什么?
Agent Gateway 是面向企业和开发团队的 AI Coding Agent 交付平台,向客户交付 Agent GW App、Agent GW CLI 工具和对应的激活 Key。用户激活后,可以在 App 或 CLI 中调用被授权的多种后端模型,用于代码编写、项目理解、代码重构、测试修复、多步骤开发任务和团队级 AI 编程协作。
02 Agent Gateway 交付哪些内容?
主要交付四部分内容:Agent GW App、Agent GW CLI 工具、Agent GW 激活 Key,以及 Agent GW 企业管理后台。企业可以基于 Agent App 和 CLI 做定制,包括 Logo、默认模型、管理入口、权限策略和企业内部功能。
03 激活 Key 可以使用哪些模型?
激活 Key 可以授权用户使用多种后端模型,具体以企业采购方案和后台配置为准。可支持 GPT 系列高阶模型、Claude Opus、Claude Sonnet、Claude Haiku,以及其他已接入并被授权的模型。企业管理员可以在后台配置不同用户、团队或 Key 可访问的模型范围。
04 每个 Key 对应什么?
每个 Key 通常对应一个用户 license。企业可以按用户、团队、部门或项目组分配 Key。用户通过 Agent App 或 CLI 激活 Key 后,即可使用该 Key 被授权的模型和 Agent 能力。Key 也可以适配其他 Agent App,例如 Codex App、Claude App;详情见配置教程。
05 Agent Gateway 适合哪些场景?
适合 AI 编程辅助、代码生成与修改、代码库理解、项目重构、Bug 修复、测试生成与测试修复、多文件多步骤开发任务、长上下文项目协作、团队级 AI Coding 管理,以及企业内部 AI Agent 工具统一交付。
06 Agent Gateway 和直接调用模型 API 有什么区别?
直接调用模型 API 时,客户需要自己实现 Agent App、CLI、系统提示词、文件读写、工具调用、终端执行、上下文管理、多轮规划、用量统计、账单和权限系统。Agent Gateway 已提供完整的 AI Coding Agent 使用入口和管理体系,客户拿到 App、CLI 和激活 Key 后即可使用,并可通过企业后台统一管理用户、模型、密钥、用量和账单。
07 Claude API 调用同一个模型,会比 Coding Plan 更聪明吗?
不会。同一个模型在底层权重、推理能力和上下文能力上是一致的。使用体验差异主要来自上层 Agent 框架,包括系统提示词、工具链、多轮规划、文件读写、测试执行、上下文压缩和任务状态管理。Coding Plan 表现更强,通常是因为它内置了完整的编程 Agent 流程。
08 为什么 Coding Plan 在复杂开发任务中表现更好?
Coding Plan 通常包含完整工程流程:读取项目结构和关键文件、分析依赖和上下文、生成架构方案、列出文件变更清单、识别风险点、等待用户确认、执行代码修改、运行测试、自查并迭代修复。这些能力来自 Agent 工作流设计;同样的模型如果只通过 API 做单轮问答,通常无法自动完成这些步骤。
09 Agent Gateway 的 Agent App / CLI 有什么优势?
Agent App / CLI 面向 AI Coding 场景设计,支持多模型授权、长上下文任务、多轮规划、工具调用、文件读写、终端开发流程、任务状态保留、用量统计、企业统一管理和团队批量交付。
10 Agent Gateway 是否支持工具、Skill 和 MCP?
支持。Agent Gateway 面向复杂 Agent 使用场景,支持工具调用、Skill、子代理编排、MCP 工具和复杂数据结构处理。在 AI Coding 场景中,模型需要持续处理文件、工具结果、上下文、任务状态和流式响应;Agent Gateway 会尽量保障这些结构稳定衔接,减少工具调用失败、状态丢失、空回复或会话卡死等问题。
11 Agent Gateway 如何保障长任务稳定性?
Agent Gateway 会持续维护任务上下文,包括项目背景、已读文件、当前进展、待办事项、工具调用结果和用户中途新增要求。对于多步骤开发任务,系统会尽量保障任务状态不丢失,让 Agent 能够持续完成规划、执行、测试和修复流程。
12 长对话会不会越来越慢?
长对话不会明显越来越慢。AI Coding 任务中有大量重复上下文,例如项目结构、历史任务、系统规则和代码片段。Agent Gateway 会通过上下文复用、Prompt Cache 和任务状态管理降低重复处理成本,提升长任务响应速度。
13 Prompt Cache 有什么价值?
Prompt Cache 可以提升速度并降低成本。在代码项目中,项目结构、代码文件、系统规则和历史上下文经常重复出现。缓存命中后,重复内容可以更高效地复用,减少重复计算。
14 Agent Gateway 如何保护隐私?
Agent Gateway 默认只记录必要的用量和运维信息,例如 token 消耗、模型名称、请求耗时和调用状态。客户代码、提示词、对话正文和工具参数原文不作为日志保存,客户对话不会用于模型训练。私有化部署场景下,网络、存储和管理权限可以由客户侧掌控。
15 是否支持私有化部署?
支持。当客户购买 license 数量超过 100 个时,可以提供私有化部署方案。私有化部署包含独立虚拟机、SD-WAN 网络、独享网络资源、独享存储资源、客户侧管理权限、license key 分配和月度对账机制。
16 Agent Gateway 如何保障稳定性?
Agent Gateway 从系统、网络和资源三个层面保障稳定性:系统层面包括 VM HA、健康检查、故障恢复;网络层面包括 SD-WAN、稳定链路、私有化独享网络;资源层面包括模型资源健康监控、动态路由、异常切换和资源扩容。客户无需自行维护多模型、多账号、多线路,平台会统一完成调度和监控。
17 企业管理后台支持哪些功能?
企业管理后台支持用量仪表盘、资源健康状态、模型供应商配置、客户端管理、密钥管理、用户管理、用量统计、监控、单价配置、计费方式和账单。企业可以通过后台统一管理用户、Key、模型授权、用量、费用和系统状态。
18 商务方案如何计费?
Agent Gateway 按 license 计费,每个 license 对应一个用户 Key。目前提供多档方案,额度每日和每周刷新;未触及封顶前,可在额度内正常使用。
19 是否有隐藏倍率?
没有。Agent Gateway 按 token 精确核算,不采用 1.2×、2× 等隐藏倍率。Prompt Cache 命中部分按照 cache_read 逻辑计算,不按满价 token 计费。
20 费用如何支付和对账?
首月按采购 license 数量预付,次月开始按实际使用情况对账。月 token 消耗低于 500 万的用户可以本月不计费,license 退回;退回的 license 可以在第二个月进行抵扣,后续每月按照同样逻辑滚动结算。支持人民币付款、企业对公付款和合同采购,可根据商务约定开具发票。
21 Agent Gateway 相比普通中转平台有什么优势?
优势集中在五个方面:交付 Agent App / CLI 和激活 Key;一个 Key 可授权多种后端模型;面向 AI Coding 场景,支持长任务、工具、Skill、MCP;提供企业管理后台,支持用户、密钥、用量、账单和健康监控;支持私有化部署、人民币付款、合同采购和月度对账。

联系报价
从你的实际用量算起

告诉我们团队规模、月调用量、目标场景。我们会在 1 个工作日内回信,给出方案与起步价。

企业接入申请 联系我们
email 邮件咨询 ≤ 4h
wechat 微信咨询 ≤ 30min · 工作日
feishu 扫码加入团队工作群 ≤ 30min · 工作日
enterprise 对公采购 · 合同 · 发票 ≤ 1 workday