Agent Gateway operational · 14ms
claude exclusive line · 2026

原生 Claude Code 体验
独享专线,token 零浪费

为 Claude Code 与 Claude Desktop 提供与 Anthropic 官方一致的接入体验。顶级 Claude 模型企业直采,独享专线稳定不抖动,按 token 精确到分,长期不涨价。

联系报价 看原生通道
MODELS
3
tiers · opus / sonnet / haiku
CONTEXT
1M
tokens · max window
UPTIME
99.9%
monthly target
REGIONS
multi
auto-failover
MARKUP
1.0×
per-token · no hidden ratio
core

为开发者
设计的五项
硬指标

Agent Gateway 不是共享账号方案。通过企业直采、独享专线、智能调度,把"便宜"和"稳定"做到不互斥;并且独家做透 Claude Code CLI 与 Claude Desktop Cowork 模式的原生兼容。

01 // stability

独享专线 · 7×24 不抖动

多区域直连 Anthropic,健康探测每秒级,单线路异常自动切换。不限速、不降级、不排队、不共享。

uptime
99.9% target
failover
< 1s
ratelimit
none
02 // pricing

按 token 精确计价

企业直采价透传到你。无 1.2× / 2× 隐藏倍率,cache_read 折扣按官方计算,取消请求按已生成部分计费。

markup
1.0×
granularity
single token
cache
official rate
03 // models

顶级 Claude 全系直采

Opus 4.8 / Sonnet 4.6 / Haiku 4.5。1M context 与 Extended Thinking 完整可用,新模型当日同步。

context
up to 1M
thinking
supported
release
same-day
04 // cli

Claude Code CLI 原生支持

终端字节级透传,tool_use、streaming、sub-agents、background tasks 全兼容。一行 env 切换。

setup
1 env var
tool_use
1:1 passthrough
streaming
SSE native
05 // desktop

Claude Desktop Cowork 完美兼容

独家支持 Desktop 的 Cowork 与部署模式协同:会话、文件、工具调用一体可用,超越所有三方代理方案。

cowork
supported
deploy
first-class
exclusive
vs 3rd-party
native channel

不是兼容层
是原生通道

多数中转服务在协议适配层做翻译——结果是 tool_use 缺字段、会话被截断、cache 命中失效。

Agent Gateway 走原生通道,请求与响应字节级透传,Claude Code 怎么跑就怎么跑

// request path round-trip · 14ms · sg-edge
your machine
Claude Code · Claude Desktop
Agent Gateway
edge · sg / tk / us · auto-failover
Anthropic
api.anthropic.com
— inside the gateway
regional routing · sg / tk / us
token accounting · per-token · cache_read
failover · < 1s detection
01 会话管理 1:1 复刻
对话历史、上下文压缩、记忆窗口与官方完全一致
02 工具调用全兼容
tool_use / function_calling 全字段透传,零行为差异
03 流式 & 长回复
SSE 流式不截断,长文回复完整送达
04 Prompt Cache
缓存命中按官方 cache_read 价计算
05 Extended Thinking
extended_thinking / reasoning 字段完整保留
06 Sub-agent 兼容
Claude Code 的 sub-agents、background tasks 全部可用
token accounting · bench
维度 行业常见做法 Agent Gateway
计费颗粒 按整千 token 取整 精确到单 token
Cache 命中 不计折扣 按官方 cache_read 价
取消请求 仍按预估计费 已生成部分计费
隐藏倍率 1.2× ~ 2× 无 · 1.0×
cache hit rate

80%+ 缓存命中
省下的全部还给你

Agent Coding 与 Cowork 工作流天然适合 Prompt Cache:工程上下文反复访问,前缀稳定。Agent Gateway 把缓存命中按官方 cache_read 价透传,绝不当满价计

// daily coding
83 % cache hit

Sonnet 4.6 · 日常编码

重复读取的代码、工程上下文、规则提示词,自动命中 Prompt Cache。一次冷启之后,大部分回合都按 cache_read 价格结算。

// cowork
88 % cache hit

Desktop Cowork · 协同会话

Cowork 模式下多人共享同一份工程上下文,缓存复用率最高。文件、工具调用、上下文窗口反复访问几乎零冷启。

// long-context
71 % cache hit

Opus 4.8 · 长上下文工程

1M context 长会话里的稳定前缀全部缓存,超长上下文仍能按 1/10 价格计费。

客户分享 — 14d window · daily coding profile
peak 88% · floor 67% · avg 79%
65% 70% 75% 80% 85% 90% target 70% 67 d−13 72 d−12 76 d−11 71 d−10 78 d−9 75 d−8 80 d−7 85 d−6 76 d−5 81 d−4 82 d−3 85 d−2 88 d−1 83 d−0
cache_hit_rate · billed at 0.1× input · passthrough · no markup · source: 客户分享 · Agent Coding workload
model catalog

顶级 Claude
全系列直采

只做 Claude,做透 Claude。新模型上线当日同步,参数与官方 100% 对齐。

updated
2026-05
tracking
Anthropic releases · same-day
deprecated
none in current set
Opus 4.8
claude-opus-4-8
TOP
CONTEXT 1M
极复杂推理 · 长上下文工程 · 关键任务
thinkingtoolscachevision
Sonnet 4.6
claude-sonnet-4-6
DAILY
CONTEXT 1M
日常 Agent Coding 主力 · 性价比之选
thinkingtoolscachevision
Haiku 4.5
claude-haiku-4-5
EDGE
CONTEXT 200K
高频小任务 · 流式响应 · 极速
toolscachevision
questions

把可能
有疑问的
都摆出来

比官方便宜的逻辑是什么?是不是有坑?
我们做的是企业级直采 + 智能调度,省下的是规模化议价空间与调度优化,不是在用户侧砍质量。请求路径仍是 Anthropic 原生接口,无翻译层、无降级。
Claude Code 接入复杂吗?需要改代码吗?
不需要。Claude Code 与 Claude Desktop 都通过环境变量切换 base URL,1 行即可。其它工具调用、流式、tool_use 行为零差异。
稳定性怎么保障?SLA 是多少?
多区域独享专线 + 健康探测 + 自动故障切换。生产档承诺 99.9% 月度可用性,详细 SLA 在合同中明确。
token 计费精确吗?会不会虚标?
按 token 精确到 1 计费,与 Anthropic 官方返回的 usage 字段完全对齐。每次调用都可在控制台核对。Prompt Cache 按官方 cache_read 价计算,绝不当满价计。
数据安全 / 隐私如何?
请求字节透传,无内容侧记录与训练。可签 DPA / NDA。如需私有部署,请通过下方联系方式咨询。
支持发票吗?支持企业付款?
支持开具增值税专票、对公付款、合同采购。月结、年付方案见报价。
contact

联系报价
从你的实际用量算起

告诉我们团队规模、月调用量、目标场景。我们会在 1 个工作日内回信,给出方案与起步价。

联系我们
channels · typical response tz · UTC+8
email 邮件咨询 ≤ 4h
wechat 微信咨询 ≤ 30min · 工作日
feishu 扫码加入团队工作群 ≤ 30min · 工作日
enterprise 对公采购 · 合同 · 发票 ≤ 1 workday
— eof —