Claude + Codex
双生态 Agent On

原生协议 · 独享专线 · token 透明计费。一个入口，接入 Claude 与 Codex 全部客户端。

~/projects/my-app - zsh

$ claude connected Agent On ● healthy · 14ms model claude-sonnet · 1M ctx accounting per-token · 1.0× · cache_read on > Refactor src/auth/* to the new middleware pattern, then make the tests pass. ● Reading 12 files ● Editing src/auth/middleware.ts ● Editing src/auth/session.ts ● Running bun test ✓ 47 pass / 0 fail · 318ms >

客户端

原生协议

可用性目标

99.9%

出口区域

多区域

计费系数

1.0×

为开发者设计的
五项硬指标

不是共享账号方案：企业直采 + 独享专线，把"便宜"和"稳定"做到不互斥。

双生态独享专线 · 7×24 不抖动

多区域秒级健康探测，异常自动切换，不限速、不共享。

按 token 精确计价

企业直采价透传，无隐藏倍率，缓存按官方折扣结算。

Claude + Codex 顶级模型入口

两个生态的旗舰模型全系覆盖，新版本同日可用。

CLI / IDE 原生支持

两条官方协议 1:1 直通，工具调用与流式零改写。

桌面端一键配置

Agent On 桌面软件一键写入全部客户端配置。

不是兼容层
是原生通道

多数中转服务在协议适配层做翻译，结果是 tool_use 缺字段、会话被截断、cache 命中失效。

Agent On 不把所有客户端硬塞进同一种兼容层。Claude 生态走 Anthropic 原生协议，Codex 生态走 Responses 原生协议，请求与响应按各自协议字节级透传。

Claude / Codex 请求路径 14ms 平均往返

your machine

Claude / Codex clients

Agent On

区域专线 · 自动调度

upstream

Anthropic API · OpenAI Responses

regional routing · sg / tk / us

protocol dispatch · Anthropic / Responses native

token accounting · per-token · cache_read

01 Claude 会话语义保真

02 工具调用全兼容

03 Codex Responses 直通

04 Prompt Cache

05 Thinking / Reasoning

06 Sub-agent / Background

维度	行业常见做法	Agent On
计费颗粒	按整千 token 取整	精确到单 token
Cache 命中	不计折扣	按官方 cache_read 价
取消请求	仍按预估计费	已生成部分计费
隐藏倍率	1.2× ~ 2×	无 · 1.0×

80%+ 缓存命中
省下的全部还给你

Agent Coding 与 Cowork 工作流天然适合 Prompt Cache：工程上下文反复访问，前缀稳定。Agent On 把缓存命中按官方 cache_read 价透传，绝不当满价计。

83 %

Sonnet · 日常编码

一次冷启后，大部分回合按 cache_read 价结算。

88 %

Desktop Cowork · 协同会话

多人共享同一份工程上下文，几乎零冷启。

71 %

Opus · 长上下文工程

长会话稳定前缀全缓存，按 1/10 价计费。

peak 88% · floor 67% · avg 79%

官方 cache_read 价透传，命中越高，账单越低。

Claude 顶级模型
Codex 原生入口

Claude 侧提供顶级模型直采；Codex 侧保持 /v1/responses 原生链路与 /v1/chat/completions 兼容入口。新模型与新客户端能力上线当日同步。

Anthropic 与 Codex 客户端能力同日跟进；当前推荐模型全部可用。

Opus

TOP

极复杂推理 · 长上下文工程 · 关键任务

thinkingtoolscachevision

Sonnet

DAILY

日常 Agent Coding 主力 · 性价比之选

thinkingtoolscachevision

Haiku

EDGE

200K

高频小任务 · 流式响应 · 极速

toolscachevision

企业采购前
最常问的
21 个问题

从交付物、激活 Key、模型授权，到长任务稳定性、隐私、私有化部署和对账方式，按主题分组，集中回答在同一个可扫描的 Q&A 模块里。

产品与交付

01 Agent On 是什么？

Agent On 是面向企业和开发团队的 AI Coding Agent 交付平台，向客户交付 Agent On GW App、Agent On GW CLI 工具和对应的激活 Key。用户激活后，可以在 App 或 CLI 中调用被授权的多种后端模型，用于代码编写、项目理解、代码重构、测试修复、多步骤开发任务和团队级 AI 编程协作。

02 Agent On 交付哪些内容？

主要交付四部分内容：Agent On GW App、Agent On GW CLI 工具、Agent On GW 激活 Key，以及 Agent On GW 企业管理后台。企业可以基于 Agent App 和 CLI 做定制，包括 Logo、默认模型、管理入口、权限策略和企业内部功能。

03 激活 Key 可以使用哪些模型？

激活 Key 可以授权用户使用多种后端模型，具体以企业采购方案和后台配置为准。可支持 GPT 系列高阶模型、Claude Opus、Claude Sonnet、Claude Haiku，以及其他已接入并被授权的模型。企业管理员可以在后台配置不同用户、团队或 Key 可访问的模型范围。

04 每个 Key 对应什么？

每个 Key 通常对应一个用户 license。企业可以按用户、团队、部门或项目组分配 Key。用户通过 Agent App 或 CLI 激活 Key 后，即可使用该 Key 被授权的模型和 Agent 能力。Key 也可以适配其他 Agent App，例如 Codex App、Claude App；详情见配置教程。

05 Agent On 适合哪些场景？

适合 AI 编程辅助、代码生成与修改、代码库理解、项目重构、Bug 修复、测试生成与测试修复、多文件多步骤开发任务、长上下文项目协作、团队级 AI Coding 管理，以及企业内部 AI Agent 工具统一交付。

能力与体验

06 Agent On 和直接调用模型 API 有什么区别？

直接调用模型 API 时，客户需要自己实现 Agent App、CLI、系统提示词、文件读写、工具调用、终端执行、上下文管理、多轮规划、用量统计、账单和权限系统。Agent On 已提供完整的 AI Coding Agent 使用入口和管理体系，客户拿到 App、CLI 和激活 Key 后即可使用，并可通过企业后台统一管理用户、模型、密钥、用量和账单。

07 Claude API 调用同一个模型，会比 Coding Plan 更聪明吗？

不会。同一个模型在底层权重、推理能力和上下文能力上是一致的。使用体验差异主要来自上层 Agent 框架，包括系统提示词、工具链、多轮规划、文件读写、测试执行、上下文压缩和任务状态管理。Coding Plan 表现更强，通常是因为它内置了完整的编程 Agent 流程。

08 为什么 Coding Plan 在复杂开发任务中表现更好？

Coding Plan 通常包含完整工程流程：读取项目结构和关键文件、分析依赖和上下文、生成架构方案、列出文件变更清单、识别风险点、等待用户确认、执行代码修改、运行测试、自查并迭代修复。这些能力来自 Agent 工作流设计；同样的模型如果只通过 API 做单轮问答，通常无法自动完成这些步骤。

09 Agent On 的 Agent App / CLI 有什么优势？

Agent App / CLI 面向 AI Coding 场景设计，支持多模型授权、长上下文任务、多轮规划、工具调用、文件读写、终端开发流程、任务状态保留、用量统计、企业统一管理和团队批量交付。

10 Agent On 是否支持工具、Skill 和 MCP？

支持。Agent On 面向复杂 Agent 使用场景，支持工具调用、Skill、子代理编排、MCP 工具和复杂数据结构处理。在 AI Coding 场景中，模型需要持续处理文件、工具结果、上下文、任务状态和流式响应；Agent On 会尽量保障这些结构稳定衔接，减少工具调用失败、状态丢失、空回复或会话卡死等问题。

11 Agent On 相比普通中转平台有什么优势？

优势集中在五个方面：交付 Agent App / CLI 和激活 Key；一个 Key 可授权多种后端模型；面向 AI Coding 场景，支持长任务、工具、Skill、MCP；提供企业管理后台，支持用户、密钥、用量、账单和健康监控；支持私有化部署、人民币付款、合同采购和月度对账。

稳定性与性能

12 Agent On 如何保障长任务稳定性？

Agent On 会持续维护任务上下文，包括项目背景、已读文件、当前进展、待办事项、工具调用结果和用户中途新增要求。对于多步骤开发任务，系统会尽量保障任务状态不丢失，让 Agent 能够持续完成规划、执行、测试和修复流程。

13 长对话会不会越来越慢？

长对话不会明显越来越慢。AI Coding 任务中有大量重复上下文，例如项目结构、历史任务、系统规则和代码片段。Agent On 会通过上下文复用、Prompt Cache 和任务状态管理降低重复处理成本，提升长任务响应速度。

14 Prompt Cache 有什么价值？

Prompt Cache 可以提升速度并降低成本。在代码项目中，项目结构、代码文件、系统规则和历史上下文经常重复出现。缓存命中后，重复内容可以更高效地复用，减少重复计算。

15 Agent On 如何保障稳定性？

Agent On 从系统、网络和资源三个层面保障稳定性：系统层面包括 VM HA、健康检查、故障恢复；网络层面包括 SD-WAN、稳定链路、私有化独享网络；资源层面包括模型资源健康监控、动态路由、异常切换和资源扩容。客户无需自行维护多模型、多账号、多线路，平台会统一完成调度和监控。

安全与部署

16 Agent On 如何保护隐私？

Agent On 默认只记录必要的用量和运维信息，例如 token 消耗、模型名称、请求耗时和调用状态。客户代码、提示词、对话正文和工具参数原文不作为日志保存，客户对话不会用于模型训练。私有化部署场景下，网络、存储和管理权限可以由客户侧掌控。

17 是否支持私有化部署？

支持。当客户购买 license 数量超过 100 个时，可以提供私有化部署方案。私有化部署包含独立虚拟机、SD-WAN 网络、独享网络资源、独享存储资源、客户侧管理权限、license key 分配和月度对账机制。

计费与管理

18 企业管理后台支持哪些功能？

企业管理后台支持用量仪表盘、资源健康状态、模型供应商配置、客户端管理、密钥管理、用户管理、用量统计、监控、单价配置、计费方式和账单。企业可以通过后台统一管理用户、Key、模型授权、用量、费用和系统状态。

19 商务方案如何计费？

Agent On 按 license 计费，每个 license 对应一个用户 Key。目前提供多档方案，额度每日和每周刷新；未触及封顶前，可在额度内正常使用。

20 是否有隐藏倍率？

没有。Agent On 按 token 精确核算，不采用 1.2×、2× 等隐藏倍率。Prompt Cache 命中部分按照 cache_read 逻辑计算，不按满价 token 计费。

21 费用如何支付和对账？

首月按采购 license 数量预付，次月开始按实际使用情况对账。月 token 消耗低于 500 万的用户可以本月不计费，license 退回；退回的 license 可以在第二个月进行抵扣，后续每月按照同样逻辑滚动结算。支持人民币付款、企业对公付款和合同采购，可根据商务约定开具发票。

联系报价
从你的实际用量算起

告诉我们团队规模与月用量，1 个工作日内回信报价。

企业接入申请 → 写邮件给我们

email support@agent-on.com

wechat 微信咨询 ≤ 30min · 工作日

feishu 扫码加入团队工作群 ≤ 30min · 工作日

enterprise 对公采购 · 合同 · 发票 ≤ 1 workday

Claude + Codex双生态 Agent On

为开发者设计的五项硬指标