AI Gateway 计费说明

本页介绍云器 AI Gateway 国内区（人民币计价）模型的计费方式与列表价。Lakehouse 计算 / 存储 / 网络资源的计费请见 Lakehouse 计费说明；总入口请见定价和计费。

概述

云器 AI Gateway 是一站式 AI 模型聚合与管理网关，通过统一接口调用主流大模型（通义千问、DeepSeek、智谱、Kimi、MiniMax、豆包等），无需逐个去各家平台注册、对接、充值。

💡 提示：Analytics Agent 调用大模型产生的 Token 消耗，单价按本文档列出的模型单价结算。

计费方式

按需计费

调用任意模型 API 时，按当次实际消耗的 tokens（或时长 / 张数）累计计费，无最低消费门槛。计量精度精确到次级调用，支持按 API Key、应用、租户等维度核算，账单按月出账，可在控制台「费用中心」查看明细。

计费维度

不同类型的模型按不同维度计费，下表是各价格表会出现的字段含义。

按 token 计费的对话模型

按 token 计费，输入与输出价格分别计量。一个 token 大致相当于 0.5 个中文字 / 0.75 个英文单词。

字段	含义
输入	用户请求中 prompt 部分的 token 单价
输出	模型生成内容的 token 单价
上下文窗口	不同窗口区间分段计价，超过当次请求实际窗口的部分按对应分段单价结算

💡 提示：举例，用某模型问答，输入 1000 字、输出 2000 字 ≈ 输入 1000 token + 输出 2000 token；若输入价 2 元 / 百万 tokens、输出价 8 元 / 百万 tokens，则这次约花费

1000÷1,000,000×2 + 2000÷1,000,000×8 = 0.018 元

1000÷1,000,000×2 + 2000÷1,000,000×8 = 0.018 元

。

缓存能让你省多少钱

如果你反复发送相同的开头内容（如同一段长系统提示词、同一份知识库文档），模型可以把这段内容「记住」，下次直接复用而不必重新计算——这就是缓存。命中缓存的部分单价远低于正常输入价，对长 prompt、多轮对话场景能大幅降低成本。

缓存分两种，对应到价格表里不同的列。

类型	工作方式	价格表里对应的列
显式缓存	你主动告诉模型「把这段存起来」，写入要付一次创建费（略高于输入价），之后每次取用付很低的命中费，长期占用还可能有存储费	显式·写入、显式·命中、缓存存储
隐式缓存	系统自动识别重复前缀帮你缓存，无需手动操作，没有写入费，命中时直接享受低价	隐式·命中

各列怎么计费：

显式·写入：首次把一段 prompt 写入缓存时收取，按写入的 token 数乘以该单价计算
显式·命中：之后再次请求命中缓存时收取，按命中的 token 数乘以该单价计算，单价显著低于输入价
隐式·命中：系统自动识别请求中重复的前缀，命中时按该单价计费；因为是系统自动写入的，没有单独的写入费

各厂商具体的支持情况如下：

厂商	显式缓存	隐式缓存
通义千问 Qwen	支持	部分支持（3.5 系列支持，3.6 / 3.7 系列暂未提供）
DeepSeek	部分支持（v3.2 支持）	部分支持（v3.2 / v4-flash / v4-pro / r1 支持）
智谱 GLM	部分支持（5.1 支持）	支持
月之暗面 Kimi	支持	支持
MiniMax	不支持	支持
豆包	支持（另收缓存存储费）	支持

视频、图片、3D、向量怎么算

不按 token 简单换算，各家计费维度不同：

视频生成：happyhorse 系列按生成视频时长计费（元 / 秒），按 720P / 1080P 分级；豆包的 Seedance 系列按 token 计费（元 / 百万 tokens），按是否含视频输入、输出分辨率（480P / 720P / 1080P）分级。
图片生成：豆包的 Seedream 系列按 token 计费（元 / 百万 tokens），文生图、图生图同价。
3D 生成：豆包的 doubao-seed3d / Hyper3d / Hitem3d 系列按 token 计费（元 / 百万 tokens），按精度（白模 / 标准纹理 / 高精白模 / 高精纹理 / 带 PBR 材质等）分级。
多模态嵌入：通义千问 qwen3-vl-embedding、豆包的 doubao-embedding-vision 按输入数据类型分别计价，文本输入价格低于图片 / 视频输入。

国内模型列表价

⚠️ 注意：以下价格为公开列表价（刊例价），单位为人民币元 / 百万 tokens（视频与图片模型按各自计费维度）。模型市场价格波动较大，列表价可能随市场变化调整，实际成交价以账单为准。

通义千问 Qwen 系列

系列	模型名称	上下文窗口	输入	输出	显式·写入	显式·命中	隐式·命中
Qwen Max	qwen3.7-max	0–1M	12	36	15	1.2	2.4
Qwen Max	qwen3.6-max-preview	0–128K	9	54	11.25	0.9	—
Qwen Max	qwen3.6-max-preview	128K–256K	15	90	18.75	1.5	—
Qwen Max	qwen3-max	0–32K	2.5	10	3.125	0.25	0.5
Qwen Max	qwen3-max	32K–128K	4	16	5	0.4	0.8
Qwen Max	qwen3-max	128K–256K	7	28	8.75	0.7	1.4
Qwen Plus	qwen3.6-plus	0–256K	2	12	2.5	0.2	—
Qwen Plus	qwen3.6-plus	256K–1M	8	48	10	0.8	—
Qwen Plus	qwen3.5-plus	0–128K	0.8	4.8	1	0.08	0.16
Qwen Plus	qwen3.5-plus	128K–256K	2	12	2.5	0.2	0.4
Qwen Plus	qwen3.5-plus	256K–1M	4	24	5	0.4	0.8
Qwen Flash	qwen3.6-flash	0–256K	1.2	7.2	1.5	0.12	—
Qwen Flash	qwen3.6-flash	256K–1M	4.8	28.8	6	0.48	—
Qwen Flash	qwen3.5-flash	0–128K	0.2	2	0.25	0.02	—
Qwen Flash	qwen3.5-flash	128K–256K	0.8	8	1	0.08	—
Qwen Flash	qwen3.5-flash	256K–1M	1.2	12	1.5	0.12	—
Qwen 嵌入	qwen3-vl-embedding（文本输入）	—	0.7	—	—	—	—
Qwen 嵌入	qwen3-vl-embedding（图片 / 视频输入）	—	1.8	—	—	—	—

MiniMax 系列

模型名称	输入	输出	隐式·命中
MiniMax-M2.7	2.1	8.4	0.42
MiniMax-M2.5	2.1	8.4	0.42

DeepSeek 系列

模型名称	输入	输出	显式·写入	显式·命中	隐式·命中
deepseek-r1	4	16	—	—	0.8
deepseek-v3.2	2	3	2.5	0.2	0.4
deepseek-v4-flash	1	2	—	—	0.2
deepseek-v4-pro	12	24	—	—	2.4

智谱 GLM 系列

模型名称	上下文窗口	输入	输出	显式·写入	显式·命中	隐式·命中
glm-4.7	0–32K	3	14	—	—	0.6
glm-4.7	32K–166K	4	16	—	—	0.8
glm-5	0–32K	4	18	—	—	0.8
glm-5	32K–198K	6	22	—	—	1.2
glm-5.1	0–32K	6	24	7.5	0.6	1.2
glm-5.1	32K–200K	8	28	10	0.8	1.6

月之暗面 Kimi 系列

模型名称	输入	输出	显式·写入	显式·命中	隐式·命中
kimi-k2.5	4	21	5	0.4	0.8
kimi-k2.6	6.5	27	8.125	0.65	1.3

豆包文本系列

豆包文本系列按上下文窗口区间分段计价；缓存存储 0.017 元 / 百万 tokens · 小时另行计费。

模型名称	上下文窗口	输入	输出	缓存存储	显式·命中	隐式·命中
doubao-seed-2.0-pro	[0, 32K]	3.2	16	0.017	0.64	0.64
doubao-seed-2.0-pro	(32K, 128K]	4.8	24	0.017	0.96	0.96
doubao-seed-2.0-pro	(128K, 256K]	9.6	48	0.017	1.92	1.92
doubao-seed-2.0-lite	[0, 32K]	0.6	3.6	0.017	0.12	0.12
doubao-seed-2.0-lite	(32K, 128K]	0.9	5.4	0.017	0.18	0.18
doubao-seed-2.0-lite	(128K, 256K]	1.8	10.8	0.017	0.36	0.36
doubao-seed-2.0-mini	[0, 32K]	0.2	2	0.017	0.04	0.04
doubao-seed-2.0-mini	(32K, 128K]	0.4	4	0.017	0.08	0.08
doubao-seed-2.0-mini	(128K, 256K]	0.8	8	0.017	0.16	0.16
doubao-seed-2.0-code	[0, 32K]	3.2	16	0.017	0.64	0.64
doubao-seed-2.0-code	(32K, 128K]	4.8	24	0.017	0.96	0.96
doubao-seed-2.0-code	(128K, 256K]	9.6	48	0.017	1.92	1.92
doubao-seed-1.8	[0, 32K] & 输出 [0, 0.2]	0.8	2	0.017	0.16	0.16
doubao-seed-1.8	[0, 32K] & 输出 (0.2, +∞)	0.8	8	0.017	0.16	0.16
doubao-seed-1.8	(32K, 128K]	1.2	16	0.017	0.16	0.16
doubao-seed-1.8	(128K, 256K]	2.4	24	0.017	0.16	0.16
doubao-seed-character	[0, 32K]	0.8	2	0.017	0.16	0.16
doubao-seed-character	(32K, 128K]	1.2	6	0.017	0.16	0.16
doubao-seed-code	[0, 32K]	1.2	8	0.017	0.24	0.24
doubao-seed-code	(32K, 128K]	1.4	12	0.017	0.24	0.24
doubao-seed-code	(128K, 256K]	2.8	16	0.017	0.24	0.24
doubao-seed-1.6	[0, 32K] & 输出 [0, 0.2]	0.8	2	0.017	0.16	0.16
doubao-seed-1.6	[0, 32K] & 输出 (0.2, +∞)	0.8	8	0.017	0.16	0.16
doubao-seed-1.6	(32K, 128K]	1.2	16	0.017	0.16	0.16
doubao-seed-1.6	(128K, 256K]	2.4	24	0.017	0.16	0.16
doubao-seed-1.6-lite	[0, 32K] & 输出 [0, 0.2]	0.3	0.6	0.017	0.06	0.06
doubao-seed-1.6-lite	[0, 32K] & 输出 (0.2, +∞)	0.3	2.4	0.017	0.06	0.06
doubao-seed-1.6-lite	(32K, 128K]	0.6	4	0.017	0.06	0.06
doubao-seed-1.6-lite	(128K, 256K]	1.2	12	0.017	0.06	0.06
doubao-seed-1.6-flash	[0, 32K]	0.15	1.5	0.017	0.03	0.03
doubao-seed-1.6-flash	(32K, 128K]	0.3	3	0.017	0.03	0.03
doubao-seed-1.6-flash	(128K, 256K]	0.6	6	0.017	0.03	0.03
doubao-seed-1.6-vision	[0, 32K]	0.8	8	0.017	0.16	0.16
doubao-seed-1.6-vision	(32K, 128K]	1.2	16	0.017	0.16	0.16
doubao-seed-1.6-vision	(128K, 256K]	2.4	24	0.017	0.16	0.16
doubao-seed-translation	—	1.2	3.6	—	—	—
doubao-1.5-pro-32k	—	0.8	2	0.017	0.16	0.16
doubao-1.5-lite-32k	—	0.3	0.6	0.017	0.06	0.06
doubao-1.5-vision-pro	—	3	9	—	—	—

happyhorse 视频生成系列

模型类型	模型名称	计费维度	720P	1080P
文生视频	happyhorse-1.0-t2v	元 / 秒	0.9	1.6
图生视频（首帧）	happyhorse-1.0-i2v	元 / 秒	0.9	1.6
参考生视频	happyhorse-1.0-r2v	元 / 秒	0.9	1.6

豆包视频生成系列

模型名称	价格维度	价格（元 / 百万 tokens）
doubao-seedance-2.0	输出 480p / 720p · 输入不含视频	46
doubao-seedance-2.0	输出 480p / 720p · 输入含视频	28
doubao-seedance-2.0	输出 1080p · 输入不含视频	51
doubao-seedance-2.0	输出 1080p · 输入含视频	31
doubao-seedance-2.0-fast	输入不含视频（不支持 1080p）	37
doubao-seedance-2.0-fast	输入含视频（不支持 1080p）	22
doubao-seedance-1.5-pro	有声视频	16
doubao-seedance-1.5-pro	无声视频	8
doubao-seedance-1.0-pro	—	15
doubao-seedance-1.0-pro-fast	—	4.2

豆包图片生成系列

模型名称	价格维度	价格（元 / 百万 tokens）
doubao-seedream-5.0-lite	—	0.22
doubao-seedream-4.5	—	0.25
doubao-seedream-4.0	—	0.2

豆包 3D 生成系列

模型名称	价格维度	价格（元 / 百万 tokens）
doubao-seed3d-2.0	带纹理和 PBR 材质的 3D 模型	2.4
Hyper3d-Gen2	白模 / 带纹理 / PBR / 带纹理 + PBR	1.8
Hitem3d-2.0	标准白模	5.8
Hitem3d-2.0	标准纹理模型	10.15
Hitem3d-2.0	高精白模	8.7
Hitem3d-2.0	高精纹理模型	13.05

豆包向量模型

模型名称	价格维度	价格（元 / 百万 tokens）
doubao-embedding-vision	文本输入	0.7
doubao-embedding-vision	图片输入	1.8

计费示例

文本模型：调用 qwen3-max（0–32K 窗口），输入 10000 tokens、输出 2000 tokens、无缓存命中：

10000 / 1,000,000 × 2.5 + 2000 / 1,000,000 × 10 = 0.045 元

带显式缓存的文本模型：调用 qwen3.5-plus（0–128K 窗口），首次请求写入缓存 5000 tokens、输出 1000 tokens；第二次请求命中缓存 5000 tokens、新输入 500 tokens、输出 1000 tokens：

首次：5000 / 1,000,000 × 1（写入）+ 1000 / 1,000,000 × 4.8 = 0.005 + 0.0048 = 0.0098 元二次：5000 / 1,000,000 × 0.08（命中）+ 500 / 1,000,000 × 0.8 + 1000 / 1,000,000 × 4.8 = 0.0004 + 0.0004 + 0.0048 = 0.0056 元

视频生成（按秒）：使用 happyhorse-1.0-t2v 文生视频，生成 720P、5 秒视频：

5 × 0.9 = 4.5 元

视频生成（按 token）：使用 doubao-seedance-2.0 输出 1080P、不含视频输入，本次调用消耗 0.5M tokens：

0.5 × 51 = 25.5 元

图片生成：调用 doubao-seedream-5.0-lite 文生图，本次调用消耗 0.1M tokens：

0.1 × 0.22 = 0.022 元

向量模型：使用 doubao-embedding-vision 处理 100 万文本 tokens：

1 × 0.7 = 0.7 元

联系我们