AI Gateway 计费说明
本页介绍云器 AI Gateway 国内区(人民币计价)模型的计费方式与列表价。Lakehouse 计算 / 存储 / 网络资源的计费请见 Lakehouse 计费说明;总入口请见 定价和计费。
概述
云器 AI Gateway 是一站式 AI 模型聚合与管理网关,通过统一接口调用主流大模型(通义千问、DeepSeek、智谱、Kimi、MiniMax、豆包等),无需逐个去各家平台注册、对接、充值。
计费方式
按需计费
调用任意模型 API 时,按当次实际消耗的 tokens(或时长 / 张数)累计计费,无最低消费门槛。计量精度精确到次级调用,支持按 API Key、应用、租户等维度核算,账单按月出账,可在控制台「费用中心」查看明细。
计费维度
不同类型的模型按不同维度计费,下表是各价格表会出现的字段含义。
按 token 计费的对话模型
按 token 计费,输入与输出价格分别计量。一个 token 大致相当于 0.5 个中文字 / 0.75 个英文单词。
| 字段 | 含义 |
|---|---|
| 输入 | 用户请求中 prompt 部分的 token 单价 |
| 输出 | 模型生成内容的 token 单价 |
| 上下文窗口 | 不同窗口区间分段计价,超过当次请求实际窗口的部分按对应分段单价结算 |
缓存能让你省多少钱
如果你反复发送相同的开头内容(如同一段长系统提示词、同一份知识库文档),模型可以把这段内容「记住」,下次直接复用而不必重新计算——这就是缓存。命中缓存的部分单价远低于正常输入价,对长 prompt、多轮对话场景能大幅降低成本。
缓存分两种,对应到价格表里不同的列。
| 类型 | 工作方式 | 价格表里对应的列 |
|---|---|---|
| 显式缓存 | 你主动告诉模型「把这段存起来」,写入要付一次创建费(略高于输入价),之后每次取用付很低的命中费,长期占用还可能有存储费 | 显式·写入、显式·命中、缓存存储 |
| 隐式缓存 | 系统自动识别重复前缀帮你缓存,无需手动操作,没有写入费,命中时直接享受低价 | 隐式·命中 |
各列怎么计费:
- 显式·写入:首次把一段 prompt 写入缓存时收取,按写入的 token 数乘以该单价计算
- 显式·命中:之后再次请求命中缓存时收取,按命中的 token 数乘以该单价计算,单价显著低于输入价
- 隐式·命中:系统自动识别请求中重复的前缀,命中时按该单价计费;因为是系统自动写入的,没有单独的写入费
各厂商具体的支持情况如下:
| 厂商 | 显式缓存 | 隐式缓存 |
|---|---|---|
| 通义千问 Qwen | 支持 | 部分支持(3.5 系列支持,3.6 / 3.7 系列暂未提供) |
| DeepSeek | 部分支持(v3.2 支持) | 部分支持(v3.2 / v4-flash / v4-pro / r1 支持) |
| 智谱 GLM | 部分支持(5.1 支持) | 支持 |
| 月之暗面 Kimi | 支持 | 支持 |
| MiniMax | 不支持 | 支持 |
| 豆包 | 支持(另收缓存存储费) | 支持 |
视频、图片、3D、向量怎么算
不按 token 简单换算,各家计费维度不同:
- 视频生成:happyhorse 系列按生成视频时长计费(元 / 秒),按 720P / 1080P 分级;豆包的 Seedance 系列按 token 计费(元 / 百万 tokens),按是否含视频输入、输出分辨率(480P / 720P / 1080P)分级。
- 图片生成:豆包的 Seedream 系列按 token 计费(元 / 百万 tokens),文生图、图生图同价。
- 3D 生成:豆包的 doubao-seed3d / Hyper3d / Hitem3d 系列按 token 计费(元 / 百万 tokens),按精度(白模 / 标准纹理 / 高精白模 / 高精纹理 / 带 PBR 材质等)分级。
- 多模态嵌入:通义千问 qwen3-vl-embedding、豆包的 doubao-embedding-vision 按输入数据类型分别计价,文本输入价格低于图片 / 视频输入。
国内模型列表价
通义千问 Qwen 系列
| 系列 | 模型名称 | 上下文窗口 | 输入 | 输出 | 显式·写入 | 显式·命中 | 隐式·命中 |
|---|---|---|---|---|---|---|---|
| Qwen Max | qwen3.7-max | 0–1M | 12 | 36 | 15 | 1.2 | 2.4 |
| Qwen Max | qwen3.6-max-preview | 0–128K | 9 | 54 | 11.25 | 0.9 | — |
| Qwen Max | qwen3.6-max-preview | 128K–256K | 15 | 90 | 18.75 | 1.5 | — |
| Qwen Max | qwen3-max | 0–32K | 2.5 | 10 | 3.125 | 0.25 | 0.5 |
| Qwen Max | qwen3-max | 32K–128K | 4 | 16 | 5 | 0.4 | 0.8 |
| Qwen Max | qwen3-max | 128K–256K | 7 | 28 | 8.75 | 0.7 | 1.4 |
| Qwen Plus | qwen3.6-plus | 0–256K | 2 | 12 | 2.5 | 0.2 | — |
| Qwen Plus | qwen3.6-plus | 256K–1M | 8 | 48 | 10 | 0.8 | — |
| Qwen Plus | qwen3.5-plus | 0–128K | 0.8 | 4.8 | 1 | 0.08 | 0.16 |
| Qwen Plus | qwen3.5-plus | 128K–256K | 2 | 12 | 2.5 | 0.2 | 0.4 |
| Qwen Plus | qwen3.5-plus | 256K–1M | 4 | 24 | 5 | 0.4 | 0.8 |
| Qwen Flash | qwen3.6-flash | 0–256K | 1.2 | 7.2 | 1.5 | 0.12 | — |
| Qwen Flash | qwen3.6-flash | 256K–1M | 4.8 | 28.8 | 6 | 0.48 | — |
| Qwen Flash | qwen3.5-flash | 0–128K | 0.2 | 2 | 0.25 | 0.02 | — |
| Qwen Flash | qwen3.5-flash | 128K–256K | 0.8 | 8 | 1 | 0.08 | — |
| Qwen Flash | qwen3.5-flash | 256K–1M | 1.2 | 12 | 1.5 | 0.12 | — |
| Qwen 嵌入 | qwen3-vl-embedding(文本输入) | — | 0.7 | — | — | — | — |
| Qwen 嵌入 | qwen3-vl-embedding(图片 / 视频输入) | — | 1.8 | — | — | — | — |
MiniMax 系列
| 模型名称 | 输入 | 输出 | 隐式·命中 |
|---|---|---|---|
| MiniMax-M2.7 | 2.1 | 8.4 | 0.42 |
| MiniMax-M2.5 | 2.1 | 8.4 | 0.42 |
DeepSeek 系列
| 模型名称 | 输入 | 输出 | 显式·写入 | 显式·命中 | 隐式·命中 |
|---|---|---|---|---|---|
| deepseek-r1 | 4 | 16 | — | — | 0.8 |
| deepseek-v3.2 | 2 | 3 | 2.5 | 0.2 | 0.4 |
| deepseek-v4-flash | 1 | 2 | — | — | 0.2 |
| deepseek-v4-pro | 12 | 24 | — | — | 2.4 |
智谱 GLM 系列
| 模型名称 | 上下文窗口 | 输入 | 输出 | 显式·写入 | 显式·命中 | 隐式·命中 |
|---|---|---|---|---|---|---|
| glm-4.7 | 0–32K | 3 | 14 | — | — | 0.6 |
| glm-4.7 | 32K–166K | 4 | 16 | — | — | 0.8 |
| glm-5 | 0–32K | 4 | 18 | — | — | 0.8 |
| glm-5 | 32K–198K | 6 | 22 | — | — | 1.2 |
| glm-5.1 | 0–32K | 6 | 24 | 7.5 | 0.6 | 1.2 |
| glm-5.1 | 32K–200K | 8 | 28 | 10 | 0.8 | 1.6 |
月之暗面 Kimi 系列
| 模型名称 | 输入 | 输出 | 显式·写入 | 显式·命中 | 隐式·命中 |
|---|---|---|---|---|---|
| kimi-k2.5 | 4 | 21 | 5 | 0.4 | 0.8 |
| kimi-k2.6 | 6.5 | 27 | 8.125 | 0.65 | 1.3 |
豆包文本系列
豆包文本系列按上下文窗口区间分段计价;缓存存储 0.017 元 / 百万 tokens · 小时另行计费。
| 模型名称 | 上下文窗口 | 输入 | 输出 | 缓存存储 | 显式·命中 | 隐式·命中 |
|---|---|---|---|---|---|---|
| doubao-seed-2.0-pro | [0, 32K] | 3.2 | 16 | 0.017 | 0.64 | 0.64 |
| doubao-seed-2.0-pro | (32K, 128K] | 4.8 | 24 | 0.017 | 0.96 | 0.96 |
| doubao-seed-2.0-pro | (128K, 256K] | 9.6 | 48 | 0.017 | 1.92 | 1.92 |
| doubao-seed-2.0-lite | [0, 32K] | 0.6 | 3.6 | 0.017 | 0.12 | 0.12 |
| doubao-seed-2.0-lite | (32K, 128K] | 0.9 | 5.4 | 0.017 | 0.18 | 0.18 |
| doubao-seed-2.0-lite | (128K, 256K] | 1.8 | 10.8 | 0.017 | 0.36 | 0.36 |
| doubao-seed-2.0-mini | [0, 32K] | 0.2 | 2 | 0.017 | 0.04 | 0.04 |
| doubao-seed-2.0-mini | (32K, 128K] | 0.4 | 4 | 0.017 | 0.08 | 0.08 |
| doubao-seed-2.0-mini | (128K, 256K] | 0.8 | 8 | 0.017 | 0.16 | 0.16 |
| doubao-seed-2.0-code | [0, 32K] | 3.2 | 16 | 0.017 | 0.64 | 0.64 |
| doubao-seed-2.0-code | (32K, 128K] | 4.8 | 24 | 0.017 | 0.96 | 0.96 |
| doubao-seed-2.0-code | (128K, 256K] | 9.6 | 48 | 0.017 | 1.92 | 1.92 |
| doubao-seed-1.8 | [0, 32K] & 输出 [0, 0.2] | 0.8 | 2 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.8 | [0, 32K] & 输出 (0.2, +∞) | 0.8 | 8 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.8 | (32K, 128K] | 1.2 | 16 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.8 | (128K, 256K] | 2.4 | 24 | 0.017 | 0.16 | 0.16 |
| doubao-seed-character | [0, 32K] | 0.8 | 2 | 0.017 | 0.16 | 0.16 |
| doubao-seed-character | (32K, 128K] | 1.2 | 6 | 0.017 | 0.16 | 0.16 |
| doubao-seed-code | [0, 32K] | 1.2 | 8 | 0.017 | 0.24 | 0.24 |
| doubao-seed-code | (32K, 128K] | 1.4 | 12 | 0.017 | 0.24 | 0.24 |
| doubao-seed-code | (128K, 256K] | 2.8 | 16 | 0.017 | 0.24 | 0.24 |
| doubao-seed-1.6 | [0, 32K] & 输出 [0, 0.2] | 0.8 | 2 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.6 | [0, 32K] & 输出 (0.2, +∞) | 0.8 | 8 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.6 | (32K, 128K] | 1.2 | 16 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.6 | (128K, 256K] | 2.4 | 24 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.6-lite | [0, 32K] & 输出 [0, 0.2] | 0.3 | 0.6 | 0.017 | 0.06 | 0.06 |
| doubao-seed-1.6-lite | [0, 32K] & 输出 (0.2, +∞) | 0.3 | 2.4 | 0.017 | 0.06 | 0.06 |
| doubao-seed-1.6-lite | (32K, 128K] | 0.6 | 4 | 0.017 | 0.06 | 0.06 |
| doubao-seed-1.6-lite | (128K, 256K] | 1.2 | 12 | 0.017 | 0.06 | 0.06 |
| doubao-seed-1.6-flash | [0, 32K] | 0.15 | 1.5 | 0.017 | 0.03 | 0.03 |
| doubao-seed-1.6-flash | (32K, 128K] | 0.3 | 3 | 0.017 | 0.03 | 0.03 |
| doubao-seed-1.6-flash | (128K, 256K] | 0.6 | 6 | 0.017 | 0.03 | 0.03 |
| doubao-seed-1.6-vision | [0, 32K] | 0.8 | 8 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.6-vision | (32K, 128K] | 1.2 | 16 | 0.017 | 0.16 | 0.16 |
| doubao-seed-1.6-vision | (128K, 256K] | 2.4 | 24 | 0.017 | 0.16 | 0.16 |
| doubao-seed-translation | — | 1.2 | 3.6 | — | — | — |
| doubao-1.5-pro-32k | — | 0.8 | 2 | 0.017 | 0.16 | 0.16 |
| doubao-1.5-lite-32k | — | 0.3 | 0.6 | 0.017 | 0.06 | 0.06 |
| doubao-1.5-vision-pro | — | 3 | 9 | — | — | — |
happyhorse 视频生成系列
| 模型类型 | 模型名称 | 计费维度 | 720P | 1080P |
|---|---|---|---|---|
| 文生视频 | happyhorse-1.0-t2v | 元 / 秒 | 0.9 | 1.6 |
| 图生视频(首帧) | happyhorse-1.0-i2v | 元 / 秒 | 0.9 | 1.6 |
| 参考生视频 | happyhorse-1.0-r2v | 元 / 秒 | 0.9 | 1.6 |
豆包视频生成系列
| 模型名称 | 价格维度 | 价格(元 / 百万 tokens) |
|---|---|---|
| doubao-seedance-2.0 | 输出 480p / 720p · 输入不含视频 | 46 |
| doubao-seedance-2.0 | 输出 480p / 720p · 输入含视频 | 28 |
| doubao-seedance-2.0 | 输出 1080p · 输入不含视频 | 51 |
| doubao-seedance-2.0 | 输出 1080p · 输入含视频 | 31 |
| doubao-seedance-2.0-fast | 输入不含视频(不支持 1080p) | 37 |
| doubao-seedance-2.0-fast | 输入含视频(不支持 1080p) | 22 |
| doubao-seedance-1.5-pro | 有声视频 | 16 |
| doubao-seedance-1.5-pro | 无声视频 | 8 |
| doubao-seedance-1.0-pro | — | 15 |
| doubao-seedance-1.0-pro-fast | — | 4.2 |
豆包图片生成系列
| 模型名称 | 价格维度 | 价格(元 / 百万 tokens) |
|---|---|---|
| doubao-seedream-5.0-lite | — | 0.22 |
| doubao-seedream-4.5 | — | 0.25 |
| doubao-seedream-4.0 | — | 0.2 |
豆包 3D 生成系列
| 模型名称 | 价格维度 | 价格(元 / 百万 tokens) |
|---|---|---|
| doubao-seed3d-2.0 | 带纹理和 PBR 材质的 3D 模型 | 2.4 |
| Hyper3d-Gen2 | 白模 / 带纹理 / PBR / 带纹理 + PBR | 1.8 |
| Hitem3d-2.0 | 标准白模 | 5.8 |
| Hitem3d-2.0 | 标准纹理模型 | 10.15 |
| Hitem3d-2.0 | 高精白模 | 8.7 |
| Hitem3d-2.0 | 高精纹理模型 | 13.05 |
豆包向量模型
| 模型名称 | 价格维度 | 价格(元 / 百万 tokens) |
|---|---|---|
| doubao-embedding-vision | 文本输入 | 0.7 |
| doubao-embedding-vision | 图片输入 | 1.8 |
计费示例
文本模型:调用 qwen3-max(0–32K 窗口),输入 10000 tokens、输出 2000 tokens、无缓存命中:
带显式缓存的文本模型:调用 qwen3.5-plus(0–128K 窗口),首次请求写入缓存 5000 tokens、输出 1000 tokens;第二次请求命中缓存 5000 tokens、新输入 500 tokens、输出 1000 tokens:
视频生成(按秒):使用 happyhorse-1.0-t2v 文生视频,生成 720P、5 秒视频:
视频生成(按 token):使用 doubao-seedance-2.0 输出 1080P、不含视频输入,本次调用消耗 0.5M tokens:
图片生成:调用 doubao-seedream-5.0-lite 文生图,本次调用消耗 0.1M tokens:
向量模型:使用 doubao-embedding-vision 处理 100 万文本 tokens:
