AI Gateway 计费说明

本页介绍云器 AI Gateway 国内区(人民币计价)模型的计费方式与列表价。Lakehouse 计算 / 存储 / 网络资源的计费请见 Lakehouse 计费说明;总入口请见 定价和计费

概述

云器 AI Gateway 是一站式 AI 模型聚合与管理网关,通过统一接口调用主流大模型(通义千问、DeepSeek、智谱、Kimi、MiniMax、豆包等),无需逐个去各家平台注册、对接、充值。

计费方式

按需计费

调用任意模型 API 时,按当次实际消耗的 tokens(或时长 / 张数)累计计费,无最低消费门槛。计量精度精确到次级调用,支持按 API Key、应用、租户等维度核算,账单按月出账,可在控制台「费用中心」查看明细。

计费维度

不同类型的模型按不同维度计费,下表是各价格表会出现的字段含义。

按 token 计费的对话模型

按 token 计费,输入与输出价格分别计量。一个 token 大致相当于 0.5 个中文字 / 0.75 个英文单词。

字段含义
输入用户请求中 prompt 部分的 token 单价
输出模型生成内容的 token 单价
上下文窗口不同窗口区间分段计价,超过当次请求实际窗口的部分按对应分段单价结算

缓存能让你省多少钱

如果你反复发送相同的开头内容(如同一段长系统提示词、同一份知识库文档),模型可以把这段内容「记住」,下次直接复用而不必重新计算——这就是缓存。命中缓存的部分单价远低于正常输入价,对长 prompt、多轮对话场景能大幅降低成本。

缓存分两种,对应到价格表里不同的列。

类型工作方式价格表里对应的列
显式缓存你主动告诉模型「把这段存起来」,写入要付一次创建费(略高于输入价),之后每次取用付很低的命中费,长期占用还可能有存储费显式·写入、显式·命中、缓存存储
隐式缓存系统自动识别重复前缀帮你缓存,无需手动操作,没有写入费,命中时直接享受低价隐式·命中

各列怎么计费:

  • 显式·写入:首次把一段 prompt 写入缓存时收取,按写入的 token 数乘以该单价计算
  • 显式·命中:之后再次请求命中缓存时收取,按命中的 token 数乘以该单价计算,单价显著低于输入价
  • 隐式·命中:系统自动识别请求中重复的前缀,命中时按该单价计费;因为是系统自动写入的,没有单独的写入费

各厂商具体的支持情况如下:

厂商显式缓存隐式缓存
通义千问 Qwen支持部分支持(3.5 系列支持,3.6 / 3.7 系列暂未提供)
DeepSeek部分支持(v3.2 支持)部分支持(v3.2 / v4-flash / v4-pro / r1 支持)
智谱 GLM部分支持(5.1 支持)支持
月之暗面 Kimi支持支持
MiniMax不支持支持
豆包支持(另收缓存存储费)支持

视频、图片、3D、向量怎么算

不按 token 简单换算,各家计费维度不同:

  • 视频生成:happyhorse 系列按生成视频时长计费(元 / 秒),按 720P / 1080P 分级;豆包的 Seedance 系列按 token 计费(元 / 百万 tokens),按是否含视频输入、输出分辨率(480P / 720P / 1080P)分级。
  • 图片生成:豆包的 Seedream 系列按 token 计费(元 / 百万 tokens),文生图、图生图同价。
  • 3D 生成:豆包的 doubao-seed3d / Hyper3d / Hitem3d 系列按 token 计费(元 / 百万 tokens),按精度(白模 / 标准纹理 / 高精白模 / 高精纹理 / 带 PBR 材质等)分级。
  • 多模态嵌入:通义千问 qwen3-vl-embedding、豆包的 doubao-embedding-vision 按输入数据类型分别计价,文本输入价格低于图片 / 视频输入。

国内模型列表价

通义千问 Qwen 系列

系列模型名称上下文窗口输入输出显式·写入显式·命中隐式·命中
Qwen Maxqwen3.7-max0–1M1236151.22.4
Qwen Maxqwen3.6-max-preview0–128K95411.250.9
Qwen Maxqwen3.6-max-preview128K–256K159018.751.5
Qwen Maxqwen3-max0–32K2.5103.1250.250.5
Qwen Maxqwen3-max32K–128K41650.40.8
Qwen Maxqwen3-max128K–256K7288.750.71.4
Qwen Plusqwen3.6-plus0–256K2122.50.2
Qwen Plusqwen3.6-plus256K–1M848100.8
Qwen Plusqwen3.5-plus0–128K0.84.810.080.16
Qwen Plusqwen3.5-plus128K–256K2122.50.20.4
Qwen Plusqwen3.5-plus256K–1M42450.40.8
Qwen Flashqwen3.6-flash0–256K1.27.21.50.12
Qwen Flashqwen3.6-flash256K–1M4.828.860.48
Qwen Flashqwen3.5-flash0–128K0.220.250.02
Qwen Flashqwen3.5-flash128K–256K0.8810.08
Qwen Flashqwen3.5-flash256K–1M1.2121.50.12
Qwen 嵌入qwen3-vl-embedding(文本输入)0.7
Qwen 嵌入qwen3-vl-embedding(图片 / 视频输入)1.8

MiniMax 系列

模型名称输入输出隐式·命中
MiniMax-M2.72.18.40.42
MiniMax-M2.52.18.40.42

DeepSeek 系列

模型名称输入输出显式·写入显式·命中隐式·命中
deepseek-r14160.8
deepseek-v3.2232.50.20.4
deepseek-v4-flash120.2
deepseek-v4-pro12242.4

智谱 GLM 系列

模型名称上下文窗口输入输出显式·写入显式·命中隐式·命中
glm-4.70–32K3140.6
glm-4.732K–166K4160.8
glm-50–32K4180.8
glm-532K–198K6221.2
glm-5.10–32K6247.50.61.2
glm-5.132K–200K828100.81.6

月之暗面 Kimi 系列

模型名称输入输出显式·写入显式·命中隐式·命中
kimi-k2.542150.40.8
kimi-k2.66.5278.1250.651.3

豆包文本系列

豆包文本系列按上下文窗口区间分段计价;缓存存储 0.017 元 / 百万 tokens · 小时另行计费。

模型名称上下文窗口输入输出缓存存储显式·命中隐式·命中
doubao-seed-2.0-pro[0, 32K]3.2160.0170.640.64
doubao-seed-2.0-pro(32K, 128K]4.8240.0170.960.96
doubao-seed-2.0-pro(128K, 256K]9.6480.0171.921.92
doubao-seed-2.0-lite[0, 32K]0.63.60.0170.120.12
doubao-seed-2.0-lite(32K, 128K]0.95.40.0170.180.18
doubao-seed-2.0-lite(128K, 256K]1.810.80.0170.360.36
doubao-seed-2.0-mini[0, 32K]0.220.0170.040.04
doubao-seed-2.0-mini(32K, 128K]0.440.0170.080.08
doubao-seed-2.0-mini(128K, 256K]0.880.0170.160.16
doubao-seed-2.0-code[0, 32K]3.2160.0170.640.64
doubao-seed-2.0-code(32K, 128K]4.8240.0170.960.96
doubao-seed-2.0-code(128K, 256K]9.6480.0171.921.92
doubao-seed-1.8[0, 32K] & 输出 [0, 0.2]0.820.0170.160.16
doubao-seed-1.8[0, 32K] & 输出 (0.2, +∞)0.880.0170.160.16
doubao-seed-1.8(32K, 128K]1.2160.0170.160.16
doubao-seed-1.8(128K, 256K]2.4240.0170.160.16
doubao-seed-character[0, 32K]0.820.0170.160.16
doubao-seed-character(32K, 128K]1.260.0170.160.16
doubao-seed-code[0, 32K]1.280.0170.240.24
doubao-seed-code(32K, 128K]1.4120.0170.240.24
doubao-seed-code(128K, 256K]2.8160.0170.240.24
doubao-seed-1.6[0, 32K] & 输出 [0, 0.2]0.820.0170.160.16
doubao-seed-1.6[0, 32K] & 输出 (0.2, +∞)0.880.0170.160.16
doubao-seed-1.6(32K, 128K]1.2160.0170.160.16
doubao-seed-1.6(128K, 256K]2.4240.0170.160.16
doubao-seed-1.6-lite[0, 32K] & 输出 [0, 0.2]0.30.60.0170.060.06
doubao-seed-1.6-lite[0, 32K] & 输出 (0.2, +∞)0.32.40.0170.060.06
doubao-seed-1.6-lite(32K, 128K]0.640.0170.060.06
doubao-seed-1.6-lite(128K, 256K]1.2120.0170.060.06
doubao-seed-1.6-flash[0, 32K]0.151.50.0170.030.03
doubao-seed-1.6-flash(32K, 128K]0.330.0170.030.03
doubao-seed-1.6-flash(128K, 256K]0.660.0170.030.03
doubao-seed-1.6-vision[0, 32K]0.880.0170.160.16
doubao-seed-1.6-vision(32K, 128K]1.2160.0170.160.16
doubao-seed-1.6-vision(128K, 256K]2.4240.0170.160.16
doubao-seed-translation1.23.6
doubao-1.5-pro-32k0.820.0170.160.16
doubao-1.5-lite-32k0.30.60.0170.060.06
doubao-1.5-vision-pro39

happyhorse 视频生成系列

模型类型模型名称计费维度720P1080P
文生视频happyhorse-1.0-t2v元 / 秒0.91.6
图生视频(首帧)happyhorse-1.0-i2v元 / 秒0.91.6
参考生视频happyhorse-1.0-r2v元 / 秒0.91.6

豆包视频生成系列

模型名称价格维度价格(元 / 百万 tokens)
doubao-seedance-2.0输出 480p / 720p · 输入不含视频46
doubao-seedance-2.0输出 480p / 720p · 输入含视频28
doubao-seedance-2.0输出 1080p · 输入不含视频51
doubao-seedance-2.0输出 1080p · 输入含视频31
doubao-seedance-2.0-fast输入不含视频(不支持 1080p)37
doubao-seedance-2.0-fast输入含视频(不支持 1080p)22
doubao-seedance-1.5-pro有声视频16
doubao-seedance-1.5-pro无声视频8
doubao-seedance-1.0-pro15
doubao-seedance-1.0-pro-fast4.2

豆包图片生成系列

模型名称价格维度价格(元 / 百万 tokens)
doubao-seedream-5.0-lite0.22
doubao-seedream-4.50.25
doubao-seedream-4.00.2

豆包 3D 生成系列

模型名称价格维度价格(元 / 百万 tokens)
doubao-seed3d-2.0带纹理和 PBR 材质的 3D 模型2.4
Hyper3d-Gen2白模 / 带纹理 / PBR / 带纹理 + PBR1.8
Hitem3d-2.0标准白模5.8
Hitem3d-2.0标准纹理模型10.15
Hitem3d-2.0高精白模8.7
Hitem3d-2.0高精纹理模型13.05

豆包向量模型

模型名称价格维度价格(元 / 百万 tokens)
doubao-embedding-vision文本输入0.7
doubao-embedding-vision图片输入1.8

计费示例

文本模型:调用 qwen3-max(0–32K 窗口),输入 10000 tokens、输出 2000 tokens、无缓存命中:

10000 / 1,000,000 × 2.5 + 2000 / 1,000,000 × 10 = 0.045 元

带显式缓存的文本模型:调用 qwen3.5-plus(0–128K 窗口),首次请求写入缓存 5000 tokens、输出 1000 tokens;第二次请求命中缓存 5000 tokens、新输入 500 tokens、输出 1000 tokens:

首次:5000 / 1,000,000 × 1(写入)+ 1000 / 1,000,000 × 4.8 = 0.005 + 0.0048 = 0.0098 元 二次:5000 / 1,000,000 × 0.08(命中)+ 500 / 1,000,000 × 0.8 + 1000 / 1,000,000 × 4.8 = 0.0004 + 0.0004 + 0.0048 = 0.0056 元

视频生成(按秒):使用 happyhorse-1.0-t2v 文生视频,生成 720P、5 秒视频:

5 × 0.9 = 4.5 元

视频生成(按 token):使用 doubao-seedance-2.0 输出 1080P、不含视频输入,本次调用消耗 0.5M tokens:

0.5 × 51 = 25.5 元

图片生成:调用 doubao-seedream-5.0-lite 文生图,本次调用消耗 0.1M tokens:

0.1 × 0.22 = 0.022 元

向量模型:使用 doubao-embedding-vision 处理 100 万文本 tokens:

1 × 0.7 = 0.7 元

联系我们
预约咨询
微信咨询
电话咨询
邮件咨询