AI Gateway 使用指南

前言

本指南旨在为企业用户提供云器 AI Gateway 产品的全面使用指导,涵盖产品核心功能、详细操作流程、最佳实践及常见问题解答。云器 AI Gateway 是云器平台推出的企业级 AI 网关服务,提供统一的多模型 API 管理、智能路由调度、BYOK(Bring Your Own Key)模型接入、用量统计分析及权限管理等核心能力,帮助企业简化多厂商大模型集成流程,降低运维复杂度,保障 AI 服务的稳定性、安全性与可观测性。

一、产品介绍

1.0 什么是 AI Gateway

AI Gateway(AI 网关 / LLM 网关) 是专门面向大模型服务的流量治理中间件,充当 AI 应用程序与多种 AI 模型服务之间的统一接入层和控制平面。

你可以把它想象成企业 AI 能力的"智能前台":所有 AI 调用请求都先经过网关,由网关统一决定谁可以用、能用多少、用哪个模型、花多少钱、安不安全,最终将处理后的结果返回给应用。

AI Gateway 与传统 API 网关的区别:AI Gateway 不是传统 API 网关的简单升级,而是针对大模型服务的特性(长连接、大带宽、高延迟、流式传输、Token 计费)设计的全新组件:

对比维度AI Gateway传统 API Gateway
核心目标大模型流量治理与 AI 能力管控通用 API 流量转发与管理
计费单位Token 级精确计量请求次数 / 带宽
流量特性长连接、流式传输、大 Payload短连接、请求-响应模式
核心能力语义缓存、模型路由、内容安全负载均衡、限流、鉴权
协议支持OpenAI API、Anthropic API 等 AI 专属协议HTTP、gRPC、WebSocket 等通用协议

工作原理

  1. 接入层处理:接收应用的 HTTP/gRPC 请求,执行身份认证和基础参数验证
  2. 请求预处理:进行敏感信息脱敏、提示词安全检查、配额校验
  3. 智能路由决策:根据路由规则和实时状态选择最优的模型服务
  4. 上游转发:将标准化后的请求转发给选定的模型服务,网关统一管理 API 密钥
  5. 响应处理:接收模型的流式响应,执行内容安全审核,统计 Token 用量
  6. 结果返回:将处理后的响应返回给客户端,同时记录日志和监控数据

AI Gateway 是云器平台专为企业级 AI 应用打造的统一接入与管理网关,是企业 AI 基础设施的核心枢纽。它向上承接企业内部各类 AI 应用(智能客服、内容生成、代码辅助、数据分析等),向下统一对接国内外主流大模型厂商、行业垂直模型及企业自有模型。

在当前企业 AI 落地的普遍痛点下,云器 AI Gateway 解决了以下核心问题:

  • 接口碎片化:不同厂商提供的 API 接口规范不一致,企业需要为每个厂商单独开发适配代码,维护成本高
  • 运维复杂度高:多模型并行使用时,缺乏统一的监控、告警与故障排查机制
  • 成本不可控:无法按团队、项目、应用维度精细化管控 AI 用量,容易出现超额消费
  • 数据安全风险:多渠道调用模型时,数据泄露风险增加,缺乏统一的安全管控与审计能力
  • 灵活性不足:切换模型厂商或新增模型时,需要修改业务代码,影响业务连续性

通过云器 AI Gateway,企业可以实现 "一次接入、全局使用",大幅降低 AI 应用的开发与运维成本,提升 AI 服务的稳定性、安全性与可观测性。

1.2 产品核心价值

云器 AI Gateway 为企业带来四大核心价值:

  1. 降本增效:统一 API 接口,减少多模型适配开发工作量;智能路由策略自动选择最优性价比模型,降低AI调用成本
  2. 统一管控:集中管理所有模型资源与调用权限,实现 "一个平台管所有 AI"
  3. 灵活扩展:支持快速接入新的模型厂商与自定义模型,无需修改业务代码,随业务需求灵活扩展

1.3 核心优势

1.3.1 多模型统一接入

  • 全厂商覆盖:支持阿里云百炼、字节跳动豆包、AWS Bedrock等国内外主流大模型厂商
  • 标准接口兼容:提供 100% 兼容 OpenAI 的 REST API 接口,原有基于 OpenAI 开发的业务代码无需修改,只需替换 API 端点与密钥即可无缝切换
  • 多模态支持:全面支持文本生成、图像理解、语音识别与合成、代码生成等多模态能力
  • 模型版本管理:统一管理不同版本的模型,支持平滑升级与回滚

1.3.2 智能路由与负载均衡

  • 多维度路由策略:支持基于价格、吞吐量、延迟、地域等多维度的智能路由

    • 价格优先:自动选择当前可用的价格最低的供应商,最大化成本效益
    • 吞吐优先:自动选择吞吐量最高的供应商,应对高并发场景
    • 延迟优先:自动选择延迟最低的供应商,保障用户体验

1.3.3 BYOK 无缝集成

  • 多供应商支持:目前支持阿里云百炼 - 北京、AWS Bedrock US-EAST-1、BytePlus AP-SOUTHEAST等主流供应商的 BYOK 接入
  • 零代码集成:只需在平台中输入你的第三方 API 密钥,即可完成自有模型的接入,无需任何开发工作
  • 独立账单体系:使用 BYOK 模型时,账单直接走你自己的第三方供应商账户,平台不收取任何额外费用
  • 统一管理体验:BYOK 模型与平台内置模型享有完全一致的管理体验,支持统一的路由、监控与用量统计

1.3.4 精细化用量管理

  • 多维度用量统计:支持按模型、账户、API Key、用户、时间等多个维度统计 Token 消耗
  • 细粒度限额控制:支持为每个 API Key 设置独立的 Token 限额与有效期,防止意外超额消费
  • 实时用量监控:实时展示 Token 消耗趋势,支持用量阈值告警
  • 成本分摊与分析:自动生成多维度成本分析报表,支持按团队、项目进行成本分摊
  • 数据导出:支持将所有用量数据导出为 Excel 格式,便于企业内部财务核算

1.3.5 企业级安全管控

  • 细粒度权限管理:支持基于角色的访问控制(RBAC),不同用户拥有不同的操作权限

1.4 核心功能模块

云器 AI Gateway 包含以下五大核心功能模块,对应左侧导航栏菜单:

功能模块核心能力业务价值
API KEY 管理密钥创建 / 编辑 / 删除 / 禁用、有效期配置、Token 限额设置、路由策略绑定、批量操作、用量查看实现不同业务、不同团队之间的权限隔离与用量管控
模型广场模型展示与搜索、模型详情查看、调用示例一键复制、模型运行状态监控快速了解平台支持的模型能力,获取集成代码,监控模型运行状态
BYOK第三方供应商管理、自有密钥配置、模型选择、连通性测试、BYOK 模型管理无缝接入企业自有第三方模型服务,保留原有账户与账单体系
用量统计多维度用量查询、趋势分析、明细查看、数据导出、成本分析全面了解 AI 成本构成,实现精细化成本管控与分摊
权限管理用户授权、角色管理、权限回收保障平台安全,实现不同用户的权限隔离

1.5 适用场景

云器 AI Gateway 采用云原生分布式架构,分为接入层、路由层、模型层、管控层四个层次:

  1. 接入层:提供统一的 API 接入端点,负责请求鉴权、流量控制、协议转换
  2. 路由层:核心智能路由引擎,负责根据路由策略将请求转发到最优的模型接入点
  3. 模型层:对接各类模型厂商的 API 接口,负责请求转发与响应处理
  4. 管控层:提供 API Key 管理、模型管理、BYOK 管理、用量统计、权限管理等管控功能

1.6 适用场景

1.6.1 企业多模型统一管理场景

业务痛点:企业同时使用多家厂商的大模型,每个厂商都有独立的 API 接口、密钥管理与计费体系,开发与运维复杂度高,成本难以管控。

解决方案:通过云器 AI Gateway 统一接入所有模型,提供标准化 API 接口,实现集中的密钥管理、路由调度、用量统计与监控告警。

1.6.2 AI 应用快速开发场景

业务痛点:开发者需要花费大量时间学习不同厂商的 API 文档,编写适配代码,开发周期长,效率低。

解决方案:云器 AI Gateway 提供 100% 兼容 OpenAI 的标准 API 接口,开发者只需学习一套接口规范,即可调用所有模型。平台还提供丰富的调用示例与 SDK,进一步降低开发门槛。

1.6.3 AI 成本精细化管控场景

业务痛点:企业 AI 成本快速增长,但无法准确统计每个团队、每个项目的 AI 用量,成本分摊困难,容易出现超额消费。

解决方案:云器 AI Gateway 支持为每个团队、每个项目创建独立的 API Key,并设置独立的 Token 限额。平台提供多维度的用量统计与成本分析报表,帮助企业实现精准的成本分摊与管控。

1.6.4 自有模型接入场景

业务痛点:企业已经在第三方厂商开通了模型服务,希望保留原有账户与账单体系,但又想通过统一网关进行管理。

解决方案:通过云器 AI Gateway 的 BYOK 功能,只需输入企业自有 API 密钥,即可将第三方模型接入统一网关,享受与平台内置模型完全一致的管理体验。

1.7 与传统集成方式对比

对比维度传统多模型集成方式云器 AI Gateway 集成方式
开发工作量每个厂商单独开发适配代码,工作量大一次开发,调用所有模型,工作量减少 80%
运维复杂度多套系统并行运维,复杂度高统一平台管理,运维简单
成本管控无法精细化管控,成本不可控多维度用量统计与限额,成本精准可控
模型切换需要修改业务代码,影响业务连续性无需修改代码,一键切换
安全管控分散管控,安全风险高统一安全管控,全方位保障数据安全
可观测性缺乏统一监控,问题排查困难全链路可观测,快速定位问题
联系我们
预约咨询
微信咨询
电话咨询
邮件咨询