Responses API

Responses API 是 OpenAI 兼容的新一代响应接口,用于统一承载文本、多模态输入、结构化输出和工具调用。阿里云百炼部分模型支持 Responses API;在 AI Gateway 中调用时仍使用 AI Gateway 的网关地址和 API Key。

如果模型广场详情页没有展示 Responses 示例,建议优先使用 Chat Completions。

一、请求地址

POST https://cn-shanghai-alicloud-aimesh.api.clickzetta.com/gateway/v1/responses

请求头:

Authorization: Bearer <API_KEY> Content-Type: application/json

二、基础请求示例

curl -X POST "https://cn-shanghai-alicloud-aimesh.api.clickzetta.com/gateway/v1/responses" \ -H "Authorization: Bearer $API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "qwen/qwen3.7-max", "input": "请总结 AI Gateway 的三个核心能力。" }'

Python 示例:

from openai import OpenAI client = OpenAI( base_url="https://cn-shanghai-alicloud-aimesh.api.clickzetta.com/gateway/v1", api_key="<your-api-key>", ) response = client.responses.create( model="qwen/qwen3.7-max", input="请总结 AI Gateway 的三个核心能力。", ) print(response.output_text)

三、请求字段

字段类型必填说明
model
model
string模型名称。以模型广场详情页复制的模型标识为准。
input
input
string / array用户输入。可以是简单字符串,也可以是多轮、多模态内容数组。
instructions
instructions
string类似 Chat Completions 中的
system
system
指令,用于设置模型行为。
stream
stream
boolean是否开启流式输出。
temperature
temperature
number采样温度。值越高输出越随机。
top_p
top_p
number核采样参数。
max_output_tokens
max_output_tokens
integer最大输出 Token 数。Responses API 使用该字段控制输出长度。
metadata
metadata
object业务自定义元数据。可用于审计、追踪或统计。
response_format
response_format
object结构化输出配置。是否支持取决于模型。
tools
tools
array工具定义列表。
tool_choice
tool_choice
string / object工具选择策略。
parallel_tool_calls
parallel_tool_calls
boolean是否允许并行工具调用。是否支持取决于模型。
previous_response_id
previous_response_id
string用于衔接上一轮 Responses 响应。是否支持取决于网关和模型能力。
store
store
boolean是否存储响应。企业场景通常按合规策略设置。

四、input 写法

字符串输入

适合单轮文本任务。

{ "model": "qwen/qwen3.7-max", "input": "把下面这句话翻译成英文:AI Gateway 支持统一模型治理。" }

多轮输入

{ "model": "qwen/qwen3.7-max", "input": [ { "role": "user", "content": "AI Gateway 支持哪些能力?" }, { "role": "assistant", "content": "支持统一模型接入、API Key 管理、路由、用量统计等能力。" }, { "role": "user", "content": "请把这些能力整理成表格。" } ] }

多模态输入

支持多模态的模型可以在

content
content
中传入文本和图片。

{ "model": "qwen/qwen3.6-plus", "input": [ { "role": "user", "content": [ { "type": "input_text", "text": "请识别图片中的主要对象,并输出 JSON。" }, { "type": "input_image", "image_url": "https://example.com/image.png" } ] } ] }

多模态字段是否支持、图片数量和大小限制,以模型详情页为准。

五、流式输出

curl -N -X POST "$AI_GATEWAY_OPENAI_BASE_URL/responses" \ -H "Authorization: Bearer $API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "qwen/qwen3.7-max", "input": "请分步骤说明 AI Gateway 的接入流程。", "stream": true, "max_output_tokens": 1024 }'

客户端需要按 SSE 事件逐段读取输出。不同 SDK 对 Responses 流式事件的封装不同,建议在业务代码中单独封装解析逻辑。

六、结构化输出

{ "model": "qwen/qwen3.7-max", "instructions": "你只输出合法 JSON,不要输出 Markdown。", "input": "抽取工单信息:客户反馈 API 调用 429,影响生产环境。", "response_format": { "type": "json_object" } }

建议业务侧仍进行 JSON Schema 校验,避免模型输出不符合预期导致下游报错。

七、工具调用

{ "model": "qwen/qwen3.7-max", "input": "查询客户 c_1001 最近 7 天的模型调用费用。", "tools": [ { "type": "function", "name": "query_customer_cost", "description": "查询客户模型调用费用", "parameters": { "type": "object", "properties": { "customer_id": { "type": "string" }, "days": { "type": "integer" } }, "required": ["customer_id", "days"] } } ], "tool_choice": "auto" }

工具调用的基本流程与 Chat Completions 类似:模型先返回工具调用意图,业务系统执行工具,再把工具结果回传给模型生成最终回答。

八、响应解析

Responses API 的响应结构与 Chat Completions 不同。SDK 中通常可以直接读取

output_text
output_text
;原始 JSON 中则需要遍历
output
output

示例结构:

{ "id": "resp_xxx", "object": "response", "model": "qwen/qwen3.7-max", "output": [ { "type": "message", "role": "assistant", "content": [ { "type": "output_text", "text": "AI Gateway 的核心能力包括统一接入、路由治理和用量统计。" } ] } ], "usage": { "input_tokens": 32, "output_tokens": 24, "total_tokens": 56 } }

字段说明:

字段说明
id
id
响应 ID。用于多轮衔接或问题排查。
output
output
输出内容数组,可能包含文本、工具调用等不同类型。
output_text
output_text
SDK 封装的纯文本输出快捷字段。
usage.input_tokens
usage.input_tokens
输入 Token 数。
usage.output_tokens
usage.output_tokens
输出 Token 数。
usage.total_tokens
usage.total_tokens
总 Token 数。

九、与 Chat Completions 的选择建议

场景推荐接口
已有 OpenAI Chat Completions 代码Chat Completions
需要最大兼容性Chat Completions
需要统一文本、多模态和工具能力Responses
需要使用 SDK 新能力,例如
client.responses.create
client.responses.create
Responses
模型详情页没有 Responses 示例Chat Completions
联系我们
预约咨询
微信咨询
电话咨询
邮件咨询