多模态 Embedding

本文说明火山 doubao-embedding-vision 的文本、图片、视频多模态向量化调用方式。

一、多模态 Embedding

适用模型:

  • doubao-embedding-vision
    doubao-embedding-vision

请求地址:

POST https://cn-shanghai-alicloud-aimesh.api.clickzetta.com/gateway/api/v3/embeddings/multimodal

该接口与 OpenAI

/embeddings
/embeddings
不同,支持文本、图片、视频等多模态输入。

文本向量化

curl -X POST "$AI_GATEWAY_VOLC_BASE_URL/embeddings/multimodal" \ -H "Authorization: Bearer $API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "doubao-embedding-vision", "input": [ { "type": "text", "text": "AI Gateway 支持统一模型调用、路由和用量统计。" } ], "encoding_format": "float", "dimensions": 1024 }'

图片向量化

curl -X POST "$AI_GATEWAY_VOLC_BASE_URL/embeddings/multimodal" \ -H "Authorization: Bearer $API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "doubao-embedding-vision", "input": [ { "type": "image_url", "image_url": { "url": "https://example.com/product.png" } } ], "encoding_format": "float", "dimensions": 1024 }'

视频、图片、文本混合向量化

curl -X POST "$AI_GATEWAY_VOLC_BASE_URL/embeddings/multimodal" \ -H "Authorization: Bearer $API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "doubao-embedding-vision", "input": [ { "type": "video_url", "video_url": { "url": "https://example.com/demo.mp4" } }, { "type": "image_url", "image_url": { "url": "https://example.com/product.png" } }, { "type": "text", "text": "请根据视频和图片生成统一向量。" } ], "encoding_format": "float", "dimensions": 1024 }'

Embedding 请求字段

字段类型必填说明
model
model
string多模态向量模型名称,例如
doubao-embedding-vision
doubao-embedding-vision
input
input
array待向量化内容数组。
input[].type
input[].type
string输入类型,例如
text
text
image_url
image_url
video_url
video_url
input[].text
input[].text
string条件必填文本内容。
input[].image_url.url
input[].image_url.url
string条件必填图片 URL。
input[].video_url.url
input[].video_url.url
string条件必填视频 URL。
encoding_format
encoding_format
string向量编码格式,常用
float
float
dimensions
dimensions
integer输出向量维度。是否支持可变维度以模型详情页为准。

响应示例:

{ "object": "list", "data": [ { "object": "embedding", "index": 0, "embedding": [0.0123, -0.0456, 0.0789] } ], "model": "doubao-embedding-vision", "usage": { "prompt_tokens": 32, "total_tokens": 32 } }

向量库接入建议:

  • 入库和查询必须使用同一个模型和同一个向量维度。
  • 如果设置了
    dimensions
    dimensions
    ,建库前应固定维度,后续不要随意修改。
  • 图片和视频 URL 需要公网可访问,且建议使用稳定对象存储地址。
  • 批量处理时控制单次输入规模,避免请求体过大或超时。
联系我们
预约咨询
微信咨询
电话咨询
邮件咨询