AI_TRANSLATE
概述
AI_TRANSLATE 是云器 Lakehouse 提供的 AI 翻译函数,可将输入文本从一种语言翻译成另一种指定语言。源语言自动检测,无需手动指定。支持中文、英文、日文、韩文、法语、德语、西班牙语等多种语言互译,一行 SQL 即可完成翻译。
语法
参数说明
| 参数 | 类型 | 必需 | 说明 |
|---|---|---|---|
| STRING | 是 | 模型标识,支持两种来源(见下方说明) |
| STRING | 是 | 需要翻译的输入文本,支持 CHAR/VARCHAR/STRING 类型 |
| STRING | 是 | 目标语言代码,遵循 ISO-639 标准(如 、、) |
model 参数
来源一:API Gateway Endpoint(推荐)
通过平台 AI Gateway 中已配置的 Endpoint 名称指定模型:
来源二:API Connection 连接对象
通过预先创建的 API Connection 对象指定外部模型:
返回值
STRING 类型,包含将原始文本翻译成目标语言后的结果。
错误行为
默认情况下,若
AI_TRANSLATE 无法处理输入,函数返回 NULL。
| 输入情况 | 返回值 |
|---|---|
为 NULL | NULL |
为空字符串 | 空字符串 |
与目标语言相同 | 返回原文不变 |
为无效语言代码 | 报错: |
| Endpoint 格式错误 | 报错: |
| Endpoint 不存在 | 报错: |
| 缺少必填参数 | 报错: |
使用说明
- 源语言自动检测 — 无需指定源语言,模型会自动识别输入文本的语言。若源语言代码传入空字符串
,同样触发自动检测(当前语法不支持传入''
参数)。from_lang - 使用标准语言代码 —
必须为有效的 ISO-639 语言代码(如to_lang
、'zh'
、'en'
),不支持语言全名。'ja' - 先过滤再翻译 — 对大表使用时,建议先用
过滤,避免不必要的模型调用。WHERE content IS NOT NULL AND LENGTH(content) > 0 - 技术术语 — 技术文本翻译质量高(如 "batch processing" → "批处理"),高度专业的领域术语建议人工审核。
- 成语与文化表达 — 模型能够进行意译(如"塞翁失马" → "blessing in disguise"),而非逐字直译。
- 与其他 AI 函数配合 — 可先用
摘要再翻译,或先翻译再用AI_SUMMARIZE
分析情感。AI_SENTIMENT - 批量处理 — 处理大量行时,AI 函数会逐行调用模型,建议配合
分批处理或控制并发。LIMIT
支持的语言代码(常用)
| 语言 | 代码 | 语言 | 代码 |
|---|---|---|---|
| 中文 | | 英文 | |
| 日文 | | 韩文 | |
| 法语 | | 德语 | |
| 西班牙语 | | 葡萄牙语 | |
| 俄语 | | 阿拉伯语 | |
| 意大利语 | | 泰语 | |
示例
中文翻译为英文
英文翻译为中文
英文翻译为日文
中文成语翻译为英文
批量翻译表中数据
同一内容翻译为多种语言
先摘要再翻译
使用 API Connection 指定模型
限制说明
| 限制项 | 说明 |
|---|---|
参数 | 必须使用 或 格式,不可省略 |
| 必须为有效的 ISO-639 语言代码,不支持语言全名 |
| 源语言指定 | 不支持手动指定源语言,始终自动检测 |
| 输入长度 | 受底层模型 context window 限制 |
| 模型依赖 | 需要 AI Gateway 中已配置可用的 Endpoint,或已创建的 API Connection |
| 结果确定性 | LLM 输出具有非确定性,同一输入多次执行结果可能略有差异 |
联系我们
