AI_TRANSLATE

概述

AI_TRANSLATE
AI_TRANSLATE
是云器 Lakehouse 提供的 AI 翻译函数,可将输入文本从一种语言翻译成另一种指定语言。源语言自动检测,无需手动指定。支持中文、英文、日文、韩文、法语、德语、西班牙语等多种语言互译,一行 SQL 即可完成翻译。


语法

AI_TRANSLATE(model, content, to_lang)


参数说明

参数类型必需说明
model
model
STRING模型标识,支持两种来源(见下方说明)
content
content
STRING需要翻译的输入文本,支持 CHAR/VARCHAR/STRING 类型
to_lang
to_lang
STRING目标语言代码,遵循 ISO-639 标准(如
'zh'
'zh'
'en'
'en'
'ja'
'ja'

model 参数

来源一:API Gateway Endpoint(推荐)

通过平台 AI Gateway 中已配置的 Endpoint 名称指定模型:

'endpoint:qwen3-max-preview'

来源二:API Connection 连接对象

通过预先创建的 API Connection 对象指定外部模型:

CREATE API CONNECTION conn_bailian ...; SELECT AI_TRANSLATE('conn_bailian:qwen3.5-plus', content, 'en') FROM t;


返回值

STRING 类型,包含将原始文本翻译成目标语言后的结果。


错误行为

默认情况下,若

AI_TRANSLATE
AI_TRANSLATE
无法处理输入,函数返回 NULL。

输入情况返回值
content
content
为 NULL
NULL
content
content
为空字符串
''
''
空字符串
''
''
content
content
与目标语言相同
返回原文不变
to_lang
to_lang
为无效语言代码
报错:
Invalid ISO-639 language code: <code>
Invalid ISO-639 language code: <code>
Endpoint 格式错误报错:
Invalid model coordinates: '<value>'
Invalid model coordinates: '<value>'
Endpoint 不存在报错:
No available endpoints found
No available endpoints found
缺少必填参数报错:
AI function must have at least two arguments
AI function must have at least two arguments

使用说明

  • 源语言自动检测 — 无需指定源语言,模型会自动识别输入文本的语言。若源语言代码传入空字符串
    ''
    ''
    ,同样触发自动检测(当前语法不支持传入
    from_lang
    from_lang
    参数)。
  • 使用标准语言代码
    to_lang
    to_lang
    必须为有效的 ISO-639 语言代码(如
    'zh'
    'zh'
    'en'
    'en'
    'ja'
    'ja'
    ),不支持语言全名。
  • 先过滤再翻译 — 对大表使用时,建议先用
    WHERE content IS NOT NULL AND LENGTH(content) > 0
    WHERE content IS NOT NULL AND LENGTH(content) > 0
    过滤,避免不必要的模型调用。
  • 技术术语 — 技术文本翻译质量高(如 "batch processing" → "批处理"),高度专业的领域术语建议人工审核。
  • 成语与文化表达 — 模型能够进行意译(如"塞翁失马" → "blessing in disguise"),而非逐字直译。
  • 与其他 AI 函数配合 — 可先用
    AI_SUMMARIZE
    AI_SUMMARIZE
    摘要再翻译,或先翻译再用
    AI_SENTIMENT
    AI_SENTIMENT
    分析情感。
  • 批量处理 — 处理大量行时,AI 函数会逐行调用模型,建议配合
    LIMIT
    LIMIT
    分批处理或控制并发。

支持的语言代码(常用)

语言代码语言代码
中文
'zh'
'zh'
英文
'en'
'en'
日文
'ja'
'ja'
韩文
'ko'
'ko'
法语
'fr'
'fr'
德语
'de'
'de'
西班牙语
'es'
'es'
葡萄牙语
'pt'
'pt'
俄语
'ru'
'ru'
阿拉伯语
'ar'
'ar'
意大利语
'it'
'it'
泰语
'th'
'th'

示例

中文翻译为英文

SELECT AI_TRANSLATE( 'endpoint:qwen3-max-preview', '你好世界', 'en' ) AS translated; -- 返回:Hello world

英文翻译为中文

SELECT AI_TRANSLATE( 'endpoint:qwen3-max-preview', 'Hello world', 'zh' ) AS translated; -- 返回:你好,世界

英文翻译为日文

SELECT AI_TRANSLATE( 'endpoint:qwen3-max-preview', 'Hello world', 'ja' ) AS translated; -- 返回:こんにちは世界

中文成语翻译为英文

SELECT AI_TRANSLATE( 'endpoint:qwen3-max-preview', '塞翁失马,焉知非福。', 'en' ) AS translated; -- 返回:When the old man lost his horse, who could have known it wasn't a blessing in disguise?

批量翻译表中数据

SELECT id, review_content, AI_TRANSLATE('endpoint:qwen3-max-preview', review_content, 'zh') AS zh_review FROM global_reviews WHERE review_content IS NOT NULL;

同一内容翻译为多种语言

SELECT doc_id, AI_TRANSLATE('endpoint:qwen3-max-preview', content, 'en') AS en_content, AI_TRANSLATE('endpoint:qwen3-max-preview', content, 'ja') AS ja_content FROM product_docs WHERE lang = 'zh';

先摘要再翻译

SELECT id, AI_TRANSLATE( 'endpoint:qwen3-max-preview', AI_SUMMARIZE('endpoint:qwen3-max-preview', content, 30), 'en' ) AS en_summary FROM chinese_articles;

使用 API Connection 指定模型

SELECT AI_TRANSLATE( 'conn_bailian:qwen3.5-plus', '云器Lakehouse是面向企业的多云一体化数据平台。', 'en' ) AS translated;


限制说明

限制项说明
model
model
参数
必须使用
'endpoint:名称'
'endpoint:名称'
'connection:模型'
'connection:模型'
格式,不可省略
to_lang
to_lang
必须为有效的 ISO-639 语言代码,不支持语言全名
源语言指定不支持手动指定源语言,始终自动检测
输入长度受底层模型 context window 限制
模型依赖需要 AI Gateway 中已配置可用的 Endpoint,或已创建的 API Connection
结果确定性LLM 输出具有非确定性,同一输入多次执行结果可能略有差异
联系我们
预约咨询
微信咨询
电话咨询