AI_SENTIMENT
概述
AI_SENTIMENT
AI_SENTIMENT
是云器 Lakehouse 提供的 AI 情感分析函数,可对输入文本进行情感倾向判断,返回
positive
positive
(正面)、
negative
negative
(负面)、
neutral
neutral
(中性)或
mixed
mixed
(混合)标签。支持中文、英文、日文等多语言,一行 SQL 即可完成情感分析。
云器将 AI 计算下沉至存储层与执行引擎,数据在平台内部即可完成智能处理,无需流转至外部环境,在保障数据安全的同时大幅降低任务延迟。
语法
AI_SENTIMENT( <model>, <text> )
参数说明
必需参数
model
model
指定用于情感分析的模型,支持两种来源:
来源一:API Gateway Endpoint(推荐)
平台管理员在 API Gateway 中预先配置模型服务,普通用户通过
endpoint:
endpoint:
前缀引用,无需关心底层连接细节。
'endpoint:<endpoint名称>'
-- 示例
'endpoint:qwen3-max-preview'
'endpoint:qwen3.5-plus'
来源二:API Connection 连接对象
用户通过
CREATE API CONNECTION
CREATE API CONNECTION
自行创建连接对象,适用于需要自定义服务地址、认证密钥或对接私有化部署模型的场景。
-- 创建连接对象
CREATE API CONNECTION conn_bailian
TYPE ai_function
PROVIDER = 'bailian'
BASE_URL = 'https://dashscope.aliyuncs.com/api/v1'
API_KEY = 'sk-xxxxxxxxxxxxxxxxxxxxxxxx';
-- 引用时使用 <连接名称>:<模型名称> 格式
SELECT AI_SENTIMENT('conn_bailian:qwen3.5-plus', '这个产品非常好用!');
CREATE API CONNECTION
CREATE API CONNECTION
各字段说明:
| 字段 | 说明 |
|---|
TYPE
TYPE | 固定为 ai_function
ai_function |
PROVIDER
PROVIDER | 模型供应商标识,如 'bailian'
'bailian' 、'openai'
'openai' 、'anthropic'
'anthropic' 等 |
BASE_URL
BASE_URL | 模型服务的 API 基础地址 |
API_KEY
API_KEY | 调用服务所需的认证密钥 |
text
text
包含待检测情感的输入文本,类型为 STRING。支持中文、英文、日文、法文、德文、西班牙文等多种语言,无需手动指定语言,模型自动识别。
返回值
STRING 类型,为以下值之一:
| 值 | 含义 |
|---|
positive
positive | 文本表达了正面评价或积极情感 |
negative
negative | 文本表达了负面评价或消极情感 |
neutral
neutral | 文本不含明显情感倾向(如陈述性事实、通知类文本) |
mixed
mixed | 文本中同时包含正面和负面情感 |
错误行为
默认情况下,若函数无法处理输入,返回
NULL
NULL
,不报错。在多行查询中,出错的行返回
NULL
NULL
,不影响其他行的正常执行。
使用说明
- NULL 和空字符串均返回 NULL:
text
text
为 NULL
NULL
或空字符串 ''
''
时,函数返回 NULL
NULL
,不报错。纯空白字符(如 ' '
' '
)会被发送给模型处理,通常返回 neutral
neutral
。
- 结果具有非确定性:基于 LLM 的情感分析结果可能因模型版本或调用时机略有差异,同一输入多次执行结果可能不同。
- 注意 mixed 与 neutral 的区别:
mixed
mixed
表示文本中同时存在正面和负面评价(如"食物好但服务差");neutral
neutral
表示文本不含情感倾向(如"下午三点开会")。
- 多语言无需额外配置:模型自动识别输入语言,中英日法德西等语言均可直接分析。
示例
基础用法
-- 正面情感
SELECT AI_SENTIMENT(
'endpoint:qwen3-max-preview',
'这个产品非常好用,强烈推荐!'
) AS sentiment;
-- 返回:positive
-- 负面情感
SELECT AI_SENTIMENT(
'endpoint:qwen3-max-preview',
'质量太差了,完全是浪费钱,非常失望。'
) AS sentiment;
-- 返回:negative
-- 中性文本
SELECT AI_SENTIMENT(
'endpoint:qwen3-max-preview',
'今天下午三点有一个会议,讨论下季度的预算安排。'
) AS sentiment;
-- 返回:neutral
-- 混合情感
SELECT AI_SENTIMENT(
'endpoint:qwen3-max-preview',
'食物非常美味,但服务态度很差,等了一个小时才上菜。'
) AS sentiment;
-- 返回:mixed
多语言
-- 英文
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'This is the best purchase I have ever made!') AS sentiment;
-- 返回:positive
-- 日文
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'この製品は素晴らしいです。品質が非常に高いです。') AS sentiment;
-- 返回:positive
-- 法语
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'Ce restaurant est absolument terrible.') AS sentiment;
-- 返回:negative
-- 中英混合
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'这个product的quality真的很nice,性价比超高!') AS sentiment;
-- 返回:positive
语义理解能力
模型具备以下语义理解能力,无需额外配置:
-- 讽刺/反语识别
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'哦,真是太好了,又加班到凌晨,我真是太开心了。') AS sentiment;
-- 返回:negative(正确识别讽刺语气,而非字面正面含义)
-- 双重否定
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'这个产品并不差。') AS sentiment;
-- 返回:positive(正确理解"并不差"= 正面评价)
-- 否定句
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'我不觉得这个产品好。') AS sentiment;
-- 返回:negative
-- Emoji 情感
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview', '今天的晚餐 🤮🤮🤮') AS sentiment;
-- 返回:negative
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview', '收到礼物了 🎉❤️😍') AS sentiment;
-- 返回:positive
-- 古诗词情感
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'春风得意马蹄疾,一日看尽长安花。') AS sentiment;
-- 返回:positive
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview',
'问君能有几多愁,恰似一江春水向东流。') AS sentiment;
-- 返回:negative
批量分析表数据
SELECT
id,
review_content,
AI_SENTIMENT('endpoint:qwen3-max-preview', review_content) AS sentiment
FROM product_reviews
WHERE review_content IS NOT NULL;
情感分布统计
SELECT
sentiment,
COUNT(*) AS cnt,
ROUND(COUNT(*) * 100.0 / SUM(COUNT(*)) OVER(), 1) AS pct
FROM (
SELECT AI_SENTIMENT('endpoint:qwen3-max-preview', content) AS sentiment
FROM customer_feedback
WHERE content IS NOT NULL
)
GROUP BY sentiment
ORDER BY cnt DESC;
负面工单优先处理
SELECT ticket_id, description, created_at
FROM support_tickets
WHERE AI_SENTIMENT('endpoint:qwen3-max-preview', description) = 'negative'
ORDER BY created_at DESC
LIMIT 50;
限制说明
- model 参数必填:省略 model 参数会报错
AI function must have at least two arguments
AI function must have at least two arguments
。
- model 格式错误会报错:model 必须使用
'endpoint:<名称>'
'endpoint:<名称>'
或 '<连接名称>:<模型名称>'
'<连接名称>:<模型名称>'
格式,格式不符时报错 Invalid model coordinates
Invalid model coordinates
。
- 输入长度受模型限制:输入文本长度受底层模型 context window 限制,超长文本会被自动截断处理,不报错。
- 不支持维度级情感分析:当前仅返回整体情感,不支持按维度(如"价格"、"服务")分别分析情感。