版本发布说明 2026-06-15
本次发布 (Release 2026.06.15), 我们引入了一系列新功能、增强特性以及修复项。请注意,这些更新将分阶段逐步推送至以下区域,更新将在发布日起一至两周内完成,具体时间取决于您所在的区域。
-
国内区域
- 阿里云(上海)
- 腾讯云(上海/北京/广州)
- AWS(北京)
- 阿里云(杭州)
-
国际区域
- 阿里云(新加坡)
- AWS(新加坡)
新功能特性
AI Function
在 SQL 中直接调用大模型,无需 Python 或外部服务,对每行数据完成模型调用后结果直接出现在查询结果集里。新增/完善以下函数,详见 AI Function概述:
| 函数 | 功能 |
|---|---|
| 通用多模态处理 |
| 文本分类 |
| 文本提取 |
| 文本语法纠错 |
| 关键信息脱敏 |
| 情感分析 |
| 文本语义相似度 |
| 文本摘要 |
| 语音/音频转文字 |
| 多语言翻译 |
| 生成文本向量嵌入 |
行级权限(Row-Level Security)
- 支持通过 SQL UDF 定义行级过滤函数,绑定到表后自动应用于所有涉及该表的查询
- 过滤条件在执行计划中下推至 TableScan 层,性能无额外开销
- 支持与业务 WHERE 条件叠加使用
- 支持随时解绑(
)恢复全量访问ALTER TABLE t DROP ROW FILTER
存储与表格式
- Lance Format 外部表:支持将存储在对象存储(OSS)上的 Lance 数据集挂载为外部表,无需数据迁移即可在 SQL 中执行向量相似度搜索。Lance 是专为机器学习设计的列式存储格式,原生支持向量数据和 ANN 索引,适用于向量检索、图像/文本语义搜索、RAG 知识库查询等场景。支持 cosine_distance、l2_distance 向量距离函数,可与标量过滤条件组合使用。详见 Lance外部表
自定义分词库
- 支持通过用户自定义词典对中文文本进行分词,适用于行业专有名词(如企业名称、产品名称、专业术语)无法被标准分词器正确切分的场景。
开发者工具
- cz-cli(ClickZetta CLI):正式发布面向命令行和 AI Agent 的操作工具,覆盖连接管理、SQL 执行、Schema/表管理、Studio 任务开发、运行巡检、Job 诊断等完整链路。详见 cz-cli 安装配置指南,支持 macOS、Linux、Windows,可通过 npm 安装:
- 核心能力包括:
- 连接管理:通过 Profile 管理多环境连接(生产、测试、UAT),支持用户名密码、JDBC 串、Personal Access Token 三种认证方式。
- SQL 执行:支持同步(--sync)和异步两种模式,写操作需显式加 --write 防止误操作。
- Studio 任务运维:支持创建、保存、配置调度、发布、手动执行任务,以及查看运行记录、日志和失败重跑。
- AI Agent 集成:可作为 Codex、Claude Code、Cursor 等 AI Agent 的 ClickZetta 操作入口,通过 cz-cli agent run 接受自然语言指令,通过 cz-cli ai-guide 生成供 Agent 使用的命令说明。
- 输出格式:默认 JSON,支持 --output table、--output csv 等格式,便于脚本和自动化集成。
问题修复
Dynamic Table
- 支持秒级实时化,实现秒级更新写入可见及实时分析
- 修复 Dynamic Table refresh 类型删除后 maintain service 仍提交 refresh 的问题
Checkpoint 性能优化
- Physical Meta 数据库存储优化,优化大表 Checkpoint 耗时,降低冗余
- Checkpoint 复用 manifest,减少重复 I/O
Catalog Connection Validation
- 新增支持 Databricks Unity Catalog 及 Iceberg REST Catalog 的连接验证
SQL 语法
语法兼容性完善LIMIT ... OFFSET- 倒排索引支持
类型array<int>
查询优化器增强
- 特定函数支持配置倾向于先计算再 shuffle
- 优化器支持 decimal(54,18) 高精度类型
- 优化多key 的 distinct agg 不下推 partial agg
- 优化broadcast inner join 在无 NDV 场景下 shuffle 行为更谨慎
- 优化分区外表默认开启 Stats 收集
Coordinator 优化
- 支持 Coordinator 动态调整作业槽位数,提升资源利用率
- Coordinator 心跳针对高并发场景优化
OP License 优化
- 修改 OP License 控制策略,适配容器云等不提供 VM 管理权限的部署环境
函数兼容性
Split 函数 Index 兼容 Presto
- 修复 Split 函数 index 从 0 开始改为兼容 Presto 从 1 开始的行为
to_date
函数兼容 DataWorks 格式
to_date
函数兼容 DataWorks 的to_date
格式yyyymmdd
json_extract 数组行为修复
数组json_extract
返回结果行为修正*
联系我们
