云器Lakehouse 2026年5月版本发布：拥抱 AI Agent，重塑数据智能开发新范式

数据见闻

2026年5月12日

云器 Lakehouse 新版落地 AI Agent 体系，全方位优化开发、同步与运维全链路

亲爱的用户们，还记得第一次尝试用自然语言描述一个数据需求，却不得不转身打开 Studio 手动配置任务的那一刻吗？还记得在密密麻麻的字段映射表单前发呆、在调度配置页反复核对 Cron 表达式的那份无奈吗？从那时起，我们始终在追问同一个问题：AI 究竟何时才能真正「接手」数据工程中那些耗尽精力却创造不了多少价值的重复工作？

今天，答案正在眼前清晰成形。自2025年12月至2026年5月，Lakehouse Studio 连续发布了 V1.9.3（2025.12.17）、V2.0（2026.01.30）、V2.1（2026.04.01）三个重要版本，累计推出百余项核心功能更新与优化改进，覆盖 AI Agent 能力建设、数据开发体验、同步场景拓展、工程协作规范、运维治理升级等多个核心维度。

Data Agent 从「首发试用」到「语义全面强化」，MCP Server 打通了与第三方 AI 应用的生态壁垒，企业级模型管理让 AI 能力调用走向精细治理，代码审批守护了生产环境的最后一道安全边界，IDE 智能补全与 For Each 循环任务让每一个开发动作都更聪明、更高效——这些更新，不仅仅是功能清单的延伸，更是对「数据工程师应当如何工作」这一命题的重新回答。正如我们的产品理念：改变数据的使用方式。

本文选取了部分内容进行介绍。如果期望了解更完整更新内容，请前往云器官网：**www.yunqi.tech** 了解或者在产品内直接体验使用！

更新亮点速览

AI 战略升级：从单点能力到全栈智能体系

这半年最令人振奋的主线，是云器 Lakehouse 的 AI 能力完成了从「单点突破」到「体系化落地」的跨越，形成了 Data Agent、MCP Server、企业级模型管理三位一体的 AI 战略格局。

Data Agent — 自然语言驱动数据开发全链路

Data Agent 正式从「概念」走进「日常工作流」。无需编写复杂代码，输入自然语言即可自动生成数据开发任务，完成字段映射、调度配置、SQL 建模的全套动作；任务实例失败时，实时诊断根因，大幅缩短人工排查时间。自然语言语义理解经过全面优化，AI 回答更精准，意图识别更智能，并新增用户反馈入口，遇到问题可随时直接推送给产品团队，形成快速迭代的闭环。

企业级模型管理 — AI 能力从「能用」到「可治理」

作为企业 AI 能力的统一调用与治理中枢，企业级模型管理内置限流控制、运行监控、权限隔离、成本管控，同时支持聚合云服务商托管模型与企业自有外部模型，实现多场景下的模型调用标准化、资源管控可视化、成本归因精细化。从此，AI 能力的引入不再是「黑盒」，每一次调用都有据可查、有成本可控。

MCP Server — 对话式数据工程，打破生态边界

搭载标准化 MCP 协议接口的 MCP Server 正式上线，轻松对接 Claude Desktop、Cherry Studio 等主流第三方 AI 应用，可直接调用平台的 SQL 执行、任务开发、数据集成、运维诊断等全套能力。工程师无需在多个工具之间反复切换，一句自然语言即可完成「离线同步配置 → SQL 建模 → 调度编排」全链路，让「对话式数据工程」不再停留于概念。

开发体验：更聪明的 IDE，更灵活的任务编排

IDE 迎来代码自动补全能力，表字段、表名、函数等关键信息随键入自动浮现；高级搜索支持精准/模糊搜索切换，双击表名即可查看字段详情，让数据探索与脚本编写之间的摩擦大幅降低。

任务编排也迎来质的飞跃：上下文传参让上下游任务之间的数据真正「流动」起来，For Each 循环任务让批量重复逻辑无需再手工拆分，Git 文件夹打通了与 GitLab 仓库的关联，脚本版本管理与团队协作从此纳入工程规范体系。

代码审批：生产环境的最后一道安全防线

工作空间级「强制代码审批」能力上线，开启后所有脚本提交须经指定角色审批方可发布至生产环境，彻底杜绝错误代码污染线上数据的风险。审批流程在新建工作空间时即可一键配置，轻量灵活，既不增加日常开发负担，又在关键节点筑起质量防线。

数据同步：覆盖更广，稳定更强

数据同步的覆盖半径持续拓宽。PostgreSQL、MySQL 加入目标端数据源阵列，TiDB 成为新的源端支持选项，达梦（DM）数据源正式接入，进一步扩展国产数据库支持能力。Elasticsearch 集成带来索引模糊匹配与指定字段写入主键 ID 的能力，多表离线同步支持基于 WHERE 条件的增量同步。

多表实时同步新增「性能优先 / 成本优先」写入模式，让用户根据业务场景自主决策资源策略；新增分区表支持，分区值来源于指定字段；全量同步分组策略优化，同步速度显著提升。

运维与监控：从「被动救火」到「主动治理」

计算监控能力全面升级，新增「当前规格 / 最大规格 / 最小规格 / 实际使用」四项指标的近7天数据，分析型和同步型集群同步上线负载监控，并可根据负载自动给出扩容/缩容建议，让集群资源管理从「凭感觉」变为「有依据」。

作业历史新增 Job Profile 可视化，引入 Operator 视角的 DAG 展示，性能瓶颈一目了然。监控报警新增「作业排队数」「平均排队时长」「集群负载」三项事项，可精细到工作空间或指定集群维度配置告警规则，运维团队的主动响应能力大幅提升。

展望未来

三个版本的连续迭代，勾勒出云器 Lakehouse 向 AI-Native 数据平台演进的清晰路径。Agent 不再是点缀，而是正在成为数据工程的新基础设施。展望接下来的版本，我们将在以下方向持续深耕：

➤ 多环境代码审批：从当前单环境审批迭代至开发 → 测试 → 生产完整发布流水线，满足企业级发版管控需求

➤ 更广泛的 MCP 工具覆盖：持续扩展权限治理、血缘追溯、成本分析等专项工具，打通数据平台更多核心场景

➤ Agent 能力纵深：Data Agent 从「生成任务」延伸至「自主运维」，探索更高自治度的数据工程工作流

➤ Git 集成扩展：在 GitLab 基础上逐步支持 GitHub、Gitee，满足不同团队的版本协作偏好

文内相关文档地址：

代码审批使用说明 →

https://yunqi.tech/documents/code_approval
上下文传参 →

https://yunqi.tech/documents/input_output

🎁 新用户专享福利

✅ 1 TB 存储 · 1 CRU时/天计算 · 1 年全托管体验

➤ 即刻访问云器官网领取：https://www.yunqi.tech/product/one-year-package

更多热门文章

云器科技宣布完成数亿元融资，打造多云及一体化数据平台

从 Hadoop 到 Snowflake，2023年数据平台路在何方？

生成式AI搭台，Data+Analytics唱戏 - Snowflake、Databricks 2023年度大会前瞻

改变数据的使用方式，云器科技要用新一代数据平台帮助客户“事半功倍”

对话贾扬清、关涛、张伯翰：AI 平民化趋势下，数据架构将被彻底颠覆？

云器Lakehouse现已开放注册

欢迎申请体验，每个账号开通会获赠一定金额的代金券，助您快速试用体验。如需更多代金券额度，请您联系商务获取。

快速注册