亲爱的用户们,还记得第一次尝试用自然语言描述一个数据需求,却不得不转身打开 Studio 手动配置任务的那一刻吗?还记得在密密麻麻的字段映射表单前发呆、在调度配置页反复核对 Cron 表达式的那份无奈吗?从那时起,我们始终在追问同一个问题:AI 究竟何时才能真正「接手」数据工程中那些耗尽精力却创造不了多少价值的重复工作?
今天,答案正在眼前清晰成形。自2025年12月至2026年5月,Lakehouse Studio 连续发布了 V1.9.3(2025.12.17)、V2.0(2026.01.30)、V2.1(2026.04.01)三个重要版本,累计推出百余项核心功能更新与优化改进,覆盖 AI Agent 能力建设、数据开发体验、同步场景拓展、工程协作规范、运维治理升级等多个核心维度。
Data Agent 从「首发试用」到「语义全面强化」,MCP Server 打通了与第三方 AI 应用的生态壁垒,企业级模型管理让 AI 能力调用走向精细治理,代码审批守护了生产环境的最后一道安全边界,IDE 智能补全与 For Each 循环任务让每一个开发动作都更聪明、更高效——这些更新,不仅仅是功能清单的延伸,更是对「数据工程师应当如何工作」这一命题的重新回答。正如我们的产品理念:改变数据的使用方式。
本文选取了部分内容进行介绍。如果期望了解更完整更新内容,请前往云器官网:**www.yunqi.tech** 了解或者在产品内直接体验使用!
更新亮点速览
AI 战略升级:从单点能力到全栈智能体系
这半年最令人振奋的主线,是云器 Lakehouse 的 AI 能力完成了从「单点突破」到「体系化落地」的跨越,形成了 Data Agent、MCP Server、企业级模型管理三位一体的 AI 战略格局。
Data Agent — 自然语言驱动数据开发全链路
Data Agent 正式从「概念」走进「日常工作流」。无需编写复杂代码,输入自然语言即可自动生成数据开发任务,完成字段映射、调度配置、SQL 建模的全套动作;任务实例失败时,实时诊断根因,大幅缩短人工排查时间。自然语言语义理解经过全面优化,AI 回答更精准,意图识别更智能,并新增用户反馈入口,遇到问题可随时直接推送给产品团队,形成快速迭代的闭环。
企业级模型管理 — AI 能力从「能用」到「可治理」
作为企业 AI 能力的统一调用与治理中枢,企业级模型管理内置限流控制、运行监控、权限隔离、成本管控,同时支持聚合云服务商托管模型与企业自有外部模型,实现多场景下的模型调用标准化、资源管控可视化、成本归因精细化。从此,AI 能力的引入不再是「黑盒」,每一次调用都有据可查、有成本可控。
MCP Server — 对话式数据工程,打破生态边界
搭载标准化 MCP 协议接口的 MCP Server 正式上线,轻松对接 Claude Desktop、Cherry Studio 等主流第三方 AI 应用,可直接调用平台的 SQL 执行、任务开发、数据集成、运维诊断等全套能力。工程师无需在多个工具之间反复切换,一句自然语言即可完成「离线同步配置 → SQL 建模 → 调度编排」全链路,让「对话式数据工程」不再停留于概念。
开发体验:更聪明的 IDE,更灵活的任务编排
IDE 迎来代码自动补全能力,表字段、表名、函数等关键信息随键入自动浮现;高级搜索支持精准/模糊搜索切换,双击表名即可查看字段详情,让数据探索与脚本编写之间的摩擦大幅降低。
任务编排也迎来质的飞跃:上下文传参让上下游任务之间的数据真正「流动」起来,For Each 循环任务让批量重复逻辑无需再手工拆分,Git 文件夹打通了与 GitLab 仓库的关联,脚本版本管理与团队协作从此纳入工程规范体系。
代码审批:生产环境的最后一道安全防线
工作空间级「强制代码审批」能力上线,开启后所有脚本提交须经指定角色审批方可发布至生产环境,彻底杜绝错误代码污染线上数据的风险。审批流程在新建工作空间时即可一键配置,轻量灵活,既不增加日常开发负担,又在关键节点筑起质量防线。
数据同步:覆盖更广,稳定更强
数据同步的覆盖半径持续拓宽。PostgreSQL、MySQL 加入目标端数据源阵列,TiDB 成为新的源端支持选项,达梦(DM)数据源正式接入,进一步扩展国产数据库支持能力。Elasticsearch 集成带来索引模糊匹配与指定字段写入主键 ID 的能力,多表离线同步支持基于 WHERE 条件的增量同步。
多表实时同步新增「性能优先 / 成本优先」写入模式,让用户根据业务场景自主决策资源策略;新增分区表支持,分区值来源于指定字段;全量同步分组策略优化,同步速度显著提升。
运维与监控:从「被动救火」到「主动治理」
计算监控能力全面升级,新增「当前规格 / 最大规格 / 最小规格 / 实际使用」四项指标的近7天数据,分析型和同步型集群同步上线负载监控,并可根据负载自动给出扩容/缩容建议,让集群资源管理从「凭感觉」变为「有依据」。
作业历史新增 Job Profile 可视化,引入 Operator 视角的 DAG 展示,性能瓶颈一目了然。监控报警新增「作业排队数」「平均排队时长」「集群负载」三项事项,可精细到工作空间或指定集群维度配置告警规则,运维团队的主动响应能力大幅提升。
展望未来
三个版本的连续迭代,勾勒出云器 Lakehouse 向 AI-Native 数据平台演进的清晰路径。Agent 不再是点缀,而是正在成为数据工程的新基础设施。展望接下来的版本,我们将在以下方向持续深耕:
➤ 多环境代码审批:从当前单环境审批迭代至开发 → 测试 → 生产完整发布流水线,满足企业级发版管控需求
➤ 更广泛的 MCP 工具覆盖:持续扩展权限治理、血缘追溯、成本分析等专项工具,打通数据平台更多核心场景
➤ Agent 能力纵深:Data Agent 从「生成任务」延伸至「自主运维」,探索更高自治度的数据工程工作流
➤ Git 集成扩展:在 GitLab 基础上逐步支持 GitHub、Gitee,满足不同团队的版本协作偏好
文内相关文档地址:
-
代码审批使用说明 →
-
上下文传参 →
🎁 新用户专享福利
✅ 1 TB 存储 · 1 CRU时/天计算 · 1 年全托管体验
➤ 即刻访问云器官网领取:https://www.yunqi.tech/product/one-year-package


