数据源管理
简介
本文档旨在指导用户如何配置和管理数据源,以便在Lakehouse产品中实现高效的数据同步任务。通过本文档,您将了解如何添加不同类型的数据源,并通过SSH Tunnel连接VPC内数据源。
操作步骤
-
登录与访问数据源管理页面
首先,登录Lakehouse产品控制台。在控制台首页,选择“管理”模块,点击进入“数据源”页面。您将看到一个数据源列表,显示了当前已配置的所有数据源。
-
新建数据源
在数据源列表页面,点击右上角的“新建数据源”按钮。此时,您需要选择数据源类型。Lakehouse支持多种数据源类型,包括但不限于MySQL、Oracle、SQL Server等。
-
填写数据源定义并进行连通性测试
根据您选择的数据源类型,填写相应的连接信息。例如,对于MySQL数据源,您需要提供数据库地址、端口、用户名、密码等信息。填写完毕后,点击“测试连接”按钮,以确保所填写的信息正确无误。
通过SSH Tunnel连接VPC内数据源
前置条件
-
VPC内数据源访问限制
确保您的VPC内数据源(如阿里云RDS for MySQL数据库)仅提供内网访问。这意味着数据源不对外公开,从而提高了数据安全性。
-
SSH Tunnel服务器准备
准备一台位于VPC内的ECS服务器,该服务器应具备公网访问能力,并支持SSH登录。此外,确保数据同步服务可以通过公网访问到这台ECS服务器。
-
VPC内网络访问配置
确保VPC内的ECS服务器可以通过内网IP或域名方式访问VPC内的数据源。这将便于在建立SSH Tunnel时,数据同步服务能够顺利连接到数据源。
配置数据源连接参数
在新建数据源页面中,启用“通过SSH Tunnel连接”选项。根据页面提示,填写以下信息:
- SSH Tunnel服务器公网地址:输入VPC内ECS服务器的公网IP地址或域名。
- SSH端口:输入ECS服务器上SSH服务的端口号(默认为22)。
- SSH用户名:输入用于SSH登录的用户名。
- SSH密码:输入对应的SSH登录密码。
完成以上配置后,点击“测试连接”按钮。如果连接成功,您将看到一个绿色的勾号提示。这意味着数据同步服务在任务启动时,可以通过SSH Tunnel与VPC内数据源建立网络连接。
使用示例
示例1:连接阿里云RDS for MySQL数据库
- 在数据源类型选择页面,选择“MySQL”作为数据源类型。
- 在数据源定义页面,填写以下信息:
- 主机名:填写阿里云RDS for MySQL的内网IP地址。
- 端口:填写MySQL数据库的端口号(默认为3306)。
- 用户名:填写数据库的访问用户名。
- 密码:填写对应的用户密码。
- 启用“通过SSH Tunnel连接”选项,并填写VPC内ECS服务器的相关信息。
- 点击“测试连接”,确认连接成功后,点击“保存”按钮完成数据源配置。
示例2:连接Oracle数据库
- 在数据源类型选择页面,选择“Oracle”作为数据源类型。
- 在数据源定义页面,填写以下信息:
- 主机名:填写Oracle数据库的内网IP地址。
- 端口:填写Oracle数据库的端口号(默认为1521)。
- 用户名:填写数据库的访问用户名。
- 密码:填写对应的用户密码。
- 启用“通过SSH Tunnel连接”选项,并填写VPC内ECS服务器的相关信息。
- 点击“测试连接”,确认连接成功后,点击“保存”按钮完成数据源配置。