AWS DocumentDB 数据源配置指南
概述
AWS DocumentDB(兼容 MongoDB)是 Amazon Web Services 提供的完全托管的文档数据库服务,它在云中提供了 MongoDB 兼容的数据库引擎。通过配置 AWS DocumentDB 数据源,您可以轻松实现与其他系统的数据同步和集成,享受云原生数据库的高可用性、可扩展性和安全性。
参数配置
配置 AWS DocumentDB 数据源时,需要提供以下信息以确保成功连接到数据库:
基础配置
- 数据源名称(必填):为您的 AWS DocumentDB 数据源指定一个唯一且易于识别的名称。建议使用有意义的命名规则,例如"行为数据数据源",以便后续管理和维护。
- URL地址(必填):提供 AWS DocumentDB 集群的连接端点地址,格式为
hostname:port。例如:docdb-example.cluster-abc123.us-east-1.docdb.amazonaws.com:27017。该地址可以在 AWS 控制台的 DocumentDB 集群详情页面中获取。
认证信息
- 用户名(必填):提供用于连接 AWS DocumentDB 的主用户名或具有相应权限的数据库用户。默认主用户名通常为
admin,您也可以使用自定义创建的用户。 - 密码(必填):提供对应用户名的数据库密码。请确保密码的安全性,避免使用弱密码。系统会对密码进行加密存储。
安全配置
- CA证书(可选):AWS DocumentDB 默认启用 TLS 加密连接以确保数据传输安全。如果您的集群启用了 TLS,需要上传 AWS 提供的 CA 证书文件(rds-combined-ca-bundle.pem)。请点击"上传文件"按钮选择本地的 CA 证书文件。
连接方式
-
通过SSH Tunnel连接(可选):为了提高安全性,特别是当 DocumentDB 集群位于私有 VPC 中时,您可以选择通过 SSH 隧道连接。启用此选项后,数据将通过安全的 SSH 通道传输到 DocumentDB。您需要提供一台具有公网访问能力且能够访问 DocumentDB 集群的跳板机信息:
- SSH 服务器的 IP 地址
- SSH 端口(默认 22)
- SSH 用户名和密钥或密码
其他配置
- 数据源描述(可选):为数据源添加描述性信息,例如"生产环境用户行为数据库",以帮助您或其他管理员理解该数据源的用途、环境或业务场景。
授权访问工作空间
- 指定工作空间:仅授权特定工作空间使用此数据源,适用于需要严格权限控制的场景。
- 全部工作空间(推荐):允许所有工作空间使用此数据源,便于跨团队协作和数据共享。
连接配置说明
网络访问配置
根据您的 AWS DocumentDB 部署架构,可以选择以下连接方式:
1. 公网直连(需配置 VPC 和安全组)
如果您的 DocumentDB 集群配置了公网访问(通过 VPN 或 Direct Connect),确保:
- DocumentDB 集群的安全组入站规则允许数据集成平台的出口 IP 地址访问 27017 端口
- VPC 网络 ACL 规则允许相应的流量通过
- 具体的平台出口 IP 地址列表,请联系技术支持人员获取
2. 通过 SSH 隧道连接(推荐)
对于位于私有 VPC 中的 DocumentDB 集群,强烈推荐使用 SSH 隧道方式:
- 在与 DocumentDB 集群相同的 VPC 中部署一台 EC2 实例作为跳板机
- 该 EC2 实例需要具有公网 IP 或弹性 IP
- 确保 EC2 实例的安全组允许来自数据集成平台的 SSH 连接(22 端口)
- DocumentDB 集群的安全组需允许来自 EC2 实例的访问(27017 端口)
- 这种方式可以避免将 DocumentDB 直接暴露在公网,提高安全性
连接测试
完成所有配置后,点击页面底部的"测试连接"按钮验证连接配置:
- 系统将尝试使用提供的参数连接到 AWS DocumentDB 集群
- 验证网络可达性、认证信息和权限设置
- 测试成功后,您可以保存数据源配置并在数据同步任务中使用
注意事项
安全性建议
- TLS 加密:AWS DocumentDB 默认启用 TLS,强烈建议保持启用状态并上传正确的 CA 证书,确保数据传输加密。
- 最小权限原则:为数据同步创建专用的数据库用户,仅授予必要的读写权限,避免使用主账户。
- 密码管理:定期更换数据库密码,避免在多个系统中重复使用相同密码。
- 网络隔离:优先使用 SSH 隧道或 VPC 私有连接,避免将数据库直接暴露在公网。
性能优化
- 连接池配置:系统会自动管理连接池,确保高效的连接复用。
- 网络延迟:选择与 DocumentDB 集群相同区域的数据集成服务,以降低网络延迟。
- 读取性能:对于大规模数据同步,可以考虑从副本实例读取数据,减轻主实例压力。
运维建议
- 监控同步状态:定期检查数据同步任务的运行状态和日志,及时发现并解决潜在问题。
- 备份策略:确保 DocumentDB 集群已配置自动备份,避免数据丢失风险。
- 版本兼容性:注意 AWS DocumentDB 的版本与 MongoDB 协议的兼容性,某些高级特性可能存在差异。
- 配额限制:了解 AWS DocumentDB 的连接数、存储容量等配额限制,避免超限导致服务中断。
故障排查
如果连接测试失败,请检查以下常见问题:
- 网络连通性:使用
telnet或nc命令测试从数据集成平台到 DocumentDB 的网络连通性 - 安全组配置:确认 DocumentDB 和 EC2(如使用 SSH 隧道)的安全组规则正确配置
- 认证信息:验证用户名和密码是否正确,用户是否具有访问目标数据库的权限
- CA 证书:如果启用 TLS,确保上传的 CA 证书文件有效且未过期
- SSH 配置:如使用 SSH 隧道,验证跳板机的 SSH 服务是否正常,密钥或密码是否正确
完成配置
完成所有参数配置并通过连接测试后,您就可以:
- 在数据同步任务中选择此 AWS DocumentDB 数据源
- 配置具体的集合(Collection)和字段映射
- 设置数据同步的调度策略和增量更新规则
- 执行数据的导入或导出操作
联系我们
