数据类型
云器 Lakehouse 支持数值、字符串、时间、布尔、二进制及复杂类型(ARRAY、MAP、STRUCT、JSON、VECTOR、BITMAP),兼容 MySQL、PostgreSQL、Hive 等常见类型别名,迁移过来的 DDL 脚本无需手动替换类型名。
类型速查
数值类型
| 类型 | 存储 | 适用场景 |
|---|---|---|
| 1 字节 | 状态码、枚举值 |
| 2 字节 | 年份、小范围计数 |
| 4 字节 | 通用整数 ID、计数 |
| 8 字节 | 大规模 ID、毫秒时间戳 |
| 4 字节 | 低精度浮点,科学计算 |
| 8 字节 | 高精度浮点,统计分析 |
| 可变 | 金额、精确计算(推荐) |
字符串类型
| 类型 | 长度 | 适用场景 |
|---|---|---|
| 固定,最大 255 | 固定长度编码(国家码、状态码) |
| 可变,最大 1,048,576 | 有长度上限的字段(用户名、邮箱) |
| 无限制 | 长文本、JSON 字符串(推荐) |
时间类型
| 类型 | 时区 | 适用场景 |
|---|---|---|
| 无 | 日期维度、生日 |
| 含时区(UTC 存储) | 跨时区事件时间、日志时间戳 |
| 无时区(原样存储) | 本地业务时间,不做时区转换 |
| — | 时间差、日期加减运算 |
其他基础类型
| 类型 | 说明 |
|---|---|
| / / |
| 二进制字节序列 |
复杂类型
| 类型 | 说明 | 适用场景 |
|---|---|---|
| 同类型元素的有序集合 | 标签列表、多值属性 |
| 键值对集合 | 动态属性、配置项 |
| 固定字段的嵌套结构 | 地址、坐标等结构化嵌套 |
| 半结构化 JSON 文档 | 灵活 Schema、事件属性 |
| 固定维度浮点向量 | Embedding 存储、向量检索、RAG |
| 压缩整数集合(Roaring Bitmap) | UV 统计、用户标签圈选 |
本章内容
| 页面 | 说明 |
|---|---|
| 数据类型概述 | 各类型完整说明、类型别名对照、迁移兼容性 |
| 数据类型转化 | 显式转换(CAST / )和隐式转换规则 |
| 数值类型 | TINYINT / SMALLINT / INT / BIGINT / FLOAT / DOUBLE / DECIMAL 详细说明 |
| 字符串类型 | CHAR / VARCHAR / STRING 对比与选型 |
| 时间类型 | DATE / TIMESTAMP / TIMESTAMP_NTZ / INTERVAL 对比与选型 |
| BINARY | 二进制类型说明 |
| BOOLEAN | 布尔类型说明 |
| ARRAY | 数组类型语法与函数 |
| MAP | 键值对类型语法与函数 |
| STRUCT | 嵌套结构类型语法与函数 |
| JSON | JSON 类型语法、字段访问、查询示例 |
| VECTOR | 向量类型语法、维度配置、向量索引使用 |
| BITMAP | 位图类型语法、集合运算函数参考 |
相关文档
| 文档 | 说明 |
|---|---|
| 数据类型转换指南 | 从 MySQL / PostgreSQL / Hive 迁移时的类型对照 |
| TIMESTAMP_NTZ 详解 | 无时区时间戳的详细说明和使用场景 |
| CREATE TABLE | 建表时使用各数据类型的完整语法 |
联系我们
