索引
云器 Lakehouse 支持多种索引类型,用于加速不同场景下的查询过滤,减少数据扫描量。
索引类型对比
| 索引类型 | 适用查询 | 适用字段 | 典型场景 |
|---|---|---|---|
| Bloomfilter 索引 | 等值查询(、) | 高基数字段,如用户 ID、订单号 | 快速跳过不包含目标值的数据文件 |
| 倒排索引 | 全文检索()、关键词搜索 | 文本字段、JSON 字段 | 日志检索、文档搜索、多关键词过滤 |
| 向量索引 | 近似最近邻检索(ANN) | VECTOR 类型字段 | 语义搜索、图像相似度、RAG 召回 |
选型建议
- 字段是高基数的 ID 类字段,等值查询多 → Bloomfilter 索引
- 字段是文本内容,需要关键词或短语搜索 → 倒排索引
- 字段是向量嵌入,需要相似度检索 → 向量索引
- 不确定用哪个 → 参考 索引最佳实践
索引管理命令
联系我们
