索引

云器 Lakehouse 支持多种索引类型,用于加速不同场景下的查询过滤,减少数据扫描量。

索引类型对比

索引类型适用查询适用字段典型场景
Bloomfilter 索引等值查询(
=
=
IN
IN
高基数字段,如用户 ID、订单号快速跳过不包含目标值的数据文件
倒排索引全文检索(
MATCH
MATCH
)、关键词搜索
文本字段、JSON 字段日志检索、文档搜索、多关键词过滤
向量索引近似最近邻检索(ANN)VECTOR 类型字段语义搜索、图像相似度、RAG 召回

选型建议

  • 字段是高基数的 ID 类字段,等值查询多 → Bloomfilter 索引
  • 字段是文本内容,需要关键词或短语搜索 → 倒排索引
  • 字段是向量嵌入,需要相似度检索 → 向量索引
  • 不确定用哪个 → 参考 索引最佳实践

索引管理命令

联系我们
预约咨询
微信咨询
电话咨询