基于高熵超平面簇的大规模数据局部敏感哈希搜索方法
本发明公开基于高熵超平面簇的大规模数 据局部敏感哈希搜索方法,分为两个阶段:(1 )索 引构建:首先 ,采用矢量量化方法对数据分布进 行估测 ,并在量化信息基础上构建一组分割数据 的候选超平面;其次,利用分布估计算法根据最 大熵原则对候选超平面进行筛选,得到多组高熵 超平面簇;最后,利用高熵超平面簇作为投影矢 量 ,为分布在超平面两侧的数据点赋予不同的哈 希编码,形成多组高质量的数据索引字典;(2)查 询阶段:首先,计算查询点在所有哈希字典中的 编码映射;其次,根据查询点的哈希编码,找到具 有相同哈希编码的数据索引集;最后,对返回的 索引集过滤得到质量最高的查询结果。本发明具 有较高的索引编码效率 ,相同编码长度下具有更 高精确度和召回率。
- 2021-06-20
- 阅读65
- 下载0
- 24页
- pdf