混合搜索中的条件下压需求

也许你听说过“如何下压过滤条件到混合搜索中” 这样的技术讨论,它的需求来源是什么呢?

举个例子,Glean 是一个企业 AI 搜索软件,它能够非常高质量地针对用户自然查询语言搜出符合要求的文档,并且,这些文档都是用户有权限访问的文档。没有权限的文档,一个也看不到。

怎么做到的呢?

企业里会构建出一个唯一的文档向量索引。自然语言搜索会用到向量索引,企业会基于所有文档构建出一个统一的向量索引出来,对于用户小余来说,它实际有权限访问的,只是里面很少的一部分。

企业里有一个文档权限表,里面详细记录了小余有权限访问的文档 ID。

查询期间,我们可以带上访问权限 ID 列表,或者带上基于这个列表生成的位图,去搜索向量索引。通过这个位图,我们可以极大地降低向量计算量,跳过不必要的计算。

在这里插入图片描述

总结:最大的下压需求来源是权限控制

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值