‌Rerank模型介绍

最新推荐文章于 2026-05-14 20:55:11 发布

原创最新推荐文章于 2026-05-14 20:55:11 发布 · 564 阅读

6 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能

该文章已生成可运行项目，

Rerank模型是一种用于优化信息检索结果排序的机器学习模型，通过精细化评估文档与查询的相关性，提升最终结果的准确性和语义匹配度。以下是具体介绍：

定义与定位：Rerank模型属于重排序算法，作用于初步检索之后，对候选文档进行二次筛选和排序。在检索增强生成（RAG）流程中，常与Embedding模型配合使用，形成“粗筛+精排”的协同机制。
核心作用：可弥补传统检索方法，如倒排索引或Embedding相似度计算，在语义理解深度上的不足。通过多维度评估，如语义一致性、上下文关联性等对文档重新打分，确保高相关性的内容优先展示，提升结果质量。
工作原理：基于大量正确与不正确的查询-文档对，利用监督学习进行训练。模型学习最大化正确对的分数、最小化错误对的分数。实际应用时，输入查询和文档，模型直接输出两者的匹配分数，并依此对文档进行排序。
核心技术分类：
- Point - wise：独立评估每个文档与查询的相关性，生成独立分数并排序。
- Pair - wise：比较两个文档与查询的相对相关性，通过排序算法生成全局顺序。
- List - wise：直接对整个文档列表进行全局排序，需要模型具备长上下文理解能力。
主流模型举例：
- LRL（Listwise Reranker with LLM）：利用大语言模型（LLM）的全局上下文理解能力，直接生成文档ID序列。但受限于LLM的输入长度，需采用滑动窗口分块处理。
- RankVicuna：基于开源LLM如Vicuna - 7B微调，通过知识蒸馏将RankGPT - 3.5的能力迁移到小模型，性价比高。
- PRP（Pairwise Ranking Prompting）：设计三元组输入（查询+文档对），通过LLM判断两文档的相对相关性。有PRP - AllPair、PRP - Sorting、PRP - Sliding - K等变体，可应对不同场景。
- BGE - Reranker系列：由智源研究院推出，基于XLM - RoBERTa架构微调，支持多语言和长文本，在BEIR基准测试中表现优异，支持指令微调。
应用场景：Rerank模型广泛应用于信息检索领域，如百度搜索会根据用户个性化进行Rerank重排序，大众点评会在客户端根据用户喜好对服务端检索结果进行Rerank重排序。此外，在RAG流程中更是发挥着关键作用，能为后续LLM生成答案提供更优质的文档，提升答案的准确性和效率。

本文章已经生成可运行项目