【AI大模型应用开发】【RAG评估】1. 通俗易懂：深度理解RAGAS评估方法的原理与应用

原创已于 2024-03-18 20:31:38 修改 · 6.3k 阅读

·

40

·

标签

#人工智能 #gpt #langchain #RAG #经验分享

于 2024-02-25 07:00:00 首次发布

大模型专栏收录该内容

152 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

大家好，我是同学小张，日常分享AI知识和实战案例

欢迎 点赞 + 关注 👏，持续学习，持续干货输出。

+v: jasper_8017 一起交流💬，一起进步💪。

微信公众号也可搜【同学小张】 🙏

本站文章一览：

在这里插入图片描述

上篇文章【AI大模型应用开发】【RAG评估】0. 综述：一文了解RAG评估方法、工具与指标，我们盘点了当前RAG系统评估的一些主流方法、工具和评估指标。本文我们针对其中的RAGAS评估方法进行详细介绍。我们将深入其原理，理解其评估指标背后是怎么实现的。都是我根据自己的理解用大白话解释，保证大家能看懂。

RAGAS论文地址：https://arxiv.org/pdf/2309.15217.pdf

文章目录

0. 简介及评估指标
1. 在LangChain中使用
2. 原理
3. 其它接口
- 3.1 批量评估 `evaluate()`
4. 总结

0. 简介及评估指标

RAGAS是一个对检索增强生成（RAG）pipeline进行无参考评估的框架。

考虑标准的RAG设置，即给定一个问题q，系统首先检索一些上下文c(q)，然后使用检索到的上下文生成答案as(q)。在构建RAG系统时，通常无法访问人工标注的数据集或参考答案，因此该工作将重点放在 完全独立且无参考的度量指标上。

该方法有四个评估指标：

评估检索质量：
- context_relevancy（上下文相关性，也叫 context_precision）
- context_recall（召回性，越高表示检索出来的内容与正确答案越相关）
评估生成质量：
- faithfulness（忠实性，越高表示答案的生成使用了越多的参考文档（检索出来的内容））
- answer_relevancy（答案的相关性）

在这里插入图片描述

1. 在LangChain中使用

1.1 首先构建你的RAG程序

了解本专栏

超级会员免费看

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

同学小张 如果觉得有帮助，欢迎给我鼓励！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。