FinGLM_ChatGLM反卷总局方案

本文介绍了如何利用ChatGLM和LLM技术进行数据库字段问题快速回答、泛化和文档问答,涉及表格数据抽取、PDF内容解析、Elasticsearch索引创建及基于LLM的文档检索增强方法,以提升公司综合问题处理效率。

ChatGLM反卷总局

https://www.bilibili.com/video/BV1hu4y147EW/?spm_id_from=333.337.search-card.all.click&vd_source=b3aaf2cdc79875f83fdd149e1178ce26

容器
镜像:registry.cn-shanghai.aliyuncs.com/fjzj/chatglm_fjzj:v6

总体架构

1、基于正则分类与抽取关键词的方式,实现数据库字段高频问题的快速回答
2、基于LLM抽取关键词的方式,实现与数据库字段相似问题的泛化
3、基于LLM文档问答的方式,实现数据库字段外问题的兜底
亮点:
1、使用In-Context Learning的方式抽取关键词,无需微调,保留大模型的通用能力
2、通过分块文本增加标题信息,以及LLM关键词的召回增强的方法,显著提升回答公司综合问题的效果
image-42

表格数据抽取

image-43

process_data:pdf2excel

A榜:2000条数据

txt_extract_info: go

结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值