通义灵码能够结合企业知识库的私域数据,生成贴合企业特点的回答。充分发挥检索增强技术的优势,构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。
前提条件
-
适用版本:通义灵码企业标准版、通义灵码企业专属版。
-
适用人员:通义灵码管理员、组织内全局管理员(专属版)。
场景介绍
通义灵码虽然具备广泛的通用知识,但缺乏企业独有的专业知识和数据。通过引入企业知识库,可以帮助模型更精准地理解私域知识,以便生成更加贴合企业特色的个性化回答。通义灵码能够基于知识库进行自由问答,代码优化与生成,广泛应用于企业规范检查、技术支持等多个场景。
例如:
-
智能自由问答场景:企业技术新人入职问答、企业安全合规规范问答、产品运维故障排查咨询、企业内部平台、API使用问答等。
-
代码优化与生成场景:根据企业编码规范,确保代码风格的一致性与规范性;根据安全规范文档检查代码漏洞,并提出修复建议等。
为了最大程度发挥生成的效果,需要从两个方面进行实践。一方面是构建高质量的知识库,确保知识数据的质量;另一方面是清晰的知识库权限分配,确保知识库的可见范围符合预期。为此知识库管理员需要:
-
提供 AI 友好的、高质量的知识数据,如文档或代码等,陈旧或不准确的信息不仅无法带来增益,反而可能会误导模型,影响回答的准确性;
-
构建一个结构合理、权限隔离的知识库。这不仅保障了数据的隐私和隔离,还保障了知识库的易管理性和可维护性。权限管理混乱的知识库可能会引发数据安全等问题。
构建高质量知识库
通义灵码的企业知识库问答功能,目前已支持通过文档上传的形式,将其转化为检索增强的知识数据,本章节将重点介绍文档类知识数据的准备原则和方法。如需了解代码类请参见。
文档格式要求
-
格式:支持PDF、CSV、DOCX、TXT、Markdown格式,优先推荐使用Markdown格式。
-
大小:每次最多上传10个 文件,单文件大小不超过 10MB。
单个文档规范
单个文档需要从名称、标题、格式、内容方面检查是否符合文档规范

详细说明与示例如下:
文档类型与命名
-
类型:推荐使用Markdown格式。相较于Word和PDF,我们推荐使用Markdown格式以获得更佳的文档处理效果。
-
编码:推荐使用UTF-8编码,以确保字符兼容性最佳。
-
文档命名:文档名用词简洁明了,不同命名之间应有明显差异,便于模型理解。避免使用含义不明的英文缩写、数字或符号。
反例
正例


1475

被折叠的 条评论
为什么被折叠?



