达成效果
基于自有文档创建知识库,并将其与大模型结合使用,实现检索与生成一体化的智能应用。具体的步骤 & 参考代码
获取并整理本地知识
-
知识选取: 识别并提取与工作相关的非结构化知识源,包括但不限于在线网站、PDF文档及各类问题清单。
实际操作:收集有用的需求文档,QA等,以及打印出官网的相关信息。 -
信息剔除: 对所选知识源中的无关信息进行系统化剔除,确保保留下来的内容具有高度的相关性和实用性。
实际操作:剔除代码,私人信息,未经处理的口语描述等信息 -
内容精简: 针对重复性内容进行精简与整合,去除冗余信息,以提高知识库的有效性和可用性。
实际操作:将相似内容教给大模型,剔除重复信息,保留精练的信息 -
文档处理: 对于Excel格式的问题清单,将内容转换为问答形式,确保信息结构化清晰;其他文档则按段落进行整理,形成描述性文字,便于后续查询与引用。
实际操作:统一将各种文档交给大模型进行优化。
一、上传文件
参考文件管理接口 API 上传文件,后续将用于录入知识库,注意: purpose 字段的值为 retrieval二、创建知识库
创建知识库,用于后续的文件管理,你可以将一个方向的内容录入到同一个知识库中,方便后续的管理。copy
注意保存好知识库ID,后续知识库关联文件,以及使用知识库,都是直接使用此ID
三,知识库关联文件
将文件关联到知识库中,后续就可以使用知识库 ID 进行检索,从而确保多个文件可以同时参与检索。copy
四,使用知识库进行对话补全
以下是一个基于食品热量的知识库检索的案例,你可以根据自己的需求,调整问题和答案,以及知识库的内容。copy

注意事项
- 上传文件时,
purpose字段必须填写为retrieval。有关文件上传及管理的详细信息,请参阅文档解析开发指南。 - 添加文件到知识库时,确保文件状态为 success 后,才能将其添加到知识库中。
- 在使用知识库进行对话补全时,确保在 description 中清晰描述知识库的内容;并在提示语(prompt)中,将任务描述与 description 紧密结合,以提高知识库命中的概率。