作者:厦门大学信息学院计算机科学系2023级研究生 黄万嘉
指导老师:厦门大学数据库实验室 林子雨 博士/副教授
在构建本地知识库时,通常会结合 Page Assist 和 nomic-embed-text,常见的方案为:
- 使用 nomic-embed-text 模型将知识库文档向量化。
- 当用户提问时,将问题向量化并与知识库中的文档向量进行相似性匹配,找到最相关的上下文。
- 将检索到的上下文输入大语言模型(如 DeepSeek),生成最终的回答
Page Assist提供了一个本地大模型的Web UI,同时也提供了方便的RAG设置,使得我们更快捷地构建本地知识库,基于此,本文采用Page Assist,基于DeepSeek大模型,实现了用户提供本地知识库(.pdf/.csv/.docx/.md),大模型进行更加专业地回复。
page assist安装
1. 应用商店安装
page assist可以通过Chorme应用商店直接安装,找到 Page Assist 后,点击“添加到 Chrome”或“安装”按钮,确认安装。
但由于网络因素,较难访问成功该网址,因此建议使用手动安装的方式
2. 手动安装(推荐)
通过网盘下载Page Assist插件,下载完成后,打开chrome浏览器,在浏览器的扩展程序找到管理扩展程序页面,启用开发者模式。
之后将下载的page assist插件拖入扩展中心,浏览器会自动识别并开始安装。
安装完毕后,你就能在浏览器的扩展列表里看到Page Assist,之后我们点击插件旁的订书钉按钮,将其固定住
固定住的插件会直接显示在显示器地址栏右侧,我们点击Page Assist按钮即可进入到web ui界面
3.在page assist中使用DeepSeek
进入page assist的web ui界面后,我们点击设置,配置好使用的模型
选择deepseek-r1-1.5b作为当前模型,可以看到,此时已能使用Deepeeek大模型进行对话。
构建本地知识库
1.下载nomic-embed-text
nomic-embed-text 是一种高效的文本嵌入模型,能够将文本转换为高质量的向量表示。借助 nomic-embed-text 可以实现文本的向量化(Embedding),这是检索增强生成(RAG)技术中的关键步骤。
可以在Ollama中下载nomic-embed-text
在命令行窗口键入以下命令下载nomic-embed-text:
ollama pull nomic-embed-text
2. 更改RAG设置并添加知识
之后来到Page Assist的Web UI界面,将RAG设置中的Embedding Model设置为我们在Ollama中下载的nomic-embed-text,并保存
之后可以在知识管理中添加本地知识
这里以DeepSeek发布的两篇技术文档为例:
添加之后,可以在对话框中选择添加的知识,大模型会根据你提供的知识库进行更贴切的回复
这样就完成了个人知识库的构建,用户可以添加更多的文件,或者采取更强力的大模型(7b/32b/70b……),获得更加精确和专业的回复。