前言
调研大模型时,了解到一些大模型的应用,其中一个就是知识库,用户可以上传文档到知识库中,系统解析文档并将内容向量化保存起来,以便在和模型交互时使用。
在和大模型对话时,可以先向量化检索自己的知识库,如果命中,则返回文档内容,然后将文档内容作为大模型的输入,以便让大模型回答得更加符合我们的预期。
这里就涉及到了向量化数据的存储,可以为 PostgreSQL 安装 vector 扩展来存储向量化数据。
记录 Windows 安装 PostgreSQL 以及 vector 扩展的步骤。
下载安装
下载地址:
EDB: Open-Source, Enterprise Postgres Database ManagementEnterpriseDB provides secure, scalable database management software, enterprise-class Postgres solutions and a wide-range services with 24x7 Postgres support.https://www.enterprisedb.com/downloads/postgres-postgresql-downloads这里下载 16 的版本
下载完成后双击下载的 exe 文件进行安装
基本上都是无脑默认下一步就行了
管理员密码,务必记住
PostgreSQL默认端口是5432,但是安装引导不能设置,所以改成了5433
安装后在连接时注意修改下端口号为5433
选择中文
无脑下一步等待安装完成
pgAdmin 4
这是 pg 自带的数据库连接工具
查询示例
vector 扩展
下载地址:
vector: Open-source vector similarity search for Postgres / PostgreSQL Extension NetworkSupports L2 distance, inner product, and cosine distancehttps://pgxn.org/dist/vector/
下载后解压
解压后的根目录为 C:\Users\xxx\Downloads\vector-0.7.3(编译时在命令行会使用cd进入到这个路径,进行编译安装)
在 Windows 上编译需要先下载 Visual Studio
Visual Studio: 面向软件开发人员和 Teams 的 IDE 和代码编辑器Visual Studio 开发工具和服务让任何开发人员在任何平台和语言的应用开发都更加轻松。 随时随地免费使用代码编辑器或 IDE 进行开发。https://visualstudio.microsoft.com/zh-hans/![](https://i-blog.csdnimg.cn/direct/3c41bdc061fd4e0d9a587088ce70da31.png)
安装时勾选C++
安装完成后,使用管理员模式打开cmd,依次执行以下命令便能够完成安装
call "C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Auxiliary\Build\vcvars64.bat"
cd C:\Users\xxx\Downloads\vector-0.7.3
set "PGROOT=C:\Program Files\PostgreSQL\16"
nmake /F Makefile.win
nmake /F Makefile.win install
最后在数据库连接工具中,选中具体的数据库实例,执行以下命令,就能扩展 vector 类型了
CREATE EXTENSION vector;
版权归原作者 编程经验分享 所有, 如有侵权,请联系我们删除。