【大模型系列篇】本地问答系统-部署Ollama、Open WebUI

部署本地大模型，结合Ollama、Open WebUI以及本地RAG（Retrieval-Augmented Generation）可以为用户提供一个强大的本地知识库和交互式对话系统。以下是详细的部署步骤和功能介绍：

一、部署Ollama

访问Ollama官网：首先，你需要访问Ollama的官方网站（https://ollama.com），在这里你可以找到适合你操作系统的安装包。
下载并安装：下载对应的安装包后，直接进行安装。Ollama的安装过程非常简单，没有复杂的配置选项。
拉取大模型：在Ollama官网的Models页面，你可以找到多种可下载的模型。例如，Meta的Llama27b版本只需要大约8GB的内存即可运行。如果你的硬件条件允许，可以选择更大的模型，如13b或70b版本，分别需要16GB和64GB的内存。
运行模型：通过在终端中运行ollama run qwen2:7b等命令，你可以自动下载并运行相应的模型。

为了屏蔽系统处理器架构，可以选择docker进行安装部署

docker pull ollama/ollama
docker run -d --restart=always -v /home/docker/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

这将在后台运行一个名为 “ollama” 的容器，并将 /home/docker/ollama 目录挂载到容器内的 /root/.ollama 目录，同时将容器内的端口 11434 映射到宿主机的端口 11434。

二、部署Open WebUI

安装Docker Desktop：由于Open WebUI是基于Windows部署的，你需要先安装Docker Desktop。可以从Docker官网下载并安装Docker Desktop。
运行Open WebUI：安装Docker Desktop后，通过运行如下命令来安装WebUI：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

访问WebUI：安装完成后，通过在浏览器地址栏输入