前提条件
- 已安装宝塔面板
操作步骤
DeepSeek 可以使用CPU进行推理,但是推荐使用NVIDIA GPU加速,文末将介绍如何使用NVIDIA GPU加速。
- 登录宝塔面板,点击左侧菜单栏中的
Docker
,进入Docker容器管理界面。 - 首次使用Docker需要先安装Docker,点击
安装
。 - 在Docker-应用商店-AI/大模型分类中找到Ollama,点击
安装
。 - 配置默认即可,点击
确定
。 - 等待安装完成,状态变为
运行中
。如您需要使用NVIDIA GPU加速,请参考文末的使用NVIDIA GPU加速配置完成后再继续。
- 在
宝塔面板-Docker-容器
界面中找到Ollama容器,点击终端
。 - 在弹出
shell类型
选择bash
,点击确认
。 - 在终端界面中输入
ollama run deepseek-r1:1.5b
,回车运行DeepSeek-R1模型。DeepSeek-R1模型有多个版本,可以根据需要选择不同版本,例如
ollama run deepseek-r1:671b
,详情如下(模型参数越大,需要配置越高):BASH
# DeepSeek-R1
ollama run deepseek-r1:671b
# DeepSeek-R1-Distill-Qwen-1.5B
ollama run deepseek-r1:1.5b
# DeepSeek-R1-Distill-Qwen-7B
ollama run deepseek-r1:7b
# DeepSeek-R1-Distill-Llama-8B
ollama run deepseek-r1:8b
# DeepSeek-R1-Distill-Qwen-14B
ollama run deepseek-r1:14b
# DeepSeek-R1-Distill-Qwen-32B
ollama run deepseek-r1:32b
# DeepSeek-R1-Distill-Llama-70B
ollama run deepseek-r1:70b - 等待下载并运行,当看到如下提示表示DeepSeek-R1模型运行成功。
- 你可以在界面中输入文本并回车,开启与DeepSeek-R1模型的对话。
- 你可以在界面中输入
/bye
并回车,退出DeepSeek-R1模型。在终端内对话看起来是不是有点麻瓜?别担心,接下来让我们来安装OpenWebUI
,在浏览器中更直观地与DeepSeek-R1模型对话 - 在
宝塔面板-Docker-容器
界面中找到Ollama容器,点击Ollama右侧的管理
,进入容器管理界面,获取容器IP,保存备用。 - 在宝塔面板Docker-应用商店-AI/大模型分类中找到OpenWebUI,点击
安装
。 - 按一下说明,配置相关信息,点击
确定
。- web端口:访问OpenWebUI的端口,默认为
3000
,根据需要自行修改 - ollama地址:填写
http://刚刚获取的Ollama容器IP:11434
,例如http://172.18.0.2:11434
- WebUI Secret Key:用于 API 访问的密钥,可以自定义,例如
123456
其他配置默认即可
- web端口:访问OpenWebUI的端口,默认为
- 配置完点击确认,等待安装完成,状态变为
运行中
。由于OpenWebUI启动后需要加载相关服务,请在状态变为运行中
后等待5-10分钟再访问。 - 在浏览器中输入
http://服务器IP:3000
,例如http://43.160.xxx.xxx:3000
,进入OpenWebUI界面。请在访问前确保云厂商服务器防火墙已放行3000端口,可以在云厂商控制台中设置。 - 点击
开始使用
,设置管理员相关信息,并点击创建管理员账号
。 - 创建完成后会自动进入管理界面,现在你可以在浏览器中更直观地与DeepSeek-R1模型对话了。
- 你可以在左上角切换模型,选择不同模型进行对话,也可以在左侧菜单栏中查看历史对话记录。
- 你可以在右上角点击
头像
,进入管理员面板,在设置-模型
中查看当前模型列表,或添加新模型。
使用NVIDIA GPU加速
DeepSeek 可以使用NVIDIA GPU加速,提高推理速度,下面将介绍如何在宝塔面板中使用NVIDIA GPU加速。
前提条件
- 服务器已安装NVIDIA GPU驱动
操作步骤
- 点击左侧导航栏中的
终端
,进入终端界面。 - 在终端界面中输入
nvidia-smi
,回车查看NVIDIA GPU信息。如果提示
nvidia-smi: command not found
,请先安装NVIDIA GPU驱动。 - 安装NVIDIA Container Toolkit,以便于Docker容器访问NVIDIA GPU,安装教程请参考NVIDIA Container Toolkit官方文档。
- 安装完成后,运行如下命令,配置docker支持使用NVIDIA GPU。BASH1
2
sudo nvidia-ctk runtime configure –runtime=docker
sudo systemctl restart docker - 配置完成后,执行如下命令,验证docker是否支持NVIDIA GPU。BASH1
sudo docker run –rm –runtime=nvidia –gpus all ubuntu nvidia-smi
如果输出如下信息表示配置成功: - 在
宝塔面板-Docker-应用商店-已安装
中找到Ollama,点击文件夹图标进入安装目录。 - 在安装目录中找到
docker-compose.yml
文件,双击编辑
。 - 在
docker-compose.yml
文件中找到resources
,回车换行,添加如下内容:YAML
reservations:
devices:
– capabilities: [gpu]
完整示例如下:YAML
services:
ollama_SJ7G:
image: ollama/ollama:${VERSION}
deploy:
resources:
limits:
cpus: ${CPUS}
memory: ${MEMORY_LIMIT}
reservations:
devices:
– capabilities: [gpu]
restart: unless-stopped
tty: true
ports:
– ${HOST_IP}:${OLLAMA_PORT}:11434
volumes:
– ${APP_PATH}/data:/root/.ollama
labels:
createdBy: “bt_apps”
networks:
– baota_net
runtime: nvidia
networks:
baota_net:
external: true - 保存文件,返回
宝塔面板-Docker-应用商店-已安装
界面,点击重建
。重建将导致容器数据丢失,重建后需要重新添加模型。 - 等待重建完成,状态变为
运行中
,至此即可使用NVIDIA GPU加速大模型运行。