用宝塔面板私有化部署自己的Deepseek

前提条件

  • 已安装宝塔面板

操作步骤

DeepSeek 可以使用CPU进行推理,但是推荐使用NVIDIA GPU加速,文末将介绍如何使用NVIDIA GPU加速。

  1. 登录宝塔面板,点击左侧菜单栏中的Docker,进入Docker容器管理界面。
    用宝塔面板私有化部署自己的Deepseek
  2. 首次使用Docker需要先安装Docker,点击安装
    用宝塔面板私有化部署自己的Deepseek
  3. 在Docker-应用商店-AI/大模型分类中找到Ollama,点击安装
    用宝塔面板私有化部署自己的Deepseek
  4. 配置默认即可,点击确定
    用宝塔面板私有化部署自己的Deepseek
  5. 等待安装完成,状态变为运行中
    用宝塔面板私有化部署自己的Deepseek如您需要使用NVIDIA GPU加速,请参考文末的使用NVIDIA GPU加速配置完成后再继续。
  6. 宝塔面板-Docker-容器界面中找到Ollama容器,点击终端
    用宝塔面板私有化部署自己的Deepseek
  7. 在弹出shell类型选择bash,点击确认
    用宝塔面板私有化部署自己的Deepseek
  8. 在终端界面中输入ollama run deepseek-r1:1.5b,回车运行DeepSeek-R1模型。
    用宝塔面板私有化部署自己的DeepseekDeepSeek-R1模型有多个版本,可以根据需要选择不同版本,例如ollama run deepseek-r1:671b,详情如下(模型参数越大,需要配置越高):BASH
    # DeepSeek-R1
    ollama run deepseek-r1:671b
    # DeepSeek-R1-Distill-Qwen-1.5B
    ollama run deepseek-r1:1.5b
    # DeepSeek-R1-Distill-Qwen-7B
    ollama run deepseek-r1:7b
    # DeepSeek-R1-Distill-Llama-8B
    ollama run deepseek-r1:8b
    # DeepSeek-R1-Distill-Qwen-14B
    ollama run deepseek-r1:14b
    # DeepSeek-R1-Distill-Qwen-32B
    ollama run deepseek-r1:32b
    # DeepSeek-R1-Distill-Llama-70B
    ollama run deepseek-r1:70b
  9. 等待下载并运行,当看到如下提示表示DeepSeek-R1模型运行成功。
    用宝塔面板私有化部署自己的Deepseek
  10. 你可以在界面中输入文本并回车,开启与DeepSeek-R1模型的对话。
    用宝塔面板私有化部署自己的Deepseek
  11. 你可以在界面中输入/bye并回车,退出DeepSeek-R1模型。在终端内对话看起来是不是有点麻瓜?别担心,接下来让我们来安装OpenWebUI,在浏览器中更直观地与DeepSeek-R1模型对话
  12. 宝塔面板-Docker-容器界面中找到Ollama容器,点击Ollama右侧的管理,进入容器管理界面,获取容器IP,保存备用。
    用宝塔面板私有化部署自己的Deepseek
  13. 在宝塔面板Docker-应用商店-AI/大模型分类中找到OpenWebUI,点击安装
    用宝塔面板私有化部署自己的Deepseek
  14. 按一下说明,配置相关信息,点击确定
    • web端口:访问OpenWebUI的端口,默认为3000,根据需要自行修改
    • ollama地址:填写http://刚刚获取的Ollama容器IP:11434,例如http://172.18.0.2:11434
    • WebUI Secret Key:用于 API 访问的密钥,可以自定义,例如123456
      其他配置默认即可
    用宝塔面板私有化部署自己的Deepseek
  15. 配置完点击确认,等待安装完成,状态变为运行中。由于OpenWebUI启动后需要加载相关服务,请在状态变为运行中后等待5-10分钟再访问。
  16. 在浏览器中输入http://服务器IP:3000,例如http://43.160.xxx.xxx:3000,进入OpenWebUI界面。请在访问前确保云厂商服务器防火墙已放行3000端口,可以在云厂商控制台中设置。用宝塔面板私有化部署自己的Deepseek
  17. 点击开始使用,设置管理员相关信息,并点击创建管理员账号
    用宝塔面板私有化部署自己的Deepseek
  18. 创建完成后会自动进入管理界面,现在你可以在浏览器中更直观地与DeepSeek-R1模型对话了。
    用宝塔面板私有化部署自己的Deepseek
    用宝塔面板私有化部署自己的Deepseek
    1. 你可以在左上角切换模型,选择不同模型进行对话,也可以在左侧菜单栏中查看历史对话记录。
    2. 你可以在右上角点击头像,进入管理员面板,在设置-模型中查看当前模型列表,或添加新模型。

使用NVIDIA GPU加速

DeepSeek 可以使用NVIDIA GPU加速,提高推理速度,下面将介绍如何在宝塔面板中使用NVIDIA GPU加速。

前提条件

  • 服务器已安装NVIDIA GPU驱动

操作步骤

  1. 点击左侧导航栏中的终端,进入终端界面。
    用宝塔面板私有化部署自己的Deepseek
  2. 在终端界面中输入nvidia-smi,回车查看NVIDIA GPU信息。
    用宝塔面板私有化部署自己的Deepseek如果提示nvidia-smi: command not found,请先安装NVIDIA GPU驱动。
  3. 安装NVIDIA Container Toolkit,以便于Docker容器访问NVIDIA GPU,安装教程请参考NVIDIA Container Toolkit官方文档
  4. 安装完成后,运行如下命令,配置docker支持使用NVIDIA GPU。BASH1
    2
    sudo nvidia-ctk runtime configure –runtime=docker
    sudo systemctl restart docker
  5. 配置完成后,执行如下命令,验证docker是否支持NVIDIA GPU。BASH1
    sudo docker run –rm –runtime=nvidia –gpus all ubuntu nvidia-smi
    如果输出如下信息表示配置成功:
    用宝塔面板私有化部署自己的Deepseek
  6. 宝塔面板-Docker-应用商店-已安装中找到Ollama,点击文件夹图标进入安装目录。
    用宝塔面板私有化部署自己的Deepseek
  7. 在安装目录中找到docker-compose.yml文件,双击编辑
    用宝塔面板私有化部署自己的Deepseek
  8. docker-compose.yml文件中找到resources,回车换行,添加如下内容:YAML
    reservations:
    devices:
    – capabilities: [gpu]
    完整示例如下:YAML
    services:
    ollama_SJ7G:
    image: ollama/ollama:${VERSION}
    deploy:
    resources:
    limits:
    cpus: ${CPUS}
    memory: ${MEMORY_LIMIT}
    reservations:
    devices:
    – capabilities: [gpu]
    restart: unless-stopped
    tty: true
    ports:
    – ${HOST_IP}:${OLLAMA_PORT}:11434
    volumes:
    – ${APP_PATH}/data:/root/.ollama
    labels:
    createdBy: “bt_apps”
    networks:
    – baota_net
    runtime: nvidia

    networks:
    baota_net:
    external: true
  9. 保存文件,返回宝塔面板-Docker-应用商店-已安装界面,点击重建。重建将导致容器数据丢失,重建后需要重新添加模型。用宝塔面板私有化部署自己的Deepseek
  10. 等待重建完成,状态变为运行中,至此即可使用NVIDIA GPU加速大模型运行。
AI模型定制案例企业应用

Shopee运营AI助手

2024-4-22 22:30:31

新闻资讯

FastGPT、Dify、Coze产品功能对比分析

2024-8-1 17:57:51

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索