RAGFlow备份的数据做恢复


昨天发表了一篇RAGFlow数据备份的文章:RAGFlow如何做数据备份有同学留言让我讲下恢复,于是今天这篇文章就来了。

RAGFlow备份的数据做恢复
恢复本身没啥技术含量,就是将备份的文件给它搞回去。在恢复之前,先了解下各数据组件都有谁,以及它们里面存的数据都是啥。

1、各组件介绍

查看组件:

docker ps组件列表:
组件
在 RAGFlow 中的角色
主要存储内容
数据是否可再生
infiniflow/ragflow
应用层 / 控制平面 / API
❌ 几乎不存核心数据
✅ 可随时重建
MySQL
元数据数据库
知识库定义、文档元信息、chunk 映射、模型配置、用户数据、任务状态
❌ 不可自动重建
MinIO
对象存储(知识本体)
原始文档、解析文件、chunk 文本、embedding 中间数据
❌❌ 不可重建
Elasticsearch
向量库 + 检索引擎
向量索引、倒排索引、chunk 文本副本
✅ 可重建

2、运维视角关键结论

维度
结论
最重要的数据
MinIO
系统大脑
MySQL
性能核心
Elasticsearch
可随时重建
RAGFlow 容器
恢复优先级
MinIO → MySQL → Elasticsearch → RAGFlow
ES 是否必须备份
非必须,但强烈推荐(节省重建时间)

3、灾难恢复

根据数据重要程度决定恢复顺序:

1️⃣ MinIO 数据
2️⃣ MySQL
3️⃣ Elasticsearch Snapshot

1)恢复minio

需要将备份的bucket依次往回覆盖

cd /opt/ragflow_backup/miniofor  d in `ls`do    mc mirror   --overwrite  $d  ragflow/$ddone2)恢复mysql
docker exec -i docker-mysql-1   mysql -uroot -pinfini_rag_flow rag_flow   < /opt/ragflow_backup/mysql/ragflow_2025-12-16.sql

说明: docker-mysql-1为mysql容器名字, /opt/ragflow_backup/mysql/ragflow_2025-12-16.sql为最新的备份文件

3)恢复es数据

curl -u elastic:infini_rag_flow  -X POST "http://localhost:1200/_snapshot/ragflow_backup/snapshot_2025_12_16/_restore"   -H "Content-Type: application/json"   -d '{    "indices": "*",    "rename_pattern": "(.+)",    "rename_replacement": "restore-$1",    "include_global_state": false  }'说明:如果es中对应的索引存在,则无法使用此命令直接恢复。如果你想测试恢复,需要先删除掉对应的索引。

Agent智能体coze新闻资讯

Coze Skill 速通教程:一文学会 Skill 设计方法

2026-5-5 19:43:28

Agent智能体langchain新闻资讯

都 2026 年了,为什么还有人分不清 LangChain 和 LangGraph?

2026-5-5 19:58:48

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索