
一、数据侧问题(知识准备阶段)
1. 数据分散、格式混乱
-
多来源:PDF、Word、Excel、网页、邮件、数据库、代码注释…
-
有些带格式/图片,有些是表格,难以统一处理
2. 知识更新频繁、版本控制困难
-
每周都有新政策、新产品文档
-
没有“知识增量更新”机制,向量库频繁重建
3. 文档质量差
-
内容重复、废话多、错别字
-
文档结构混乱:段落标题不清、上下文不连贯
4. 权限管理
-
某些知识只给部分人用,RAG 默认是“全量检索”
-
缺乏“用户身份感知 + 检索过滤”机制
二、检索与嵌入阶段问题
5. Chunking 切分不合理
-
切太碎 → 上下文断裂
-
切太大 → 相似度降低、token 超长
-
没有按文档结构(如章节、段落)切分
6. 嵌入模型选择不当
-
使用通用英文模型处理中文内容,效果差
-
没有评估向量相似度的语义表现力
7. 向量库选型混乱
-
有人选 Pinecone、Qdrant、Weaviate、pgvector,但不清楚性能差异
-
不清楚是否需要混合索引(向量 + keyword)
-
缺少备份机制或版本管理
三、大模型调用阶段问题
8. Prompt 构造粗糙
-
把检索内容全堆上去,超长 + 模型迷惑
-
没有做 prompt 模板封装、指令细化
9. 无 rerank 或摘要聚合
-
拿到多个 chunk 不做排序、摘要聚合,导致回答杂乱无章
10. 大模型调用成本过高
-
一问就是 GPT-4 → 高成本
-
没有做缓存 / fallback / 小模型优先策略
四、系统工程/性能问题
11. 检索响应慢
-
每次都调用向量库 → 无缓存 / 无近似索引优化
-
向量库部署不合理(跨区域、资源不足)
12. 无法评估系统效果
-
无检索准确率评估指标(如 MRR、Precision@k)
-
用户问了啥?模型答得准不准?无法反馈优化
13. 无异常处理/可观测性
-
模型响应失败、embedding 服务超时无感知
-
无日志追踪每一步(embedding → 检索 → prompt → 调用)
五、运营与管理问题
14. 没有知识运营机制
-
谁来维护知识?什么时候更新?
-
无知识审核流程,用户提错问题也不纠偏
15. 用户信任感差
-
回答不引用来源
-
有时答非所问、编造内容,用户不敢用
16. 多语言、多终端支持薄弱
-
海外企业 → 英文 + 中文 + 日文文档都有
-
没有移动端支持,或者网页体验差


