-
三任务两失败,通用agent暂时只能坐小孩那桌
"通用智能体将彻底改变人类工作方式!"、"Agent真正开启AI商业落地!"、"万能助手让你躺着把事情做完!"——最近这类标题充斥各大平台,似乎不说自己产品是"通用智能体"都不好意思出门见人了。但实际体验下来,只想说一句:通用智能体,目前也就是坐小孩那桌的水平。最近测试了当下最热门的两款产品:coze空间和Manus。…- 2
- 0
-
RAG评估深度解析:LLM时代的全方位指南(1.5万字综述)
“ 在传统信息系统中,‘监控什么得到什么’;在 AI 系统中‘评估什么得到什么’;监控和评估,是我们运营系统重要的量化反馈手段之一。” 大家好,我是肆〇柒!在“觉察流”的社群中,我看到了有伙伴分享了这篇关于 RAG 评估的总结性小综述——《Retrieval Augmented Generation Evaluation in the Era of Large Language…- 5
- 0
-
RAG 落地必备的 1 个开源 AI 原生向量数据库 —Chroma
一、Chroma 核心概念与优势1. 什么是 Chroma?Chroma 是一款开源的向量数据库,专为高效存储和检索高维向量数据设计。其核心能力在于语义相似性搜索,支持文本、图像等嵌入向量的快速匹配,广泛应用于大模型上下文增强(RAG)、推荐系统、多模态检索等场景。与传统数据库不同,Chroma 基于向量距离(如余弦相似度、欧氏距离)衡量数据关联性,而非关键词匹配。GitHub地址:https:/…- 7
- 0
-
用维基百科(wikipedia) 数据集上手RAG 优化实践
原因不再赘述, 本文将以维基百科的数据集为例, 用PolarDB PostgreSQL数据库进行管理, 说明如何通过以下手段提高召回覆盖率和召回精度.分段方法提取QA pairs提取标签s全文检索模糊查询标签检索向量检索rerank准备环境假设你已经部署好了如下环境《穷鬼玩PolarDB RAC一写多读集群系列 | 在Docker容器中用loop设备模拟共享存储搭建PolarDB RAC》《穷鬼玩…- 9
- 0
-
Dify工作流→知识检索|问题分类
功能概述从知识库中检索与用户问题相关的文本内容,作为下游 LLM 节点的上下文应用场景:构建基于外部数据/知识的 AI 问答系统(RAG)基础应用流程用户问题 → 知识库检索 → 召回相关文本 → LLM 生成回答典型示例:知识库问答应用配置指引1. 查询变量配置选择代表用户问题的查询变量(通常为 sys.query)知识库最大查询内容限制:200 字符2. 知识库选择需提前在 Dify…- 6
- 0
-
基于MiniO存储的RAGFlow+Dify图片处理方案
上篇文章中介绍了如何基于 RAGFlow 知识库,通过 dify 的 HTTP 请求获取映射 + Code 节点替换,将占位符解析为最终的 <img> 标签,来稳定的实现问答中图片正常显示问题。Dify+RAGFLow:基于占位符的图片问答升级方案(最佳实践)其中的"占位符"和"实际图片访问 URL"映射关系的存储使用了阿里云的 OSS 存储服务…- 3
- 0
-
一文搞懂GraphRAG(RAG + 知识图谱)
GraphRAG(Graph-based Retrieval-Augmented Generation)是检索增强生成(RAG)技术的升级版本,通过将知识图谱(Knowledge Graph)与大型语言模型(LLM)结合,解决了传统RAG在处理复杂查询、多跳推理和跨文档语义关联上的局限。其核心目标是通过结构化的知识图谱表示,捕捉数据中实体、关系及全局语义,从而提升LLM对私有或未训练数据的理解与生…- 5
- 0
-
CAMEL-AI与OceanBase向量数据库的深度融合
一、CAMEL AI 简介CAMEL(Communicative Agents for Mind Exploration of Large Language Model Society)是最早的基于大语言模型(LLM)的多智能体框架,现已发展成为一个通用框架,用于构建和使用基于LLM的智能体来解决现实世界的任务。CAMEL团队相信,大规模研究这些智能体能够为理解它们的行为、能力和潜在风险提供宝贵的…- 7
- 0
-
RAG 作者:RAG 已死,RAG 万岁!
每隔几个月,人工智能领域就会经历类似的模式。一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。Meta 最近的突破再次引发了这场讨论——Llama 4 Scout 惊人的 1000 万(理论上)token 上下文窗口代表着一次真正的飞跃。RAG 的初衷为什么我们仍然需要 RAG(并且永远需要)警惕错误的二分法- 9
- 0
-
基于推理模型+RAG+Agent,作业帮内部安全体系建设实践
背 景在互联网智能化与 AI 大模型技术的双重驱动下,信息安全领域正遭遇史无前例的复杂挑战。从外部环境来看,AI 大模型的应用降低了攻击门槛。外部攻击者利用 AI 工具生成自动化攻击脚本、绕过传统检测规则,进行网络资产测绘和漏洞挖掘,攻击效率呈指数级增长,同时,攻击者逐渐呈现出组织化、产业化的趋势,他们之间分工明确,这无疑加剧了企业遭受针对性网络攻击及数据泄露风险。进而使得…- 7
- 0
-
MCP审计场景再探,用AI操作Excel?不太靠谱
首先我们得大致浏览一下这个工具能实现什么功能,不然你也不知道要AI帮你操作什么,打开工具的github页面看下简介可以看到,这个工具能创建修改工作簿、读取写入数据、应用格式样式、创建图表、生成透视表等感觉功能还不是很多那么我们来测试一下AI是否能用这个工具帮我们干活案例我选择了之前我讲过的Excel必知必会的案例01从透视表开始吧目标:透视A列至I列,求每种销售模式的收入之和↓在Cherry St…- 6
- 0
-
最大边际相关性MMR:提升RAG检索结果的多样性与实用性
-正文-在RAG系统中,仅靠向量相似度检索容易造成信息重复或片面。为提升回答的多样性与覆盖度,引入MMR(Maximum Marginal Relevance)算法能有效在“相关性”与“多样性”之间取得平衡,从而挑选出既相关又不重复的信息,提升系统输出的质量与实用性。1. MMR 是什么,它能解决什么问题?2. MMR 的基本思想3. MMR 的原理和公式解析3.1 算法流程3.2 举个例子:摘要…- 5
- 0
-
RAG进阶:Embedding Models嵌入式模型原理和选择
一、概念与核心原理1. 嵌入模型的本质嵌入模型(Embedding Model)是一种将离散数据(如文本、图像)映射到连续向量空间的技术。通过高维向量表示(如 768 维或 3072 维),模型可捕捉数据的语义信息,使得语义相似的文本在向量空间中距离更近。例如,“忘记密码”和“账号锁定”会被编码为相近的向量,从而支持语义检索而非仅关键词匹配。2. 核心作用语义编码:将文本、图像等转换为向量,保留上…- 11
- 0
-
大模型:多种RAG组合优化(langchain实现)
大模型RAG优化:Adaptive RAG 这篇文档整合了多种rag优化策略,并且使用langchain实现。可以有效的解决幻觉的问题。概要我们将把RAG论文中的想法整合到RAG代理中:• Routing: Adaptive RAG (paper). 将问题路由到不同的检索方法• Fallback: Corre…- 5
- 0
-
一文搞懂RAG构建知识库和知识图谱
RAG(Retrieval-Augmented Generation,检索增强生成)技术通过检索增强生成,显著提升了知识问答的准确性和时效性。在构建知识库时,RAG通过向量数据库和动态更新机制,实现了高效的知识检索与生成;在构建知识图谱时,RAG通过GraphRAG和Graphusion等框架,实现了实体关系的精准抽取与图谱融合。一、RAGRAG(Retrieval-Augmented Gener…- 11
- 0
-
RAG不需要切块向量化了?通过PageIndex构建Agentic RAG
你是否对长篇专业文档的向量数据库检索准确性感到失望传统的基于向量的RAG系统依赖于语义相似性而非真正的相关性。但在检索中,我们真正需要的是相关性——这需要推理能力。当处理需要领域专业知识和多步推理的专业文档时,相似度搜索常常不尽人意。基于推理的RAG提供了更好的选择:让大语言模型能够思考和推理,找到最相关的文档部分。受AlphaGo启发,Vectify AI提出使用树搜索来执行结构化文档检索。Pa…- 8
- 0
-
文档解析主流开源工具全家桶及RAG中的文档目录解析PageIndex思路解析
关于RAG切分,已经有很多的方案了,我们也说过很多文档解析的方案,例如基于文档布局分析,将文档解析成段落、标题、图片等等block。可以以这些block作为一个单位做切分。但随着大模型的上下文越来越大,可能不需要切的这么细,可以直接作为目录进行索引,那么问题就来了,如何进行目录生成?我们来看一个实现方案。然后,继续回到文档解析,我们可以再看文档解析的代表模型工具池,东西越来越多,有哪些主流的,表现…- 6
- 0
-
腾讯发布Conan-Embedding-V2,登顶MTEB中英榜单,性能更强、覆盖场景更广
导语Embedding模型作为RAG中检索召回的重要一环。我们团队在2024年8月底发布了中文Embedding模型Conan-Embedding-V1取得了CMTEB榜单SOTA,并在Huggingface开源。Conan-Embedding-v1已在开源社区获得了广泛关注,帮助工作者在搜索、推荐、RAG等许多领域上取得收益。近期团队在Embedding方向持续探索,发布Conan-Embedd…- 7
- 0
-
想让 FastGPT 更猛?试试 OceanBase 向量数据库吧!
RAG 的核心魔法之一,就是向量数据库。向量数据库RAG 的“记忆大脑” ,它负责将海量知识转化为向量存储,并在用户提问时高效检索出最相关的知识片段。这些检索结果是驱动大模型生成高质量答案的关键,直接影响 RAG 应用的整体效果。一直以来,FastGPT 默认推荐大家使用 PostgreSQL (配合 pgvector 扩展) 作为 “记忆大脑”。不得不说,PostgreSQL 是非常优…- 9
- 0
-
RAG应用必备!10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强?
----带你了解RAG应用中常见的10种向量数据库及其区别引言在构建能够理解和生成自然语言的智能应用时,大型语言模型(LLMs)展现出了强大的能力。然而,这些模型通常依赖于训练时所拥有的知识,对于特定领域或最新信息的掌握可能存在不足。为了弥补这一缺陷,检索增强生成(RAG)技术应运而生。RAG通过在LLM生成答案之…- 12
- 0
-
深度拆解RAGFlow分片引擎!3大阶段+视觉增强,全网最硬核架构解析
背景上次讲解代码以后,把rag这块遗留了下来,rag的代码相对来说比较复杂,一环套一环。我们今天先来拆解下分片的整体流程。整体分为3个阶段• 切片设置• 启动任务• 异步消费我们挨个来解析下。注意:代码为当天更新的代码,部分功能还未发布。切片设置查找接口我们从接口的请求参数和界面对照,大致了解下• doc_id 文档id• parser_config&nb…- 9
- 0
-
国人AI IDE神器Trae+MCP实现知识库检索精度暴涨300%【喂饭级教程】
但是很多朋友可能都面临一个痛点:就是满怀期待的把资料“投喂”进知识库后,以为大模型能把所有资料完整“消化吸收”了。结果一测试发现问答效果不尽如人意。咱们得先明白,RAG它不是银弹,不是全能的,它也有局限性,并不适合所有场景。RAG的原理其实网上已经有非常多的资料了,这里就不详细赘述了。下面这个图,形象的展示了RAG的工作原理我们先探讨一下RAG的局限性:1.文件分片:文件分片本身不是局限性,但是分…- 7
- 0
-
理解 RAG 第二部分:经典 RAG 的工作原理
在本系列的第一篇文章中,我们介绍了检索增强生成 (RAG) ,并解释了扩展传统大型语言模型 (LLM)功能的必要性。我们还简要概述了 RAG 的核心思想:从外部知识库中检索上下文相关的信息,以确保 LLM 生成准确且最新的信息,而不会产生幻觉,也无需不断地重新训练模型。本系列的第二篇文章将揭秘传统 RAG 系统运行的机制。尽管如今随着人工智能的迅猛发展,各种增强版和更复杂的 RAG 版本几乎每天都…- 4
- 0
-
18种RAG技术大比拼:谁才是检索增强生成的最佳选择?
在当今信息爆炸的时代,如何从海量数据中快速准确地获取所需信息,是人工智能领域的一大挑战。Retrieval-Augmented Generation(RAG,检索增强生成)技术应运而生,它结合了检索和生成的优势,通过从大量文档中检索相关信息,再利用这些信息生成高质量的回答。然而,RAG 的实现方式多种多样,不同的技术路径有着不同的优势和局限。今天,我们就来深入探讨一下这些 RAG 技术,看看谁才是…- 1
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





















