-
AI是 0,数据是 1
AI 技术再怎么飞速发展,也逃不脱工具类技术的宿命:落地应用时需要数据输入。不管是人工录入、API 接口获取还是文档提取,总要有这样一步“Input”作为前提,而往往就是这一步,扼住了技术落地的喉咙。1. 专家 = 数据 + 经验我们常把 AI 比作专家,期望 AI 可以充当一 7×24h 不眠不休、随叫随到的专家。我们在训练模型或创建知识库时,也是通过撰写固化的问题答案对,来模拟专家经验的,但问…- 6
- 0
-
RAG前沿进展:多抽象层级chunk及对齐机制的ARM实现思路
我们继续来看RAG,来看看引入多层级粒度chunk的RAG方案,主要应对chunk切分的问题;一个是针对问题分解,引入对齐机制的ARM方案。读读看,都会有收获。专题化,体系化,会有更多深度思考。大家一起加油。一、引入多抽象层级chunk粒度的RAG方案 现有RAG的方法通常依赖于固定长度的块(chunk) 来支持问答,这可能导致信息的片段化和不完整性;检索过多的信息可能导致 “中间迷失” 问题,并…- 7
- 0
-
如何从网关层降低 AI 的调用成本
《Higress AI 网关挑战赛》正在火热进行中,Higress 社区邀请了目前位于排行榜 top5 的选手杨贝宁同学分享他的心得。下面是他整理的参赛攻略:背景我们要在 Higress 网关中编写 WebAssembly(wasm)插件,使得在 http 请求的各个阶段(requestHeader,requestBody,responseHeader,responseBody)能够将…- 6
- 0
-
推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目
介绍Microsoft GraphRAG 是一个开源项目,旨在利用 Microsoft Graph 的强大功能构建企业级的知识图谱增强的检索增强生成(RAG)方案。简单来说,它将企业内部的各种数据源(如邮件、文档、日历、联系人等)通过 Microsoft Graph 连接起来,形成一个结构化的知识图谱,然后利用这个知识图谱来增强 RAG 系统的检索能力,从而提升大语言模型(LLM)在企业应用中的问…- 6
- 0
-
用Ollama+RAGflow打造私有知识库
1. Ollama 简介 https://ollama.comOllama 是一个本地运行的大语言模型(LLM)工具平台,允许用户在本地设备上运行和管理大模型,而无需依赖云服务。它支持多种开源模型,并提供了用户友好的接口,非常适合开发者和企业使用。安装 Ollama首先,从 Ollama 官网 下载安装包,并按照提示完成安装。启动OllamaWindows下搜索ollama,然…- 6
- 0
-
RAG 系统开发 01:使用 rig 调用 ollama 的模型
这是个系列文章,将介绍基于 Rust 语言生态来开发一个 RAG 系统。本文是文章的第一篇,主要介绍如何使用 rig[1] 来调用 ollama 模型。项目准备设置 Rust 开发环境推荐使用 RsProxy 来设置 Rust 开发环境,步骤非常的简单:1. 设置 Rustup 镜像, 修改配置 ~/.zshrc 或 …- 5
- 0
-
解锁AI新技能!揭秘检索增强生成(RAG):如何让AI更懂你的业务?
标题:解锁AI新技能!揭秘检索增强生成(RAG):如何让AI更懂你的业务?引言:你是否遇到过这样的场景?• 客户问“这款手机支持卫星通信吗?”,AI客服却回答去年的旧参数;• 让AI写行业分析报告,结果引用了过时的数据;• 企业内部知识库更新了,但员工查询时AI依然“一问三不知”...别急!让RAG技术来破局——只需5分钟,带你读懂这项让AI“智商”翻倍的黑科技!一、RAG…- 4
- 0
-
Think思考用来增强RAG的Embedding?兼看推理模型使用实践建议等前沿进展
今天是2025年02月15日,星期 六,北京,天气晴。我们继续来看昨日大模型地一些有趣进展,围绕GraphRAG、openai推理模型使用实践建议、大模型训练注意力机制以及Deepseek推理建议等,供各位参考。第二个事,我们来看下深度思考与RAG结合进展,做嵌入Embedding,让llm生成嵌入的同时,也输出thought,很想Hyde的做法。专题化,体系化,会有更多深度思考。大家一起加油。一…- 8
- 0
-
AI应用的前提,是解决DeepSeek的幻觉问题
关注公众号回复1获取一线、总监、高管《管理秘籍》去年我在为某些公司做深度AI定制的时候,遭遇了最大的问题是:AI在隔靴搔痒!数字化程度低的公司,根本轮不到AI上场;数字化程度高的公司,将面临完全不一样的问题:技术团队基于AI提供的功能,可以有更好的选择,并不是非AI不可;业务方想要的功能,却没有提供,可以认为AI是将原本就很好的功能做了一次包装。深究下来,对于业务方,对其的判定条件是:AI应用只要…- 6
- 0
-
Agentic RAG:对标准RAG(增强检索生成系统)的能力增强
-正文-Agentic RAG 是一种基于 AI Agent的 RAG 实现。具体而言,它将AI Agent纳入 RAG 流程中,以协调其组件并执行超越简单信息检索和生成的额外操作,以克服RAG基本流程的局限性。这种从“工具”到“智能体”的转变,提升了RAG系统的处理能力1. 基本概念1.1 什么是Retrieval-Augmented Generation (RAG)1.2 什么是Agent1.…- 13
- 0
-
KG2-RAG:利用图谱来增强LLM生成效果
1、前言目前在RAG方向,存在两个主要的方向,一个是检索文档+rank方式来提升LLM,一个是利用图谱(知识库)来提升LLM,形式如下:两种方式存在的优缺点是:(1)第一种就是采用检索+rank方式来获取相关片段来增强大模型生成,优点就是简单有效;缺点是存在检索到很多与query无关的片段,增加噪声输入,与query关联的信息比较稀疏,需要LLM本身去提炼或挖掘利用;且一般是直接将检索的片段(ch…- 3
- 0
-
DeepSeek-R1超高幻觉率解析:为何大模型总“胡说八道”?
DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从而评估模型的幻觉率,帮助优化和选择模型)中,DeepSeek-R1显示出14.3%的幻觉率。图:Vectara HHEM人工智能幻觉测试结果显然,DeepSeek-R1的幻觉率不仅是 DeepSeek-V3的…- 3
- 0
-
探索提升RAG系统问答质量的技术路线
Query Translation Query Translation 将用户的自然语言查询转换为更适合检索和生成的形式。在这个过程中,系统将原始查询转化成一种或多种可以提升信息检索效果的形式,确保系统能够更有效地从不同的数据源中提取相关信息。对于具有挑战性的检索任务,用户问题的措辞可能不太恰当。Query Translation 是指将用户的原始问题重新表达,使其…- 5
- 0
-
基于爆火的deepseek探索RAG多知识源方案
众所周知,RAG的核心是检索和增强。其具体流程是当我们向一个简单的RAG系统提问时,RAG系统可根据问题特征,到数据库中检索,得到相关片段后,传输给大模型,让大模型做答案生成。这样的RAG系统在应对具体问题时,可以较好地检索到相关片段,但当我们的问题变得宽泛起来时,就不那么适用了。比如,我们有一篇文章,有好几个章节。当我们想问具体某个章节的知识点时,传统的RAG系统,在理想情况下可以锁定到知识点相…- 5
- 0
-
TiDB x DeepSeek 打造更好用的国产知识库问答系统解决方案
前言过去两年,GenAI(生成式人工智能)的落地应用一直是行业热点话题,而 RAG (检索增强生成,Retrieval-Augmented Generation)更是每每谈及的关键技术。各大数据库厂商纷纷积极探索数据库内实现或集成向量功能,或者打造一款向量数据库,并将向量数据库与 AI 大语言模型 LLM 相结合,推出创新的 RAG 解决方案。或许有人会说,当更好的大模型出现时,向量数据库就有些鸡…- 7
- 0
-
【RAG落地利器】向量数据库Weaviate部署与使用教程
Weaviate 部署1. 简介Weaviate 是一种开源的向量搜索引擎数据库,允许以类属性的方式存储 JSON 文档,并将机器学习向量附加到这些文档上,以在向量空间中表示它们。Weaviate 支持语义搜索、问答提取、分类等功能,并且可以通过 GraphQL-API 轻松访问数据。官网地址:https://weaviate.io/2. 安装 Weaviate从 Docker Hub 下载 We…- 7
- 0
-
探索从传统检索增强生成(RAG)到缓存增强生成(CAG)的转变
在人工智能快速发展的当下,大型语言模型(LLMs)已成为众多应用的核心技术。检索增强生成(RAG)(RAG 系统从 POC 到生产应用:全面解析与实践指南)和缓存增强生成(CAG)(Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案)作为提升 LLMs 性能的关键技术,备受关注。这两种技术各自具有独特的优势与局限,深入探究从 RAG 到 CAG 的转变…- 7
- 0
-
DeepSeek 还不能联网?我干脆做了个满血+联网版!
除了官方,还有办法拥有满血、可联网的 DeepSeek 吗?这两天,这个问题我至少被问了 10 遍。频繁宕机的 API 平台、DeepSeek R1 的各种平替网站, 相信大家已经习惯了,就算它们偶尔恢复,也还是不能联网。这对我来说,真的忍不了。经过深入研究,我终于找到了一个稳定支持联网的方案!一、效果 先给大家展示下智能体的效果。当下,除了 DeepSeek 自己,最火的恐怕…- 6
- 0
-
基于RAG开发大语言模型
当前,人工智能技术发展迅猛,无疑成为新质生产力中最为夺目的黑马。特别是OpenAI推出ChatGPT以来,人工智能在大数据、大算力和大算法方面实现了完美结合,真正让普通人感受到人工智能的“神奇”。随着越来越多的通用大语言模型(LLM)的出现和发展,如何利用LLM能力实现人工智能应用的落地成为业界努力的方向。高校的信息化建设有着大量的应用建设需求,基于 LLM的能力和学校信息化建设的结合也是高校智慧…- 6
- 0
-
小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑
检索增强生成(RAG)虽好,但一直面临着资源消耗大、部署复杂等技术壁垒。近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。研究团队开发的这套MiniRAG系统采用小模型架构,实现了轻量级的检索增强生成功能。通过本地部署的方式,既降低了资源消耗,又能…- 6
- 0
-
基于 DeepSeek R1 和 Ollama 开发 RAG 系统(含代码)
今天我们一起聊一下如何借助当下最热的开源推理工具 DeepSeek R1 和轻量级本地 AI 模型运行框架 Ollama,构建功能强大的 RAG 系统。DeepSeek R1:RAG 系统的卓越之选DeepSeek R1 (DeepSeek R1:开启 AI 推理新时代的开源先锋)在 RAG 系统构建领域脱颖而出,有着诸多令人瞩目的优势,堪称开发者的得力助手。与 OpenAI 的 o1 模型相比,…- 2
- 0
-
浏览量超 10w 的热图,描述 RAG 的主流架构
大模型性能的持续提升,进一步挖掘了 RAG 的潜力,突破“检索-拼贴”的原始范式。详见下方“RAG 的定义、优势和常见架构”这张图近期在国外社区传播比较多,结构化的描述了 RAG 的主流架构。RAG 用于提升大模型的生成效果,使得大模型更加智能,而持续提升的大模型语义和逻辑推理能力,又能更加精准的识别和应用专业知识库。本文将梳理 RAG 的基本信息,旨在获得更加清晰的理解。目录:为什么需要 RAG…- 5
- 0
-
RAG+LlamaParse:引领PDF解析与检索新时代!
检索增强生成(Retrieval-Augmented Generation, RAG)的核心在于将用户感兴趣的数据无缝连接至大型语言模型(LLM),实现数据驱动的生成式AI功能。这一过程充分结合了生成式AI的强大能力与数据资源的深度融合,使得LLM能够更高效地提供精准且上下文相关的回答。RAG 系统的潜力远不止于传统意义上服务于聊天机器人类型的应用程序,还将在改进业务决策、预测分析等创新型 AI …- 8
- 0
-
打造RAG智能助手:实时数据检索的终极指南!惊呆你的需求,如何一步到位?
目标本文的目标是演示如何使用 LangGraph 和 LangChain 创建一个大型语言模型(LLM)代理,该代理将在一组文档上执行检索增强生成(RAG)。此外,我们将探讨如何构建一个工具,以便进行 API 调用,从而使 LLM 能够从外部来源获取实时知识。最后,我们将使用 Flask API(FastAPI)在本地提供此代理,并使用本地 PostgreSQL 数据库服务器存储与 LLM 的聊天…- 5
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























