全部标签

新闻资讯

Gemini多模态Prompt：风水堪舆大宗师（玄清道人）

坦白说，我对风水一窍不通，所谓的堪舆之道、峦头理气，都是从古籍和AI对话中拼凑出的只言片语。这个提示词的诞生，与其说是专业研究，不如说是一场有趣的实验：看看能否让AI扮演一位真正的国学大师，用古法的智慧和温和的语调，为你的家宅把把脉。班门弄斧，供诸君一笑。该内容纯属虚构，如有言中，纯属巧合。适合谁用新居入住想看布局的年轻人，家运不顺寻求改善的有心人，对传统文化好奇的探索者，想为父母长辈调整家居的孝…
前沿技术
- 0
- 0
charles4月12日
都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

最近一年，互联网上各种为RAG赛博哭坟的帖子不胜枚举。所有内容总结一句话，其实还是那些陈词滥调：大模型上下文已经够长了，可以取代RAG了。但果真如此吗？要知道，上下文再大，本质还是一次性的记忆空间，全量加载token不仅浪费算力，大模型本身的注意力也是有限的，过长的上下文，只会导致上下文输出时模糊重点，反而导致质量下滑。也是因此，RAG不但没死，还从单纯的语义检索进化成了先想清楚该不该检、检什么、…
RAG技术
- 0
- 0
charles4月12日
Sam Altman 祝贺 Gemini 3 是“阴阳怪气”？我写了个 Prompt 破案了…

Gemini 3正式发布了，Sam是懂阴阳的。其实 Gemini 2.5Pro之前就一直是我个人使用的主力模型，不管是各类文本亦或者是多模态场景的应用，使用体感最佳。这次的Gemini3发布，登顶各大榜单，综合能力最强模型，实至名归，比如我直接复刻的Gemini大风车，直接让Gemini生成一个网页，展示Gemini 3Pro的发布，表现效果如下：加入动能控制、风速和阵风强度均能控制，以及3D表现…
前沿技术
- 0
- 0
charles4月12日
当 Claude Code 连接 NotebookLM，个人 AI 终于有了“长期记忆”

很多人第一次看到 NotebookLM Skill，都会觉得它是一个挺实用的小工具：让 Claude Code 多了一个可以查资料的能力。这个判断不算错，但严重低估了它的真正威力。因为这件事的本质，不是“多一个工具”，而是个人 AI 架构层级的一次跃迁。一、先别急着谈体验，先看结构我们先把情绪放一边，冷静看一下这套结构本身：一句话概括：这是一个“知识检索 + 本地执行”的闭环系统。注意，这里不是 …
RAG技术
- 0
- 0
charles4月12日
Gemini 3 多模态Prompt：手相宗师 – 玄师

Gemini3.0 Pro 今日发布，文本、编程、多模态能力提升明显分享一个多模态Prompt，使用江树下面的提示词开始玄学算命。使用 Gemini 模型，复制粘贴提示词，提供你的手相图和性别描述，「手相宗师 - 玄师」启动。## 手相宗师 - 玄师━━━━━━━━━━━━━━━━## 需求：输入（手相图片）：输出（手相解读）：模型 Gemini 3.0 Pro / Claude Sonnet 4…
前沿技术
- 0
- 0
charles4月12日
AI 总 “胡说八道”？分类法 + 本体论，让 AI 决策透明可追溯

你有没有遇到过这样的糟心场景：医生对着 AI 辅助诊断报告皱紧眉头，明明患者症状是病毒性感冒，系统却推荐了抗生素治疗方案，稍有不慎就可能误导诊疗；银行客服加班到深夜，几百位客户集中投诉 —— 工资转账被 AI 风控误判为欺诈，账户被临时冻结，影响正常消费；电商运营看着智能客服的回复欲哭无泪，消费者问 “羽绒服能不能机洗”，系统却答非所问扯起面料成分，导致客户流失。AI 越智能，“不可控” 的风险就…
RAG技术
- 0
- 0
charles4月12日
一场极卷的大模型PoC，吓退了大厂一大堆！

“不做POC，我坚决不会买！”踩了半年大模型的“坑”之后，老孙终于学聪明了。老孙，某集团CIO兼数智化办公室主任。作为行业里最早吃大模型“螃蟹”的人，这半年可谓“匆匆忙忙、连滚带爬”。坑他的既不是模型，也不是算力，而是在大家看来毫无存在感的「MaaS」。提起这MaaS，老孙就火大，那是今年Q2招算力服务器集群的时候，顺便「采」了一套。当时，老孙的注意力都在模型和GPU上，没把MaaS当回事。结果，…
前沿技术
- 0
- 0
charles4月12日
MegaRAG ：用“多模态知识图谱”打破 RAG 的“次元壁”

教科书、财报、PPT 里那些图表，AI 终于能看懂了！你有没有这样的经历？上传一份带流程图的技术白皮书，问：“这个架构的核心模块是什么？”→ AI 只复述文字，完全无视旁边的架构图。丢给大模型一本数学教材扫描件，问：“图3.2 如何证明勾股定理？”→ 它答非所问，甚至编造不存在的“图3.2”。问题根源：传统 RAG（检索增强生成）是纯文本范——它把 PDF 切成一块块文字，视觉信息直接丢弃。而人类…
RAG技术
- 0
- 0
charles4月12日
谁是OCR王者？MinerU、PaddleOCR、DeepSeek-OCR 实测对比，集成一个多模态PDF解析系统

在大模型应用、办公自动化、数据挖掘等场景中，OCR（光学字符识别）工具是处理图文混排文档、扫描件、复杂表格的核心支撑。当前主流工具中，MinerU 以 “易用性” 出圈，PaddleOCR 凭 “轻量化开源” 占据市场，DeepSeek-OCR 则靠 “高压缩高吞吐” 成为新宠。本文将从技术架构、核心性能、场景适配三大维度展开实测对比，为不同需求的用户提供选型参考～并在文章最后，给大家提供一个实现…
前沿技术
- 0
- 0
charles4月12日
打造你的企业级智能文档问答系统——Everything plus RAG 实战指南

从零开始，用开源技术搭建一个能"读懂"文档的智能问答系统大家好,我是铭毅天下。今天给大家分享一个非常实用的项目——Everything plus RAG 智能文档问答系统。相信大家的电脑上都安装了 Everything，一个磁盘文件快速查找桌面级应用软件。一直以来，我都有个想法，能否做一个 plus 版本，支持文档的全文检索和智能问答？！这个想法萌芽已久，且和同事、朋友做过多次…
RAG技术
- 0
- 0
charles4月12日
Doc-Researcher：多模态文档解析准确率提升3.4倍

你知道吗？现有AI研究系统竟会“错过”文档中超过60%的关键信息——这些信息恰恰隐藏在图表和公式里。该论文提出的Doc-Researcher系统，通过深度多模态解析和迭代式智能体工作流，彻底解决了传统方法在文档结构破坏、检索单一等三大痛点。实验显示，其在新基准上的准确率超越现有最优模型3.4倍，为复杂文档研究树立了新范式。当AI遇上复杂文档的现实困境当用户向AI提问一份技术报告的核心结…
前沿技术
- 0
- 0
charles4月12日
LEANN：200GB 压到 6GB，笔记本跑 RAG 不是梦

开篇：做 RAG 应用，向量数据库动辄几十上百 GB，云服务费用一个月小几千。有个开源项目挺有意思，反着来——不存向量，只存关系图，6000 万文档只要 6GB。先说痛点去年给公司搭 RAG 系统，踩了不少坑：云服务贵：Pinecone 免费额度用完，一个月账单 200 刀起本地吃资源：试过 Milvus，100 万文档就要 30 多 GB，服务器内存直接吃满数据出不去：金融客户要求数据不能上云，…
RAG技术
- 0
- 0
charles4月12日
DeepSeek-OCR多模态数据分析Agent实战

DeepSeek-OCR 驱动的多模态数据分析 Agent 实战本文围绕在数据分析场景中，如何使用 DeepSeek-OCR + LangChain 1.0 搭建一套端到端的多模态数据分析 Agent。开箱即用的项目源码可到项目部署全部免费领取！项目功能核心功能一：使用Vllm启动DeepSeek-OCR模型并多线程实现复杂图像、PDF、扫描件、手写笔记、旧试卷等文档高精度…
前沿技术
- 0
- 0
charles4月11日
如何用NotebookLM，把枯燥的财报解读成精美的PPT？

Notebook LM，看似是个笔记本，但它绝不是像Notion或Evernote那样，是个只等着我们往里面传文件的空本子。它是Google（全家桶工具Google到底出了多少AI工具？25年Google AI地图！）推出的一款基于RAG（检索增强生成）技术的AI笔记助手，基于我们给的内容，帮我们重新理解、重组和输出。其核心前提是：你先给资料，它再工作。我们可以把它想象成一个超级学霸助手…
RAG技术
- 0
- 0
charles4月11日
DeepSeek-OCR 实测

去年 12 月，DeepSeek 横空出世。官方宣传时不断拿自己和其他国际一流大模型对比，声称性能更强、效果更优，一度被包装成“国产大模型之光”。朋友圈、媒体、技术社区都在热议，仿佛一夜之间 AI 的未来已经被点亮。然而，实际体验下来，DeepSeek 的表现并没有达到宣传时的高度。与其说它“超越了最好的大模型”，不如说它在对比中显得严重名不符实。没想到，时隔10个月，DeepSeek 团队低调发…
前沿技术
- 0
- 0
charles4月11日
这次，RAG记忆被微信AI团队的超图盘活了

https://github.com/Encyclomen/HGMemImproving Multi-Step RAG with Hypergraph-Based Memory for Long-Context Complex Relational Modeling https://arxiv.org/pdf/2512.23959港中大 & WeC…
RAG技术
- 0
- 0
charles4月11日
Qwen3-Omni：一个模型，全能不偏科

一个模型能够同时处理文字、图片、语音和视频了！新一代原生全模态大模型 Qwen3-Omni 正式发布。在 36 项音视频基准测试中，取得了 32 项开源模型最佳效果，22 项达到 SOTA 水平。在音视频能力强劲的同时，文本与图像的单模态性能保持稳定，真正实现“全模态不降智”。现阶段，Qwen3-Omni 已在 Hugging Face、ModelScope、DashScope…
前沿技术
- 0
- 0
charles4月11日
企业级 RAG + 知识图谱的4 种主流实现路径

前面我们重点讲了 LlamaIndex + Nebula + Milvus 这条“开源组合拳”路线，但它并不是唯一解。在企业级 RAG + 知识图谱的实际落地中，根据业务目标、技术栈偏好、合规要求和团队能力的不同，至少还有 4 种主流实现路径，每种都有成功案例。🧭 企业级 RAG+知识图谱的 5 大实现路径路径核心思想典型用户优势劣势1. 开源组合派（LlamaInd…
RAG技术
- 0
- 0
charles4月11日
手把手教学：用n8n+RSS+飞书实现多平台热点自动抓取（含RSS源分享）

现在自动生成和发布有了，又有了新的问题，我们该写点什么呢？我平时写文章，都是看看各平台的热搜，然后还有最新资讯什么的，看看是否有合适的选题，可是每次都要打开各个平台去看，就比较麻烦。是否有办法将不同平台的热搜，甚至是自己主要关注的资讯合并到一起呢？还真有！今天就带大家用n8n + rss 打造一个自己专属的选题库，以下是我把这个功能集成到我软件的效果，现在通过我的软件，可以直接在这里搜到关键词，找…
前沿技术
- 0
- 0
charles4月11日
企业RAG知识库系统中关于向量数据库的对比选型指南

0 引言选择合适的向量数据库（Vector Store）对 RAG（Retrieval-Augmented Generation，检索增强生成）系统的性能、成本和可扩展性至关重要。本文全面对比了 2024–2025 年最主流的向量数据库选型。1 什么是向量数据库？为什么 RAG 需要它？向量数据库是一种专门用于存储和查询高维嵌入向量（embedding vectors）的数据库。在 RAG 系统中…
RAG技术
- 0
- 0
charles4月11日
多模态AI质检：身份核验场景实践

本文介绍了一项将多模态AI模型应用于身份证照片质量检测的实践。针对用户上传身份证时常见的图片问题，项目通过引入阿里云百炼平台的多模态模型，在OCR识别失败时进行智能检测与反馈，提供对客友好的提示文案，从而引导用户重新上传合格照片。该方案采用“无感知预发布+递进+灰度”上线策略，确保稳定性，并在不牺牲安全性的前提下，利用大模型提升图像理解能力。业务背景随着现代互联网业务的不断发展与深入，用户身份信息…
前沿技术
- 0
- 0
charles4月11日
EdgeVec：浏览器原生向量数据库，让AI应用彻底摆脱服务器

在浏览器中做向量检索，一直是个麻烦事。原生的IndexDB并不支持向量。之前笔者使用过pglite方案，完成浏览器内的向量检索及问答。我已经将它做为一款书签/桌面/资讯于一体的chrome插件，感兴趣的朋友可以下载使用。https://chromewebstore.google.com/detail/memwink/mpklgnebhehdpdpddabokaocemmalijn?hl=zh-CN…
RAG技术
- 0
- 0
charles4月11日
Claude Code 外挂最强大脑 NotebookLM Skill

这个Skills同样之前也有MCP，也被推翻使用Skills生重做了。一个PG数据库分析Skills用Claude Code 来读取几百个 PDF 和 Markdown目前来说不太现实。Claude Code的上下文就200K，直接挂载大量的外部数据，不可能。但使用传统的本地 RAG 又很弱很麻烦，切片，向量化，检索，这一套流程下来，经常因为切片破碎导致 AI 幻觉。今天这个Skill就完美地解决…
RAG技术
- 0
- 0
charles4月11日
多模态大模型Keye-VL-1.5发布！视频理解能力更强！

近日，快手正式发布了多模态大语言模型Keye-VL-1.5-8B。与之前的版本相比，Keye-VL-1.5的综合性能实现显著提升，尤其在基础视觉理解能力方面，包括视觉元素识别、推理能力以及对时序信息的理—表现尤为突出。Keye-VL-1.5在同等规模的模型中表现出色，甚至超越了一些闭源模型如GPT-4o。Keye-VL-1.5-8B在技术上实现了三项关键创新：引入慢快编码策略（Slow-Fast）…
前沿技术
- 0
- 0
charles4月11日