-
Gemini多模态Prompt:风水堪舆大宗师(玄清道人)
坦白说,我对风水一窍不通,所谓的堪舆之道、峦头理气,都是从古籍和AI对话中拼凑出的只言片语。这个提示词的诞生,与其说是专业研究,不如说是一场有趣的实验:看看能否让AI扮演一位真正的国学大师,用古法的智慧和温和的语调,为你的家宅把把脉。班门弄斧,供诸君一笑。该内容纯属虚构,如有言中,纯属巧合。适合谁用新居入住想看布局的年轻人,家运不顺寻求改善的有心人,对传统文化好奇的探索者,想为父母长辈调整家居的孝…- 0
- 0
-
都有混合检索与智能路由了,谁还在给RAG赛博哭坟?
最近一年,互联网上各种为RAG赛博哭坟的帖子不胜枚举。所有内容总结一句话,其实还是那些陈词滥调:大模型上下文已经够长了,可以取代RAG了。但果真如此吗?要知道,上下文再大,本质还是一次性的记忆空间,全量加载token不仅浪费算力,大模型本身的注意力也是有限的,过长的上下文,只会导致上下文输出时模糊重点,反而导致质量下滑。也是因此,RAG不但没死,还从单纯的语义检索进化成了先想清楚该不该检、检什么、…- 0
- 0
-
Sam Altman 祝贺 Gemini 3 是“阴阳怪气”?我写了个 Prompt 破案了…
Gemini 3正式发布了,Sam是懂阴阳的。其实 Gemini 2.5Pro之前就一直是我个人使用的主力模型,不管是各类文本亦或者是多模态场景的应用,使用体感最佳。这次的Gemini3发布,登顶各大榜单,综合能力最强模型,实至名归,比如我直接复刻的Gemini大风车,直接让Gemini生成一个网页,展示Gemini 3Pro的发布,表现效果如下:加入动能控制、风速和阵风强度均能控制,以及3D表现…- 0
- 0
-
当 Claude Code 连接 NotebookLM,个人 AI 终于有了“长期记忆”
很多人第一次看到 NotebookLM Skill,都会觉得它是一个挺实用的小工具:让 Claude Code 多了一个可以查资料的能力。这个判断不算错,但严重低估了它的真正威力。因为这件事的本质,不是“多一个工具”,而是个人 AI 架构层级的一次跃迁。一、先别急着谈体验,先看结构我们先把情绪放一边,冷静看一下这套结构本身:一句话概括:这是一个“知识检索 + 本地执行”的闭环系统。注意,这里不是 …- 0
- 0
-
Gemini 3 多模态Prompt:手相宗师 – 玄师
Gemini3.0 Pro 今日发布,文本、编程、多模态能力提升明显分享一个多模态Prompt,使用江树下面的提示词开始玄学算命。使用 Gemini 模型,复制粘贴提示词,提供你的手相图和性别描述,「手相宗师 - 玄师」启动。## 手相宗师 - 玄师━━━━━━━━━━━━━━━━## 需求:输入(手相图片):输出(手相解读):模型 Gemini 3.0 Pro / Claude Sonnet 4…- 0
- 0
-
AI 总 “胡说八道”?分类法 + 本体论,让 AI 决策透明可追溯
你有没有遇到过这样的糟心场景:医生对着 AI 辅助诊断报告皱紧眉头,明明患者症状是病毒性感冒,系统却推荐了抗生素治疗方案,稍有不慎就可能误导诊疗;银行客服加班到深夜,几百位客户集中投诉 —— 工资转账被 AI 风控误判为欺诈,账户被临时冻结,影响正常消费;电商运营看着智能客服的回复欲哭无泪,消费者问 “羽绒服能不能机洗”,系统却答非所问扯起面料成分,导致客户流失。AI 越智能,“不可控” 的风险就…- 0
- 0
-
一场极卷的大模型PoC,吓退了大厂一大堆!
“不做POC,我坚决不会买!”踩了半年大模型的“坑”之后,老孙终于学聪明了。老孙,某集团CIO兼数智化办公室主任。作为行业里最早吃大模型“螃蟹”的人,这半年可谓“匆匆忙忙、连滚带爬”。坑他的既不是模型,也不是算力,而是在大家看来毫无存在感的「MaaS」。提起这MaaS,老孙就火大,那是今年Q2招算力服务器集群的时候,顺便「采」了一套。当时,老孙的注意力都在模型和GPU上,没把MaaS当回事。结果,…- 0
- 0
-
MegaRAG :用“多模态知识图谱”打破 RAG 的“次元壁”
教科书、财报、PPT 里那些图表,AI 终于能看懂了!你有没有这样的经历?上传一份带流程图的技术白皮书,问:“这个架构的核心模块是什么?”→ AI 只复述文字,完全无视旁边的架构图。丢给大模型一本数学教材扫描件,问:“图3.2 如何证明勾股定理?”→ 它答非所问,甚至编造不存在的“图3.2”。问题根源:传统 RAG(检索增强生成)是纯文本范——它把 PDF 切成一块块文字,视觉信息直接丢弃。而人类…- 0
- 0
-
谁是OCR王者?MinerU、PaddleOCR、DeepSeek-OCR 实测对比,集成一个多模态PDF解析系统
在大模型应用、办公自动化、数据挖掘等场景中,OCR(光学字符识别)工具是处理图文混排文档、扫描件、复杂表格的核心支撑。当前主流工具中,MinerU 以 “易用性” 出圈,PaddleOCR 凭 “轻量化开源” 占据市场,DeepSeek-OCR 则靠 “高压缩高吞吐” 成为新宠。本文将从技术架构、核心性能、场景适配三大维度展开实测对比,为不同需求的用户提供选型参考~并在文章最后,给大家提供一个实现…- 0
- 0
-
打造你的企业级智能文档问答系统——Everything plus RAG 实战指南
从零开始,用开源技术搭建一个能"读懂"文档的智能问答系统大家好,我是铭毅天下。今天给大家分享一个非常实用的项目——Everything plus RAG 智能文档问答系统。相信大家的电脑上都安装了 Everything,一个磁盘文件快速查找桌面级应用软件。一直以来,我都有个想法,能否做一个 plus 版本,支持文档的全文检索和智能问答?!这个想法萌芽已久,且和同事、朋友做过多次…- 0
- 0
-
Doc-Researcher:多模态文档解析准确率提升3.4倍
你知道吗?现有AI研究系统竟会“错过”文档中超过60%的关键信息——这些信息恰恰隐藏在图表和公式里。该论文提出的Doc-Researcher系统,通过深度多模态解析和迭代式智能体工作流,彻底解决了传统方法在文档结构破坏、检索单一等三大痛点。实验显示,其在新基准上的准确率超越现有最优模型3.4倍,为复杂文档研究树立了新范式。当AI遇上复杂文档的现实困境当用户向AI提问一份技术报告的核心结…- 0
- 0
-
LEANN:200GB 压到 6GB,笔记本跑 RAG 不是梦
开篇:做 RAG 应用,向量数据库动辄几十上百 GB,云服务费用一个月小几千。有个开源项目挺有意思,反着来——不存向量,只存关系图,6000 万文档只要 6GB。先说痛点去年给公司搭 RAG 系统,踩了不少坑:云服务贵:Pinecone 免费额度用完,一个月账单 200 刀起本地吃资源:试过 Milvus,100 万文档就要 30 多 GB,服务器内存直接吃满数据出不去:金融客户要求数据不能上云,…- 0
- 0
-
DeepSeek-OCR多模态数据分析Agent实战
DeepSeek-OCR 驱动的多模态数据分析 Agent 实战本文围绕在数据分析场景中,如何使用 DeepSeek-OCR + LangChain 1.0 搭建一套端到端的多模态数据分析 Agent。开箱即用的项目源码可到 项目部署 全部免费领取!项目功能核心功能一:使用Vllm启动DeepSeek-OCR模型并多线程实现复杂图像、PDF、扫描件、手写笔记、旧试卷等文档高精度…- 0
- 0
-
如何用NotebookLM,把枯燥的财报解读成精美的PPT?
Notebook LM,看似是个笔记本,但它绝不是像Notion或Evernote那样,是个只等着我们往里面传文件的空本子。它是Google(全家桶工具Google到底出了多少AI工具?25年Google AI地图!)推出的一款基于RAG(检索增强生成)技术的AI笔记助手,基于我们给的内容,帮我们重新理解、重组和输出。其核心前提是:你先给资料,它再工作。我们可以把它想象成一个超级学霸助手…- 0
- 0
-
DeepSeek-OCR 实测
去年 12 月,DeepSeek 横空出世。官方宣传时不断拿自己和其他国际一流大模型对比,声称性能更强、效果更优,一度被包装成“国产大模型之光”。朋友圈、媒体、技术社区都在热议,仿佛一夜之间 AI 的未来已经被点亮。然而,实际体验下来,DeepSeek 的表现并没有达到宣传时的高度。与其说它“超越了最好的大模型”,不如说它在对比中显得严重名不符实。没想到,时隔10个月,DeepSeek 团队低调发…- 0
- 0
-
这次,RAG记忆被微信AI团队的超图盘活了
https://github.com/Encyclomen/HGMemImproving Multi-Step RAG with Hypergraph-Based Memory for Long-Context Complex Relational Modeling https://arxiv.org/pdf/2512.23959港中大 & WeC…- 0
- 0
-
Qwen3-Omni:一个模型,全能不偏科
一个模型能够同时处理文字、图片、语音和视频了!新一代原生全模态大模型 Qwen3-Omni 正式发布。在 36 项音视频基准测试中,取得了 32 项开源模型最佳效果,22 项达到 SOTA 水平。在音视频能力强劲的同时,文本与图像的单模态性能保持稳定,真正实现“全模态不降智”。现阶段,Qwen3-Omni 已在 Hugging Face、ModelScope、DashScope…- 0
- 0
-
企业级 RAG + 知识图谱的4 种主流实现路径
前面我们重点讲了 LlamaIndex + Nebula + Milvus 这条“开源组合拳”路线,但它并不是唯一解。在企业级 RAG + 知识图谱的实际落地中,根据业务目标、技术栈偏好、合规要求和团队能力的不同,至少还有 4 种主流实现路径,每种都有成功案例。🧭 企业级 RAG+知识图谱的 5 大实现路径路径核心思想典型用户优势劣势1. 开源组合派(LlamaInd…- 0
- 0
-
手把手教学:用n8n+RSS+飞书实现多平台热点自动抓取(含RSS源分享)
现在自动生成和发布有了,又有了新的问题,我们该写点什么呢?我平时写文章,都是看看各平台的热搜,然后还有最新资讯什么的,看看是否有合适的选题,可是每次都要打开各个平台去看,就比较麻烦。是否有办法将不同平台的热搜,甚至是自己主要关注的资讯合并到一起呢?还真有!今天就带大家用n8n + rss 打造一个自己专属的选题库,以下是我把这个功能集成到我软件的效果,现在通过我的软件,可以直接在这里搜到关键词,找…- 0
- 0
-
企业RAG知识库系统中关于向量数据库的对比选型指南
0 引言选择合适的向量数据库(Vector Store)对 RAG(Retrieval-Augmented Generation,检索增强生成)系统的性能、成本和可扩展性至关重要。本文全面对比了 2024–2025 年最主流的向量数据库选型。1 什么是向量数据库?为什么 RAG 需要它?向量数据库是一种专门用于存储和查询高维嵌入向量(embedding vectors)的数据库。在 RAG 系统中…- 0
- 0
-
多模态AI质检:身份核验场景实践
本文介绍了一项将多模态AI模型应用于身份证照片质量检测的实践。针对用户上传身份证时常见的图片问题,项目通过引入阿里云百炼平台的多模态模型,在OCR识别失败时进行智能检测与反馈,提供对客友好的提示文案,从而引导用户重新上传合格照片。该方案采用“无感知预发布+递进+灰度”上线策略,确保稳定性,并在不牺牲安全性的前提下,利用大模型提升图像理解能力。业务背景随着现代互联网业务的不断发展与深入,用户身份信息…- 0
- 0
-
EdgeVec:浏览器原生向量数据库,让AI应用彻底摆脱服务器
在浏览器中做向量检索,一直是个麻烦事。原生的IndexDB并不支持向量。之前笔者使用过pglite方案,完成浏览器内的向量检索及问答。我已经将它做为一款书签/桌面/资讯于一体的chrome插件,感兴趣的朋友可以下载使用。https://chromewebstore.google.com/detail/memwink/mpklgnebhehdpdpddabokaocemmalijn?hl=zh-CN…- 0
- 0
-
Claude Code 外挂最强大脑 NotebookLM Skill
这个Skills同样之前也有MCP,也被推翻使用Skills生重做了。一个PG数据库分析Skills用Claude Code 来读取几百个 PDF 和 Markdown目前来说不太现实。Claude Code的上下文就200K,直接挂载大量的外部数据,不可能。但使用传统的本地 RAG 又很弱很麻烦,切片,向量化,检索,这一套流程下来,经常因为切片破碎导致 AI 幻觉。今天这个Skill就完美地解决…- 0
- 0
-
多模态大模型Keye-VL-1.5发布!视频理解能力更强!
近日,快手正式发布了多模态大语言模型Keye-VL-1.5-8B。与之前的版本相比,Keye-VL-1.5的综合性能实现显著提升,尤其在基础视觉理解能力方面,包括视觉元素识别、推理能力以及对时序信息的理—表现尤为突出。Keye-VL-1.5在同等规模的模型中表现出色,甚至超越了一些闭源模型如GPT-4o。Keye-VL-1.5-8B在技术上实现了三项关键创新:引入慢快编码策略(Slow-Fast)…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!























