全部标签

新闻资讯

从安装到运行：手把手教你用Clawdbot完成第一个智能任务

这两天Clawdbot可谓在AI圈里闹翻天了！它到底是什么？Clawdbot是由Peter Steinberger（PSPDFKit 创始人）及其团队开发的，它绝不仅仅是对大语言模型的简单封装，它代表了一种全新的计算范式：将分布式智能、本地硬件控制，以及全球主流通信协议（如 WhatsApp、Telegram、iMessage）深度融合，从而构建出一个能够7×24 小时持续运行、自主完成复杂任务的…
前沿技术
- 0
- 0
charles4月1日
RAG的五种分块策略

RAG 是将附加文档存储为嵌入向量，将传入的查询计算向量与这些向量进行匹配，并将最相似的信息与查询一起提供给LLM的过程。由于附加文档可能非常大，流程的步骤1还需要分块，将大文档分成较小/方便管理的文本块，RAG的分块策略主要有五种，分别是固定大小分块、语义分块、递归分块、基于文档结构的分块、基于LLM的分块。固定大小的分块固定大小的分块是最直观和直接的方法，根据预定数量的字符、单词或标记将文本分…
RAG技术
- 0
- 0
charles4月1日
刚刚，阿里旗舰模型Qwen3-Max-Thinking发布，编程能力“踢馆”Gemini与Claude

1 阿里突发最强旗舰模型，总参数过万亿就在刚刚，Qwen3-Max-Thinking 正式版突然发布，总参数规模超过 1 万亿（1T），位于目前全球最大规模 AI 模型行列，预训练数据规模高达 36T Tokens，覆盖大量高质量语料。Qwen3-Max 是阿里通义团队迄今规模最大、能力最强的语言模型，该版本包括 Base、Instruct 和 Thinking 多种形式。在多项权威基…
前沿技术
- 0
- 0
charles4月1日
关于RAG检索增强的右侧优化方案——企业级应用中怎么提升RAG的检索准确度

“ RAG最终的评判标准只有一个——召回精度，RAG所有的技术都是围绕着怎么更快更准确的召回数据。”RAG增强检索的核心指标只有一个——召回准确率；对于RAG技术来说，最重要的事情就是其召回数据的准确性；而怎么提升其召回准确率，方法只有两个，一个是左侧增强，一个是右侧增强。所谓的左侧增强就是文档处理处理，怎么更好的处理复杂文档；而右侧增强就是召回侧的召回策略。今天，我们就来讨论一下RAG…
RAG技术
- 0
- 0
charles4月1日
重磅！千问最强模型正式发布

刚刚，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。千问新模型通过总参数、强化学习、推理计算的极致规模扩展，实现了性能的大幅飞跃，在多项关键性能基准测试中刷新全球新纪录。同时，该模型采用全新测试时扩展机制，推理性能提升同时更经济，并大幅增强原生Agent能力，模型对话…
前沿技术
- 0
- 0
charles4月1日
在RAG中文档处理质量参差不齐的情况下——提升召回精度的企业级解决方案

“ RAG做起来很简单，但想把RAG做好就需要想尽办法去提升数据的召回质量。”在RAG中文档处理可以说是一个重难点，特别是复杂文档的处理更是一言难尽；因此，面对这种现实问题，总不能直接摆烂，因此怎么在文档质量处理参差不齐的情况下，提升RAG的召回精度就是一个需要解决的问题。文档处理的质量直接影响到RAG的召回效率，但目前文档处理是一个难点；因此怎么基于现有条件，提升RAG的召回精度？既然…
RAG技术
- 0
- 0
charles4月1日
Skills 设计思路分享｜一键实现 OneService 接口调用

概述名词解释SKILL：最初是 Claude AI 的一项功能，允许用户将复杂的、多步骤的流程（例如数据清洗、内容格式化、特定分析等）保存为可重复使用的自定义“技能”，用来提升在某些特定任务上的表现。更多理解欢迎阅读一文读懂 Skills｜从概念到实操的完整指南OneService（后写作 OS）：由字节团队开发的数据服务化平台。帮助用户将各种主流数据源的 SQL 查询快速服务化，提供…
前沿技术
- 0
- 0
charles4月1日
再学 RAGFlow 的文件解析逻辑

经过几天的学习，我们了解了 RAGFlow 的文件上传和解析流程，了解了解析任务是如何触发并放入 Redis Stream 消息队列中，等待任务执行器消费和处理的。今天我们将继续学习任务执行器中最重要的函数 do_handle_task() 的实现，看看 RAGFlow 是如何具体执行每个解析任务的。do_handle_task 函数实现do_handle_task&…
RAG技术
- 0
- 0
charles4月1日
3个真实场景 + 5个专业技巧：Claude Code Skills如何重塑你的开发工作流

你是否遇到过这样的场景：让AI生成API接口，结果返回了一堆无法编译的代码；想要重构组件，AI却给了你一个过度设计的"完美方案"；数据处理时，AI生成的代码逻辑完全偏离了业务需求。问题的根源不在于AI不够聪明，而在于我们没有给AI装上正确的技能包。2025年10月，Anthropic正式推出了Agent Skills系统——这不仅仅是功能的叠加，更是编程范式的根本性…
前沿技术
- 0
- 0
charles4月1日
AWS使用提示词与RAG来减少大模型幻觉

概览大型语言模型（LLM）是生成内容的强大工具。这些LLM的生成能力伴随着诸多优缺点。我们经常遇到的主要问题之一是生成内容的事实准确性。这些模型具有高度的幻觉倾向，有时会生成不存在或错误的内容。生成的内容往往极具说服力，看起来像是事实正确的有效信息。作为开发者，我们有责任确保系统完美运行并生成简洁的内容。本文将深入探讨在使用AWS Bedroc…
RAG技术
- 1
- 0
charles4月1日
突发！OpenAI 明天“发布会”，GPT能再次碾压谷歌 Gemini吗？

各位老铁，AI开发者狂欢的一周即将揭开帷幕！上周已经给大家预告了这周 OpenAI 将有大动作，本以为按 O 记惯例，会在周四或五开发布会没想到OpenAI 等不急了！明天就发布！就在今早，奥特曼在 X 上发帖称：“明天我们将在 OpenAI 举办一场面向人工智能开发者的线上研讨会。我们希望在开始构建新一代工具之前收集反馈意见。这是一次实验，也是对新形式的首次尝试——我们将于太平洋时间下午 4 点…
前沿技术
- 0
- 0
charles4月1日
RAG与Agentic RAG：智能AI系统的进化之路

近年来，人工智能（AI）如同一股洪流，席卷了整个数字世界。从日常的搜索问答到视频生成，再到客户服务支持，AI的身影无处不在。而在AI的众多技术中，RAG（Retrieval-Augmented Generation，检索增强生成）和Agentic RAG（智能代理RAG）无疑是两颗耀眼的明星。它们不仅提升了信息处理的效率，还为复杂任务的解决提供了全新的可能性。但问题来了：RAG和Agentic R…
RAG技术
- 0
- 0
charles4月1日
深度剖析｜Claude Agent 是如何一步步加载 Skill 的？

最近 Skill 这个东西火了。虽然它去年 10 月 16 日就发布了，但一开始动静不大。有意思的是，这个时间节点跟 2024 年 MCP 发布时间差不多。它最终是落地上生产，还是重演 MCP 的路径，现在还不好说。可以明显感受到 Skill 的热度正在扩散，各种解读文章开始出现，现在企业里的领导开始问这个东西了，开会的时候会专门提一句要不要研究一下 Claude 的 Skill 功能，有没有落地…
前沿技术
- 0
- 0
charles4月1日
不止于相似度：混合搜索如何重塑 RAG 的未来

1. 引言：当“最相似”不再是“最相关” 在构建检索增强生成（RAG）系统时，我们常常陷入一个困境：如何确保检索到的上下文既“语义相关”又“关键词精确”？想象一下这个场景：当用户搜索“苹果公司发布的 M3 芯片评测”时，一个纯粹依赖向量搜索的 RAG 系统可能会返回一篇关于“苹果公司最新财报”的文章。从语义上看，这没错，两者都与“苹果公司”高度相关。但用户最关心的核心关键词——“M3 芯片”—…
RAG技术
- 0
- 0
charles4月1日
深度剖析｜Claude Agent 是如何一步步动态加载 skill 的（续）

书接上文，上一篇偷懒了，做得还不够深入。这一篇进一步研究下 Claude Agent 的上下文是怎么构建的，Skill 相关的提示词是怎么注入的。抓取请求日志首先我们利用 litellm 的 proxy 来中转请求，这样就可以获取 Agent 发送的所有数据。配置 proxy config 后，直接修改 anthropic 的 endpoints，把 request_body 写入指定日志：# l…
前沿技术
- 0
- 0
charles4月1日
CodeBuddy Code 2.0：国产Claude Code，有点东西

我在公众号里持续分享Claude Code、Codex、Antigravity、Cursor等世界顶级AI编程工具的使用心得，好多朋友来问：它们都对科学上网的要求太高了，有没有好用的国产替代？其实国产的平替已经做得很好了，几家都很强。今天我想要聊一聊CodeBuddy Code，因为，在某些场景下，我找到了它值得推荐的理由。尤其是CodeBuddy Code新出的2.0版本，又增色了不少。不需要科…
前沿技术
- 0
- 0
charles4月1日
RAG应用如何进行有效的文本切分

在RAG（检索增强生成，Retrieval-Augmented Generation）应用中，文本分块（Text Chunking）是连接“知识存储”与“检索-生成”的核心预处理步骤，其重要性体现在对检索效率、相关性、生成质量及系统灵活性的多维度影响。首先松哥和大家讨论第一个问题，就是为什么我们要重视文本切分。一为什么文本切分很重要1.1 提升检索相关性：精准匹配用户需求RAG 的核心是“先检索…
RAG技术
- 0
- 0
charles4月1日
RTP-LLM 在相关性大模型中的推理优化最佳实践

一、背景在淘宝搜索场景下，用户Query与候选商品(Item)之间的相关性判别是非常重要的一环，它筛选出该Query下最相关的商品，是用户体验的基石。过去几年主搜在相关性场景上已经做了不少工作，并且取得了显著的正向收益，今年，为了进一步解决部分口语化Query承接效果较差的问题，我们又引入了更大参数量(激活3.5B的MoE)的LLM模型，同时扩展了单次打分商品个数，这给我们的系统性能提出了巨大挑…
前沿技术
- 0
- 0
charles4月1日
为什么你的RAG效果总差一点？从RankNet到Qwen，一文读懂Rerank模型的演进

为什么你的RAG效果总差一点？从RankNet到Qwen，一文读懂Rerank模型的演进概要本文主要面向对检索增强生成（RAG）和 Rerank 技术感兴趣的初学者。我们希望通过梳理 Rerank 模型从经典的概率模型到前沿的大模型驱动范式的演进历程，帮助大家理解 Rerank 在优化 RAG 系统效果时扮演的关键角色，以及不同阶段的核心技术思想。目录概要前言第一章：基础架构 - 基于概率模型的成…
RAG技术
- 0
- 0
charles4月1日
Google Antigravity推出终端沙盒：AI助手终于不会乱删文件了

Google Antigravity刚刚推出了终端沙盒功能，这个功能解决了一个很实际的问题：AI代理在终端里执行命令时，再也不会误操作你的系统文件了。沙盒如何工作终端沙盒采用内核级隔离技术，将AI代理的所有终端命令严格限制在项目工作目录内。简单说，就是给AI划了个活动范围，它只能在你指定的文件夹里折腾。目前该功能在macOS上通过苹果的Seatbelt机制实现，Linux支持即将到来。用户可以在设…
前沿技术
- 0
- 0
charles4月1日
提升RAG表现的15个实战分块技巧

RAG Chunking TechniquesRetrieval-Augmented Generation（RAG）很大程度上取决于你怎么分块数据。想让LLM检索到真正有意义的上下文？你得用心设计数据的分块方式。下面是15种关键的分块策略，详细解释，每种都带一个实际的例子和实用的拆分方法。1. 按行分块（Line-by-Line Chunking）是什么：每遇到新行就拆分。什么时候用：…
RAG技术
- 0
- 0
charles4月1日
Claude Code 更长更快！Agent能自己管项目了！从 Todo 升级到 Task

上周 Claude Code 团队更新了他们的任务清单系统，我觉得还蛮重要的，特地来讲一讲。更新公告简单理解：任务系统，从「记事本」变成了「项目管理系统」。为什么要升级？得益于模型能力增强，我们的需求从简单任务变成了复杂任务。需求变化现在模型增强后，TodoWrite 变得有点鸡肋了：小任务？模型自己能记住，不需要 TodoWrite大任务？TodoWrite 又实现不了为了追求更快、更复杂的任务…
前沿技术
- 0
- 0
charles4月1日
96.3%准确率！Routine框架：让企业级Agent告别“不靠谱”

想象一下，你给一个超级聪明的AI助手布置一项公司里的复杂任务，比如“查一下新员工小王的部门预算还剩多少，并和去年对比生成报告”。通用AI模型（如GPT-4）可能想法天马行空，但实际操作起来却容易“掉链子”：步骤混乱、用错内部工具、参数填不对，甚至直接“摆烂”不干活。这就是当前大模型智能体（LLM Agent）落地企业面临的核心难题——缺乏领域知识导致规划不稳、执行飘忽。论文：Routine: A …
RAG技术
- 0
- 0
charles4月1日
Gas Town 启示录：多智能体编排开启 AI 编程工业革命

“启示录”（Apocalypse）在希腊语原意中并非仅指毁灭，更意味着“揭开面纱”。2026 年的钟声敲响时，软件开发领域正经历着这样一场启示录。旧世界——那个由 IDE、手动键入代码、人类结对编程构成的世界——正在崩塌。我们拥有了前所未有的强大模型（Claude Sonnet/Opus 4.5、GPT-5、Gemini 3.0 Pro等），但当开发者试图用它们构建庞大的企业级系统时，却陷入了另一…
前沿技术
- 0
- 0
charles4月1日