-
OpenAI:构建Agent的实用指南
本文译自OpenAI发布的Practical Guide to Building Agents(原文以PDF格式发布)。在研究Agents的过程中将之与Google、Claude等关于Agent的文章一起进行比较,学习业界对Agents的不同定位。 OpenAI的这份指南非常侧重于为产品和工程团队提供可操作的建议和最佳实践,目标是帮助开发者构建出能实际运行的Agent。它清晰定义了Agent的…- 7
- 0
-
刚刚,Karpathy 又造新词 :”细菌式编程”诞生记,兼论上下文工程演进史
Andej Karpathy之前提出“#氛围编程”(vibe coding)大火特火,今天AK又造了一个新词“#细菌式编程” 在软件开发的世界里,我们时常陷入关于最佳实践的无尽讨论中:是应该构建一个大而全的单体应用(Monolith),还是拥抱灵活的微服务(Microservices)?是该追求零依赖,还是善用成熟的第三方库? 01细菌式编程一、细菌编码的三大法则 Karpathy 指出,如果我们…- 7
- 0
-
AI产品:从建筑行业实例解析AI Agent
AI Agent无疑是今年最热的词汇之一,但在实际的应用场景中,我发现这个概念已经过度泛化——每个人都在用自己的方式定义和使用它。 在最近沟通过的多个SaaS产品分析中,我意识到一个关键问题:如果不能明确AI在产品中的真实定位和作用机制,团队很容易陷入概念之争,而忽略了产品本质的变化。 基于这些实践经验,我想分享一些关于AI Agent在产品中真实作用的思考,以我自己比较熟悉的建筑行业的SaaS产…- 37
- 0
-
AI Agent 凭什么火?看懂 60 年软件演进史,你就明白了
大家好,我是孟健。 前几天,一位做了很多年开发的朋友跟我说: "现在的 AI Agent 让我想起当年第一次用 Spring 框架的感觉——既兴奋又迷茫。" 我深有同感。 每一次技术范式的转变,都会让我们重新审视"什么是软件"这个根本问题。 最近在研究 12-Factor Agent,看到了一篇特别有意思的软件简史。 作者用一个简单却深刻的视角,带我们回顾了…- 6
- 0
-
微软AI特别报告:教育中的人工智能
2025年6月25日,微软发布了《2025 Microsoft AI in Education Report》(微软2025年教育中的人工智能特别报告);系统总结了AI技术在全球教育领域的最新应用现状、面临的挑战和未来发展的方向。 微软连续多年对AI在教育领域的应用做跟踪调研(如:微软研究发现:人工智能对批判性思维的影响)。本报告以2024年为基线,通过全球范围的问卷、案例分析和专家访谈,试图回答…- 5
- 0
-
用子模优化法为DeepResearch生成多样性查询
在开发DeepResearch时,生成多样化的查询 (query) 是一个关键细节。我们在开发时会在至少两处遇到这个问题。第一处是在解析用户的原始输入,并生成网页搜索查询,因为直接把原始输入抛给搜索引擎,效果往往不尽人意。第二处,是许多 DeepResearch 系统会前置一个“研究方案规划器”,负责将原始问题分解为多个正交的子问题,然后调用 Agent 来分而治之的解决这些子问题,最后再整合它们…- 5
- 0
-
MemAgent:当LLM学会记笔记,350万字超长文本处理难题迎刃而解
今天,我们要聊一个让所有大模型开发者都头疼的问题——长上下文(Long-Context)处理。想象一下,让AI阅读一本几十万字的小说并回答一个横跨多个章节的细节问题,或者让它分析一个包含数百万行代码的整个项目。这些任务对于当前的大模型来说,几乎是不可能完成的任务。 问题的根源在于Transformer架构的天生缺陷——O(n^2)的计算复杂度。这意味着上下文长度(n)每增加一倍,计算量和内存消耗就…- 20
- 0
-
字节推出 Claude Code 和 Gemini CLI 替代品(我测试了)
字节跳动刚刚推出了一个终端 AI 编程工具,类似于 Claude Code 或 Gemini CLI。我刚测试过,可能会让你失望。 字节跳动 一直在慢慢追赶 Cursor、Claude 和其他 AI 编程助手,试图在编程助手市场中建立自己的立足点。 如果你一直在关注我的内容,我之前比较了 Trae 与 Cursor 的编程分析测试。 Trae AI,并没有达到我的期望,尽管后来的更新令人印象深刻,…- 5
- 0
-
当微信支付开放MCP之后,我却有一点后怕。
前两天,微信开放了自己的微信支付MCP。补上了智能体链路的最后一块拼图。虽然现在还只能在腾讯自己家的腾讯元器上用,但,影响也还是足够的大。很多人可能不知道微信支付MCP到底意味着什么,但我正好是为数不多提前拿到正式版的体验者,还用它搓了几个小Demo。这两天,那种一边用一边产生那种兴奋与后怕交织的复杂感受,是真实得不能再真实了。所以,我也想,分享一下我自己真实客观的体验,和想法。先给完全不懂的用户…- 5
- 0
-
几个故事,理解AI Agent规划的不同实现方式
在o1将多步推理能力内化到模型之前,Agent规划的实现,依赖开发者在外部搭建的工作流。根据工作流的构建方式,可以分为“硬”和“软”两种。[1] 硬工作流: 系统流程类似扣子、dify等低代码平台,由开发者根据预设任务逻辑,搭建一个包含分支、判断条件的固定流程图。模型是被动的执行器,完全遵从预设好的硬编码流程,在指定节点执行某个具体任务。[2] 软工作流:模型提示词开…- 7
- 0
-
「上下文工程」硅谷爆火,Karpathy亲自站台!提示工程瞬间失宠
新智元报道 编辑:桃子【新智元导读】继提示工程之后,「上下文工程」又红了!这一概念深得Karpathy等硅谷大佬的喜欢,堪称「全新的氛围编程」。而智能体成败的关键,不在于精湛的代码,而是上下文工程。硅谷如今炙手可热的,不再是提示词工程,而是上下文工程(Context Engineering)! 就连AI大神Karpathy,都为「上下文工程」投下了一票。 还有Shopify CEO Tob…- 7
- 0
-
基于AI(LLM)和Playwright MCP(模型上下文协议)的测试自动化
编译整理|TesterHome社区 作者|Kailash Pathak以下为作者观点:在快节奏的软件开发领域,大规模交付高质量应用始终是一项挑战。传统测试自动化虽然功能强大,但常面临动态用户界面、不稳定测试和耗时的脚本维护等难题。生成式AI(GenAI)与Playwright MCP(模型上下文协议)——这对改变游戏规则的组合,正在重新定义现代测试自动化。 MCP(模型上下文协议) 本文将探讨这些…- 17
- 0
-
为什么我觉得AGI并不会马上到来
持续学习是一大瓶颈 “事情往往比你预期的慢,但一旦发生,又快得超出你的想象。”— 鲁迪格·多恩布什(Rudiger Dornbusch) 在我的播客[1]中,我经常跟嘉宾聊到实现AGI(通用人工智能)的时间表。有些嘉宾认为还需要20年[2],而有些人则认为2年就够[3]。截至2025年6月,我自己的观点如下。 持续学习能力问题 有时候人们会说,即使现在AI技术不再进步,当下的AI智能体也会比互…- 8
- 0
-
10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个
机器之心报道编辑:杨文这个AI让打工人「磕头」致谢。 前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩溃。要是哪个 AI 能一键分析表格,我当场就能给它磕一个。 现在,终于有 AI 来整顿 Excel 表格了! 这款 AI 工具名为 Shortcut,号称是「第一个超越人类的 Excel Agent…- 5
- 0
-
再见AI Agents,你好Agentic AI
AI Agents被定义为由大型语言模型(LLMs)和大型图像模型(LIMs)驱动的模块化系统,用于特定任务的自动化。Agentic AI的出现是为了解决AI Agents在处理复杂、多步骤或需要协作的场景中的局限性,它代表了一种范式转变,强调多智能体协作、动态任务分解、持久记忆和协调自主性。从基础AI Agents到Agentic AI系统、应用、局限性和解决方案策略的方法论流程图一、AI Ag…- 6
- 0
-
行业大模型的“燃料革命”:高质量数据集助推产业智能升级
在数字化转型浪潮中,行业大模型被视为推动产业升级的核心引擎。但是,当前大多数行业大模型面临着训练数据的质量缺陷导致模型“逻辑混乱的伪推理”巨大挑战。2025年4月30日全国数据标准化技术委员会秘书处发布了《高质量数据集建设指南(征求意见稿)》,对高质量数据集建设的全生命周期要求,包括数据需求、数据规划、数据采集、数据预处理、数据标注、模型验证等阶段提出了建设指南,同时对高质量数据集分类、质量评测规…- 8
- 0
-
大模型上下文工程(context engineering)
“上下文工程”(Context Engineering)这个在当前(2025年)AI领域,特别是大语言模型(LLM)应用中,变得至关重要的概念。这可以说是继“提示词工程”(Prompt Engineering)之后的又一个核心技术热点。 一、上下文工程(Context Engineering)是什么含义? 上下文工程(Context Engineering)是一种系统化的方法论和技术栈,其核心目标…- 5
- 0
-
2025年AI发展现状报告:AI实干家的操作指南
💡2025年,人工智能已不再是遥远的未来,而是企业竞争力的核心驱动力。从最初的探索性采购到如今的深度构建与运营,AI正在以前所未有的速度重塑各行各业的格局。ICONIQ发布的《2025 年人工智能发展现状报告:构建者实战指南》是写给 AI 实干家的操作指南。该报告深入剖析了AI构建者(AI Builder)的实践蓝图,揭示企业如何从概念构思到规模化,成功驾驭 AI 浪潮,实现业务增长与效率飞跃。原…- 4
- 0
-
智能检索+图技术:Neo4j、Kùzu 与代理式 RAG 的崛起
点击“蓝字” 关注我们在人工智能领域,大型语言模型(LLMs)正以惊人的速度重塑我们与机器交互的方式。然而,这些模型在处理复杂知识和动态信息时仍面临挑战。检索增强生成(RAG)技术的出现为解决这一问题提供了新思路,而当RAG与知识图谱(KGs)结合,并引入智能代理(Agents)进行流程编排时,一个更强大的AI生态正在形成。本文将深入探讨图基RAG(Graph RAG)的技术内涵、核心工具及代理驱…- 9
- 0
-
Ollama新版功能:AI思维链控制
~~关注我,一起成长~~ 1、概述 Ollama 现在可以启用或禁用思考功能。这使用户可以灵活地针对不同的应用程序和用例选择模型的思考行为。 当开启思考时,输出会将模型的思考和模型的输出分离;当关闭思考时,模型不会思考,直接输出内容。 支持思考的模型: • DeepSeek R1 • Qwen3 2、CLI命令行中使用 CLI中缺省是启用思考模式的,如: ollama run deepseek…- 23
- 0
-
炸裂!AI“读心术”被破解,我们终于能亲眼看见它的思考过程了!
解密AI黑箱:深入Anthropic开源电路追踪工具,看见语言模型的“思考”过程 图片来源:Anthropic 作为AI爱好者,我们总是对那些驱动着大型语言模型(LLM)的神秘力量充满好奇。它们如何写出诗歌?如何进行推理?当我们在屏幕上看到一个完美的答案时,其背后庞大的神经网络中究竟发生了什么?长期以来,这就像一个密不透风的“黑箱”。 然而,就在2025年5月29日,AI安全和研究领域的领军者…- 6
- 0
-
智谱新出的模型,做PPT太会整活了
上周的某个夜晚,我在智谱的Z.ai上悄悄发现了一个新模型。 GLM-Experimental。Experimental就是实验的意思,意思是说这是一个新的实验模型。 本来都准备睡觉了,但是看到“擅长PPT”,于是我就去跑了几个case。 比如,让模型做个关于Z.ai介绍的PPT。 左右滑动查看PPT更多内容啊???这是哪个神经产品经理跑来霍霍我们“又红又专”的GLM了? 别说……我还挺喜欢的。请继…- 6
- 0
-
忽视Embedding?你的RAG正在暗坑里裸奔!
你是否曾为一个智能问答系统倾尽心血,满怀期待地部署上线,却发现它频频翻车?用户抛来的问题,它要么答非所问,要么迟迟无应。你百思不得其解:是模型不够强,还是数据有问题?别急,低头看看脚下——你可能忽略了一个致命的“暗坑”:Embedding模型。作为RAG(Retrieval-Augmented Generation)系统的命脉,Embedding模型若选错了,你的系统就像在黑夜里裸奔,随时可能摔得…- 7
- 0
-
微软裁员9000人!给员工整不会了:用不用AI都要被裁?
微软宣布裁员9000人,18个月内第四次大规模人员调整。更值得玩味的是,微软正将AI工具使用率纳入员工绩效考核,并考虑在下一财年的绩效考核中,正式加入与 AI 使用相关的考核指标。 一方面用AI代替员工,一方面强制留任员工提升AI使用效率,这成为硅谷巨头的“家常便饭”。0118个月内微软的4次裁员Agent 智能体 微软这次行动并非是今年第一次大裁员,早在今年5月,微软就已宣布在全球范围内裁员约6…- 5
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























