AI资讯
-
MCP模型上下文协议详解(附参考资料)
一、MCP概述与背景MCP 由 Anthropic 于 2024 年 11 月推出,是一种开放协议,旨在标准化大语言模型(LLMs)应用程序与外部数据源和工具之间的交互方式。MCP的核心在于建立一个标准化的通信层,使得LLMs能够在处理用户请求或执行任务时,通过MCP客户端向MCP服务器发送请求。MCP服务器则负责与相应的外部数据源或工具进行交互,获取数据并按照MCP协议规范进行格式化,最后将格式…... -
AI+MCP+测试工具来了!
导言:测试自动化的三次进化浪潮从Selenium的「坐标记录」到Playwright的「智能等待」,UI自动化始终围绕确定性规则展开。而今,以Claude为代表的生成式AI与MCP协议的结合,正在触发第三次进化——让测试系统具备自主决策能力。这种变革不是简单的工具升级,而是从根本上重塑质量保障的运作范式。所以,我们能说测试智能体来了吗?破局:传统UI自动化的「三重困境」PART 01脚本脆弱性陷阱…... -
伯克利大学35页综述:多智能体LLM系统为何会失败?
尽管多智能体系统(MAS)备受关注,多个大模型智能体通过协作完成任务的方式引起了广泛兴趣,但在各种流行基准测试中,其性能提升相比单智能体框架仍然微不足道。这一差距凸显了分析影响MAS有效性挑战的必要性。本文提供了首个关于MAS挑战的综合研究。我们分析了五个流行的MAS框架在超过150个任务中的表现,并邀请六位专家标注员参与研究。我们识别出14种独特的失败模式,并提出了适用于各种MAS框架的综合分类…... -
【深度】一文解读Claude如何思考——大模型是真懂是装懂?
大模型(Large Language Model,LLM)在处理语言时,往往会给人一种“思考”的错觉:似乎它们能够层层推理、事先规划、或者对不同语言的知识进行统一抽象。Anthropic近期发表的一篇论文“On the Biology of a Large Language Model”使用了一种叫做“跨层转换器”的方式,对于 Claude 3.5 Haiku 模型的具体分析,可以帮助我们以更直观…... -
AI Agent:大模型落地应用的“最后一公里”?
前言自从ChatGpt面世以来,AI继续如火如荼地发展,一次次震惊世人。最近DeepSeek的横空出世,更是因为它的推理模型,首创的推理链并且将模型的思考推理过程展示给用户,以及极低的模型训练成本,一举夺得各大媒体头条,讨论热度居高不下,产品页面始终“服务器繁忙”。在外界大众看来,人工智能已经能够媲美人类,将来将替代大部分工作的言论也是甚嚣尘上。这种观点不能说是完全正确,但也确实反映了一种趋势和担…... -
豆包新发布的深度思考,让AI搜索更像人类的思考模式了
豆包新上线的深度思考,用起来好像...没那么“人工智障”了?想当初,ChatGPT、Perplexity、秘塔这些AI搜索工具刚出来的时候,都说要颠覆传统搜索。结果呢?我兴冲冲地抛给AI一个复杂问题,它“吭哧吭哧”搜了几百个网页,最后给我的答案,还是感觉差了点意思。要么是信息太零碎,像在堆砌资料;要么是抓不住重点,问题问东答西。总觉得AI只是机械地搬运信息,并没有真正理解我的问题,更别…... -
大模型下半场:7个趋势判断
推理模型能力的持续提升,推动大模型迎来“可用”到“好用”的拐点。推理强化和应用拓展启动了大模型下半场的新赛程。个人智能体潜力初步显现,行业应用渐次走深,开源开放日益成为大模型的核心竞争力组成。大算力、多模态、强推理、广开源、准数据、智能体、深应用等,成为当前发展的重要趋势。一、大力出奇迹的算力投入模式尚未见顶DeepSeek以557万美金的低成本训练,给全球带来很大震动。但这并未颠覆大模型需要大算…... -
FunctionCall还没学会,又来了MCP,一文搞懂他们的区别
对于很多关注人工智能应用拓展的人来说,Function Call 和 MCP 是相对陌生的概念,而且容易将二者混淆。鉴于它们在大模型与外部资源交互方面起着重要作用,很有必要清晰地了解它们各自的特点及相互之间的区别。接下来,就和大家分享一下。什么是MCP?MCP(Model Context Protocol):MCP 是 Anthropic 提出的一种标准化协议,旨在让 AI 应用更好地连接各种外部…... -
真格基金戴雨森:长聊 AI Agent,各行业都会遭遇「李世石时刻」(上)
上个月,真格基金管理合伙人戴雨森与「晚点」长聊了一次 AI 与 Agent。我们将这次访谈整理成完整版文字稿,分为(上)、(下)两期发布。去年至今有两个重要节点:o1 和 R1。它们分别带来了两个对 AI 全行业的影响:一是 o1 在大语言模型中引入强化学习,开启 pre-training(预训练)Scaling Law 之外的 post-training(后训练)和 test-time comp…... -
真格基金戴雨森:长聊 AI Agent,各行业都会遭遇「李世石时刻」(下)
上个月,真格基金管理合伙人戴雨森与「晚点」长聊了一次 AI 与 Agent。我们将这次访谈整理成完整版文字稿,分为(上)、(下)两期发布。在《真格基金戴雨森:长聊 AI Agent,各行业都会遭遇「李世石时刻」(上)》中,雨森解析了 o1 和 R1 模型的突破,指出:「在 Agent 时代,Attention is not all you need」。2025 年,AI 在特定领域超越人类的现象将…...