全部标签

新闻资讯

Google 11月发布了Agent质量白皮书，输出了四大评估支柱，两大评估层级、三大可视化基石

Google这两天发布了最新的《Agent Quality》白皮书，深入探讨了在 AI Agents时代，软件工程和质量保证（QA）面临的范式转变，并提供了一套完整的框架来构建、评估和监控高可靠性的 AI 系统。今天来解读一下这份Agent质量白皮书里有哪些内容。AI Agents时代的核心挑战，是传统的软件测试已无法应对 AI 智能体。传统软件测试有确定的路径和期望输出。像送货卡车，按既定路线行…
前沿技术
- 0
- 0
charles3月16日
为何AI创业者不应迷信RaaS

最近，欧洲独角兽、募资超过5000万英镑的法律AI创业公司Robin AI被爆出融资失败、濒临倒闭。与之对比鲜明的，是美国的法律AI公司Harvey AI刚以80亿美元估值完成了1.5亿美元的融资。什么决定了两者命运呢？商业模式。商业模式指价值主张以及实现价值主张所采用的分工治理模式，即哪些是合作伙伴做、哪些自己做以及对应地获取哪部分收入。我课上常这样引出商业模式：给定你优秀的法律AI能力，前途取…
前沿技术
- 0
- 0
charles3月16日
仅凭几张图片，我们是如何让 AI 自动生成 70% 可用前端代码的？

本文系统总结了在仅有 UI 图片、无设计稿和交互说明的情况下，如何通过 AI 技术实现高质量前端代码自动生成。一、需求图片开局一张图需求，前端先行！对于一个仅提供几张图片没有任何Sketch文件和设计稿的前端开发需求，我们尝试使用AI技术来生成代码。看下来非常合适用AI出码，分别尝试使用不同方式出码：二、imgcook + Agent 智能出码方案演进基于imgcook插件 + Aone Agen…
前沿技术
- 0
- 0
charles3月16日
Kylin MCP Server 发布：打通 Agent 与企业数据的“高速通道”

近日，Kylin MCP Server 对外发布，成为连接 AI 智能体与企业数据资产的统一服务接口。它能够安全、高效地向 Agent 开放企业级数据能力，使 Agent 在分析、洞察、问答等场景中获得高精度与高稳定性的支撑，从而加速企业 Agent 落地与规模化应用。下载体验·项目地址👇https://github.com/jlfsdtc/Kylin-MCP MCP Server 被视…
前沿技术
- 0
- 0
charles3月16日
突发！Claude Opus 4.5编程世界第一，把谷歌OpenAI踢下王座

全球编码王座，一夜易主。果不其然，Anthropic深夜放出了Claude Opus 4.5，堪称全球最顶尖的模型。它不仅编程强，而且智能体和计算机使用（computer use）能力也是一流。Opus 4.5的诞生，标志着AI能力再一次飞跃，更将在未来彻底变革工作的方式。基准测试中，Opus 4.5的编码、工具调用、计算机使用的成绩刷新SOTA，比Sonnet 4.5、Opus 4.1领先一大截…
前沿技术
- 0
- 0
charles3月16日
Opus 4.5 发布：所有信息，全整理

今天，Anthropic 发布了 Claude Opus 4.5，目前编程能力最强的大模型更多成绩成绩：• SWE-bench Verified：80.9%（GPT-5.1 是 76.3%，Gemini 3 Pro 是 76.2%）• Terminal-Bench 2.0：59.3%• OSWorld：66.3%• ARC-AGI-2：37.6%Anthropic 还放了一个…
前沿技术
- 0
- 0
charles3月16日
Google又发布了一篇可能改变AI未来的论文，这次它教AI拥有了记忆。

前两天，Google发了一个非常有趣的论文：《Nested Learning: The Illusion of Deep Learning Architectures》非常有意思，很多人戏称，这篇论文，是《Attention is all you need (V2)》。《Attention is all you need》，神中神。这篇论文提出的Transformer架构，现在是几乎所…
前沿技术
- 0
- 0
charles3月15日
Nano Banana Pro 到底强在哪？10个落地场景告诉你（附Prompt）

今天带来迟到的Nano Banana Pro评测..21号，Google发布了Nano Banana Pro🍌，图像生成SOTA模型，奈何当时一直在沪给企业做培训，没有时间测，现在终于有空来爽玩一下了！看到老朋友Lovart第一时间接入模型，老规矩直接Free爽玩三天，第一时间就丢到各大群里了..群友们已经爽玩了三天，带来各种创意Case，地址在这：www.lovart.ai趁着回程的高铁，我抱着…
前沿技术
- 0
- 0
charles3月15日
anthropic慌了，Claude 4.5 Opus发布即降价

前言既然这么强，为啥要降价捏～我就喜欢你桀骜不驯的样子呢我们来分析下大模型定价背后的事儿下面是发布内容哈～我们的最新力作——Claude Opus 4.5，于今日正式上线。它不仅智能、高效，更堪称目前全球范围内处理代码、驱动 AI 智能体 (AI Agent) 以及操作计算机的最佳模型。在深度研究、处理幻灯片和电子表格等日常任务上，它也展现出了显著的进步。Opus 4.5 不仅代表了 …
前沿技术
- 0
- 0
charles3月15日
Agent 设计的实践挑战与经验总结

近期关于智能体（Agent）构建的实践经验表明,这项工作的复杂度远超预期。随着实际应用场景的深入,许多看似简单的技术决策都暴露出需要权衡的地方。本文将从SDK选择、缓存策略、循环强化等多个维度,分享构建生产级智能体过程中的关键发现。SDK选择的困境与取舍在智能体开发初期,开发者往往面临一个基础选择:是直接使用底层SDK(如OpenAI SDK或Anthropic SDK),还是采用更高级的抽象层(…
前沿技术
- 0
- 0
charles3月15日
解锁Gemini 3 Pro潜力：Google官方Prompt Engineering最佳实践

Gemini 3 Pro 必须是最近火热的话题。昨天在一个大佬的评论区看到有好几个人留言说：“Gemini 3 Pro 老理解错意思”。我想可能不是它理解不了，是我们表达得不够清楚。如果只能推荐一份关于 Gemini 3 Pro 的进阶指南，我会毫不犹豫地选择这一份：谷歌官方 68 页提示词工程手册。下面是基于本书做的总结：13条Prompt Engineering最佳实践
前沿技术
- 0
- 0
charles3月15日
Pixeltable:一张表搞定embeddings、LLM、向量搜索，多模态开发不再拼凑工具

开发过多模态 AI 应用的人都应该遇到过这个问题，其实最头疼的不是算法而是基础设施。向量数据库需要存 embeddings；SQL 数据库需要元数据管理；大文件还要放到对象存储上，不仅邀单独跑个 pipeline 做 chunking，还要再写个脚本调模型推理，最后还得套个 Agent 框架把这些东西串起来。代码里到处是胶水逻辑，维护起来十分麻烦。Pixeltable 这个开源库就的目标…
前沿技术
- 0
- 0
charles3月15日
深入AI Agent内核: Google gemini-cli 源码深度解构

随着大语言模型与开发工具链的深度融合，命令行终端正被重塑为开发者的AI协作界面。本文以 Google gemini-cli 为范本，通过源码解构，系统性分析其 Agent 内核、ReAct 工作流、工具调用与上下文管理等核心模块的实现原理。为希望构建终端 Agent 的开发者，提供工程实现的系统化参考。一、引言命令行终端是开发者的核心工作区，也是许多开发者完成工作的首选工具。当前，大语言模型正在重…
前沿技术
- 0
- 0
charles3月15日
Data Agent的理想很美好，现实很残酷

这是一篇关于Data Agent的技术实践思考与应用价值探索，同时也是这一年实践经验的沉淀。PS：这是今年关于ai大模型应用实践的总结第一篇。另外感谢gemini帮忙修改文章里的语病和美化格式。Data Agent综述为了准确理解Data Agent，我咨询了DeepSeek、豆包和通义千问，它们各自给出了如下定义：• DeepSeek的回答：Data Agent（数据智能体…
前沿技术
- 0
- 0
charles3月15日
Google 发布 Antigravity Agent编辑器

当前使用版本Antigravity Version: 1.11.2优势支持macOS、Windows、Linux多平台免费预览阶段，可以免费使用限制macOS最低支持 12(Monterey)Windows最低支持 Windows 10（64 位）Linux最低支持 Ubuntu 20、Debian 10、Fedora 36、RHEL 8等需要使用Google 账号登录授权需要科学上网环境Gemi…
前沿技术
- 0
- 0
charles3月15日
在全世界都教你写Prompt的时候，我做了个不用Prompt的AI画图产品

为什么我要做Morisot这款产品？几年前，我在前东家做手机输入法产品。有一天，我盯着自己电脑上的输入法皮肤，突然冒出一个念头：“这皮肤，我真的看腻了。”但紧接着第二个念头就是——“那我想要什么风格呢？”我竟然一句话也说不清。「要不要换成深色？」「还是再可爱一点？」「要不要来点扁平、极简、3D科技感？」……按常规做法，产品经理下一步应该是：写一份很专业的需求文档，认真描述——主色调要偏什么色号视觉…
前沿技术
- 0
- 0
charles3月15日
谈LLM应用层目前推荐的新功能研发范式

其实本文要谈的范式并不是一个很少见的方式，但真的能这么做的团队并不多。我感觉目前遇到的case中，能这么做的创业团队大概这方面的研发能力已经跻身于第一梯队了。如果是在一个超过100人的组织中（严格来说是单一业务中），那么这种研发方式就更加少见，并且更加难推动。而我刚刚在一个组织中实践和推行了这种方式，所以也算是有了一些在组织中实践的经验，不算是无病呻吟。本文在我之前的实践基础上，又做了一些扩展，增…
前沿技术
- 0
- 0
charles3月15日
一文说清 Agentic AI：基于 LLM 的智能体进化史

主要内容包括以下几个部分：1. Agent 概念溯源2. 阶段一：裸大模型调用时期3. 阶段二： LLM-Based Agent 探索4. AI Agent 与 LLM-Based Agent5. 阶段三：从单一到多元，协作模式的探索（2023年 - 2024年）6. 阶段四：多智能体蓬勃发展7. 站在 AGI 回望 Agentic AI8. 写在最后作者｜马云…
前沿技术
- 0
- 0
charles3月15日
我来彻底说说 AI 上下文工程（下）

在前两篇里，我们从概念与基础实践（上），聊到了 LangChain、Claude Code 等工程化案例（中）。这篇我们会把故事收尾：一端是 Manus 和 Kiro 代表的工程极致；另一端，是比「上下文工程」更远一步的「环境工程」视角。从 Manus 看「极致工程化」的上下文设计（manus System Architecture and Workflow）很多人第一次看到 Manus 的结构图…
前沿技术
- 0
- 0
charles3月15日
Cursor看了都要菊花一紧！Google AntiGravity 官方教程生猛来袭！

AntiGravity不仅仅是一个代码编辑器，更是一个集成了智能代理管理和全功能浏览器的综合开发环境。通过 AI 代理接管环境配置、代码编写、文档查阅甚至端到端测试等耗时任务，将传统的开发效率从 90% 提升至 100%。和传统的Cursor完全不一样，AntiGravity开发环境分为三大核心支柱：Agent优先，Agent Manager专用用来统筹管理分布在不同工作空间中的 AI 代理。深度…
前沿技术
- 0
- 0
charles3月15日
不服 Gemini 3！Claude 祭出 Skills“反杀” 器！

最近，谷歌发布的 Gemini 3 Pro 在前端开发能力上表现惊艳，引发了开发者的热议。许多人测试后发现，它生成的前端界面确实比之前的版本更加精致和多样化。但如果你是 Claude 的老用户，可能会发现一个问题：无论让 Claude 生成多少次界面，似乎总是那熟悉的配方——Inter 字体、紫色渐变、白色背景、简约动画。虽然干净整洁，但看多了难免审美疲劳，一眼看上去就知道是 AI 写…
前沿技术
- 0
- 0
charles3月15日
麦肯锡最新重量级报告：《The State of AI》全球企业AI应用现状——AI飞速普及，但能转化成利润的企业，只有 6%

自 2020 年起，麦肯锡每年都会发布《The State of AI》调研，持续追踪全球企业在 AI 技术、组织变革、人才与商业价值方面的真实进展。今年（2025），11月5日，麦肯锡再次发布重量级报告，对全球企业的 AI 使用现状与趋势进行了系统研究。本次调研覆盖面更广、规模更大：调研时间：2025 年 6 月 25 日 – 7 月 29 日调研方式：在线问卷调研对象：来自 105…
前沿技术
- 0
- 0
charles3月15日
Hugging Face CEO预警：AI泡沫将破，无人幸免！

【新智元导读】 AI泡沫的警钟被连环敲响：Hugging Face说泡沫的是LLM，不是AI；谷歌警告，泡沫若破，无人幸免；资本已开始撤退。神话的光环正在褪色，技术的真相正在浮出。AI的故事，也许从泡沫碎裂那一刻，才真正开始。过去一周，「AI泡沫论」突然密集爆发。Hugging Face的Clem说我们陷入的是「LLM泡沫」，不是AI；谷歌的皮查伊警告，若泡沫破裂，谁都逃不掉。投资圈更早…
前沿技术
- 0
- 0
charles3月15日
把专家判断转化成AI能力，这家团队融资7200万美元，用AI做工程产品设计评审

昨天，S朋友分享了一家企业给我，这个月刚它完成了7200万美元C轮融资，YC跟投，发展速度很快。它是一家为工程机械和硬件开发团队打造协作工具的SaaS公司，名叫CoLab，这家成立仅8年的公司，累计融资已超1.3亿美元。更值得关注的是增长数据。过去三年收入增长超过10倍，2024年B轮时实现了158%的净收入留存率(NRR)，C轮披露2025年预计收入再翻三倍。福特、通用电气、江森自控、施耐德这些…
前沿技术
- 0
- 0
charles3月15日