全部标签

新闻资讯

微软研究院路保同：用向量检索重塑模型注意力｜Attention

在大语言模型中，超长上下文推理能力是影响其性能表现的主要瓶颈之一。这是由于 Self-attention 的平方复杂度，和 KV 缓存显存先行、随着长度增长而造成的。例如，一个 8B 的模型在推理 1M Token 的上下文时，KV Cache 能轻轻松松超过 100GB 显存，普通的 GPU 在这种情况下根本跑不动。基于这一问题，新一篇 Attention 系列访谈文章，聚焦于论文 R…
前沿技术
- 0
- 0
charles3月6日
Azure Storage Discovery 现已正式发布！

我们很高兴宣布 Azure Storage Discovery（国际版）现已正式发布！这是一项全托管服务，能够为企业提供 Microsoft Azure Blob Storage 和 Azure Data Lake Storage 的全局可视化，让您轻松掌握数据资产。借助 Azure Storage Discovery（国际版），您可以优化存储成本、遵循安全最佳实践，…
前沿技术
- 0
- 0
charles3月6日
超越炒作：一份给企业管理者的大模型落地实操清单

当谈及人工智能，尤其是大语言模型时，企业决策者们往往被两种极端声音包围：一种是将其神化为解决一切业务难题的“万能钥匙”；另一种则是因其初期应用中的失误而将其视为“华而不实的玩具”。真相，恰恰介于两者之间。本文旨在为您——企业的掌舵者与场景负责人——提供一份务实的评估框架，帮助您超越技术炒作，清晰认知大模型的能力与边界，从而做出明智的选型与落地决策。一、大…
前沿技术
- 0
- 0
charles3月6日
Figma Make 技术实现剖析

核心技术栈与架构基础大语言模型代码生成的核心离不开大语言模型。 Figma Make 的核心驱动是 Claude Sonnet 4.5（最新版本）和早期的 Claude 3.7 Sonnet 模型。根据 Figma 的博客说他们选择这些模型的原因在于这两个模型在在代码生成和复杂推理任务上表现最优。比如在 SWE-bench 验证评估中的顶级表现，能够处理超过 30 小时的复杂多步骤任务，…
前沿技术
- 0
- 0
charles3月6日
所有的一切都是上下文 – 深入研究Claude体系的感悟

TL;DR在最近研究Claude Skills的过程中，它的运作机制对我的触动很大，而它的主要设计思路，是对上下文管理(Context Engineering)的精心打磨。结合自己在以前一些文章的积累，对上下文这个概念有了一些更深的认识。在本文中，简单梳理了一下Claude Skills的运作机制和Claude全家桶全面的上下文管理思路。这部分有点技术化，但是思考的方式非常有意思，感兴…
前沿技术
- 0
- 0
charles3月6日
Claude Skills 自定义实战：提炼会议纪要并推送企业微信

上一次，我们了解了 Claude Skills 有哪些内置技能，并实际体验了一把。今天，我们就自己搭建一个 Skill。毕竟，自己搭的才能真正解决我们手头的问题。重要步骤步骤非常简单，按照官网教程主要就 3 步：创建一个Skill.md文件，名词就叫这个，也是单个技能的入口。添加辅助资源，包括参考文档、图片，甚至可执行脚本。打包，这一步其实有两种方式。如果是在线 Cl…
前沿技术
- 0
- 0
charles3月6日
AI 产品 vs 互联网产品商业化的关键差别

过去二十年，互联网产品创造了无数奇迹：社交、搜索、电商、短视频……商业化路径几乎被总结成“流量—转化—变现”的经典打法。但当我们进入 AI 时代时：AI 产品的商业化，是否可以照搬互联网的路子？我认为：骨架相同，但物理规则完全不同。互联网靠的是规模效应，而 AI 靠的是场景选择、ROI 验证和成本控制。换句话说，互联网是“规模优先”，AI 是“价值优先”。接下来，我想从 9 个角度，和你聊聊 AI…
前沿技术
- 0
- 0
charles3月6日
复杂文档也能一键读懂？PaddleOCR VL + RAG 给出新答案

当文档包含复杂表格、数学公式或多栏排版时，传统 OCR 工具往往会产出杂乱内容，需要手动整理。就在上周，我逛 GitHub 时看到了百度新近开源的 PaddleOCR-VL-0.9B。老实讲，看到它只有 9 亿参数时，我第一反应是：“哦，又一个小模型来凑热闹？”但出于职业好奇，我还是要问一句：它能打吗？结果完全把我震住了。这不只是 OCR，这是文档理解的一次量子飞跃PaddleOCR-VL 远超我…
前沿技术
- 0
- 0
charles3月6日
什么是CUDA？大模型推理过程中的计算为什么需要它？

CUDA，英文全称：Compute Unified Device Architecture，直译过来就叫：统一设备计算架构，它是英伟达开发的一种并行计算平台和编程模型，简单理解其实就是一种开发框架，用更通俗一点的话来说：CUDA 就是一套让程序员能“指挥”NVIDIA 显卡（GPU）来做大量计算工作的工具。为什么需要 CUDA？传统的 CPU 擅长处理…
前沿技术
- 0
- 0
charles3月6日
大模型建设难点：多源异构数据的统一接入与治理

导读在大模型建设过程中，多源异构数据的统一接入与治理是一大难题，因为它不仅是技术接口问题，还涉及跨部门的数据标准协同。不同系统建设年代不同，厂商各异，数据权限归属也不清晰。本文结合车企真实案例，分享了该问题带来的三重挑战和治理策略，各行业均值得借鉴。分享者：陈强现任职于某大型车企，硕士，毕业于华东师范大学，曾就职于 Intel、IBM、联想、爱奇艺等公司；有多年基于 Do…
前沿技术
- 0
- 0
charles3月6日
世界模型｜中国企业AI转型的奇思妙想

今天我参加了金蝶年度客户大会，会上金蝶董事长宣布公司核心产品由“金蝶云”更名为“金蝶AI”。企业们都认为AI转型是当前的要务，然而，采用大语言模型驱动的智能体是不是就是企业AI转型的终极方向呢？我在《果总原创｜企业人工智能转型的策略和方法论》文中总结了当前的主流设想。我主持了一个来自大型企业的企业家、企业CIO的闭门论坛，讨论企业AI转型的现状和设想。有位来自某头部光伏企业CIO分享的AI转型…
前沿技术
- 0
- 0
charles3月6日
它来了！Context Engineering 2.0

从ChatGPT到Cursor，我们越来越习惯让AI“记住”刚才的对话、项目背景、甚至个人偏好。但“把历史记录塞进提示词”≠上下文工程。SJTU&SII&GAIR的的新作《Context Engineering 2.0:The Context of Context Engineering》想回答三个终极问题：上下文工程到底是什么？它从哪来，要往哪去？怎么系统性地设计，而不是靠“拍脑…
前沿技术
- 0
- 0
charles3月6日
AI教父Hinton末日警告！你必须失业，AI万亿泡沫豪赌才能「赢」

「这场AI万亿美元豪赌，只有裁员才能盈利」。这是AI教父Hinton，最新发出的末日警告。最近，Hinton在接受彭博采访时，直言不讳地预警：超级智能AI即将到来，它不仅会取代人类、引发大规模失业，甚至威胁人类生存。科技巨头们正在亲手制造「外星入侵者」，却仍在沉迷于商业竞赛。如今，AI的终极泡沫，近在眼前。预计明年，微软、Meta、谷歌、亚马逊这四大巨头在AI领域支出高达4200亿美元（今年360…
前沿技术
- 0
- 0
charles3月6日
Claude Code Router快速上手教程

Claude Code Router 是什么？Claude Code是为编写代码而生的Agent，可以像与人对话一样，使用自然语言轻松实现的想法，无需任何学习成本。Claude Code Router是Claude Code请求路由的一个中间平台，可将请求路由到指定的大模型供应商，如gpt、claude4。5 分钟安装教程# 1️⃣ 安装 Claude Codenpm install -…
前沿技术
- 0
- 0
charles3月6日
阿里新研究：统一了VLA和世界模型

如果说视觉让AI看见世界，动作让AI改变世界，那么——WorldVLA正在让AI理解世界。顾名思义，WorldVLA是一个将视觉语言动作模型（VLA）与世界模型相融合的统一框架，由阿里巴巴达摩院、湖畔实验室和浙江大学共同提出。在该框架下，世界模型通过结合对动作与图像的理解来预测未来图像，旨在学习环境的潜在物理规律，以提升动作生成的准确性；动作模型则基于图像观测生成后续动作，不仅有助于视觉理解，还反…
前沿技术
- 0
- 0
charles3月6日
开发一套Agent平台难吗？

随着生成式 AI 技术的爆发式发展，Agent（智能体）已从学术概念逐步落地为企业数字化转型的核心工具——它能模拟人类决策逻辑，自主完成 “感知环境 - 分析任务 - 执行操作 - 优化反馈” 的闭环，广泛应用于客户服务（智能客服 Agent）、智能制造（设备运维 Agent）、供应链管理（库存调度 Agent）等领域。据《2024年全球AI Agent产业研究报告》显示，2024年全球企业对 A…
前沿技术
- 0
- 0
charles3月6日
Dify VS N8N 谁更牛？

核心定位与技术架构差异对比维度DifyN8N核心定位AI原生应用开发平台，专注大语言模型（LLM）应用构建通用工作流自动化引擎，聚焦跨系统流程连接与执行技术架构LLM优先设计，内置模型管理、RAG引擎、知识库系统节点驱动架构，支持400+预建集成节点与自定义代码扩展核心价值降低AI应用开发门槛，实现从知识库构建到智能交互的全流程支持打破系统孤岛，通过可视化+代码双模式实现复杂流程自动化…
前沿技术
- 0
- 0
charles3月6日
详解Al Agent (智能体) L0-L5的分级框架！

AI智能体自主性表现（Agentic behavior）指的是AI系统具备的自主能力与决策水平，其范围涵盖从简单的任务自动化，到完全自主运行的智能体系统。本文将详解智能体自主性的每个层级，当前智能体的行业现状以及发展的核心局限。何为“自主性”？为何要分级？如今行业都在争相构建AI智能体，但若问“AI智能体究竟是什么”，往往会得到不同答案。与其纠结定义，不如聚焦核心问题：这些系统实际能做什么？它们拥…
前沿技术
- 0
- 0
charles3月6日
大模型不擅长点鼠标？中科院团队打造AI专属交互界面，任务成功率提升67%

在日常使用电脑时，看着屏幕、点击鼠标是再自然不过的基本操作。但这种对人类明明很容易的操作方式，却成为 AI 的巨大挑战：它们视力差、动作慢、不擅长看也不擅长点。几十年来，操作系统的图形用户界面（GUI）一直都是为人类使用而设计，从未考虑有一天，大语言模型（LLM）会成为操作系统新的使用者。要知道，GUI 智能体与人类在能力上存在巨大的差异，完美适配人类能力特征的 GUI，反而非常不适合 LLM 使…
前沿技术
- 0
- 0
charles3月5日
我错了，Gemini 做PPT不是“一般”，是“封神”。（尤其挖到第3层功能后…）

讲真，一开始我对 Gemini 做 PPT 是没抱什么希望的。这功能上得又低调又晚，国内 AI 不都玩烂了么？我抱着“就随便看看”的心态去试了试，第一感觉：就这？它也能传附件、也能根据主题生成，但感觉... 很一般。直到我发现了它跟 Canvas 和 Slides 的恐怖联动... 朋友们，我收回前言。这（可能）是目前最强的 AI PPT 解决方案。信我，它强的地方跟你想的完全不一样。1. 不只是…
前沿技术
- 0
- 0
charles3月5日
微信开发者工具 2.0，全面升级智能编程新体验

在今年「微信技术公开课」上，微信开发生态团队发布了全新的微信开发者工具 2.0（开发者预览版），希望在全过程智能编程方向上提供更好的开发体验。相比于之前的版本，新版微信开发者工具有很多亮点，接下来为各位开发者详细介绍：内核升级1. 焕然一新的开发体验相信经常使用的开发者一眼就能看出不同。微信团队对「开发者工具」的整体结构、编辑器和模拟器都进行了全方位的升级改造。特别是重新设计的 Toolbar，让…
前沿技术
- 0
- 0
charles3月5日
实战·Agentic 上下文工程（下）：实现一个可自我学习与进化的智能体原型

在上篇中，我们了解到ACE(Agentic上下文工程)框架的核心理念：不依赖模型微调，而是通过上下文的自我演化，让智能体实现“自学成长”。本篇参考 ACE 论文中的架构与提示词设计，实现一个可自我学习与进化的 ACE 智能体原型，帮助你更直观地理解 ACE 在实际系统中的运作机制。内容概览：整体架构与流程实现Playbook -- “策略手册”实现Generator -- “行动者”实现Refle…
前沿技术
- 0
- 0
charles3月5日
美团新独立APP，点不了菜只能点AI

用外卖的打法做AI模型？美团这是跟“又快又稳”杠上了（doge）。两个月哐哐发了多款模型后，美团依旧动作不停——最新开源LongCat-Flash-Omni，从名字你也能看出来了（Omni意为“全能的”），没错，这款模型终于支持多模态了！任务虽更复杂，但模型实力不减，一出手依旧是“开源即SOTA”：在综合性的全模态基准测试（如Omni-Bench, WorldSense）上，超越Qwen3-Omn…
前沿技术
- 0
- 0
charles3月5日
当AI的知识与认知能力全面超越人类时

当AI 知识与认知能力超越人类之后，作为具体个人如何辨别与区分哪些是自己可理解的知识领域，哪些是无法判断的知识领域，或者是哪些根本无法理解与判断，完全超越出自己认知范围之内领域，可能未来最大的挑战来源于，很多时候是人类认知无法理解与判断的领域会越来越大，并且完全无法理解它为什么会如此发生，可能未来超级智能的发展与进化速度会在为人类认知与判断划分一个基本界限，人类智能由于遭遇了几十万倍智能…
前沿技术
- 0
- 0
charles3月5日