-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 0
- 0
-
Function Calling已经过时 ,MCP才是真正的大模型接口标准
前言过去一个月,全球大模型圈最热的关键词,非MCP莫属。模型侧,从Claude到Open AI,从Llama到DeepSeek、通义;应用侧,从Figma到Unreal,从Milvus到高德地图,全球超过 8,000 个主流工具和软件支持MCP,适配 MCP Server已经成为行业标准动作;可以说,模型与工具对接标准的大一统时代已经呼之欲出;而借助MCP,人人都是AI应用开发者的时代也正加速到来…- 0
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 0
- 0
-
除了MCP我们还有什么?
在 AI 时代的浪潮下,wildCard 团队在 OpenAPI 基础之上,实现了 agents.json规范,它是一个基于 OpenAPI 标准的开放规范,通过将互联网上的服务提供方(如alibaba.com、谷歌邮箱等)提供的 API 进行进一步的结构化描述,使 AI agents 可以更稳定更准确的调用API Service,是一个专门为 AI agent 设计的与网络服务提供方的交互方案。…- 0
- 0
-
LLM 推理引擎之争:Ollama or vLLM ?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型推理框架。 在人工智能领域,模型的推理能力是衡量其性能的核心指标之一,直接影响其在复杂任务中的表现。随着自然语言处理(NLP)和大规模语言模型(LLM)技术的迅猛发展,众多创新模型不断涌现,为开发者提供了多样化的选…- 0
- 0
-
大模型技术创新驱动的AI生态和应用演进
我把AI的发展阶段和地球上从生物智能到人类智能的发展阶段做了一个对比,发现一些非常有意思的规律。大家首先来看AI发展的四个阶段。第一阶段:1940年代开启人工智能的元年,整个人工智能从1940年代图灵提出计算机理论模型和神经网络的初始构想,到1956年达特茅斯会议首次提出人工智能,此后人工智能进入符号主义、行为主义、连接主义的曲折发展;第二阶段:2012~2018年间的感知AI(Perceptio…- 0
- 0
-
刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦
今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经将该模型集成在产品中。需要注意的是,OpenAI已经对新模型的API使…- 0
- 0
-
捕获AI的注意力:重复、幻觉、偏见背后的物理学
Spin-Transformer数据雕刻自旋玻璃 中笔者总结过:“从概念上的相似性、物理解释、优化参数规模角度,基于矢量自旋磁化的平均场新方程,提出了一类受物理启发的 spin-transformer :一个可微的矢量自旋系统,由数据驱动,其集体行为可以通过训练来塑造。这是一个高度自适应的系统,其中自旋交互形势全景本身是由输入动态塑造的。”4月初乔治华盛顿大学学者采用…- 1
- 0
-
Trae这次更新太炸了:上下文、MCP、智能体全上线,AI IDE全面觉醒!
春节前,字节低调发布了全新的AI IDE:Trae。最初我只是出于好奇随手试了试,谁知道这一试,直接上头了!几个月下来,它几乎周周更新,功能一个接一个地补齐,体验也越来越丝滑。不得不说,这次的更新,我真觉得它可以"封神"了。这波更新,根本不是简单打补丁,而是一次系统级的进化。它从模型、上下文理解、执行能力,到智能体的全面登场,彻底突破了"AI工具"的范畴,成…- 0
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 0
- 0
-
专题策划(下)| 如何实现大模型与行业的深度耦合?
学术沙龙思想库Review2025年,以行业大模型为代表的人工智能将进一步赋能产业升级。大模型应用已覆盖油气、煤炭、电力和新能源等多个领域,而大模型与行业的深度耦合被视为一项系统工程,需要从数据、技术、人才等多个维度协同发力。近期,《能源评论》与许继电气联合举办第36次学术沙龙,邀请学术界、企业界专家,围绕“行业大模型与通用大模型、专用小模型的异同”“大模型在能源、通信等领域的应用”“行业大模型如…- 2
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 1
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 2
- 0
-
2025:LLM 超越 “Token 生成器” 的一年
在刚刚过去的 GTC 2025 大会上,Meta 首席 AI 科学家 Yann LeCun (一如既往地)再次发出了对当前主流大模型的尖锐批评。他坚持认为,LLM 本质上仍是 “Token 生成器” ,其核心在于预测离散 Token 序列,而非构建对世界的稳健理解。“LLMs are mere token generators — lacking world models, reasoning, …- 1
- 0
-
DeepSeek助力企业变革核心业务?这8个案例太经典了
AI技术浪潮奔涌而来,以摧枯拉朽之势重构产业格局,以DeepSeek为代表的大模型不仅在推理精度、训练效率、交互方式等维度实现跨越式突破,更以全栈自主的技术架构为企业智能化转型提供新的契机,企业如何从 “效率工具” 的使用者,向 “智能引擎” 进行跃迁,是每一位决策者必须破解的难题。 2025年4月15日,华为云“企业快成长DeepSeek行业深度应用创新论坛”在北京拉开帷幕。来自金融、医疗、传媒…- 1
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 0
- 0
-
万字解读AI落地本质:To B才是AI主战场
点击卡片 关注我们虎嗅智库荐语:2025年全球AI技术发展已进入深水区,以DeepSeek、Gemini为代表的模型突破与ChatGPT等产品的持续迭代,正在加速技术从实验室向产业端的渗透。 在这个关键节点下,多数企业面临着美国关税政策与宏观经济波动等现实困境,AI技术的爆炸式增长又带来了"用或不用"的战略焦虑。 谷歌云CEO托马斯·库里安的判断直击本质——AI落地难题的症结不…- 0
- 0
-
一家小VC眼中的:AI投资指北
题记白猫、黑猫,抓住老鼠就是好猫!但是,你也别给我整个机器猫啊 今年以来,一级市场的热点不断切换。曾经火热的硬科技赛道慢慢冷却下来,有人这样评价硬科技赛道:没有人能做出来的时候,叫做卡脖子当有一个人做出来的时候,就成了制造业当有三个人做出来的时候,变成了产能过剩最近外部环境出现了大幅波动,也给硬科技行业投资带来了影响;很多投资人都在观望,甚至重新思考硬科技赛道的投资逻辑。另一…- 1
- 0
-
揭秘Manus:了解其背后的原理与架构
一、Manus 的整体架构Manus 的架构可以类比为 “一个会思考的云端机器人”,它由 大脑(模型层)、双手(工具层) 和 工作台(执行环境) 三部分组成:1. 大脑(模型层)功能:负责理解用户指令、规划任务步骤、监控执行过程。技术实现: (1)基于多个大模型(如 Claude 3.5 和 Qw…- 1
- 0
-
周飞:能源电力大模型的研发路径与应用模式探讨
大模型要融入到电力系统各业务环节,一个有效的解决思路是,将近年来兴起的具身智能与智能体相结合,构建电力具身智能体,为大模型添加“可行动的躯体”。文/周飞(中国电力科学研究院正高级工程师,电力异构融合类脑计算关键技术研究项目负责人、电力人工智能大模型分布式算力调度与协同训练推理项目执行负责人)生成式人工智能(AI)大模型已成为当前第三次AI浪潮的研究热点,代表了AI技术最新发展趋势,将引领三场革命:…- 0
- 0
-
OpenAI:就你们也配做智能体?
「OpenAI吹响市场清洗号角。」4月17日,OpenAI发布了全新的推理模型o3和o4-mini。着实令人意外!因为前天新版本大模型GPT-4.1刚刚发布,业内以为短时间内OpenAI不会再发新模型,此前Altman明确表示过不会再单独发布o3模型,要将其融合进GPT 5一起提供给用户。没想到,这次大料接着一个大料!这次o3和o4-mini除了在Codeforces、SWE-bench、MMMU…- 0
- 0
-
AI 能陪你亲亲热热,多亏了“存储硬汉”输出狠活儿!
AI 能陪你亲亲热热,多亏了“存储硬汉”输出狠活儿!文 | 史中(一)AI 凭啥免费给你香香?你有没有想过,这些国民级的 AI 应用凭啥能免费给你用?现在咱人均都有四五个“在线卑微”的 AI 秘书。她们化着淡妆站一排,从“霸王龙怎么搓澡”到“丧尸围城靠一根牙签如何突围”,无论多奇葩的问题,只要你问得出口,她们就必须捏着鼻子答。而且,豆秘书(豆包)的答案不满意,你扭头就去找 D 秘书(DeepSee…- 0
- 0
-
AI Agent 的下半场:从token生成到自主体验
“?²·ℙarad?g?智能平方范式研究:书写解构智能,范式提升认知AI agents 是由大型语言模型(LLM)驱动的行动体,但 LLM 的核心能力在于生成 token,类似于一个“语言的缸中之脑”——它不具备外部感知或与真实世界直接交互的能力,也没有内生的意志或自发的动机。因此,在当前技术阶段,AI agents 的行动动机仍然依赖于人类通过指令、提示(prompt)或任务定义来提供。为了让 …- 0
- 0
-
突发!OpenAI 收购谷歌 Chrome 浏览器,AI与搜索领域或掀风暴!
2025年 4月23日凌晨,AI界再次传来重磅消息:路透社报道OpenAI高管在谷歌垄断案庭审中透露有意收购谷歌旗下Chrome浏览器。此时,谷歌正深陷美国司法部发起的反垄断审判泥沼,如果上诉失败,面临的不仅是Chrome业务的拆分,数字广告业务也会被剥离,公司架构将被强制重组。此前的4 月21 日凌晨,《华盛顿邮报》率先曝光谷歌被起诉一事,司法部意在通过要求谷歌出售 Chrome 浏览器,打破搜…- 0
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页
联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!