-
谁说 Mac 只能写代码?Google 官宣:M 芯片本地微调 Gemma 4 时代开启!
Gemma 4多模态微调,Apple Silicon就能搞定很多Mac用户在本地开发AI时,第一反应就是硬件扛不住。想让Gemma 4处理音频、文本和图像三种数据,完成一次多模态微调,传统路径要么上云端烧钱,要么本地直接OOM。M系列芯片的Neural Engine明明很强,但框架兼容性差,混合数据输入经常卡住。Google Gemma官方账号转发了一个社区项目,直接打破这个限制。这个…- 9
- 0
-
用 Unsloth 微调 Embedding 模型,让你的 RAG 检索不再答非所问
你用 RAG 搭了一个知识库问答系统,结果用户一问问题,检索回来的全是不相关的内容。问题出在哪?大概率是你的 Embedding 模型不够"懂"你的数据。通用的 Embedding 模型在开放域表现不错,但换到你的专业领域——法律文书、医疗记录、代码文档——它对"相似"的理解可能和你完全不同。解决方案:微调。用你自己的数据训练 Embedding 模型,让它…- 8
- 0
-
ComfyUI v0.19.0 更新:大量新节点、新模型、新修复与性能优化全面落地,工作流与训练能力再升级
2026年4月13日,ComfyUI 发布了 v0.19.0 最新版本。本次更新内容非常丰富,覆盖了 图像编辑、文本生成、音视频能力、训练支持、节点扩展、API 节点、模板更新、前端升级、资产管理、模型兼容性、性能优化、平台适配 等多个方向。而且这次版本标注为 Immutable release,说明发布后只有 标题和说明&n…- 6
- 0
-
Agent 持续学习落地路径:先做 Traces,再做 Context,最后才微调模型 | Jinqiu Select
标题:Agent 持续学习不只是训练模型:解读 Harrison Chase 的三层框架摘要:Agent 持续学习落地路径:先做 Traces,再做 Context,最后才微调模型本文来自投稿。作者:Daniel,DeerFlow 联合作者。DeerFlow 是基于 LangGraph 的开源 SuperAgent 框架,专注多智能体编排,GitHub 60K+ Stars。长期深耕智能体工作流设…- 9
- 0
-
养死四只龙虾的小白有感
2026年3月20日晚23时30分,我的第四只龙虾,也是第一只成功投入工作的龙虾,在受到来自某M字开头模型的<think>标签影响进入退行性神经疾病后,因抢救无效,进入晚期。为了保证电脑安全和tokens资源不再因为疾病而无意义消耗,我,作为其主人兼主治医师,宣布,对该龙虾执行安乐死,完成卸载程序。说真的,作为一个没有任何计科基础的AI小白,靠着龙虾自己的vibe coding,能够在…- 5
- 0
-
Mistral Forge 的真正意义:企业AI从“租用”走向“拥有”
租赁时代的幻觉两年来,企业AI的主流范式似乎已经定型:注册OpenAPI密钥,调用GPT-4或Claude的API,做一点提示词工程或轻量级微调,然后上线一个“能用”的AI功能。这套组合拳确实够快——几天就能从概念到原型;够方便——无需维护复杂的基础设施;看起来也够专业——毕竟谁还能拒绝叫出来的“最强大模型”呢?但在这种看似完美的租赁模式下,三个结构性问题正悄然积累:认知鸿沟:通用大模型不懂你公司…- 5
- 0
-
马斯克再次站台Kimi,扒掉了Cursor 500亿估值的底裤
3月20日,Cursor发了条推,发布了「自研」的 Composer 2 模型。配的图显得还挺nb的,显示Composer 2在CursorBench上拿到了61.3%的得分,成本不到Opus 4.6的1/5。言下之意:我们自研了一个又强又便宜的编程模型。讲道理这个Benchmark就好笑的👇不过呢,更主要的是,两个半小时后,这个模型的底裤被扯没了。一个叫Fynn的开发者在调试Cursor的API…- 7
- 0
-
MiniMax M2.7 炸场!自己训自己,8 项基准硬刚 GPT-5 和 Opus 4.6
距离 MiniMax M2.5 发布才刚过一个月,MiniMax 又出手了。MiniMax 正式发布了 M2.7,官方给出的定义很有意思:"这是我们第一个深度参与了自身进化的模型。"什么意思?简单说就是,M2.7 在训练过程中,自己帮着训自己。这听起来有点科幻,但从基准测试的成绩来看,这种"自我进化"的路线确实跑通了。先看硬数据。Min…- 11
- 0
-
【淘宝直播数字人互动LLM】告别AI感:基于真人ASR数据的拟人化探索
本文针对数字人直播中LLM回复“AI感强、书面化”的问题,提出一种 基于真人直播ASR数据的拟人化训练方法:先构建高质量〈AI回复, 拟人化回复〉数据对,训练拟人化改写模型;再进一步训练拟人化奖励模型,通过GRPO强化学习使生成模型直接输出自然、口语化、有帮助的回复。实验证明该方法在保持准确性和帮助性的同时,显著提升语音交互的真实感与用户体验。引言近几年,随着大模型浪潮的袭来,各种文本生…- 6
- 0
-
罕见!Meta、OpenAI、xAI联合分享了用生产环境提升LLM的最佳实践!
大家好,我是PaperAgent,不是Agent!Meta/OpenAI/xAI联合发表了一篇在生产环境中规模化迭代优化高吸引力与可控的LLM的新成果:CharacterFlywheel。斯坦福最新OpenClaw论文:Agents of Chaos当前大语言模型(LLM)的发展主要集中在助手型AI(如ChatGPT、Claude),目标是成为"全知全能的预言家"——知识渊博、…- 5
- 0
-
工具调用准确率从60%飙到95%?我用这个‘解耦微调’把Qwen-7B救活了
用Qwen-7B做Agent,本来信心满满,结果MCP一跑,选工具选不对、参数填得稀巴烂,准确率惨不忍睹,最高也就60%徘徊。后来我发现:普通LoRA根本救不了复杂工具调用。真正能救命的,是2026年最火的解耦微调(Decoupled Fine-Tuning)。一句话总结它的核心:把“选工具”和“填参数”彻底拆开,分别训练两个LoRA,谁也别干扰谁。只用3步,就能让你的模型起飞第一步:拆任务,造数…- 8
- 0
-
普林斯顿大学RLAnything:AI学会一边学习一边给自己打分
刚开始学自行车的时候,爸妈可能会扶着你,告诉你向左偏了向右歪了。慢慢地,你学会了自己感知平衡,甚至不用别人说,就知道自己骑得好不好。然后你开始提高难度,先在平坦的小路上练,熟练了再挑战有坡度的马路。普林斯顿大学的研究,做的事情本质上就是这个:让人工智能也学会这种自我学习的本领。2026年2月2日,研究团队发布了一篇名为RLAnything的论文,翻译过来就是强化学习万能版,意味着这套方法可以用在几…- 5
- 0
-
Agent 越用越聪明?AgentScope Java 在线训练插件来了!
背景与挑战Cloud Native背景随着大模型能力的成熟,智能体(Agent)正从实验性原型快速走向生产级应用。在客服自动化、运维诊断、数据查询、业务流程编排等场景中,Agent 通过调用工具、规划任务、与用户多轮交互,展现出显著的生产力价值。为适配特定业务需求,开发者普遍基于开源大语言模型(LLM),采用监督微调(SFT)、强化微调(RFT)等技术对 Agent 进行定制化优化,在推理成本、响…- 3
- 0
-
DeepSeek 发布新论文,提出全新 MHC 架构,有何创新与应用前景?
2026 年的第一天,我发现 DeepSeek 悄悄干了件狠事。他们发布了一篇论文,梁文锋署名。这篇论文讲了一个新架构,叫 mHC 流形约束超连接。 别被名字吓跑,这件事情的本质,是在挑战 AI 圈儿过去十年的绝对真理。 要把这事儿聊清楚,得把时间拨回到 2016 年。 那一年,何恺明大神提出了 ResNet 残差网络。 这玩意就像建筑里的钢筋混凝土…- 4
- 0
-
LoAR做Fine-Tuning微调原理到底是什么?
目前模型微调在大模型垂直领域有着广泛的应用,尤其LoAR方式的微调。本期就给大家介绍LoAR微调的原理。什么时候才微调?在大模型应用开发过程中,遇到大模型解决不了的问题时就需要微调吗?答案显而易见。最简单的方式当然是提示词工程,因为大模型就是一个装了压缩几十TB数据的“类人脑”,知识储备囊括各个方面且普遍具有Function Calling和MCP的能力,只要给他高质量的提示词,它能完成大部分任务…- 4
- 0
-
如何将 AI 代码采纳率从30%提升到80%?
为什么 AI 编码采纳率不高?目前尝试过不少 AI 编程工具,重度使用过的包括 VSCode+Roo Code 、Continue、Trae、Claude Code,Cursor 浅用了一下,因为没有申请到公司企业版本,不算很了解。包括之前还没有兴起 Agent 概念时,也经常用对话方式让 AI 生成部分代码片段。虽然很多人在说程序员要被 AI 替代,但实际使用 AI 进行复杂业务逻辑编程后发现,…- 5
- 0
-
大模型微调,为什么99%的企业都不应该碰这个坑?
昨天在公众号后台,有朋友私信,说他们公司现在打算做大模型微调,问我靠不靠谱,我了解了他们公司业务之后,直接跟那朋友说,这没戏,微调不是想做就能做的,就算做了也不一定能达到预期的效果。我还简单的跟他讲下了,这事我们也做过,也是从坑里走出来的。劝完这个朋友之后,我思绪难平,想着是不是可以写一篇文章,来具体讲下我的故事,以及我对微调这事得看法,于是就有了现在这篇文章。说说我们的那次"折腾&qu…- 5
- 0
-
万不得已,不要对 LLM 进行微调?
文章内容总结文章《Fine-Tuning LLMs Is a Huge Waste》认为微调LLM并非必要,强调其风险。文章指出,微调不是知识注入,而是对现有知识的破坏性覆盖,可能导致神经模式的意外改变。例如,基础模型生成80%男性、20%女性的客户分布,微调后可能变为近100%女性,显示输出偏置显著变化(文章中提及的Figure 6)。文章建议,对于90%的用例,微调被错误用于知识注入,带来灾难…- 3
- 0
-
可以将任何符合OpenAPI规范的接口转 MCP Server吗?
前言前面介绍了借助MCP,在聊天框里轻松实现增删改查, 核心就是把FastAPI封装的API直接转为MCP Server。现实中有很多使用各种语言(框架)实现的API,我们有没有办法直接转为MCP Server,但不入侵代码?开源BI Apache Superset 秒变MCP Server 就是提供了这样一个思路, 对我们感兴趣的功能进行二次封装。另外我们注意到Supers…- 6
- 0
-
OpenAI发布GPT-4.1系列模型,对行业最大吸引力是什么?
OpenAI发布了三款GPT-4.1系列模型,这背后其实是OpenAI在战略上的一次调整:更专注特定领域、更关注性价比、更懂开发者的实际需求。这次发布了GPT-4.1、GPT-4.1mini和GPT-4.1nano三款模型,在写代码、指令遵循、处理超长文本上做了更新,知识库也更新到了2024年6月。最大的亮点是100万token的上下文窗口,比GPT-4o的12.8万翻了好几倍,差不多能支持75万…- 7
- 0
-
私有部署大模型需要多少显存?
最近,接触了不少AI的项目。客户上来就问:部署个大模型需要多少算力。"老板,上32B模型需要多少显存?""90GB够了吧?""不,您可能少算了30%!"随着百亿级大模型成为行业标配,显存估算误差动辄导致数十万硬件成本偏差。今天,以部署 QwQ-32B 模型,FB16 精度的显存需求作为例子。笔者尝试将算力评估这件事情通俗地说清…- 8
- 0
-
Oxygen 9N-LLM生成式推荐训练框架
引言:生成式推荐作为推荐系统领域一个蓬勃发展的新范式,为整个领域带来了新的思路和机遇。它在处理复杂语义、提升推荐多样性、突破效果天花板以及优化系统架构方面展现出巨大潜力,但同时也给训练引擎带来新要求与新挑战。为了更好的支撑零售算法业务以更高的效率、更低的成本探索这一新方向,京东零售九数算法平台团队凭借在训练引擎领域多年的技术积累,建设了一套多框架(TensorFlow/PyTorch)、多硬件(G…- 5
- 0
-
自然·通讯:如何挖掘复杂系统中的三元交互
导语复杂系统通常包含超越成对网络的高阶交互。三元交互,即一个节点调节另外两个节点之间的交互,是许多生物系统中存在的一种高阶动力学的基本形式,从神经元-胶质细胞通信到基因调控和生态系统均可见其身影。然而,三元交互至今大多被忽视。本文提出了三元感知机模型,该模型表明,三元交互可以调节两个相连节点动态状态之间的互信息。基于这一发现,作者构建了三元交互挖掘算法,以从节点元数据中提取三元交互,并将此框架应用…- 4
- 0
-
微调已死?LoRA革新
当模型参数规模突破百亿甚至千亿级别,全量微调的成本和复杂性呈指数级增长。一台A100服务器微调70B模型的时代已一去不复返,取而代之的是参数高效微调技术的崛起。2025年,LoRA及其变体正重新定义模型适配的范式,让我们不禁思考:全量微调是否真的走向终结?一、全量微调的技术瓶颈与时代局限传统全量微调要求更新模型所有参数,对于千亿级模型而言,这意味着需要存储完整的优化器状态——其体积往往超过模型本身…- 4
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



















