模型微调

    • 1GB 显存即可部署:腾讯 HY-MT1.5 的模型蒸馏与量化策略解析
    • 【GitHub高星】AI Research Skills:一键赋予AI“博士级”科研能力,74项硬核技能库开源!
    • 前Mata GenAI研究员田渊栋​的年终总结:关于未来AI的思考
    • 智元发布SOP:让机器人在真实世界规模化部署与智能化运行
    • 英伟达4B小模型:合成数据+测试时微调+优化集成
    • 2026年 LLM 微调全指南
    • 本地跑小模型带来5倍性能且成本极低!斯坦福从信息论视角重构智能体设计
    • 刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章
    • 数据蒸馏技术探索
    • 多页文档理解强化学习设计思路:DocR1奖励函数设计与数据构建思路
    • Llama Factory 实战,轻量级微调 LLM。
    • Open联合创始人:AI大模型2025年度回顾
    • 我微调了一个LangChain专家模型,离Vibe Agent又近了一步
    • 左脚踩右脚:大模型的有趣且简单的微调方式“SHADOW-FT”
    • 大模型训练的高效内存解决方案:流水线感知的细粒度激活卸载,实现显存开销与吞吐性能的联合最优
    • 一杯咖啡成本搞定多模态微调:FC DevPod + Llama-Factory 极速实战
    • OpenAI公开新的模型训练方法:或许能解决模型撒谎问题,已在GPT-5 thiking验证
    • 微调Rerank模型完整指南
    • 大模型微调全流程实战指南:基于IPO框架的深度解析与优化
    • AI基础 |  Qwen3 0.6B 微调实现轻量级意图识别
    • 从零开始:手把手教你微调Embedding模型,让检索效果提升10倍!
    • 2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了
    • 基于昇腾NPU的Qwen3量化因子代码生成微调实战
    • 从零教你微调一个专属领域大模型,看完小白也能学会炼丹!(完整版)
    购物车
    优惠劵
    搜索