模型微调

    • 实测Grok3效果到底如何!发现中文好像蒸馏了Qwen!
    • 1.5B小模型逆袭!DeepScaleR如何用强化学习颠覆AI数学竞赛规则
    • 实战教程:用一张4090显卡+512GB内存部署671B的Deepseek大模型
    • DeepSeek-R1微调指南
    • 一文详解大模型训练全过程
    • 一文说清楚什么是预训练(Pre-Training)、微调(Fine-Tuning)
    • DeepSeek 本地部署——蒸馏版、量化版和满血版实测效果对比
    • 满足个性化需求,手把手教你微调DeepSeek大模型
    • DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
    • DeepSeek R1 671B 完整版本地部署教程来了!!!
    • 昇腾 910B 部署满血 DeepSeek-R1
    • 如何训练LLMs像DeepSeek-R1“思考”
    • 7G显存,训练你自己的DeepSeek-R1
    • DeepSeek-R1 如何通过知识蒸馏将推理能力传递给 Qwen
    • 飞书多维表格+Deepseek王炸组合,最强AI agent工具
    • 谷歌 AI Agent 白皮书 3/3
    • 如何在通义灵码里用上 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型?
    • 单卡复现 DeepSeek R1 Zero教程来了!
    • 申请API-KEY,通过接口使用DeepSeek服务
    • DeepSeek零门槛三步极速部署指南,注册秒过,对话零延迟!
    • 大模型应用部署过程中流量管控的常见需求和应对方案
    • AI应用开发先了解这些概念:智能体、LLM、RAG、提示词工程
    • 腾讯云TI平台和HAI部署DeepSeek的步骤及其区别
    • Chain-of-Action (行动链):从Agent工作流到Agent模型
    购物车
    优惠劵
    搜索