模型微调

    • 微调篇「数据集构建」保姆级教程来了!
    • olmOCR-7B:文档提取专用模型
    • 如何用 deepseek v3-0324 最新版,附常见问题和解决方案
    • 大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析
    • 从SFT到RFT:AI模型训练的进化之路
    • 使用MCP Inspector调试MCP服务端
    • 软标签:知识蒸馏的核心机制与应用
    • 基于特征的模型蒸馏:深层次知识转移的挑战与局限
    • 我也曾一上来就想微调大模型,直到我发现自己错得离谱!
    • AI开发进入“全民时代”?百度秒哒全量上线,首日吸引2万用户
    • AI训练存储方案选谁?DeepSeek 3FS与JuiceFS的全面对比
    • Ollama v0.6.1重磅更新!1110亿参数模型上线,AI性能炸裂!
    • MCP实用指南
    • 告别复杂配置!轻松使用VLLM部署大模型
    • 30行代码让DeepSeek做Web自动化测试
    • 领导,别被忽悠了!你的AI转型可能只是个Demo
    • Cursor 最新版 0.48 更新
    • 基于AnythingLLM搭建本地知识库
    • STEVE:用AI训练AI,打造更聪明的电脑操作助手帮你操控UI界面
    • 如何理解模型的蒸馏和量化
    • 目前来看,ollama量化过的DeepSeek模型应该就是最具性价比的选择
    • 使用 vLLM 生产环境部署 DeepSeek,算力减半、吞吐增十倍!
    • Ollama高并发测试
    • Cursor Rules 最佳实践总结
    购物车
    优惠劵
    搜索