一位淘宝工程同学的大模型LoRA微调尝试

本文主要介绍了大模型时代下，如何通过 LoRA（Low-Rank Adaptation）这一参数高效微调技术，实现对大模型的轻量级定制。文章从微调的基本概念出发，详细阐述了 LoRA 的原理、优势与局限性，并结合本地原生实现（Transformers + PEFT）和百炼平台两种方式，展示了在小样本、低资源场景下的实战流程。结果表明，LoRA 能以极低的计算成本让通用大模型有效学习业务知识，显著提升其在特定任务中的表现，真正实现“让大模型懂业务”，推动 AI 从“可用”走向“好用”。

前言
如今大模型时代，深刻重塑了很多行业的业务形态与技术架构。从智能客服到内容生成，从代码辅助到推荐系统，大模型正以前所未有的速度渗透到互联网技术的各个领域，成为驱动创新的核心引擎。其强大的泛化能力和上下文理解水平，使得许多过去需要复杂工程与规则设计的任务，如今只需一次“提示”即可完成。

然而，尽管大模型展现出惊人的通用能力，对大多数开发者和业务方而言，它仍是一个“黑盒”——我们只能调用其预训练时所掌握的知识与行为模式，难以干预其内部逻辑，也无法直接引导模型适应特定场景的表达习惯、术语体系或业务规则。在生产环境中，这种“能力固定”的特性带来了明显的局限：模型输出可能偏离业务预期，难以保证一致性，更无法随业务演进而持续进化。

面对这一挑战，模型微调（Fine-tuning）提供了一条关键路径。尤其是以 LoRA 等为代表的参数高效微调技术（PEFT），在不改变主干模型的前提下，仅通过训练少量新增参数，即可实现对大模型行为的精准定制。这不仅大幅降低了计算成本与技术门槛，更让业务开发者能够基于自身积累的高质量数据，赋予通用大模型“专属”的业务理解能力。本文将围绕 LoRA 微调技术展开，探讨其在小样本、低资源场景下的实践价值，展示如何利用业务数据对大模型进行轻量级定制，真正实现“让大模型懂业务”，推动 AI 从“可用”走向“好用”，从“通用”迈向“专属”。

一位淘宝工程同学的大模型LoRA微调尝试

微调

▐什么是微调

大模型的微调（Fine-tuning），是指在一个已经预训练好的大模型（比如 GPT、DeepSeek、BERT、Llama 等）基础上，针对特定任务、领域或数据进行进一步训练。微调通常通过在目标数据集上继续训练模型权重，使模型更适应该任务，从而提升下游任务的表现。简单来说，预训练让模型掌握通用知识，微调让模型适应某个具体用例。LLM 微调是一个有监督学习过程，即有监督微调(SFT)，通常语言模型的初始训练是无监督的，但微调是有监督的。

▐微调的分类

按照⽬标任务
标准微调（任务微调）：针对某⼀具体任务进⾏微调（如分类、问答、摘要等）。
领域微调：针对某⼀特定领域数据进⾏微调（如医疗、法律、⾦融等）。
指令微调：通过⼤量的「指令-响应」数据集（如 Alpaca, Baize 等）对模型进⾏微调，使其能够按照⾃然语⾔指令完成多种任务。

按参数调整⽅式
全参数微调（Full-parameter T un i n g）：对所有模型参数进⾏更新。
部分参数微调（R e pu r po s i n g）：只更新部分参数，⽐如最后⼀层、分类头等。
参数⾼效微调（Parameter Eﬃcient Fine-Tuning,P E F T）：引⼊少量额外可训练参数，冻结原模型绝⼤部分参数，如 LoRA、Adapter、Preﬁx Tuning 等，主要⽬的是⽤很少量新参数即实现任务适配。

▐常⻅微调⽅法

全参数微调
直接在⽬标数据集上继续训练所有模型参数，效果好但耗资源⼤，对硬件要求⾼，不易迁移。

参数⾼效微调（PEFT）
LoRA（Low-Rank Adaptatio n）：通过在部分参数上引⼊低秩矩阵，仅训练这些新增的低秩参数，⼤⼤减少训练所需参数量和显存消耗。
Adapter：在原有⽹络层之间插⼊⼩型新⽹络模块并仅训练这些模块参数。
Prefix Tuning/Prompt Tuning：在输⼊或模型内部插⼊可训练的参数向量（前缀、提示），主⽹络参数保持不变。

一位淘宝工程同学的大模型LoRA微调尝试

LoRA微调

▐什么是 LoRA

LoRA(Low-Rank Adaptation of LLMs)，即 LLMs 的低秩适应，是参数⾼效微调最常⽤的⽅法。

▐原理

LoRA 的核⼼思想是：冻结预训练的基座模型（Base Mode l），在其某些层（如注意⼒中的 Q、K、V 投影）上，额外添加低秩矩阵（A 和 B）作为可训练参数，⽤于学习任务特定的增量调整。
原始基座模型的权重全程保持冻结、未修改。
训练过程中，只有 LoRA 引⼊的少量新增参数（如 loraA, loraB）被更新。

LoRA 的本质就是⽤更少的训练参数来近似 LLM 全参数微调所得的增量参数，从⽽达到使⽤更少显存占⽤的⾼效微调。LoRA 的核⼼思路就是，直接 freeze 基座模型的全部参数，然后额外给模型增加⼀个扰动的 module，来模拟 finetune 之后参数改变的效果。如此⼀来，只要这些扰动的 module 参数量够⼩且推理够快，就不会影响模型整体的 inference 成本，且可以⼤幅地缩减模型 finetune 的开销，因为我们只需要训练极⼩量的⼀部分参数即可。基座模型只参与训练过程中的前向传播，反向传播更新参数的只有 LoRA 的插⼊的adapter 参数。

一位淘宝工程同学的大模型LoRA微调尝试

保留原来预训练好的权重 W 不动；
旁路插入一个低秩矩阵 BA，对 W 的输出做一个可学习的微小增量；
只训练 A、B 这两组很小的参数，就能让模型适配新任务。

上⾯是简化的示意图，实际的 Transformer 由很多线性投影（如 Q、K、V、O、FFN 的W₁、W₂ 等）组成，每个都是⾃⼰的 d₁ × d₂ 矩阵。LoRA 是把这些⼤矩阵 W 逐个冻结，然后在它们上⾯叠加⼀个低秩增量 ΔW=B A。因此，严格来说是对模型⾥的每个⼤矩阵都做⼀次 rank = r（远⼩于 d₁, d₂）的低秩更新。训练省资源的根本原因
原来若要微调 W，需要存和反向传播 d₁·d₂ 个参数；
LoRA 只训练 A(r×d₂)和 B(d₁×r)，参数量变成 2·r·max(d₁,d₂)，当 r≪min(d₁, d₂)时可省 100×乃⾄10 000×的显存和梯度计算；
W 冻结→不必存动量/梯度，也不⽤进⾏前后两次 matmul⽐较差分，⼤幅降低显存与算⼒。
推理过程

核心机制：权重增量叠加（Weight Addition）。LoRA（Low-Rank Adaptation）在推理时，并不是“绕道”或“替换”，而是：将 LoRA 学习到的增量权重，加到原始预训练模型的对应权重上。数学表达：对于一个原始权重矩阵 W∈Rd×k W∈R d×k，LoRA 引入低秩分解：ΔW=AB 其中 A∈Rd×r,B∈Rr×k,r≪dΔ W=AB 其中 A∈R d×r,B∈R r×k,r≪d 推理时的实际权重为：Wnew=W+ΔW=W+AB W new=W+Δ W=W+AB 然后使用 Wnew W new 进行前向计算。两种推理模式：
模式说明特点
推理时动态叠加（On-thefly）加载原始模型 + LoRA 权重，实时计算 W+ΔWW+ΔW 可用，但慢
合并后推理（MergedInference）将 LoRA 权重合并到原始模型中，生成一个新模型，直接推理推理更快、更稳定
⼀般采⽤合并后⽣成新的模型来进⾏推理，同时可以保留原始模型。
优劣势

LoRA 的优势
优势说明
资源成本低仅需训练少量参数（如 QKV 投影层），节省 GPU 显存和算力
训练速度快梯度计算集中在小模块，训练效率显著提升
存储友好一个基础模型+多个 LoRA 权重（每个几 MB~几百 MB），便于版本管理和部署
灵活切换任务可动态加载不同 LoRA 权重，实现多业务场景快速切换
保护原始模型原模型冻结，避免灾难性遗忘，保证通用能力
LoRA 的局限性
劣势说明
性能略低于全参数微调在复杂任务上可能稍逊于全量微调，但差距通常可控（<5%）
依赖基础模型质量 LoRA 无法修复基础模型的根本缺陷，微调效果受限于预训练能力
适配层选择敏感效果受插入位置（如仅 attention、FFN 等）影响，需实验调优
推理需额外集成需支持 LoRA 加载的推理框架（如 HuggingFace+PEFT、vLLM、llama.cpp 等）

▐实战

LoRA 微调⽬前有多种⽅式实现，Transformers+PEFT 原⽣实现，LLaMA-Factory、Axolotl 等框架实现，以及借助百炼等封装好的可视化界⾯平台实现。本⽂主要尝试了 Transformers+PEFT 原⽣实现，以及公司⽣产中更有可能⽤到的百炼平台实现。
原⽣微调

使⽤Transformers+PEFT 原⽣实现。环境搭建 1. transformers+peft+datasets 注意：几个库的版本之间有协同关系，随意安装版本可能导致不兼容问题，可在Hugging Face 的官方文档中查看推荐版本。代码：pip install –upgrade torch==2.1.0+cpu torchvision==0.16.0+cpu –index-url https://download.pytorch.org/whl/cpupip install -U transformers==4.38.2 peft==0.10.0 datasets==2.18.0 accelerate sentencepiece safetensors tqdm2. 模型准备这里考虑到微调是在 mac本地运行，算力有限，所以使用了较小的 DeepSeek-R1-Distill-Qwen-1.5B 作为基座模型。使用 Hugging Face 或 Modelscope 等下载模型到本地即可。数据处理训练数据：准备好数据文件 loraseckillqa.jsonl，格式使用如下 instruction-response 格式。{"instrucAon":"埋点时主要记录哪些事件？","response":"使⽤的是xx埋点框架，埋点有分为各种事件类型，主要的有曝光事件和点击事件，可以根据曝光和点击事件来统计数据，如点击率等"}{"instrucAon":"xxxxxxxxxxxxxxxxxx？","response":"xxxxxxxxxxxxxxx"}处理脚本：import jsonfrom datasets import Datasetfrom transformers import AutoTokenizer# 正确读取jsonlwith open("loraseckillqa.jsonl", "r", encoding="utf-8") as f:rawdata = [json.loads(line) for line in f if line.strip()]# 如果是单轮格式可直接用# dataset = Dataset.fromlist(rawdata)# 若是conversation 格式（如 [{"conversation":[…]}]），需展开def conversationtolist(item):out = []for turn in item["conversation"]:instr = turn.get("system", "") + "n" + turn["input"] ifturn.get("system") else turn["input"]out.append({"instruction": instr.strip(),"response": turn["output"].strip()})return out# 如果你的rawdata 已经是单轮格式就跳过这一段allsamples = []if "conversation" in rawdata[0]:for d in rawdata:allsamples.extend(conversationtolist(d))dataset = Dataset.fromlist(allsamples)else:dataset = Dataset.fromlist(rawdata)# 保存分词器tokenizer = AutoTokenizer.frompretrained("/Users/shawn/Documents/AI-dev/models/deepseek/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B",trustremotecode=True,localfilesonly=True)tokenizer.savepretrained("./tokenizer")# 保存处理后的数据集dataset.savetodisk("./processeddatasetms")print("预处理完成，已保存！")训练参数训练脚本：

import torchfrom datasets import loadfromdiskfrom transformers import AutoTokenizer, AutoModelForCausalLM,TrainingArguments, Trainer, defaultdatacollatorfrom peft import getpeftmodel, LoraConfigimport random# 1. 加载数据集dataset = loadfromdisk("./processeddatasetms")# 2. 样本随机打乱dataset = dataset.shuffle(seed=42)# 3. 分词器tokenizer = AutoTokenizer.frompretrained("./tokenizer", localfilesonly=True)def generateandtokenizeprompt(batch):texts = [f"""<s>### Instruction:{instruction}### Response:{response}</s>"""for instruction, response in zip(batch["instruction"],batch["response"])]out = tokenizer(texts,maxlength=256,padding="maxlength",truncation=True,addspecialtokens=False,returntensors=None,)# Loss 忽略paddingp.out["labels"] = [[tok if tok != tokenizer.padtokenid else -100 for tok in label]for label in out["inputids"]]return outtokenizeddataset = dataset.map(generateandtokenizeprompt,batched=True,removecolumns=dataset.columnnames,desc="Tokenizing")# 4. 加载基座模型（如设备有限可指定CPU/其他device）model = AutoModelForCausalLM.frompretrained("/Users/shawn/Documents/AI-dev/models/deepseek/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B",torchdtype=torch.bfloat16, # MPS、A100 等建议用bfloat16localfilesonly=True,trustremotecode=True)# 5. LoRA 配置loraconfig = LoraConfig(r=8,loraalpha=16,targetmodules=["qproj", "vproj", "kproj", "oproj"],loradropout=0.05, # 或0, 稳定死记记忆；推荐小数据降dropoutbias="none",tasktype="CAUSALLM")model = getpeftmodel(model, loraconfig)model.printtrainableparameters()# 6. 训练参数trainingargs = TrainingArguments(outputdir="./resultsms",perdevicetrainbatchsize=2,gradientaccumulationsteps=1,learningrate=3e-4,numtrainepochs=8,loggingdir="./logsms",savesteps=100,savetotallimit=3,loggingsteps=10,overwriteoutputdir=True,reportto=None,fp16=False)trainer = Trainer(model=model,args=trainingargs,traindataset=tokenizeddataset,datacollator=defaultdatacollator,)# 7. 训练与自动采样输出trainer.train()# 8. 保存模型与tokenizermodel.savepretrained("./deepseek-7b-lorams")tokenizer.savepretrained("./deepseek-7b-lorams")print("训练完成。")参数解析 LoRA 配置参数（lora_config）1. r=8
含义：LoRA 中低秩矩阵的秩（rank），⽤于近似原始权重矩阵。
作⽤：控制新增参数量，显著降低训练显存消耗。
影响：
r 太⼩→⽋拟合，表达能⼒不足
r 太⼤→接近全量微调，失去 LoRA 优势
常⻅值：4~ 64，根据任务复杂度调整（如简单任务⽤r=8，复杂任务可⽤r=32）
lora_alpha=16
含义：LoRA 权重的缩放因⼦，控制低秩矩阵对输出的影响强度。
作⽤：调节 LoRA 分⽀的贡献程度，类似“学习率系数”。
影响：
推荐保持 alpha/r≥1（如 r=8,alpha=16→ ⽐值为 2）
值过⼤ → 容易过拟合；值过⼩ → 影响微弱
建议：初试设置 alpha=2×r
targetmodules=["qproj","vproj","kproj","o_proj"]
含义：指定在哪些模块上应⽤LoRA（通常是注意⼒层的投影层）。
作⽤：精准控制适配范围，节省计算资源。
常⻅选择：
LLaMA 系列：["qproj", "kproj", "vproj", "oproj"]
BERT 类：["query", "value", "key", "dense"]
影响：
仅作⽤于部分模块 → 可能限制模型适应能⼒
可根据模型结构扩展（如加⼊upproj,downproj）
lora_dropout=0.05
含义：LoRA 层的 Dropout 概率，⽤于正则化。
作⽤：防⽌过拟合，提升泛化能⼒。
影响：
值越⼤ → 正则化越强
⼩数据集建议：0.1~0.2
⼤数据集可设为 0 或 0.05
注意：若训练不稳定，可尝试增加 dropout
bias="none"
含义：是否在 LoRA 层中引⼊偏置项。
选项：
"none"：不加偏置（推荐起点）
"all"：所有模块加偏置
"lora_only"：仅 LoRA 层加偏置
影响：
加偏置可能略微提升效果，但增加参数量
建议：从"none"开始，效果不佳再尝试"lora_only"
tasktype="CAUSALLM"
含义：指定任务类型，影响损失函数和标签处理⽅式。
常⽤类型：
"CAUSAL_LM"：⾃回归语⾔模型（如 GPT、LLaMA⽣成任务）
"SEQ_CLS"：序列分类（如情感分析）
"TOKEN_CLS"：Token 级分类（如命名实体识别）
"SEQ2SEQ_LM"：Seq2Seq 任务（如翻译、摘要）
注意：必须与任务匹配，否则训练会出错

训练参数（training_args）
参数值说明
outputdir"./resultsms"保存模型检查点、日志等文件的目录
perdevicetrainbatchsize 2 每个设备上的 batchsize，显存不足时可减小
gradientaccumulationsteps 1 梯度累积步数，等效增大 batchsize（如设为 4→ 实际 batch = 8）
learning_rate 3e-4 学习率，LoRA 推荐范围：1e-4~1e-3
numtrainepochs 8 训练轮数，一般从 3~10 开始调整
loggingdir"./logsms"日志保存路径，可用于 TensorBoard 可视化
save_steps 100 每隔多少 step 保存一次 checkpoint
savetotallimit 3 最多保留几个 checkpoint，自动删除旧的
logging_steps 10 每隔多少 step 输出一次日志，便于监控
overwriteoutputdir True 若目录存在则覆盖，避免手动清理
report_to None 不连接远程报告工具（如 wandb、tensorboard）
fp16 False 是否启用 FP16 半精度训练✅支持设备建议开启（节省显存+加速）⚠️若开启需确保模型

场景建议配置
小数据集微调 r=8 , alpha=16 , dropout=0.1 , epochs=5~10
大数据集微调 r=16~32 , alpha=32 , dropout=0.05 , lr=2e-4
显存受限减小 batchsize ，启用 fp16 ，使用 gradientaccumulation
快速实验 overwriteoutputdir=True , loggingsteps=10 , savesteps=50
训练成本使⽤1000 条左右数据微调 qwen3-14b 的模型，⼀次训练成本预计 10 元左右。可以看到模型微调本⾝的成本并不算很⾼，即使换参数量更⼤的模型以及更多的数据。后续的部署、推理成本才是⼤头。

一位淘宝工程同学的大模型LoRA微调尝试

测试脚本import torchfrom transformers import AutoModelForCausalLM, AutoTokenizerfrom peft import PeftModel# 路径设置BASEPATH = "/Users/shawn/Documents/AI-dev/models/deepseek/deepseekai/DeepSeek-R1-Distill-Qwen-7B"LORAPATH = "./deepseek-7b-lorams"# 加载分词器tokenizer = AutoTokenizer.frompretrained(BASEPATH,localfilesonly=True,trustremotecode=True)# === 严格分离模型实例 ===# 原始模型modelbase = AutoModelForCausalLM.frompretrained(BASEPATH,devicemap="mps",torchdtype=torch.bfloat16,localfilesonly=True,trustremotecode=True)# 微调后的模型（Base + LoRA 适配器）modelbaseforlora = AutoModelForCausalLM.frompretrained(BASEPATH,devicemap="mps",torchdtype=torch.bfloat16,localfilesonly=True,trustremotecode=True)modellora = PeftModel.frompretrained(modelbaseforlora,LORAPATH)def formatpromptoneround(userinput: str) -> str:return f"<s>### Instruction:n{userinput}n### Response:n"def generatesingle(model, prompt, tokenizer, maxnewtokens=200):inputs = tokenizer(prompt, returntensors="pt")for k, v in inputs.items():inputs[k] = v.to(model.device)with torch.nograd():outputs = model.generate(inputs,maxnewtokens=maxnewtokens,temperature=0.7,topp=0.9,dosample=True,eostokenid=tokenizer.eostokenid)fulloutput = tokenizer.decode(outputs[0], skipspecialtokens=True)reply = fulloutput[len(prompt):]# 截断下一个分隔符，保证只输出新生成内容for sep in ["<s>", "</s>", "###"]:if sep in reply:reply = reply.split(sep)[0]return reply.strip()def main():print("="*40)print("DeepSeek 模型微调前/后单轮对话对比（严格模型物理分离版）")print("="*40)print("输入exit 退出。n")while True:userinput = input("你说：").strip()if userinput.lower() in {"exit", "quit"}:print("对话结束~ 再见！")breakprompt = formatpromptoneround(userinput)# 原始模型推理basereply = generatesingle(modelbase, prompt, tokenizer)# LoRA 微调后模型推理lorareply = generatesingle(modellora, prompt, tokenizer)print("n——————————-")print("【原模型输出】↓n" + basereply)print("n【微调后输出】↓n" + lorareply)print("——————————-")if name == "main_":main()测试结果 case：可以看到原模型完全无法感知到业务相关的知识，而微调后的模型已经有效的学到了（注：由于数据量小，且模型本身参数量也小，做演示的微调结果存在一定的过拟合）

一位淘宝工程同学的大模型LoRA微调尝试

百炼平台微调

数据准备根据百炼的训练数据示例格式准备数据

一位淘宝工程同学的大模型LoRA微调尝试

百炼训练数据格式{“messages": [{"role": "system", "content": "You are a professional e-commercetitle analyst. Given a long product title, output ONLY the core product entityname (1-5 words) without any other text."}, {"role": "user", "content": "请从下列商品标题中提取最核心的商品主体，直接输出主体名，不要加其它词：【黑旗】心语肉松原味辣味1kg 烘焙面包蛋糕寿司原料商用肉松小贝"}, {"role": "assistant", "content": "肉松"}]}{"messages": [{"role": "system", "content": "You are a professional e-commercetitle analyst. Given a long product title, output ONLY the core product entityname (1-5 words) without any other text."}, {"role": "user", "content": "请从下列商品标题中提取最核心的商品主体，直接输出主体名，不要加其它词：夏季竹枕片成人藤凉席冰丝枕头套单人儿童竹枕席藤枕芯套一对拍2"}, {"role": "assistant", "content": "枕套"}]}训练参数

一位淘宝工程同学的大模型LoRA微调尝试

参数跟原⽣实现的参数基本⼀致，可以参考上述的训练参数解析及百炼的⽂档。评测 1. 创建评测数据集创建⽅式同训练数据，使⽤百炼模版

一位淘宝工程同学的大模型LoRA微调尝试

2.选择评测⽅式，开始评测有三种评测⽅式
⼈⼯评测

特点：经过⼈⼯校验打分，在很多应⽤场景下是相对准确的；同时⽐较主观，在⼀些场景下可能不够标准化，且⼈⼒消耗较高。

一位淘宝工程同学的大模型LoRA微调尝试

模型评测

特点：适合评测⽂本⽣成类，可以调整 prompt 来对⾃⼰微调后模型的回答要点进⾏打分，利⽤另⼀个⼤模型的能⼒，实现灵活打分，但是⽐较依赖模型的能⼒以及 prompt，同时分数有时也不够标准化。

一位淘宝工程同学的大模型LoRA微调尝试

基线评测

通过预置的算法来对模型的特定⽅向能⼒进⾏标准化评测。

一位淘宝工程同学的大模型LoRA微调尝试

⼿动测试结果左侧为微调后的模型，右侧为原始模型，其对商品主体识别的能⼒得到提升。

一位淘宝工程同学的大模型LoRA微调尝试

总结 LoRA（Low-Rank Adaptation）微调技术为业务开发场景提供了⾼效、低成本的⼤模型定制化路径，展现出显著优势：
训练成本低，效果出色
显存占用少：仅需微调少量新增参数，可在消费级 GPU 上完成训练，降低硬件门槛。
训练速度快：参数更新量小，支持快速迭代，适合业务团队敏捷试错。
性能接近全量微调：在多种任务中表现优异，效果逼近全参数微调，性价比极高
部署灵活，易于管理
适配器轻量化：LoRA 权重文件通常仅几十 MB，便于存储、传输与版本管理。
多任务共享主干：支持“一个基础模型+多个 LoRA 适配器”的模式，实现不同业务线共用底座模型，提升资源利用率。
稳定可靠，风险可控
缓解过拟合：在小样本场景下表现更稳定，有效避免全参数微调带来的灾难性遗忘或过拟合问题。
保护原始模型：不修改主干参数，仅通过低秩增量进行适配，提升模型鲁棒与可维护性。

核心价值：让大模型真正“懂业务”LoRA 微调的轻量与高效，使得业务开发者能够基于自身积累的高质量业务数据（如客服对话、商品描述、内部流程文本等），对大模型进行快速定制化训练。这不仅大幅降低了 AI 落地的技术门槛，更让模型输出更可控、更精准、更贴近实际业务需求。未来，我们将持续探索 LoRA 在真实业务场景中的应用，例如智能推荐、自动化文案生成、研发提效等方向，以数据驱动+模型微调的方式，助力业务增长与技术升级。

{{userData.name}}已认证

一位淘宝工程同学的大模型LoRA微调尝试

OpenClaw发布 v2026.5.2 版本🦞

你的 Agent 终于能碰数据库了：Google 开源的 mcp-toolbox 打通了 20+ 种数据引擎