
一、自训练专业垂类模型

-
获取标注数据:你需要收集大量的医学图像数据,并由专业的医学专家进行标注。这个过程通常需要1个月的时间。 -
在数据上训练模型:使用标注的数据训练一个深度学习模型,这个过程需要2个月的时间。 -
部署和调用模型:训练完成后,你需要将模型部署到实际环境中,并进行测试和优化,这个过程大约需要3个月的时间。
-
高精度:适用于需要高精度的专业应用,例如医学图像分析、金融风险评估等。
-
高成本:数据收集和标注成本高,训练周期长,对硬件要求高。
二、Prompt工程对知识精准度要求低

-
指定提示词:例如,你可以输入“生成一篇关于夏季旅游的文章”。这个过程通常只需几分钟到几小时。 -
调用模型:AI模型根据提示词生成内容,这个过程同样只需几分钟到几小时。
-
开发速度快:适用于需要快速迭代和灵活调整的应用。 -
成本低:不需要大量的数据收集和标注。
-
精度较低:不适用于需要高度专业化和精度要求高的应用。
三、Prompt工程LangChain专业垂类知识库

-
本地文档加载器:加载公司的技术文档和FAQ资料,处理非结构化数据。 -
文本分割:将技术文档分割成小段,便于处理。 -
文本嵌入:将文本段转换成向量,以便进行向量匹配。 -
向量存储:将向量存储起来,供后续查询使用。 -
查询向量:用户提出技术问题,系统将问题转换成向量。 -
向量相似度匹配:系统通过向量相似度匹配,找到最相关的技术文档段落。 -
提示模板:生成提示,调用大语言模型(LLM)进行回答。
-
快速响应:结合Prompt工程的快速响应能力。 -
高准确度:利用专业知识库,提高回答的准确性和专业性。
-
需要一定的前期准备:需要加载和处理大量的本地文档。
四、结论
-
高度专业化和高精度需求:选择自训练专业垂类模型,例如医学诊断系统。 -
快速迭代和灵活调整需求:选择Prompt工程,例如自动文章生成、社交媒体内容创作。 -
快速响应和一定准确度需求:选择Prompt工程LangChain专业垂类知识库,例如智能客服、技术支持。

