一、LangChain 是什么
1. LangChain: 一个快速崛起的开源项目

2. LangChain: 通过组合模块和能力抽象来扩展 LLM 的助手

3. AIGC 应用开发生态

二、为什么需要 LangChain
1. GPT-4 很强,但还不够

-
私有化模型:很多企业需要在私有化环境中运行模型,保护数据隐私。 -
无法查询数据库:直接使用GPT-4无法灵活地查询和操作数据库。 -
不能调用第三方API:在实际应用中,往往需要与其他系统或服务交互,而GPT-4本身无法直接调用第三方API。 -
数据隐私:将敏感数据发送到外部服务存在数据泄露风险。 -
输出结果不稳定:生成内容的稳定性和一致性需要进一步提升。 -
无法对接外部工具:在复杂应用场景中,常常需要结合多种工具和服务,而GPT-4本身不具备这种能力。 -
无法联网:当前的LLM模型在处理实时信息和动态数据时存在局限。 -
数据截止2021年Q3:模型训练数据截止于2021年第三季度,无法处理更新后的信息。 -
Max Token 限制:生成内容的长度有限制,无法处理超长文本。
2. 为什么开发者要用 LangChain?而不是直接使用 OpenAI 或者 Hugging Face 上的模型?

-
集成复杂:需要编写大量代码来实现模型调用、数据处理、结果解析等功能。 -
功能扩展受限:直接使用底座模型难以实现复杂的功能组合和扩展。 -
维护成本高:需要持续关注模型更新和服务变更,保证系统稳定运行。
三、LangChain 典型使用场景

四、LangChain 基础概念与模块化设计

-
数据处理模块:负责数据预处理和格式转换,保证数据输入的规范性和一致性。 -
模型调用模块:封装对各类模型的调用接口,支持多种模型的灵活切换。 -
结果生成模块:根据应用需求生成结果,并进行后处理和优化。 -
工具集成模块:支持与数据库、API、外部工具等的集成,实现复杂功能组合。