企业用AI卡点在数据,无高质量数据何谈Embedding?


最近有一些思考,是从这个问题引起的:Manus和DeepSeek哪个更厉害?
这个问题看起来匪夷所思。我们并不想表达为什么要问这个问题,而实际现状的确是这样,我们需要深思的问题是AI技术圈聊的热火朝天、企业想引入应用困难重重!
实际上是不同大众有不同知识覆盖,不能要求所有大众和企业都去训练模型(很多很多人还真认为用大模型就必选训练),企业AI转型,道阻且艰!

问题

Manus什么时候能走进企业落地?如何落地?现在企业对AI还没用明白,如何把最新技术引入企业帮助降本、增效、扩大营收、提升品质与服务?

现在企业数据化最难的就是对于数据的认知以及管理,看到企业各种各样的格式保存数据就很崩溃,纸质资料、 PPT、Excel、Word等等各种类型数据,谈技术各类RAG和Embedding都很成熟,多种工具都能实现,可是数据没准备好(没有收集汇总、质量不高、还缺少很多资料等等)。数据治理是个挺重的工作!

目标

致敬Manus让我们看到并能触摸到设想的Agent,如何帮助更多企业将AI应用落地也是非常重要的环节。

整体方案

从6个资源纬度盘点数字资产、从6个架构纬度设计与企业业务流相结合的AI应用架构,现在又增加了AI应用开发框架旁企业级AI应用架构更加完善。看着很虚的方法论本来就不落地,因此在方法论底层搭建从代码到Agent到应用到业务流的路线图并跑起来,也才是迈出第一步,效果好不好、能否帮助企业实现预期价值等等还要时间来检验。

数据使用4步骤
企业用AI卡点在数据,无高质量数据何谈Embedding?
有同学问有没这类的工具来处理,其实也有的,发现过程如下:
1. 本以为没有,后来发现阿里百炼、火山方舟、百度千帆、AWS Bedrock等已经有这类流程;

2. 后来又发现,其实很多创业团队、开源项目有类似的框架;

3. 个人观点,我们没必要重复造轮子,就把大厂+创业公司的工具用好,服务到自己的主线上。

RAG技术前沿技术新闻资讯

langchain+qwen实现RAG数据之间的隔离

2026-4-25 13:58:40

RAG技术前沿技术新闻资讯

Chonkie:开源、轻量、极速的 RAG 分块神器 🦛

2026-4-25 14:05:38

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索