上次文章提到年前要开发一款3D数字人在教育上的学习伙伴。然后雇佣了几个AI小伙伴来为自己服务。目前基本框架搭建完成。这也是自己开始打造自己数字人应用产品的第一步。单纯做数字人聊天已经满足不了目前的客户需求了。
开发背景
自从研究AI+数字人+智能体后,一直想着给自己的娃开发一款适合它的学习伙伴。目前他正是对各种知识求知欲望最强的时候。英语+古诗+动画片+历史+音乐+数学+成语+汉字+拼音+魔方+鲁班锁等等技能每天都在疯狂增长。所以需要尽快给它做出一款适合他的学习工具。
开发过程
1. 用v0.dev开发网页的基本框架。把竞品的效果图输入,然后让它一步步还原。
借着这次机会,让AI把我之前乱成一坨的数字人代码都清晰化了,这个小伙伴值得点赞。

我整体采用的是react+threejs框架。UI上用了tailwindcss+shadn,这样就省去了做UI的工作。从上面效果图可以看出,v0.dev生成的代码结构无论是命名上还是代码规范上都非常棒。
2. 用字节最新出来的Trae这个工具梳理整个项目,微调其中的问题。

这个工具基本是cursor的升级版,对中文支持的很好。现在可以免费使用claude-3.5-sonnet,不用白不用,赶紧帮我干事才是正题。
炫酷的开场动画
为了让网站看起来更加炫酷,正好看到国外一个网站做的一个三维场景动态效果不错,于是下载里面的glb模型后,用cursor复刻了里面的着色器和动画效果。
用字节的即梦帮我生成界面的图

购买了几款数字人二次加工
最近花了点银子从3D模型网站上购买了几款代表性的人物模型,完善自己的模型库。然后重新贴图,并花了2天时间做了4个数字人的面部形态键,骨骼绑定和动画。效率简直飞速。通过这次机会,把我之前做过的所有数字人都整合进来了。

完成了三种交互方式
在数字人交互界面支持文本、话筒、电话三种输入方式的来回切换。这也是目前最常见的三种交互,全部整合进来,想用哪个用哪个。

接下来的工作
离过年还有几天时间。继续打磨整个产品。
接入各种智能体
目前已经准备好4个不同智能体,基本满足多模态的形式。明天全部接入
丰富人物的场景
将人物放置到3D场景中,更有画面感。
接入会员制的后台
分离线版和在线版两种,离线版比较费设备,根据情况收费。
在线版主要用来负担各种API。
对接好玩的应用。
比如今天看到开源的DeepSeek R1-Zero生成的Manim数学动画视频,不到30秒钟无误的生成了勾股定理解释动画,9分钟一次性完成了量子电动力学概念的视觉化。这个很有必要接入。

比如牛顿掉下苹果的案例



