让Kimi帮你看视频,帮你学习,效率爆表!

最近学习AI的时候,经常要看一些视频资料。但有些视频内容比较长,完整看下来比较花时间。

所以,就想着用大模型对视频内容先做一次总结,然后再有选择性地去看。

一不小心,就开发了一个视频总结智能体

让Kimi帮你看视频,帮你学习,效率爆表!

下面就给朋友们分享一下核心科技,啊哈哈。

第一步,获取视频

这里用小破站上讲解 GPT 的视频为例

让Kimi帮你看视频,帮你学习,效率爆表!

用扣子中的插件,输出视频url就可以下载视频

让Kimi帮你看视频,帮你学习,效率爆表!

第二步,提取视频内容

这里只提取了视频字幕。分两小步,先分离视频中的音频,再调用ASR语音识别技术,将音频转成文本。

这两步虽然在扣子中都有对应的插件,但我试了下没成功。就自己动手开发了一个插件。

让Kimi帮你看视频,帮你学习,效率爆表!

代码是用大模型生成的。将插件发布后,就可以在工作流中使用了

让Kimi帮你看视频,帮你学习,效率爆表!

第三步,总结视频内容

这个视频有27分钟,并且是英文版,提取的字幕大小30kb。长文本内容总结,当然用 Kimi。

让Kimi帮你看视频,帮你学习,效率爆表!

Kimi可以帮我们总结、提炼,生成中文版的核心要点。

纯文字版内容读起来还是差点意思,我们可以继续添加插件,将 Kimi 生成的内容做成思维导图。

让Kimi帮你看视频,帮你学习,效率爆表!

这样,一个27分钟的视频,经过智能体总结,分分钟掌握其中的核心要点。学习效率嗖嗖的。

这个智能体我们只能提取了字幕进行总结,其实还可以提取视频关键帧,送入视觉大模型,进行内容生成或者问答。

前沿技术新闻资讯

扑朔迷离“GPT-5”

2025-3-9 0:31:32

前沿技术新闻资讯

有人说:生成式 AI 将在3年内终结编程。到那时,软件开发团队中还会留下哪些角色?

2025-3-9 2:36:52

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索