多模态技术

    • AI结合游戏NPC会发生什么?
    • 基于多模态信息抽取的菜品知识图谱构建
    • 揭秘 Agent-E:浏览器内的智能助理,升级在线自动化体验
    • 作为微软开源的全新架构,Florence-2 以其小巧的体积、炸裂的性能以及对多任务的统一处理方式,在视觉理解领域掀起了一阵旋风
    • 人工智能与教学:人工智能AI把课文变成视频。
    • SignLLM:通过文字描述生成手语视频的多语言模型
    • 23.5k Star!OpenVoice:这款AI工具能够精准模仿你的声音并说出任何语言!
    • 可视化文档引擎全面更新,解锁文档新玩法
    • 阿里云 PAI 大语言模型微调训练实践
    • 斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
    • 让图片开口说话的模型Hallo: 基于音频驱动的肖像图像动画,精准唇形同步,支持多种语言和风格
    • 微软Azure AI更新视频翻译和语音翻译 API 功能!
    • AI终将淘汰不会大模型的人?
    • Runway发布Gen-3 Alpha,逼真到分不清现实!
    • 翻车了?这才是真正的SD3!
    • 火爆ChatTTS!小说角色对话,让真人都怀疑自己的耳朵!有人靠它赚了第一桶金
    • 在清华与中国AIGC大会的分享:多模态AI大爆发,多模态提示词与智能体
    • 【PPT+讲稿+笔记】张俊林:多模态大模型:系统、趋势与问题
    • 接入腾讯混元大模型,腾讯问卷推出AI功能为调研提效提质
    购物车
    优惠劵
    搜索