多模态技术

    • 商汤大模型的「5o」交互,普通人如何和 AI 过一天?
    • 为医院装载“超级大脑”,商汤启动医疗多模态大模型赋能的智慧医院标杆联合共创
    • AI 赋能营销 | 拓展营销和创意潜能
    • 超强 AI 解析器:轻松处理文档、网页、音视频等 10 几种文档,高效清洗和组织你的数据!
    • 开源AI回答引擎的新时代:Morphic为你提供高效、准确的智能回答
    • 论文:大模型图表理解能力哪家强?CharXiv评估结果
    • 企业如何构建大模型营销体系:架构与实战
    • 实测:开源轻量化模型Gemma 2 在 A4000 GPU 上表现如何?
    • 多模态大型语言模型(MLLMs)在跨图像、视频和音频等多种任务中表现卓越
    • SpeechLLM:  分析音频演讲者情感的大模型
    • AI结合游戏NPC会发生什么?
    • 基于多模态信息抽取的菜品知识图谱构建
    • 揭秘 Agent-E:浏览器内的智能助理,升级在线自动化体验
    • 作为微软开源的全新架构,Florence-2 以其小巧的体积、炸裂的性能以及对多任务的统一处理方式,在视觉理解领域掀起了一阵旋风
    • 人工智能与教学:人工智能AI把课文变成视频。
    • SignLLM:通过文字描述生成手语视频的多语言模型
    • 23.5k Star!OpenVoice:这款AI工具能够精准模仿你的声音并说出任何语言!
    • 可视化文档引擎全面更新,解锁文档新玩法
    • 阿里云 PAI 大语言模型微调训练实践
    • 斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
    • 让图片开口说话的模型Hallo: 基于音频驱动的肖像图像动画,精准唇形同步,支持多种语言和风格
    • 微软Azure AI更新视频翻译和语音翻译 API 功能!
    • AI终将淘汰不会大模型的人?
    • Runway发布Gen-3 Alpha,逼真到分不清现实!
    购物车
    优惠劵
    搜索