多模态技术

    • 多模态技术,释放垂直AI软件潜力的关键
    • 重磅!ChatGPT实时语音终于要来了!附详细使用说明
    • NotebookLM +PodLM + F5:AI播客系列,个性化中英文播客(本地安装、Colab部署)
    • 通过 Swarm 构建模块化、可扩展的多代理应用程序
    • UniIR:通用多模态信息检索模型训练和评测标准
    • 探索 Phi-3-Vision-128K:引领未来的 AI 文档处理与 OCR 技术
    • 多模态大模型有哪些落地场景?贝壳、海尔等4家头部企业实践
    • Agent S通过对话让Agent控制电脑, 该类应用目前成功率还不到30%
    • 实时语音交互的游戏队友——网易伏羲 AI Agent 创新应用
    • OpenAI Swarm:探索多智能体(Agent)系统的新框架
    • NotebookLM爆火背后:AI原生产品的核心洞察与创新
    • ElevenLabs打造AI版费尔南多·阿隆索,开启虚拟人互动新纪元
    • Agent S-比肩普通人一样的电脑Agent如约而来,引领“电脑交互”新纪元。
    • 可以在浏览器中本地运行Whisper了!
    • Phi-3-Vision-128K大模型,AI助力OCR,文档处理更上一层楼
    • PyMuPDF4LLM:多模态PDF 解析神器!
    • 一文彻底搞懂多模态 – 多模态检索
    • GPT4o Realtime voice功能的复现路径
    • Memfree:一个混合 AI 搜索引擎,输入输出支持多模态内容(知识库+联网 混合Rerank)
    • 一文彻底搞懂多模态 – 多模态推理
    • 基于Qwen2多模态大模型构建的开源OCR项目
    • OpenAI Realtime 低延迟,多模态,实时语音交互
    • 使用 GPT-4-Vision 和 LangChain 的多模态 RAG
    • NotebookLM 用AI帮助你构建第二个大脑
    购物车
    优惠劵
    搜索