多模态技术

    • Deep-Live-Cam: 一张图像让视频人物实时换脸
    • MiniCPM-V 2.6 面壁“小钢炮”,多图、视频理解多模态模型,部署和推理实战教程
    • 重塑 CLIP模型,jina-clip-v1 统一多模态模型,实现最先进表现 !
    • 多模态大模型的构成式思维链提示
    • 小试牛刀 – MiniCPM-V-2.6在安卓手机运行
    • MiniCPM-Llama3-V-2_5 微调记录
    • 一键拥有你自己的 ChatGPT+StabilityAI+Midjourney 网页服务
    • AI发型师
    • AutoStudio连环漫画生成方案体验、原理解析
    • 融合企业内部数据,赋能工业场景多模态智能决策
    • MAS | 让多智能体干活!做海南旅游官网优化方案,tools爬取网站,Agent分析输出优化方案!
    • 深度分析–多模态大模型在金融行业应用解决方案 2024
    • 多模态手机智能体 Mobile-Agent
    • Stable Diffusion WebUI v1.10.0重大更新,支持SD3!
    • 多模态大模型数据处理策略总结:兼看RAG增强编程语言翻译任务的简单方案
    • 利用AI进行视频与文本处理:技术流程实现与应用场景分析
    • 只需将感知推理能力拆分,2B大模型就能战胜20B!国产新框架高效处理视觉任务
    • Agent | 清华提出智能体IoA新框架:编织异构代理网络,实现协作智能
    • 微软推出Glyph-ByT5-v2,支持10种语言高精度文字海报生成
    • 腾讯新研究Follow-Your-Emoji:可生成面部说话视频的真人、卡通、雕塑、动物…
    • 万字长文分享快手 Kolors 可图大模型应用实践
    • 大模型创业:体感温度与实际温度
    • 腾讯SEED-Story:生成丰富、叙事连贯及风格一致图文故事的大模型
    • 【LLM】通过文档截图嵌入统一多模态检索
    购物车
    优惠劵
    搜索