GPT-4o发布新的生图模型,实测目前地表最强

 

 

openai近期在chatgpt内发布了新的生图模型面向所有用户开放,根据博主的卡尔的AI沃茨测评结果显示,目前这个生图模型一定程度上让openai在主战场面对claude,grok,deepseek围追堵截下,可以稍稍缓一口气,综合能力暂时“遥遥领先”。

对比领域 GPT-4o 表现 结果/特点
写实风格   vs FLUX
在人物特写表现惊艳,光效和氛围感强,但质感略逊于Flux
GPT-4o发布新的生图模型,实测目前地表最强
写实风格优秀,但Flux仍略胜一筹
风格化       vs MJ
在“赛博水墨”“敦煌飞天机械姬”等复杂风格融合上表现惊艳,逻辑清晰,元素精准
GPT-4o发布新的生图模型,实测目前地表最强
超越Midjourney,尤其在细节和创意融合上
文字处理   vs 即梦
生成稳定中文、复杂文字布局(如海报、漫画对白)能力强,文字精准无乱码
GPT-4o发布新的生图模型,实测目前地表最强
优于即梦2.1,是目前文字稳定性最强的模型之一
对话修图   vs Gemini 豆包
能根据用户指令逐步修改图片,风格化处理自然,保留原图特征
优于Gemini 2.0和豆包,修图逻辑更清晰
多图融合
支持多张图片上传,可进行风格转换、人物融合(如马斯克+奥特曼)、UI设计+场景合成等
独特功能,其他工具暂无类似能力
四格漫画   vs 即梦
能根据文字或图片生成逻辑完整的四格漫画,画风统一,叙事清晰
GPT-4o发布新的生图模型,实测目前地表最强
优于即梦2.1,是目前漫画生成能力最强的模型之一

 

对于暂时无法使用openai的国内用户来说,字节跳动的即梦或者豆包依然是我们的首选,相信用不了多久,生图模型的DeepSeek时刻也即将到来。

 

前沿技术大模型技术新闻资讯

精通 MCP Server和Client 01

2025-5-16 22:07:53

RAG技术前沿技术新闻资讯

理解 RAG 第二部分:经典 RAG 的工作原理

2025-5-16 22:55:12

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索