GPT-4o是否是目前生图能力最强的AI模型?

另外,GPT-4o的生图能力是否还需要依赖OpenAI的DALL·E模型?
收藏者
0
被浏览
103

6 个回答

wuchao LV

发表于 2025-4-8 12:27:00

教程

1️⃣ 根据自己的需求找一个表情参考图或者是自己画的。
2️⃣ 使用DeepSeek根据下方的提示词继续出其他表情的提示词
无奈(扶额+省略号漩涡);得意(叉腰+闪光背景);疲惫(黑眼圈+乱发打盹);害羞(脸红蒸汽+手指绕圈);疑惑(挠头问号+乱码脑波);幸灾乐祸(偷笑捂脸+吃瓜图标);惊恐(瞳孔缩小+炸毛静电);无语(白眼+下沉箭头);期待(闪亮星星眼+搓手);心虚(冷汗+眼神飘忽)
3️⃣ 其他的根据图片里面的提示词或DeepSeek出的提示词来优化表情包即可。
原图来源网络仅测试使用。

GPT-4o是否是目前生图能力最强的AI模型?-1.jpg


GPT-4o是否是目前生图能力最强的AI模型?-2.jpg


GPT-4o是否是目前生图能力最强的AI模型?-3.jpg


GPT-4o是否是目前生图能力最强的AI模型?-4.jpg


GPT-4o是否是目前生图能力最强的AI模型?-5.jpg


GPT-4o是否是目前生图能力最强的AI模型?-6.jpg


GPT-4o是否是目前生图能力最强的AI模型?-7.jpg


GPT-4o是否是目前生图能力最强的AI模型?-8.jpg


GPT-4o是否是目前生图能力最强的AI模型?-9.jpg


GPT-4o是否是目前生图能力最强的AI模型?-10.jpg


GPT-4o是否是目前生图能力最强的AI模型?-11.jpg


GPT-4o是否是目前生图能力最强的AI模型?-12.jpg

关于如何使用图像生成模型GPT-4o


关于如何使用图像生成模型GPT-4o - UIED用户体验学习平台

写在 最后

UIED Tools - 免费在线工具集合UIED-用户体验学习平台
UIED用户体验交流社区是一个专门为设计师提供的学习平台,它提供了丰富的资源和文章,覆盖了多个领域,包括UI设计、交互设计、平面设计、产品设计、设计干货、效率工具和AIGC(人工智能生成内容)等。本文由UIED用户体验交流社区作者@Tomda( 原创发布。转载请联系UIED用户体验交流社区)

steking LV

发表于 2025-4-8 12:39:10

从现在的体验上看,目前为止GPT-4o生图应该是最强了。其效率完全可以媲美SD和FLux。而且它无需进行配置和调整,使用的是自家的DALL·E。效果就超过了人类精心设计的工作流。
这可是经过长达一年与人类训练师协作优化的成果,目标只有一个:生成更加逼真、细节更炸裂的图像!

GPT-4o是否是目前生图能力最强的AI模型?-1.jpg

简单来说,你只需要在 ChatGPT 中用文字描述你想要的画面(还能指定宽高比、色号甚至透明度哦!),GPT-4o 就能在一分钟内给你"变"出一张相应的图像。
这波更新,简直是突破了以往 AI 生图的诸多边界!
先看下如何开启这个功能呢?依次按照下图格式开始即可,在 GPT 上,当你有如下创作图片的选项时,就说明用的是 4o Image Generation 了。

GPT-4o是否是目前生图能力最强的AI模型?-2.jpg

然后就可以开始画图了
  1. 使用极简主义的素描漫画风格,一个版面12副连环画完整展示《龙珠》第一章第二节,对话captions用中文简体汉字展示
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-3.jpg
  1. 使用极简主义的素描漫画风格,连环画完整展示《道德经》第一章的「真意」。
  2. 道可道,非常道。名可名,非常名。无名天地之始。
  3. 有名万物之母。故常无,欲以观其妙。 常有,欲以观其徼。
  4. 此两者,同出而异名,同谓之玄。玄之又玄,众妙之门。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-4.jpg

不过有个问题,由于使用生成图片的人数太多,Sam Altman 表示他们的GPU正在融化,会暂时限制一下大家的使用时间。

GPT-4o是否是目前生图能力最强的AI模型?-5.jpg

GPT-4o 图像生成,这次带来了哪些"王炸"特性?
OpenAI 在公告中明确了 GPT-4o 图像生成功能的几大亮点:

  • 精准渲染图像内文字: 这意味着制作 logo、菜单、邀请函和信息图等将变得易如反掌!再也不用担心 AI 把文字"糊"成一团了。
  • 精确执行复杂指令: 哪怕是细节非常丰富的构图,GPT-4o 也能准确理解并呈现出来,简直是细节控的福音!
  • 基于先前图像和文本进行扩展: 能够记住之前的对话内容和生成的图像,确保多次交互之间的视觉一致性,让创作更连贯。
  • 支持各种艺术风格: 从写实照片到各种风格的插画,GPT-4o 都能轻松驾驭,满足你天马行空的想象力。

GPT-4o是否是目前生图能力最强的AI模型?-6.jpg

更令人兴奋的是,除了在 ChatGPT 中直接生成图像,GPT-4o 还被整合进了 OpenAI 的视频生成平台 Sora,进一步扩展了其多模态能力,未来可期!
谁能第一时间体验?升级后的 ChatGPT 就是你的"专属画师"!
这项新功能即日起将作为 ChatGPT 的默认图像生成引擎,向 ChatGPT Free、Plus、Team 及 Pro 用户全面开放,直接取代了之前使用的 DALL-E 3。
作为去年推出的多模态模型,GPT-4o 最初的定位就是成本优化版的旗舰 AI 模型,已经具备了生成和理解文本、视频、音频和图像等多种能力。
而这次的精调版本,更是让普通用户和企业能够更轻松地创建逼真图像、可读文本段落,甚至是公司 logo 和演示幻灯片等。
背后功臣:人类训练师和"人类反馈强化学习"
项目首席研究员 Gabriel Goh 透露,GPT-4o 能够取得如此突破性的进展,关键在于人类训练师对模型数据的标注工作——他们细致地标注了 AI 生成图像中的错别字、畸形手脚和面部特征等问题。
通过"人类反馈强化学习 (RLHF)"技术,模型学会了更精准地遵循人类指令,从而生成更准确且实用的图像。

GPT-4o是否是目前生图能力最强的AI模型?-7.jpg

OpenAI 的 AI 系统拥有庞大的用户基础,每周用户超过 4 亿,这使得参与优化的训练师团队(规模略超百人)能够产生巨大的影响力。
当然,GPT-4o 也并非完美,依然存在一些"小瑕疵":
正如《华尔街日报》报道的案例,当用户上传一张带有两扇窗户的客厅照片,并要求重新布置家具时,AI 在重构图像时遗漏了一扇窗户。

GPT-4o是否是目前生图能力最强的AI模型?-8.jpg

此外,AI 图像生成的使用仍然面临一些争议,例如艺术家对版权和生计的担忧。
OpenAI 首席运营官布拉德·莱特卡普回应称,GPT-4o 的训练数据来自"公开可用的资料"以及与 Shutterstock 等公司的合作内容。
OpenAI 总裁格雷格·布罗克曼早在 2024 年 5 月就预告过 GPT-4o 的原生图像能力,但出于未知原因,直到现在才正式发布。此前,谷歌 AI Studio 的 Gemini 2 Flash 实验模型已经推出了类似功能。

GPT-4o是否是目前生图能力最强的AI模型?-9.jpg


格雷格·布罗克曼此前预告GPT-4o原生图像能力

现阶段,GPT-4o 还存在一些需要改进的地方,包括:

  • 裁剪问题: 像海报这样较大的图像可能会被过度裁剪。
  • 非拉丁字符的文本准确性: 某些非英语字符可能无法正确呈现。
  • 小字体中的细节保留: 小字号文本的细节可能会丢失或不够清晰。
  • 编辑精确度: 修改图像的特定部分时,可能会意外影响其他元素。
OpenAI 表示,他们正在积极解决这些问题,并通过持续的模型改进来提升用户体验。
保障安全与透明:AI 生成图像将带有"身份证"
作为 OpenAI 对负责任 AI 开发承诺的一部分,所有由 GPT-4o 生成的图像都将包含 C2PA 元数据,用户可以验证其 AI 来源。
此外,OpenAI 还建立了一个内部搜索工具,用于帮助检测 AI 生成的图像。同时,OpenAI 强调,涉及真人图像的内容会受到更严格的限制,以保护用户隐私和安全。

GPT-4o是否是目前生图能力最强的AI模型?-10.jpg


OpenAI负责任AI开发承诺

OpenAI 首席执行官山姆·奥特曼在新能力上线后发布"小作文",称此次发布标志着"创作自由的新高峰",并强调用户将能够创建各种视觉内容,OpenAI 将在真实世界的使用基础上观察并完善其方法。
眼见为实!GPT-4o 生图效果实测:
以下是一些来自 OpenAI 官方和网友的生图实测案例,让我们一起感受一下 GPT-4o 的强大能力:
图片质量相当高,可直接用于科普插画: 比如,
  1. 生成一个分光三棱镜。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-11.jpg

继续对话,一致性相当好:
  1. 让他把上面的三棱镜画成书册。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-12.jpg

文本渲染绝佳:
  1. 根据对话内容,画一个菜单(文字是单独给的)。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-13.jpg

上下文关联:
  1. 上传图片参考风格,精准输出。比如,根据风格插画生成三角形轮子的自行车。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-14.jpg
  1. 参考图一的配色,重新设计图二相机的配色和质感。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-15.jpg
  1. 这是我家的两只猫。公猫黄色,母猫灰色。根据他们的长相和特点,帮我预测一下他们幼崽的长相。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-16.jpg
  1. 保持空间骨架100%保留不变,把这张毛坯房生成意式风格的客厅,拥有皮质沙发与其它搭配的家具、艺术感的装置,高级感的地毯与墙面挂画、具备氛围感的灯光与墙面光泽,整体以2025潘通流行色摩卡慕斯色系,搭配个别墨绿色。要求生成真实的摄影照片的效果。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-17.jpg
  1. 生成吉卜力漫画风格,要求高度还原
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-18.jpg
  1. 用第-个 icon 的风格,重新设计第二个 icon
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-19.jpg
  1. 你能基于以上信息,请你帮我设计新的清明节海报,并提供拆解文案
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-20.jpg
  1. 一张卡尔·马克思在美国购物中心停车场匆匆走过的偷拍照片,他惊慌地回头看,试图避免被拍照。他手里拿着多个装满奢侈品的光滑购物袋。他的外套在风中飘动,其中一个袋子在他迈步时摇摆。背景模糊,汽车和发光的商场入口突显运动感。相机的闪光灯部分曝光过度,给图像一种混乱的八卦感。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-21.jpg
  1. 马正好在海洋与天空相接的地平线上。使用三分法来定位马。由于相机距离拍摄对象非常远,马的大小是整个图像大小的1%。相机视角非常接近地面/海洋,就像虫眼视角。马正好在海洋与天空相接的地方奔跑。
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-22.jpg
  1. 电商服装场景,直接试穿衣服
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-23.jpg
  1. 电商家具,室内设计
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-24.jpg
  1. 首饰替换,电商场景
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-25.jpg
  1. 老照片修复
复制代码
GPT-4o是否是目前生图能力最强的AI模型?-26.jpg

看完这些作图能力,真的太可怕了,这次 GPT 又将让一大批人失业,对于很多行业,简直是降维打击,让我想到《三体》里面的那句台词:我消灭你,与你无关。
一个全新的图像生成时代已经到来
GPT-4o 的原生多模态能力以前所未有的成熟姿态横空出世,其近乎完美的生成质量和丝滑的多模态对话体验,预示着一个全新的图像生成时代的到来。
这已经不仅仅是“能不能用”的问题,而是将彻底颠覆现有 AI 绘图生态,并深刻改变人们与 AI 进行图像创作的交互方式。
它将无差别地替代初级执行职位,曾经那些针对大模型的工程优化也将面临严峻挑战,甚至逐步侵蚀更上层的专业领域。这就像一场数字时代的工业革命,曾经看似坚固的技术壁垒和工作流程,在 GPT-4o 面前正被无情地瓦解。
我们仿佛已经看到,大量重复性的机械工作将被高效智能的 AI 所取代。虽然在专业和工业级领域,对精度和可控性的需求依然存在,为 ComfyUI 等工具留有一席之地,但这股变革的浪潮已不可阻挡。
要么成为弄潮儿,要么被时代抛弃。你,会选择哪一个?
<hr/>大全目前专注于小白 AI 入门领域的研究,分享从 0 到 1 入门 AI,ChatGPT ,DeepSeek 知识的系统性教程,
0 基础的小白也可以学会 ,有基础的小伙伴也可以学到进阶的知识,这里全部免费送给大家:

大全Prompt:都是干货!超全 AI 入门,DeepSeek,ChatGPT 资料分享!大全的愿景是成为 AI 的布道者,带领 10 万小白入门 AI。关注 @大全Prompt 带您 AI 入门。
最后,祝大家都能寻得可以全身心投入的事情,生活愉快!记得给我一个赞。

bibi_im286 LV

发表于 2025-4-8 12:53:46

经过长达一年与人类训练师协作优化,OpenAI于美国当地时间周二发布了GPT-4o原生多模态图像生成功能,支持生成更加逼真的图像。这是 Deep Research 以来 OpenAI 最有意义的模型更新。 新模型+一句话指令,效果就超过了人类精心设计的工作流。 Al 在设计方面超过人类,已是必然。
用户只需在ChatGPT中描述图像(可指定宽高比、色号或透明度等参数),GPT-4o便能在一分钟内生成相应图像。让我们细致看一看:本次更新,突破了以往的哪些边界。
OpenAI在公告中确认,GPT-4o图像生成功能具有以下特点:

  • 精准渲染图像内文字,能够制作logo、菜单、邀请函和信息图等;
  • 精确执行复杂指令,甚至在细节丰富的构图中也能做到;
  • 基于先前的图像和文本进行扩展,确保多个交互之间的视觉一致性;
  • 支持各种艺术风格,从写实照片到插图等。

GPT-4o是否是目前生图能力最强的AI模型?-1.jpg


GPT-4o生成图片效果展示


除了通过GPT-4o可以在ChatGPT中直接生成图像,该模型还整合进了OpenAI的视频生成平台Sora,进一步扩展了其多模态能力。
新模型即日起将作为ChatGPT的默认图像生成引擎,向ChatGPT Free、Plus、Team及Pro用户开放,取代此前使用的DALL-E 3。企业版、教育版以及API接口也将在不久后支持该功能。
据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进:
更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中;
增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性;
改进的多对象绑定:过去的模型在正确定位场景中的多个不同物体时存在困难,而GPT-4o现在可以一次处理多达10至20个物体;
多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。
让我们看看,目前4o生图可以做到的水平吧!
4o目前生图水平

1、一句话老照片上色


GPT-4o是否是目前生图能力最强的AI模型?-2.jpg


2、一句话修改图片


GPT-4o是否是目前生图能力最强的AI模型?-3.jpg


3、一句话做成鸟瞰图



GPT-4o是否是目前生图能力最强的AI模型?-4.jpg


4、一句话图标风格设计


GPT-4o是否是目前生图能力最强的AI模型?-5.jpg


5、一句话将原图改风格


GPT-4o是否是目前生图能力最强的AI模型?-6.jpg


GPT-4o是否是目前生图能力最强的AI模型?-7.jpg

6、一句话将图像转换样式


GPT-4o是否是目前生图能力最强的AI模型?-8.jpg


7、一句话融图创建新图像


GPT-4o是否是目前生图能力最强的AI模型?-9.jpg

8、一句话基于草图直接生成产品UI页面。

“你能基于这个UI创建一个高保真的产品模型吗?”。

GPT-4o是否是目前生图能力最强的AI模型?-10.jpg


GPT-4o是否是目前生图能力最强的AI模型?-11.jpg

9、一句话根据图片生成漫画


GPT-4o是否是目前生图能力最强的AI模型?-12.jpg


现阶段,GPT-4o取得了许多进步,但它仍然存在一些问题,其中包括:
裁剪问题:像海报这样的较大图像可能会被过度裁剪;
非拉丁字符的文本准确性:某些非英语字符可能无法正确呈现;
小字体中的细节保留:小字号文本的细节可能会丢失或不够清晰;
编辑精确度:修改图像的特定部分时,可能会意外影响其他元素。
OpenAI表示,正在通过持续的模型改进积极解决这些问题。
<hr/>怎么才能用上最新版 GPT-4o?
目前,可以确定的渠道是付费的 OpenAI 的 Plus、Pro 和 Team 用户。
但是海外使用有点困难,所以整理了一些其他的方式,小伙伴们可以尝试使用,接触一下4o生图的功能。
千言万语其实不如你自己实际体验一下,快来领会一下科技的魅力。

一些使用4o的方式

1、官网

没错,如果有能力的话,建议还是直接去官网使用,体验相当nice。

GPT-4o是否是目前生图能力最强的AI模型?-13.jpg


GPT-4o是否是目前生图能力最强的AI模型?-14.jpg

就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。
使用地址:https://chatgpt.com/

2、爱发电

国内大佬主要做解决GPT4o和Claude使用的公益服务网站,但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。

GPT-4o是否是目前生图能力最强的AI模型?-15.jpg

公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!
使用地址:https://afdian.com/a/warmo

3、Salck

大佬通过OpenAI官网的API在Slack配置的一个应用。
加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。

GPT-4o是否是目前生图能力最强的AI模型?-16.jpg

注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备)。加入完进入工作区在频道@GPT4应用即可。
工作区加入链接:https://h5ma.cn/jxn


4、lmarena


进入竞技场后点击DIRCTChat,然后选择4o模型就好。
需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。

GPT-4o是否是目前生图能力最强的AI模型?-17.jpg

注:首次进入稍微卡,需要等待一会。
使用地址:https://h5ma.cn/lpi

5、Poe


一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的Claude3.5、Claude3 Opus、GPT4o、Gemini基本都涵盖了。

GPT-4o是否是目前生图能力最强的AI模型?-18.jpg

但是限制次数,免费用户每天有3000积分,每日重置一次,对于4o模型来说,每次对话消耗200积分,也就是每天可以免费对话15次。尝个鲜还是不错的。当然次数用量大,可以换号薅~
使用地址:https://poe.com/

6、chatshare

国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。

GPT-4o是否是目前生图能力最强的AI模型?-19.jpg

注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。
使用地址:chatshare.biz
激活码获取:https://h5ma.cn/chatjhm

7、Sider插件

Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。

GPT-4o是否是目前生图能力最强的AI模型?-20.jpg

接入ChatGPT官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持GPT4、Claude3、Claude3.5-16k等等,可在国内使用。
可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。
使用地址:https://sider.ai/invited?c=c72098f2510f255a812ffb1a4b8fe977

8、Aichatru


俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。

GPT-4o是否是目前生图能力最强的AI模型?-21.jpg

使用地址:https://aichatru.ru
脚本地址:https://greasyfork.org/zh-CN/scripts/515897
注意安装脚本前必须浏览器有油猴插件
没有可前往油猴插件官网安装:首页 | Tampermonkey

如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!
如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!

陈宸 LV

发表于 2025-4-8 13:07:26

发现伊藤润二版的敖闰真的很迷人!
有兴趣为我去亖吗?人类

GPT-4o是否是目前生图能力最强的AI模型?-1.jpg


GPT-4o是否是目前生图能力最强的AI模型?-2.jpg

在2025年而言,真的太强了,可以说是效率上完美比得上SD和FLux,关键不用配置也不调,用的当然是自家的DALL.E 。
值得注意的是在GPT上AI绘画和在Sora上的效果一样,但是在Sora上用AI绘画会更快。

GPT-4o是否是目前生图能力最强的AI模型?-3.jpg

也可以直接打开GPT,输入Prompt:请改为日本动画电影新海诚《你的名字》的画风

GPT-4o是否是目前生图能力最强的AI模型?-4.jpg

得出来的就是新海诚《你的名字》的画风:有兴趣作个梦吗?

GPT-4o是否是目前生图能力最强的AI模型?-5.jpg

《龙珠》画风:有兴趣打一架吗?悟空!
那我变成超级赛亚龙3,有兴趣打一架吗?

GPT-4o是否是目前生图能力最强的AI模型?-6.jpg


GPT-4o是否是目前生图能力最强的AI模型?-7.jpg

《魔卡少女樱》版:有兴趣变装拍个照吗?知世

GPT-4o是否是目前生图能力最强的AI模型?-8.jpg


GPT-4o是否是目前生图能力最强的AI模型?-9.jpg

这个好认,一看就是《多啦A梦》的画风:有兴趣给我一个法宝吗?叮当

GPT-4o是否是目前生图能力最强的AI模型?-10.jpg

《小猪佩奇》版:有兴趣来吹个口哨吗?

GPT-4o是否是目前生图能力最强的AI模型?-11.jpg

《天线宝宝》版:有兴趣来嗨吗?宝贝们

GPT-4o是否是目前生图能力最强的AI模型?-12.jpg

蜡笔小新版:有兴趣来看屁屁外星人吗?

GPT-4o是否是目前生图能力最强的AI模型?-13.jpg

《瑞克和莫蒂》版来了:有兴趣来穿越吗?

GPT-4o是否是目前生图能力最强的AI模型?-14.jpg

《恶搞之家》版:有兴趣玩虐待吗?

GPT-4o是否是目前生图能力最强的AI模型?-15.jpg

《海绵宝宝》版:有兴趣来个汉堡吗?

GPT-4o是否是目前生图能力最强的AI模型?-16.jpg


GPT-4o是否是目前生图能力最强的AI模型?-17.jpg

欧美超级英雄画风:

GPT-4o是否是目前生图能力最强的AI模型?-18.jpg

马里奧画风:
1985年:

GPT-4o是否是目前生图能力最强的AI模型?-19.jpg

2023年:

GPT-4o是否是目前生图能力最强的AI模型?-20.jpg

美少女战士敖闰(把龙甲换了的原因,是因为美少女战士的战衣是重点):有兴趣让我代表月亮消灭你吗?

GPT-4o是否是目前生图能力最强的AI模型?-21.jpg

《圣斗士龙》:有兴趣让我来保护雅典娜吗?假教皇……
(把龙甲换了的原因,是因为圣斗士的圣衣是重点)

GPT-4o是否是目前生图能力最强的AI模型?-22.jpg

《城巿猎人》版:

GPT-4o是否是目前生图能力最强的AI模型?-23.jpg

JOJO版:有兴趣换个替身吗?老东西

GPT-4o是否是目前生图能力最强的AI模型?-24.jpg

《EVA》版:有兴趣给我驾驶一下初号机吗?碇司令!

GPT-4o是否是目前生图能力最强的AI模型?-25.jpg

《海贼王》版:有兴趣做个海贼王吗?路飞

GPT-4o是否是目前生图能力最强的AI模型?-26.jpg

《高达》版:有兴趣来部高达吗?旧人类

GPT-4o是否是目前生图能力最强的AI模型?-27.jpg

《火影》版:有兴趣当个火影吗?鸣人

GPT-4o是否是目前生图能力最强的AI模型?-28.jpg

《名侦探柯南》版:有兴趣找个真相吗?柯南

GPT-4o是否是目前生图能力最强的AI模型?-29.jpg

《死神》版:有兴趣卐解吗?一护

GPT-4o是否是目前生图能力最强的AI模型?-30.jpg

《灌篮高手》版:有兴趣打个篮球吗?大猩猩

GPT-4o是否是目前生图能力最强的AI模型?-31.jpg

游戏《拳皇97》版:

GPT-4o是否是目前生图能力最强的AI模型?-32.jpg

《熊出没》版:有兴趣来砍棵树吗?光头强

GPT-4o是否是目前生图能力最强的AI模型?-33.jpg

《喜羊羊与灰太狼》版:有兴趣去吃只狼吗?喜羊羊

GPT-4o是否是目前生图能力最强的AI模型?-34.jpg

《奶龙》版:

GPT-4o是否是目前生图能力最强的AI模型?-35.jpg

这种尸鬼风的是魂系游戏《血源诅咒》:

GPT-4o是否是目前生图能力最强的AI模型?-36.jpg

这个很明显就是《黑神话悟空》:

GPT-4o是否是目前生图能力最强的AI模型?-37.jpg

这个当然是正常少女版的敖闰,说实话比別的COSPLAY都好看些:

GPT-4o是否是目前生图能力最强的AI模型?-38.jpg

这个可能很多人都猜不着,其实是国产水墨颠峯《雾山五行》的画风:

GPT-4o是否是目前生图能力最强的AI模型?-39.jpg

接下来,继续来几个国漫风格的:
这是2003年的《哪吒传奇》的风格:

GPT-4o是否是目前生图能力最强的AI模型?-40.jpg

1986年上海美院的《葫芦娃》风格:

GPT-4o是否是目前生图能力最强的AI模型?-41.jpg

还可以换一个黑猫警长……

GPT-4o是否是目前生图能力最强的AI模型?-42.jpg

应评论区的来一个《北斗神拳》:

GPT-4o是否是目前生图能力最强的AI模型?-43.jpg


GPT-4o是否是目前生图能力最强的AI模型?-44.jpg

想看什么风格的小伙伴可以评论。
最可怕的还是对中文的支持,随手都可以来一张海报:

GPT-4o是否是目前生图能力最强的AI模型?-45.jpg

再来一张,也完成没有问题:

GPT-4o是否是目前生图能力最强的AI模型?-46.jpg

真的是不懂设设都能解决电商图,带来的影响就是文案+设计,可以直接合并为一个岗位。
有兴趣可以看看其它AI知识:AI大千宇宙

yanjifu LV

发表于 2025-4-8 14:17:01

关于GPT-4o是否是目前生图能力最强的AI模型,这一问题的答案并非绝对。当前,AI技术发展日新月异,不同模型在生图能力上各有所长。GPT-4o在图像生成方面表现优秀,但其他模型如DALL·E等也在不断进步。<br><br>至于GPT-4o的生图能力是否依赖OpenAI的DALL·E模型,这取决于具体的应用场景和模型融合的方式。在某些情况下,GPT-4o可能结合其他模型来提升生图能力。然而,这并不意味着GPT-4o完全依赖DALL·E模型。其生图能力也与其自身的算法和训练数据密切相关。<br><br>总体来说,评价一个AI模型的生图能力需综合考虑其在实际应用中的表现、技术细节及市场认可度等多方面因素。

TsMnO LV

发表于 2025-4-8 13:21:53

更新一下,目前4o生图应该是最强了。
https://zhuanlan.zhihu.com/p/1889445232006894110
&lt;hr/&gt;说一下结论:GPT-4o应该不是目前生图能力最强的模型,但是GPT-4o作为一个端到端的原生多模态模型,可以直接生成图像,不再需要像GPT-4那样外接一个DALLE-3模型。
我这里之所以说GPT-4o的生图能力不是最强,是因为OpenAI的官方公告中并没有直接给出GPT-4o在生图能力与其它SOTA模型比如Midjounery和SD 3的对比。
GPT-4o的一大亮点是一个支持文本、语音和图像的端到端的多模态大模型,它可以输入文本、语音和图像,也可以输出文本、语音和图像。

GPT-4o是否是目前生图能力最强的AI模型?-1.jpg

这和之前的多模态大模型有比较大的区别,比如GPT-4V只支持输入图像,而要生成图像需要接一个单独的文生图模型DALL-E 3。而且GPT-4V原生并不支持语音,要输入语音和输出语音,还要接两个语音模型:语音-&gt;文字模型和文字-&gt;语音模型。
虽然GPT-4o的生图能力不是最强,但是我觉得从目前OpenAI给出的例子来看,GPT-4o这种原生多模态模型会有一些单独的文生图所不具有的能力,因为GPT-4o可以支持文本+图像作为条件。
比如我们可以输入文本+图像来做头像的风格转换:

GPT-4o是否是目前生图能力最强的AI模型?-2.jpg

还可以组合两个图像加上文本生成新的图像:

GPT-4o是否是目前生图能力最强的AI模型?-3.jpg

还可以借助大模型的上下文能力创作一致性的角色:

GPT-4o是否是目前生图能力最强的AI模型?-4.jpg

此外,GPT-4o还可以渲染大段的文字:

GPT-4o是否是目前生图能力最强的AI模型?-5.jpg

以上所展示的能力,靠GPT-4来外接一个DALL-E 3还是比较难做到的。所以,我觉得GPT-4o会是一个非常有前景的多模态模型。

您需要登录后才可以回帖 登录 | 立即注册