首页 大发棋牌官方网站入口 >新闻资讯 校园风采 大发棋牌官网
跑步成绩第一,真实提臀! GPT Image 1.5遭到严厉批评,奥特曼受到质疑
2025-12-21

新智报编辑部:编辑部【新智介绍】OpenAI半夜迈出一大步,全新GPT Image 1.5发布,双双排名第一,碾压Google Nano Banana Pro。然而,整个网络都受到了考验和批评。谷歌刚刚宣布将发布Gemini 3.0 Flash,但OpenAI的反手却是一颗“王炸弹”。就在今天,OpenAI扔下了“圣诞彩蛋”——新一代旗舰图像模型ChatGPT Images正式登场。这次,OpenAI直接将生成图像的能力发挥到了极致:精准控制:命令理解力大幅提升,真正能“改变所教”。细节疯狂:图像细节被完美保留,纹理异常出色。超快一代:速度较上一代提升4倍。即日起,所有免费的ChatGPT用户都可以开始使用,开发者也可以直接调用GPT Image 1.5 API。在LMArena的竞技场中,e似乎没有输:Vincent图:以1264 Elo点位居榜首,击败了Google Nano Banana Pro(NBP)。图片编辑:chatgpt-image-latest 以 3 分的微弱优势击败 NBP 夺得冠军,而 GPT Image 1.5 紧随其后位居第四。在人工分析方面,它甚至获得了“双第一”。左右滑动查看,但是返回速度太快。经过实际测试,网友发现,这似乎又是一个“高分低能”的例子。在金宇辰的对比中,GPT的图像生成能力可以达到Google NBP的水平,但智商却被碾压。特别是在处理手写笔记时,GPT Image 1.5 一代看起来还不错,但做得并不好。左:ChatGPT 提供的图像;右:Nano Banana Pro 左:ChatGPT 图片;右:Nano Banana Pro 这一差距引发了社区的强烈抱怨。有人直言:“Google Nano Banana Pro 依然是王者”。甚至有人批评:“这可能是另一个大使馆先是GPT-5.2在网络上得到了负面评价,然后GPT Image 1.5第一次就在谷歌“香蕉”中迷失了。OpenAI似乎在年底与谷歌的硬战中彻底失败了……GPT Image 1.5首次亮相史诗般的进化回到正题。根据官方博客,ChatGPT现在在修图方面明显比以往任何时候都更加合规——即使是最微小的细节OpenAI 中国研究员陈博源的一张照片证实,代号“榛子”的 GPT 图像已发布,无论是有用的照片编辑、试穿衣服和发型,还是保留原始照片本质的风格滤镜和概念转换,ChatGPT 都可以做到。让 ChatGPT 成为一个便携式创意工作室:您可以努力工作,让您的创造力飞扬。这不,奥特曼圣诞节来了……想怎么改就怎么改,多轮P图GPT Image 1.5擅长各种“操作”,包括添加、删除、组合、合并、替换。因此,当你想改变照片时,它仍然可以保持照片原来的“味道”。两个用户和一只狗,GPT Image 1.5 准确地捕捉到了他们在生日聚会上被迫“做生意”时感受到的无聊。提示:制作一张 2000 年代电影般的照片,将两个男人和狗放在一起,然后拍摄他们在孩子生日聚会上一脸无聊的样子。然后,基于这个图像库,你可以使用ChatGPT对其进行“认真的编辑”,例如在背景中添加一群顽皮的孩子。提示:在背景中添加一群顽皮的孩子,扔东西并尖叫,使其有点混乱。然后,左边的男人变成了动漫脸,小狗变成了一个毛绒娃娃。 AI精准完成编辑。提示:左边的男人改为手绘复古日式漫画风格,狗变成毛绒公仔,右边的男人和背景单独留下。然后让他们都戴上OpenAI定制的戴帽并控制他们。 (PS:Mark Chen的颈部处理有点不一样) 提示:把所有东西都放进OpenAI毛衣里,看起来像这样。更神奇的是,ChatGPT还可以一键换背景,把生日聚会瞬间变成OpenAI直播间。提示:现在去掉两个人,只留下狗,然后将其放入OpenAI直播中,如图所示。以滑板为例,让 ChatGPT 以 20 世纪 90 年代末街头纪实摄影的风格构建洛杉矶滑板场景的镜头。提示:在洛杉矶拍摄滑板风光,采用以下风格:90年代末纪实街头ph耳相摄影,使用 35 毫米彩色胶片拍摄,配备 35 毫米镜头的徕卡 M 型旁轴相机,柯达 Portra 400 彩色面板,自然光,柔和的对比度,柔和逼真的色彩,嵌入胶片颗粒,轻微边缘柔化,无数字边缘柔化,无数字胶片照明,无数字合成照明仅凭此图像,您就可以将滑板运动员的服装变成“红色”,而且很快就完成了。提示:将滑板手的衣服改为红色,帽子改为黄色。限速标志上写着15,那辆卡车一定是消防车。仿佛人生还不够,左边来了一群人,右边来了一只老鹰,天上又多了一艘飞艇。你想要的一切都在那里。提示:左边添加一群围观者,右边添加一只蹲在路上的老鹰,以及远处天空中飞翔的飞艇。接下来,将此图像直接打印到T恤上,ChatGPT将直接输出该图像。提示:拿一件挂在晾衣绳上的T恤,按照我说的做。T恤上印有年龄,属于全包印花。最后,ChatGPT 不妨让滑板佬穿上这件 T 恤。提示:你能把先挂在晾衣绳上的T恤穿在滑板小子身上吗?从上面两个demo我们不难看出,在GPT Image 1.5的支持下,ChatGPT具备了精确编辑图像的能力——它可以准确地改变你想要的内容,同时在多轮编辑后仍能保持一致性。创造力是超乎寻常的,而正确的细节编辑是基础。 GPT Image 1.5的创造力在“大变革”期间显得尤为耀眼。它允许通过更改和添加元素(例如文本和版式)来实现想法,同时保留重要的细节。细分这既适用于简单的概念,也适用于复杂的想法。并且借助全新的ChatGPT Images功能,您无需提示文字,只需使用预设的样式和创意即可直接开始离开。例如,在 ChatGPT 上上传两人在一起的照片以创建电影风格的海报。提示:拍摄这两个人的照片,制作一张老式好莱坞黄金时代风格的电影海报,称为“codex”。服装可以随意更换,只要适合季节即可。演员名字更改为沃伊切赫·扎伦巴(左)和格雷格·布罗克曼(右)。由萨姆·奥尔特曼执导,菲吉·西莫制作。制片人写道:感受 AGI Pictures Production。正如你所看到的,生成的创意图像的光环突然降临。而且,说明书中文字的细节在图片中完美再现。让奥特曼成为20世纪80年代的健身教练,头发蓬松,头带、腕带。提示:将我变成标志性的 80 年代 VHS 磁带式健身教练,保持我原有的面部结构和表情。真实的 80 年代照片和视频效果直接应用于脸部:柔和的发光、轻微的模糊、轻微的噪点、轻微的颜色出血d,以及影响肤色和边缘细节的微弱扫描线。用充满活力的 80 年代运动服、毛圈布发带、腕带和霓虹色运动服打造造型。头发应该像20世纪80年代那样柔和,并且应该遵循原来的长度和质地。如果妆容是色彩鲜艳的复古妆,与整体造型相配的话就可以加。整体灯光采用柔和柔和的演播室灯光,加上稍微受损的 VHS 美学,为脸部和身体提供了模拟信号的环境。图片看起来是我在带领大家做有氧运动。将相应的文本添加到屏幕上。必须说,ChatGPT 抓住了 20 世纪 80 年代的精髓。甚至连“华丽娃娃”风格的生成都可以在ChatGPT中一键完成。提示:创建一个超级风格化的 3D 浮动头像。主角应该被打造成一个开玩笑的、迷人的、悲伤的、无感情的版本:半眯着眼睛、扬起眉毛、微微上扬嘴角一勾,展现出经典的“刻薄辣妹”风格。皮肤应具有光滑、有光泽的质感,并且应在颧骨和鼻子上涂抹强烈的高光,以捕捉柔和的工作室光线。眼影应该是全息偏光的,从紫色到青色的渐变,有清晰的反光斑点。头发浓密、光滑、有光泽,呈雕塑般的波浪状或整齐的造型,像抛光的亚克力一样反射光线。添加一个带有一点拉丝金属反光的小金属镀铬鼻环(钉子或戒指)。头部应悬挂在纯白色中性背景上,倾斜 15 度,就像高端产品渲染中一样。使用明亮的漫射工作室光,无硬阴影,强调光泽、可塑性和皮肤下的散射,以创建逼真的深度。心情应该是细腻的、时尚的、冷静的、超然的。机位应为特写人像,直视相机,焦距为85mm。纹理是皮肤、嘴唇和头发上的超光滑、高光泽、卡通般的塑料外观。奥特曼立即摆出了“刻薄辣妹”的样子。更有趣的是,角色(奥特曼)也能干有用的边缘工作。提示:用抛光模压玻璃制作一个吊坠,其表面具有高光泽的油漆,可以反射来自各个角度的光线。它的触感必须非常光滑和凉爽,而且它的重量必须既脆弱又永恒。涂层应具有光泽的珐琅质地,介于陶瓷和糖衣外壳之间,具有高度反射性,允许微小的亮点像弯曲表面上的柔和火花一样绽放。轮廓和纹理带有微小的金属装饰——点、线和金丝图案,触摸时闪闪发光。这些应该用精细的闪光涂料或微珠来完成,以创造一种手工装饰的感觉;闪光应该是分层的,而不是平坦的,这样光线就会在凸起的细节上跳舞。整个作品应该发出一种重新的感觉tro kitsch 奢华:明亮的色块与光泽的装饰形成鲜明对比,既有趣又刻意。曲线应具有微妙的虹彩光泽——金色、玫瑰色和珍珠色调。表面纹理应该看起来可以食用,就像倒入模具中的糖霜或融化的糖果。这款吊坠悬挂在精致的金戒指和细绳上,散发着微妙的戏剧感,既喜庆又具有雕塑感。这是一种既具有标志性又有趣的东西,是一件在圣诞树灯光或工作室灯光下闪闪发光的宣言作品,散发着营地的美丽和手工怀旧之情。这也是一位圣诞老人。那就拿奥特曼在苹果WWDC演讲时穿的经典粉色衣服,让他现在穿上看看效果。提示:使用上传的图像作为主题参考。将其改为极简的 90 年代美国时尚广告。主角的五官、比例、姿势、表情必须完美保留。原来的颜色双领Polo衫被完整地保存下来。风格:干净、低调、高端的时尚画报风格。着装:双层 Polo 衫(一件 Polo 衫叠在另一件上面)、经典剪裁、中性或略柔和的颜色。场景:无缝工作室背景纸,构图简单。灯光:柔和、均匀的演播室灯光和柔和的阴影;肤色应该是自然的。心情:自信、放松、没有时间。该品牌写道:GPT‑Shirt。摄影风格:中幅胶 胶片质感、细微颗粒、对比度要克制。至于气场,还是因人而异。一些女孩最喜欢的《芭比装扮》也可以在ChatGPT上玩。提示:将她置于2000年代的装扮游戏界面中,并将环境设置为粉色。确保太阳镜包含在套装中。奥特曼的服装非常适合他的性格。此外,甚至要求的一副太阳镜也出现在图片中。 ChatGPT也能让奥特曼——《戴珍珠耳环的少女》成为经典。提示:放我画作《戴珍珠耳环的少女》中。他还可以用来代言饮料广告。提示:使用附件中的人脸为一种名为“SOTA”(一种新苏打水)的新饮料制作复古苏打水广告。标语是:Nothing Artificial about it(一切自然,没有人工)。风格应该忠实地再现那个时代。经过一轮的演示,ChatGPT Image的创意更加富有想象力。相比GPT-4o主打的吉卜力风格,新的则是更具创意的照片模型版本。更加人性化,完美还原6x6网格。与GPT Image的第一个版本相比,1.5版本具有更强的监听命令的能力。这允许更精确的编辑和更复杂的原始合成,其中元素之间的关系按预期保留。直接进入地狱级难度——6x6网格,36个元素,GPT Image 1.5,如丝般光滑,精确,每一个细节。提示:创建一个具有 6 列和 6 行的网格图。内容如下: 第1行:希腊字母β、沙滩球、柠檬、机器人、鱼缸、青蛙。第 2 行:螳螂、手表、浴缸、太阳镜、彩色蝴蝶、信封。第三行:邮票、相框、热气腾腾的饺子、奇迹字、滑雪板、字母Z。第四行:厕所、地铁代币、静音。图标,香水,蜻蜓,滑板头盔第5行:蓝牙图标,13号,绿心,魔方,加拿大鹅,士兵头盔第6行:白狗,救生衣,结,键盘,纸巾盒,14号左:新模型;右图:旧的文本模型渲染清晰,直接编程 在文本渲染方面,新模型更进一步,可以处理更密集、更小的文本。下面用图来介绍一下GPT-5.2,ChatGPT的Markdown渲染能力很恐怖。提示:下面的卡路里信息图非常详细。提示:ChatGPT甚至可以编译复杂的编程接口。提示:在其他方面进行了更多改进r 维度,新模型也进行了改进,使输出更直接可用。例如,它可以更好地画很多脸,看起来更自然。让 ChatGPT Image 创建 1970 年代伦敦的图片。新(左)和旧(右)版本之间的差异是显而易见的。在面部细节方面,1.5版本更强、更真实。提示:在伦敦切尔西创建 20 世纪 70 年代的街景,需要逼真、完全聚焦并揭示每个细节。街上挤满了人,也有公交车。公交车上有一个广告,写着“ImageGen 1.5”,上面有OpenAI的标志,副标题是“Create What you Imagine。整体风格应该是超写实的业余摄影,就像是用iPhone拍摄的一样……再比如,人山人海的“大场景”。新版本(下图左)下图更加真实、自然,而右图则为,下图则为P。rompt:金门大桥前,场面浩大,数千人。人群中每个人的脸都应该清晰,才能赚到潜水员在海底弹钢琴的钱。新版本(左)更加真实,更具人性化。提示:潜水员在水下弹奏钢琴,美人鱼在一旁观看。超现实的业余射击风格。让它创建一个眩光图像。下面的对比图中,一眼就能看出右侧的效果比较假。提示:使用打印的复古图片创建图片。照片中,酒吧里有一名亚裔少年和一名白人少年,两人都戴着圣诞帽,其中一人手里还拿着一杯饮料。相机闪光灯留下的反光点应在打印图像上可见。图像还应该有一个可见的细白色边框,并且放置得稍微倾斜。更进一步 为了评估性能,OpenAI 重新运行了 ChatGPT Image 1.0 版本中的许多示例。在各种情况下,新尽管结果仍然不完美,但模型显示出明显的改进。虽然此版本代表了重大进展,但未来迭代仍有很大的改进空间。例如,日本漫峰展示了不同海洋深度的生物横截面。新版(左)细节更多,但风格明显不如旧版(右),更行。与“日本漫风”。提示:制作一张深海生物的海报,展示它们在不同深度的情况。以日本动漫风格创建海洋的垂直剖面,特别细致且美丽。对于暗黑奇幻动漫风格,新版(左)相比旧版(右)也有明显的理解偏差: 提示:我画了一张图,那应该是暗黑奇幻动漫中的风格。 OpenAI 承认,与之前的版本相比,其生成某些艺术风格的能力有所下降。解决方案是:尝试使用在“照片”功能中预设过滤器,会有帮助的。另外,之前版本的ChatGPT Images现在是自定义GPT,您也可以直接使用旧版本。另一个主要限制是新模型无法可靠地对多人合影进行 Photoshop 处理(上图),并且处理后面部特征很容易变形(下图)。提示:你能把这些印有“OpenAI”的T恤都穿上去,让大家开心地笑吗?当人多了,新模型就很难准确地保持每个人的外貌和特征。另一个很大的限制是多语言文本渲染,这充满了问题——中文彻底完蛋了……尤其是阿拉伯语和希伯来语等非英语语言。说。提示:你能画一张图,列出一些用中文点菜的基本常用短语吗? API:便宜 20% API 中的 GPT Image 1.5 提供与 ChatGPT 图像相同的所有改进。例如,它保留品牌logos 和关键视觉效果在多次编辑中更加一致,使其非常适合营销和品牌工作,例如图形和徽标设计,以及电子商务团队从单一源图像构建完整的产品图库(不同的变体、场景和角度)。 GPT Image 1.5 的图像输入和输出价格比 GPT Image 1 便宜 20%,因此您可以使用相同的预算构建和迭代更多图像。目前,各行各业的企业和初创公司,包括创意工具、电子商务、营销软件等,都已经使用了GPT Image 1.5。左右滑动即可看到奥特曼亲自拉响紧急警报。此次更新也是对谷歌的强力反击。就在上个月,奥特曼立即响起了“红色警报”,因为谷歌双子座正在抢占市场份额。但当时谷歌刚刚发布了新旗舰机型Gemini 3和图像构建工具Nano Banana Pro,后者在多项基准测试中均位居LMArena排行榜榜首。方舟测试。面对谷歌的接连施压,OpenAI迅速加快了步伐:大约5天前,发布了GPT-5.2;今天,它推出了升级版形象模型。这一波OpenAI更新显然是对谷歌在开发者中拥有良好口碑的Nano Banana Pro的直接挑战。 OpenAI 面临的对手不仅仅是谷歌。今年8月,Qwen-Image已经支持生成中英文可读文本; Black Forest Labs还发布了开源图像模型Flux.2,功能非常强大。这场AI图像模型之争显然已经进入白热化阶段,目标也很明确:赢得企业市场。奥特曼展示了新模型的许多改进和新的编辑功能。作为 OpenAI 的应用 CEO,Fidji Simo 秘密对标 Google Nano Banana Pro,直言这次是从文本转向动态 AI 体验。他认为通过ChatGPT Images以及更多的功能,距离“你所想的”和“得到的”之间的距离可以缩短。人类的思维不仅仅是言语。事实上,最令人兴奋的灵感往往始于脑海中的一个图像、一段旋律、一个动作或一个模式。如果人工智能想要帮助我们充分发挥潜力,它必须以我们习惯的方式理解、表达和交流。 Fidji Simo透露,除了图像生成器之外,OpenAI还全面升级了ChatGPT的视觉体验:过去几个月,我一直在谈论ChatGPT的进化方向:它正在从一个被动的、基于文本的产品转变。一个更直观、更贴近您想要执行的任务的智能助手。从纯文本到多模式和动态 UI(用户界面)的转变是这一演变的重要组成部分,我很高兴看到这些发展。 Fidji Simo宣布,未来用户在搜索问题时将看到更多可视化信息和清晰的资源。例如,在转换单位、查看游戏分数等情况下,插图比文字更直观。然而,体验过GPT Image 1.5和Nano Banana Pro的网友直言,这次OpenAI“失控”了:一个用青蛙头愚弄奥特曼的表情包开始传播:悲伤青蛙或佩佩青蛙(左),完全模仿了OpenAI预热图(右)——同样的背景,相似的衣服,不同的眼睛,相似的文字,不同的眼睛。但最让人心痛的评论无疑是OpenAI推文下网友直接“打脸”:OpenAI彻底完蛋了。同样的提示语下,相比GPT Image 1.5,Nano Banana的nabuo图像更加真实自然,对于电商创意素材来说非常有用。在下图中,前两张是由 GPT Image 1.5 生成的,下两张是由 Nano Banana Pro 生成的。提示词:一名 53 岁的白人德国男子在他的卧室里,典型的意大利风格卧室里,架子上堆满了盒子和书籍。背景中有一张桌子,上面有一台 iMac,文件散落在各处。他穿着一件灰色连帽衫(带有简单的标志)和一枚结婚戒指。她的手腕上戴着一个低调的红色手镯。他直视镜头,具有自然风格的用户生成内容。不过,有网友表示,GPT Image 1.5生成的“马斯克和奥特曼的圣诞照片”太逼真了,没有任何可见的瑕疵。考虑到Gemini 3.0 Flash即将推出,新的Nano Banana图像生成功能可以更快、更便宜。不知道这次OpenAI的图1.5是不是一场“徒劳的挣扎”。可以肯定的是,OpenAI的紧急警报一时半会儿也停不下来。参考资料:HYJhttps://x.com/OpenAI/status/2000990989629161873https://openai.com/index/new-chatgpt-images-is-here/Miaochai ASI⭐点赞、转发、一键观看⭐快推点亮新智慧之星! 特别声明:上述内容(如有的话,包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。 注:以上内容(包括图片、视频,如有)由网易号用户加载并发布,网易号为社交媒体平台,仅提供信息存储服务。

Copyright © 2024-2026 爆料黑料网站-爆料快手网红黑料网站-快手抖音网红爆料网站 版权所有

网站地图

鄂ICP备36659856号

友情链接: