1. ZDNET 的关键观点是什么?
ChatGPT Images 2.0 能生成准确的文本和可用的图形,还能匹配包括 ZDNET 视觉风格在内的品牌样式,但仍会出现错误,需要人工审核。本周早些时候,OpenAI 推出了其全新的图像生成引擎 ChatGPT Images 2.0。此次发布的关键在于其功能有了巨大提升,从创建“装饰性图像”(OpenAI 的说法)跃升至能生成包含详细文本的整页图形。提前获得预发布版本试用机会,它整体表现不错,但在处理 ZDNET 标志时总是出错。现在该产品已正式发布,将对其进行全面深入的测试。
ChatGPT Images 2.0 对所有 ChatGPT 用户层级开放,但更强大的语言功能仅对能使用 Thinking 模型的付费用户开放。使用开启了 Thinking 功能的 ChatGPT Plus 账户进行了所有测试。另外,还对 GPT - 5.5 进行了 10 轮测试,它得了 93 分(满分 100),仅因表述过于夸张而失分。
2. 从 ZDNET 品牌测试开始,情况如何?
没有直接上传 ZDNET 页面让它识别页面上的标志,而是单独创建了 ZDNET 标志的图像,并在每次提示时都上传该标志,这似乎很有帮助。(ZDNET 不允许 OpenAI 抓取其页面。ZDNET 的母公司 Ziff Davis 在 2025 年 4 月对 OpenAI 提起诉讼,指控其在训练和运行 AI 系统时侵犯了 Ziff Davis 的版权。所以使用 Chrome 扩展程序截取了想用于 Images 2.0 测试的文章的全屏截图,这样 ChatGPT 才能读取这些文章。)
ChatGPT Images 2.0 能保留 ZDNET 标志吗?以之前写的关于 Images 2.0 的文章为测试起点,向 ChatGPT 输入提示:“使用 ZDNET 品牌风格和附带的 ZDNET 标志,为这篇文章创建一个详细生动的信息图。”结果不仅标志正确,颜色也完全符合 ZDNET 的风格。而且该图像在文本处理上表现出色,所有文本都正确,甚至图像中倾斜的小字体也无误。
3. 能否生成风格化的速记笔记?
几个月前,曾让 Google 的 Nano Banana 完成创建美国《权利法案》速记笔记版本的任务。Nano Banana 在图像方面表现出色,但反复尝试才让它把文字表述正确。这次针对 ChatGPT Images 2.0,提高了难度,要求生成符合 ZDNET 品牌风格的速记笔记。在整篇文章中都强调品牌风格,因为这是 ChatGPT Images 2.0 能为用户提供实际价值的一种方式。
给出的第一个提示是:“为我创建一份美国《权利法案》的速记笔记,使用 ZDNET 标志风格,并采用 ZDNET 风格制作速记笔记。”这是左侧的图像。第二个提示是:“加入 ZDNET 标志,并添加更多霓虹灯风格的颜色,或许可以用黑色背景。”这是右侧的图像。
可以看到,文本准确无误,没有重复或遗漏内容,这已经远超 Nano Banana 的表现。两个版本都符合 ZDNET 的风格,唯一美中不足的是,第二张图像中的 ZDNET 标志看起来有些拥挤。不过标志本身是正确的,可能再调整几次提示就能让它的位置更合适。
4. 信息图有哪些小失误?
在测试中,让 Images 2.0 将 AI 网站建设工具对比文章转换为信息图。它生成了一个虽然有点繁杂但还算可用的信息图,甚至还从互联网上添加了文章中没有的信息,如基础定价。
但信息图存在四个明显错误:标题突出显示“以下是 9 款最佳 AI 网站建设工具”,还特意突出了“9”,可实际上文章只评测了 5 款网站建设工具。在信息图下方,确实展示了评测的 5 款工具。奇怪的是,ChatGPT 不知为何用 Durable(10Web 的竞争对手)替换了 10Web,而既没有评测 Durable,文章中也未提及它。
AI 为这些服务生成了一个总结表格,列出了易用性、设计灵活性和 AI 功能的星级评分,但并未提供这些类别的星级评分,而且 AI 对某些供应商过于慷慨,评分与评测文本内容相悖。最后,在信息图底部,AI 正确再现了 ZDNET 标志,但标志上方有一条下垂的线,这是怎么回事呢?
公平地说,这些错误在内部人类平面设计师的初稿中也可能出现。作为创始人兼产品经理,在过去见过设计师初稿中出现更严重的图形错误。当重新提示 Images 2.0 进行修正(除了星级评分,在第二张图像中未进行修正)时,它确实用更合适的信息修改了信息图。
5. ChatGPT Images 进步显著体现在哪?
ChatGPT Images 2.0 较之前版本有了巨大改进。去年试用的 ChatGPT Images 版本就令人印象深刻,尤其是在图像重新情境化方面。而这个新版本能解读实际内容并创建图像,相较于之前的版本有了质的飞跃。更重要的是,它能带来切实的商业价值,这使得它不仅适用于娱乐图片,在实际工作中也很有价值。
请继续关注,将对比这个版本与 Google Gemini 的 Nano Banana,并进一步探索它能协助完成哪些与工作相关的任务,特别是在用户界面设计方面。对依赖 AI 生成的视觉内容有多大信心呢?毕竟模型可能会引入一些细微的事实性错误。欢迎在下方评论区分享看法。可以在社交媒体上关注日常项目的更新动态,记得订阅每周更新时事通讯,并在 Twitter/X(@DavidGewirtz)、Facebook(Facebook.com/DavidGewirtz)、Instagram(Instagram.com/DavidGewirtz)、Bluesky(@DavidGewirtz.com)和 YouTube(YouTube.com/DavidGewirtzTV)上关注。
6. 人工智能相关其他内容有哪些?
- 试用了一款本地、开源且完全免费的 Claude Code 替代工具,了解它的工作原理。
- 如何立即从 Windows 11 中移除 Copilot AI。
- AI 正悄然自我毒害,使模型走向崩溃,但有解决办法。
- 如何识别 AI 图像:6 个表明其为假图的明显迹象,以及常用的免费检测工具。