正文

ChatGPT 4o图像生成功能重大升级，免费开放基础功能使用|界面新闻 · 科技

52黑料 V管理员 /2025-03-26/122阅读/0评论

0326

文章最后更新时间2025年03月26日，若文章内容或图片失效，请留言反馈！

当地时间3月25日，美国开放人工智能研究中心（OpenAI）宣布推出4o图像生成功能，OpenAI的CEO奥特曼称GPT-4o为“有史以来最好的模型 ”，并宣布将全面免费开放基础功能，API调用价格下调50%。

奥特曼当地时间周二直播活动中宣布，正式推出基于 GPT-4o 模型的原生图像生成功能，不再调用独立的 DALL-E 文生图模型。利用GPT-4o的多模态能力，ChatGPT在图像生成时能更加精确地遵循指示、更精确地渲染图像上的文字，同时支持多轮迭代优化图像时保持角色形象一致。

从官方给出的示例来看，不管是生成黑板板书，还是印刷体、展示科学常识的绘图，ChatGPT在生成图像文字领域终于从完全不能用，达到接近商用的程度。

不过，OpenAI承认新图像生成器还存在局限性，会受到模型幻觉影响，在密集文字和非拉丁语文字图像生成方面易出问题。

ChatGPT在2022年底上线，最初只能生成和编辑文本，不能生成图像。大约一年后，OpenAI发布第三代图像生成模型DALL-E 3，并集成到ChatGPT，但两者一直是互相独立的系统，AI图像生成器“理解提示词能力差”。

推荐阅读：

以工代赈促进重点群体就业增收，发改委作出最新部署|界面新闻

此次推出基于 GPT-4o 模型的原生图像生成功能的举措，被视为应对谷歌Gemini等竞品的技术压力。

今年阿里巴巴、谷歌先后推出能准确生成文字的文生图模型。其中，谷歌其旗舰模型之一的 Gemini 2.0 Flash 推出实验性原生图像输出功能之后，在社交媒体上迅速传播。但Gemini 2.0 Flash 的图像组件几乎没有防护措施，人们可以去除水印并创建描绘受版权保护角色的图像。

OpenAI 首席运营官布拉德・莱特卡普在一份声明中表示：“在输出方面，我们尊重艺术家的权利，并且我们有相应的政策来防止我们生成直接模仿任何在世艺术家作品的图像。”

即日起，所有Plus、Pro 、Team及免费用户将陆续在ChatGPT和Sora中体验该功能，企业版与教育版即将接入，Sora平台同步启用。开发者即将通过API调用GPT-4o图像生成功能，接口权限将于未来数周内开放。

你可能想看：

GPU超负荷、马斯克也加入其中，ChatGPT引爆吉卜力风格AI图像热潮|界面新闻 · 科技

AI早报 | 全球首场人形机器人马拉松今日开跑；小米大模型团队提出新图像生成方式|界面新闻 · 科技

AI早报 | ChatGPT将增加购物功能；8款通义千问Qwen3系列模型发布并开源|界面新闻 · 科技

大模型开源卷至视频生成领域：阿里开源万相2.1，性能超Sora|界面新闻 · 科技

湖南在线:66吃瓜黑料-黑料吃瓜爆料在线-百度美股涨近4%，消息称苹果仍与百度合作为iPhone开发AI功能|界面新闻 · 科技

67款App违法违规收集使用个人信息被官方通报|界面新闻 · 科技

百家号:天天吃瓜黑料-免费黑料吃瓜网站-DeepSeek概念公司云从科技发布业绩快报，去年净亏损6.37亿元|界面新闻 · 证券

鲁中晨报:黑料社吃瓜爆料-黑料吃瓜免费入口-支付宝也能语音通话了，拨打时可显示对方真实姓名|界面新闻 · 科技

相关阅读

发表评论取消回复

评论列表（暂无评论，122人围观）

还没有评论，来说两句吧...

目录[+]