OpenAI推出GPT-4o图像生成功能，全面免费开放

财经聚焦 2025-03-26 15:03:16 来源：界面新闻作者：网络

AI导读：

OpenAI宣布推出GPT-4o图像生成功能，被誉为有史以来最好的模型之一。全面免费开放基础功能，API调用价格下调50%。GPT-4o具备原生图像生成能力，支持多轮迭代优化，将推动人工智能图像生成技术普及。

　　当地时间3月25日，美国开放人工智能研究中心（OpenAI）宣布推出GPT-4o图像生成功能，这一创新被誉为“有史以来最好的模型”之一。OpenAI的CEO奥特曼在直播活动中宣布，将全面免费开放GPT-4o的基础功能，同时API调用价格下调50%，此举将极大地推动人工智能图像生成技术的普及。

　　奥特曼在直播中强调，GPT-4o模型具备原生图像生成功能，无需再调用独立的DALL-E文生图模型。借助GPT-4o的多模态能力，ChatGPT在图像生成时能更精确地遵循指示、渲染文字，并支持多轮迭代优化，保持角色形象一致。这一突破使得ChatGPT在图像生成文字领域实现了从不可用到接近商用的质的飞跃。

　　从官方示例来看，GPT-4o在生成黑板板书、印刷体及科学常识绘图等方面表现出色。然而，OpenAI也承认新图像生成器存在局限性，如易受模型幻觉影响，在密集文字和非拉丁语文字图像生成方面仍需改进。

　　ChatGPT自2022年底上线以来，一直专注于文本生成和编辑。大约一年后，OpenAI发布了第三代图像生成模型DALL-E 3，并将其集成到ChatGPT中，但两者一直是独立的系统。此次GPT-4o的原生图像生成功能，被视为OpenAI应对谷歌Gemini等竞品技术压力的重要举措。

　　近期，阿里巴巴、谷歌等巨头也推出了能准确生成文字的文生图模型。其中，谷歌Gemini 2.0 Flash的实验性原生图像输出功能在社交媒体上迅速传播。但Gemini 2.0 Flash的图像组件缺乏防护措施，引发了版权保护问题的关注。相比之下，OpenAI表示尊重艺术家的权利，并采取措施防止生成直接模仿在世艺术家作品的图像。

　　即日起，所有Plus、Pro、Team及免费用户将陆续在ChatGPT和Sora中体验GPT-4o的图像生成功能，企业版与教育版也将接入该功能。同时，开发者将能够通过API调用GPT-4o的图像生成功能，接口权限将于未来数周内开放。

（文章来源：界面新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。