OpenAI推出GPT-4o图像生成功能,全面免费开放
AI导读:
OpenAI宣布推出GPT-4o图像生成功能,被誉为有史以来最好的模型之一。全面免费开放基础功能,API调用价格下调50%。GPT-4o具备原生图像生成能力,支持多轮迭代优化,将推动人工智能图像生成技术普及。
当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出GPT-4o图像生成功能,这一创新被誉为“有史以来最好的模型”之一。OpenAI的CEO奥特曼在直播活动中宣布,将全面免费开放GPT-4o的基础功能,同时API调用价格下调50%,此举将极大地推动人工智能图像生成技术的普及。
奥特曼在直播中强调,GPT-4o模型具备原生图像生成功能,无需再调用独立的DALL-E文生图模型。借助GPT-4o的多模态能力,ChatGPT在图像生成时能更精确地遵循指示、渲染文字,并支持多轮迭代优化,保持角色形象一致。这一突破使得ChatGPT在图像生成文字领域实现了从不可用到接近商用的质的飞跃。
从官方示例来看,GPT-4o在生成黑板板书、印刷体及科学常识绘图等方面表现出色。然而,OpenAI也承认新图像生成器存在局限性,如易受模型幻觉影响,在密集文字和非拉丁语文字图像生成方面仍需改进。
ChatGPT自2022年底上线以来,一直专注于文本生成和编辑。大约一年后,OpenAI发布了第三代图像生成模型DALL-E 3,并将其集成到ChatGPT中,但两者一直是独立的系统。此次GPT-4o的原生图像生成功能,被视为OpenAI应对谷歌Gemini等竞品技术压力的重要举措。
近期,阿里巴巴、谷歌等巨头也推出了能准确生成文字的文生图模型。其中,谷歌Gemini 2.0 Flash的实验性原生图像输出功能在社交媒体上迅速传播。但Gemini 2.0 Flash的图像组件缺乏防护措施,引发了版权保护问题的关注。相比之下,OpenAI表示尊重艺术家的权利,并采取措施防止生成直接模仿在世艺术家作品的图像。
即日起,所有Plus、Pro、Team及免费用户将陆续在ChatGPT和Sora中体验GPT-4o的图像生成功能,企业版与教育版也将接入该功能。同时,开发者将能够通过API调用GPT-4o的图像生成功能,接口权限将于未来数周内开放。
(文章来源:界面新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。