OpenAI GPT-4o图像生成功能引发算力挑战，GPT-5或提前发布

财经聚焦 2025-03-28 13:11:10 来源：每日经济新闻作者：网络

AI导读：

OpenAI宣布推出GPT-4o图像生成功能，引发算力挑战。该功能以“动动嘴就能P图”的便利迅速火爆，但也导致GPU过载。同时，OpenAI计划推出GPT-5，面临开发挑战。生成式AI正从通用工具向产业基础设施演变，但社会伦理、监管框架的完善有待探索。

随着OpenAI的图像生成功能完成重大升级，新的问题出现了。OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）表示：ChatGPT的文生图应用需求过高，我们的GPU“冒烟了”，在努力提高效率的同时，将暂时对ChatGPT生成图片的功能引入一些速率限制。这一决定是为了缓解GPU过载压力，并优先保障文本生成、对话等核心功能的稳定性。

图片来源：社交平台

据OpenAI官网，当地时间3月25日，美国开放人工智能研究中心（OpenAI）宣布正式推出GPT-4o图像生成功能。该功能上线后，以“动动嘴就能P图”的便利迅速火爆，互联网平台上涌入大量由个人照片、知名梗图转变而来的“吉卜力”卡通风格图片。

图片来源：OpenAI官网

GPT-4o是一个多模态AI模型，能够接受文本、音频和图像的组合输入，并生成相应的图像输出。这种功能的核心在于将自然语言处理与图像生成技术相结合，极大地降低了图片编辑的门槛。

连Altman也感叹起该功能带来的巨大流量，并分享了个人体验。据OpenAI介绍，GPT-4o图像生成功能具备四大核心优势：精准文本渲染、严格指令遵循、深度知识调用及创意拓展能力。

为验证其实际表现，记者进行了多组实测。测试结果显示，GPT-4o在英文内容识别上表现良好，但对中文字符的识别能力有待提升。同时，GPT-4o展现了强大的上下文连贯性和对复杂场景的处理能力。

Sam Altman在社交平台上的新头像，生成自Images in ChatGPT

尽管存在不足，GPT-4o图像生成功能的革新性依然显著。其精准的文本渲染能力、对复杂指令的高遵循度，以及多轮对话中的一致性表现，为创意设计、教育教学、游戏开发等领域提供了强大工具。

OpenAI因新功能面临的问题，折射了AI多模态技术发展中的资源与需求平衡难题。一方面，AI应用对GPU等算力资源的需求依然庞大；另一方面，行业继续呼唤技术迭代，以求高效利用现有资源。

据北京商报报道，此次更新GPT-4o的图像生成功能之后，OpenAI更大的产品更新将是推出GPT-5。GPT-5将集成公司多项技术，可能会在未来几个月内推出。然而，GPT-5的开发也面临诸多挑战，包括训练过程中的新问题和软件达不到预期等。

东吴证券发布研报称，GPT-5的发布时间或提前，或由于竞争对手Deepseek的更新和亮眼表现对OpenAI产品版图构成了威胁。研究机构Gartner预测，到2026年，多模态生成模型的商业价值将占AI市场的45%。

随着谷歌与微软等巨头持续加码，生成式AI正从通用工具向产业基础设施演变。但其社会伦理、监管框架的完善也有待各方共同探索。

每日经济新闻综合北京商报、扬子晚报·紫牛新闻、OpenAI官网、公开资料

（文章来源：每日经济新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。