OpenAI GPT-4o图像生成功能引发算力挑战,GPT-5或提前发布
AI导读:
OpenAI宣布推出GPT-4o图像生成功能,引发算力挑战。该功能以“动动嘴就能P图”的便利迅速火爆,但也导致GPU过载。同时,OpenAI计划推出GPT-5,面临开发挑战。生成式AI正从通用工具向产业基础设施演变,但社会伦理、监管框架的完善有待探索。
随着OpenAI的图像生成功能完成重大升级,新的问题出现了。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)表示:ChatGPT的文生图应用需求过高,我们的GPU“冒烟了”,在努力提高效率的同时,将暂时对ChatGPT生成图片的功能引入一些速率限制。这一决定是为了缓解GPU过载压力,并优先保障文本生成、对话等核心功能的稳定性。


图片来源:社交平台
据OpenAI官网,当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布正式推出GPT-4o图像生成功能。该功能上线后,以“动动嘴就能P图”的便利迅速火爆,互联网平台上涌入大量由个人照片、知名梗图转变而来的“吉卜力”卡通风格图片。

图片来源:OpenAI官网
GPT-4o是一个多模态AI模型,能够接受文本、音频和图像的组合输入,并生成相应的图像输出。这种功能的核心在于将自然语言处理与图像生成技术相结合,极大地降低了图片编辑的门槛。
连Altman也感叹起该功能带来的巨大流量,并分享了个人体验。据OpenAI介绍,GPT-4o图像生成功能具备四大核心优势:精准文本渲染、严格指令遵循、深度知识调用及创意拓展能力。
为验证其实际表现,记者进行了多组实测。测试结果显示,GPT-4o在英文内容识别上表现良好,但对中文字符的识别能力有待提升。同时,GPT-4o展现了强大的上下文连贯性和对复杂场景的处理能力。

Sam Altman在社交平台上的新头像,生成自Images in ChatGPT
尽管存在不足,GPT-4o图像生成功能的革新性依然显著。其精准的文本渲染能力、对复杂指令的高遵循度,以及多轮对话中的一致性表现,为创意设计、教育教学、游戏开发等领域提供了强大工具。
OpenAI因新功能面临的问题,折射了AI多模态技术发展中的资源与需求平衡难题。一方面,AI应用对GPU等算力资源的需求依然庞大;另一方面,行业继续呼唤技术迭代,以求高效利用现有资源。
据北京商报报道,此次更新GPT-4o的图像生成功能之后,OpenAI更大的产品更新将是推出GPT-5。GPT-5将集成公司多项技术,可能会在未来几个月内推出。然而,GPT-5的开发也面临诸多挑战,包括训练过程中的新问题和软件达不到预期等。
东吴证券发布研报称,GPT-5的发布时间或提前,或由于竞争对手Deepseek的更新和亮眼表现对OpenAI产品版图构成了威胁。研究机构Gartner预测,到2026年,多模态生成模型的商业价值将占AI市场的45%。
随着谷歌与微软等巨头持续加码,生成式AI正从通用工具向产业基础设施演变。但其社会伦理、监管框架的完善也有待各方共同探索。
每日经济新闻综合北京商报、扬子晚报·紫牛新闻、OpenAI官网、公开资料
(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。