AI导读:

OpenAI宣布推出GPT-4o图像生成功能,引发算力挑战。该功能以“动动嘴就能P图”的便利迅速火爆,但也导致GPU过载。同时,OpenAI计划推出GPT-5,面临开发挑战。生成式AI正从通用工具向产业基础设施演变,但社会伦理、监管框架的完善有待探索。

随着OpenAI的图像生成功能完成重大升级,新的问题出现了。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)表示:ChatGPT的文生图应用需求过高,我们的GPU“冒烟了”,在努力提高效率的同时,将暂时对ChatGPT生成图片的功能引入一些速率限制。这一决定是为了缓解GPU过载压力,并优先保障文本生成、对话等核心功能的稳定性。

图片来源:社交平台

据OpenAI官网,当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布正式推出GPT-4o图像生成功能。该功能上线后,以“动动嘴就能P图”的便利迅速火爆,互联网平台上涌入大量由个人照片、知名梗图转变而来的“吉卜力”卡通风格图片。

图片来源:OpenAI官网

GPT-4o是一个多模态AI模型,能够接受文本、音频和图像的组合输入,并生成相应的图像输出。这种功能的核心在于将自然语言处理与图像生成技术相结合,极大地降低了图片编辑的门槛。

连Altman也感叹起该功能带来的巨大流量,并分享了个人体验。据OpenAI介绍,GPT-4o图像生成功能具备四大核心优势:精准文本渲染、严格指令遵循、深度知识调用及创意拓展能力。

为验证其实际表现,记者进行了多组实测。测试结果显示,GPT-4o在英文内容识别上表现良好,但对中文字符的识别能力有待提升。同时,GPT-4o展现了强大的上下文连贯性和对复杂场景的处理能力。

Sam Altman在社交平台上的新头像,生成自Images in ChatGPT

尽管存在不足,GPT-4o图像生成功能的革新性依然显著。其精准的文本渲染能力、对复杂指令的高遵循度,以及多轮对话中的一致性表现,为创意设计、教育教学、游戏开发等领域提供了强大工具。

OpenAI因新功能面临的问题,折射了AI多模态技术发展中的资源与需求平衡难题。一方面,AI应用对GPU等算力资源的需求依然庞大;另一方面,行业继续呼唤技术迭代,以求高效利用现有资源。

据北京商报报道,此次更新GPT-4o的图像生成功能之后,OpenAI更大的产品更新将是推出GPT-5。GPT-5将集成公司多项技术,可能会在未来几个月内推出。然而,GPT-5的开发也面临诸多挑战,包括训练过程中的新问题和软件达不到预期等。

东吴证券发布研报称,GPT-5的发布时间或提前,或由于竞争对手Deepseek的更新和亮眼表现对OpenAI产品版图构成了威胁。研究机构Gartner预测,到2026年,多模态生成模型的商业价值将占AI市场的45%。

随着谷歌与微软等巨头持续加码,生成式AI正从通用工具向产业基础设施演变。但其社会伦理、监管框架的完善也有待各方共同探索。

每日经济新闻综合北京商报、扬子晚报·紫牛新闻、OpenAI官网、公开资料

(文章来源:每日经济新闻)