AI导读:

MiniMax在文本、视频、语音多模态技术领域领先,其海螺AI视频网站全球访问量位居榜首。公司坚持技术驱动,突破长文本处理瓶颈,助力上海人工智能产业规模突破4000亿元。

  Deepseek的崛起,就像一颗超新星,释放出惊人的能量,瞬间点亮了中国的AI版图。在上海人工智能的璀璨星辰中,MiniMax无疑是最为耀眼的明星之一。

  DeepSeek擅长文字处理,而MiniMax则在文本、视频、语音等多模态技术领域独占鳌头。今年1月,MiniMax旗下的海螺AI视频网站在全球AI视频排行榜上独占鳌头,访问量位居榜首。截至2月上旬,MiniMax每日生成数百万条视频,稳居全球第一,每日生成的语音量也位居国内前列,文本处理量同样名列前茅。

  在全球竞争最为激烈的领域,这家上海公司如何一步步提升竞争力,在细分赛道上超越顶尖同行?

一张照片打造电影级效果

  利用人工智能生成视频已成为许多人的新宠。然而,AI的技术缺陷也引发了不少吐槽。比如,在连续的视频中,主角的面孔可能会突然改变,无法保持一致性。这一难题大大限制了AI生成视频的应用场景。

  直到今年1月,MiniMax发布了最新的视频模型,彻底解决了这一难题。用户只需提供一张人物的正面照片,无论生成多少段风格各异的视频,主角都始终保持一致。这一创新让网友们惊叹不已,一张照片就能制作电影,这不再是梦!

  在创业历程中,MiniMax始终坚持技术驱动。团队致力于解决动态视频中人物面部多角度的真实度和稳定性问题,以及保持人物角色高度一致等痛点。经过大量技术探索和比选,最终开发出S2V模型,该模型仅需传统方案1%的输入和计算成本,上传一张图片就能获得极佳的效果。

  在3年多的时间里,MiniMax不断迭代升级,持续优化文生视频、图生视频、主体参考等功能。这些创新使海螺AI视频在激烈竞争中脱颖而出,使用量超过了OpenAI的Sora,用户遍布全球超过200个国家和地区。

  同样,在文生语音等功能上,MiniMax也走出了差异化路线。MiniMax的语音功能竟然具备情绪调节和效果器功能,AI生成的语音可以带有开心、难过、生气等情绪。这一创新极大地提升了有声书和广播剧的生产力。

  “通用人工智能不仅是互联网流量的变化,更是计算范式的颠覆式创新,将引领生产力、社会分工以及产业结构的深刻变革。”上海稀宇科技(MiniMax)创始人闫俊杰表示。

自建图纸打造AI大厦

  闫俊杰曾在商汤科技负责通用智能技术。2021年,看到通用人工智能的曙光,他带领团队二次创业,MiniMax成为少数在ChatGPT诞生前就已进入这一赛道的中国公司。

  当前领先的大语言模型大多采用Transformer底层架构,但其存在“注意力机制”缺陷。随着文本长度的增加,计算复杂度呈平方级增长,这不仅会降低处理效率,还会增加计算成本。

  算力、算法和数据是人工智能发展的“铁三角”。在MiniMax创立之初,算力和数据有限,因此团队选择在算法上寻求突破。从2023年夏天开始,公司将80%的算力与研发资源投入底层架构研发。一年后,公司成功推出国内首个基于MoE架构的模型,并继续向“注意力机制”难题发起挑战。今年1月,大规模实现线性注意力机制的MiniMax-01模型诞生,这是中国公司首次突破传统Transformer架构,并逐渐得到行业的广泛认可。

  “底层模型能力是决定大模型应用成功与否的首要因素。”MiniMax副总裁刘华指出,虽然按照现有图纸建造相对容易,但图纸的不足也会限制建筑的高度。因此,MiniMax选择自建图纸,虽然起初可能进展较慢,但希望能更好地应对未来的挑战。

  底层架构如同AI的“新基建”,01模型突破了长文本处理瓶颈,可高效处理最长400万token的上下文。在工业领域,该模型可以快速解析百万字设备日志,辅助故障诊断;在医疗场景,它能连续跟踪患者数年的病历,生成个性化的治疗方案。

  近年来,大模型技术快速迭代,国内外AI行业竞争日益激烈。底层模型的一次重大迭代对产品带来的优化效果,远超在工程实现层面对产品进行“雕花”。这也是MiniMax始终关注模型本身,加速迭代升级的重要原因。

借助上海优势加速发展

  作为上海人工智能高地孵化的代表性企业,MiniMax的成长离不开这座城市的独特文化和基因。

  上海汇聚了全球顶尖的AI人才,为产业快速发展提供了有力支撑。在MiniMax上海总部大楼,研发人员数量持续增长。从人工智能行业的发展来看,成功的模型源于科学的做事方法、数百人技术团队的有效组织以及坦诚扎实的研发文化。

  人工智能是上海三大先导产业之一。上海推出了一系列有力举措,包括算力、场景、数据、人才等方面,以更好地满足人工智能行业的发展需求。

  上海还积极推动大模型企业与场景企业的对接。以MiniMax为例,他们与小红书合作打造生成式智能搜索,与阅文集团合作将数千本小说转化为超自然、高保真的有声书等,通过相互赋能实现更快发展。

  身处上海这个开放前沿,MiniMax也自带海派风格。公司面向个人用户的Talkie产品率先出海,短短几年内已拥有数千万用户,MiniMax也成为行业内出海最早、海外覆盖率最高的公司之一。

  闫俊杰坚信,“真正有价值的事,不在于当前的表现,而在于技术进化的速度。”在人工智能这个快速迭代的行业中,民营科技企业展现出独特价值,即以技术驱动实现快速发展,以灵活机制捕捉前沿趋势,以务实创新解决产业痛点。经过团队的艰苦努力,实现自我超越。

  上海人工智能产业规模已突破4000亿元,规模以上企业超过350家。仅“模速空间”及周边区域,就已聚集了255家模型企业和34个备案大模型。上海的AI宇宙正在加速扩张,更多激动人心的故事正在上演。

(文章来源:上观新闻)