AI导读:

DeepSeek发布了V3-0324模型,该模型在性能、用户体验和实用性方面进行了全面优化,总体积增至6850亿参数。新版模型在多轮对话中展现出更强的上下文理解能力,回复更接近人类习惯。同时,采用更宽松的MIT开源许可协议,引发全球开发者关注。

3月24日晚间,Deepseek发布了V3模型的最新更新版本——V3-0324模型。该模型在保持原有技术框架的基础上,针对性能、用户体验和实用性进行了全面优化。

新版V3-0324模型延续了V3系列的核心架构,总体积增至6850亿参数,相比之前版本的6710亿有了小幅提升。目前,该模型已在官方网页、App小程序等多个平台开放,同时,其开源版本也已上架至各大开源网站。

整体来看,V3-0324模型是一次重要的迭代升级,其主要特点包括:

一是性能显著提升。尽管DeepSeek未公布新版模型的基准测试结果,但用户测试显示,在生成复杂代码、解决数学问题及前端设计任务方面,新版模型表现尤为出色。尤其在前端代码能力上,有海外AI博主称赞,DeepSeek已能与Anthropic的Claude3.5/3.7Sonnet相媲美。

例如,有海外博主提到,新版DeepSeekV3-0324仅凭一个提示,就能根据想法自动生成市场网站的名称、主题、颜色和内容,效果惊艳,让非技术人员也能轻松创造出色作品。

二是用户交互体验优化。新版模型默认关闭“深度思考”模式,响应速度更快,更适合快速迭代任务。这一调整兼顾了实时性需求与复杂任务处理的平衡。

三是自然语言表达能力提升。据用户反馈,新版模型在多轮对话中展现出更强的上下文理解能力,回复语气与用词更接近人类习惯,减少了机械式回答。

此外,DeepSeek延续了其开源传统,新版V3-0324模型采用了更宽松的MIT开源许可协议,意味着研究人员和开发者可以自由下载、修改和部署模型。

V3-0324模型凭借其诸多亮点,迅速引发全球开发者关注。尽管此次升级并非传闻中的V4或R2版本,但凭借6850亿参数的开源模型和更友好的开源协议,仍备受瞩目。

同时,外界对DeepSeek的新模型充满期待。有分析认为,V3-0324的发布时机和特性或许预示着它将成为DeepSeek-R2的基础模型。目前,DeepSeek官方尚未公布R2的具体发布日期及技术细节,市场预期R2将于5月发布。

(文章来源:证券时报)