DeepSeek发布V3小版本更新,性能再升级
AI导读:
DeepSeek发布了V3系列的小版本更新——DeepSeek-V3-0324,其开源版本已上线Hugging Face,参数规模达6850亿。此次升级未达市场期待的V4或R2版本。DeepSeek-V3曾在多项评测中表现优异,性能媲美顶尖闭源模型。同时,DeepSeek-R1模型也运用强化学习技术提升了推理能力。
3月24日晚,Deepseek发布了模型更新——DeepSeek-V3-0324,本次更新为DeepSeek V3系列的小版本迭代,而非市场期待的DeepSeek-V4或R2版本。目前,该模型的开源版本已登陆Hugging Face平台,其参数规模达到6850亿。

同日,DeepSeek官方宣布,V3模型已完成小版本升级,用户可前往官方网页、App、小程序体验(关闭深度思考功能),API接口及使用方法维持原样。

回顾2024年12月发布的DeepSeek-V3模型,曾以557.6万美金的高性价比媲美Claude 3.5,并在多项评测中超越Qwen2.5-72B和Llama-3.1-405B等开源模型,性能与GPT-4o及Claude-3.5-Sonnet等顶尖闭源模型相当。然而,至今尚未有新版DeepSeek-V3的能力基准测试榜单发布。
此外,DeepSeek于2025年1月推出了DeepSeek-R1模型,该模型在后训练阶段大量运用强化学习技术,在标注数据有限的情况下,显著提升了模型推理能力。
值得一提的是,2025年2月市场曾传言DeepSeek-R2模型发布时间或提前。路透社报道指出,DeepSeek正加速推进DeepSeek-R2的研发,原计划5月初发布的R2版本有望提前亮相。
(文章来源:上海证券报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。