AI导读:

3月24日晚,DeepSeek发布了DeepSeek-V3-0324小版本更新,并非市场期待的V4或R2版本。该模型已在Hugging Face上线,拥有6850亿参数。此前发布的V3版本以高性价比著称,性能与顶尖闭源模型相当,但新版能力基准测试榜单尚未发布。

3月24日晚,Deepseek发布了其DeepSeek-V3模型的最新小版本更新——DeepSeek-V3-0324,此次更新并非市场期待的DeepSeek-V4或R2版本。目前,该模型的开源版本已在Hugging Face平台上线,拥有6850亿参数的庞大体积。

同日,DeepSeek官方交流群内宣布,DeepSeek V3模型已完成此次小版本升级,用户可前往官方网页、App、小程序进行试用体验(关闭深度思考功能),API接口和使用方式维持原样不变。

早在2024年12月发布的DeepSeek-V3模型,便以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,性能上与GPT-4o和Claude-3.5-Sonnet等顶尖闭源模型不相上下。然而,至今尚未有关于新版DeepSeek-V3能力基准测试榜单的发布。

此外,DeepSeek于2025年1月推出了DeepSeek-R1模型,该模型性能比肩OpenAI GPT-4正式版,在后训练阶段大规模运用了强化学习技术,在极少标注数据的情况下,显著提升了模型推理能力。

近期,市场曾有传闻称DeepSeek将提前发布DeepSeek-R2模型。路透社报道指出,DeepSeek正加速推出DeepSeek-R1的后续产品DeepSeek-R2,原计划5月初发布的R2版本,有望提前面世。

(文章来源:上海证券报)