AI导读:

幻方量化全新AI模型DeepSeek-V3上线并同步开源,拥有671B参数,性能卓越,超越多个知名开源模型,与世界顶尖闭源模型比肩。

幻方量化公司近期宣布,其全新系列模型Deepseek-V3的首个版本正式上线,并同步面向公众开源。此次更新还包括了API服务的同步升级,且接口配置无需进行任何改动,确保用户无缝对接。值得注意的是,当前版本的DeepSeek-V3暂不支持多模态输入输出功能。

据幻方量化介绍,DeepSeek-V3是一款自研的MoE模型,拥有671B的庞大参数规模,其中激活了37B参数。该模型在14.8T的token数据上进行了深入的预训练,取得了显著的成效。在多项评测中,DeepSeek-V3的成绩已经超越了Qwen2.5-72B和Llama-3.1-405B等其他知名开源模型。更令人瞩目的是,在性能方面,DeepSeek-V3与世界顶尖的闭源模型GPT-4以及Claude-3.5-Sonnet相比,同样表现出色,难分高下。

这一成果的发布,标志着幻方量化在人工智能模型研发领域取得了新的突破,也为用户提供了更加强大、高效的数据处理和分析工具。

(文章来源:财联社)