AI导读:

DeepSeek在知乎发布《DeepSeek-V3/R1推理系统概览》文章,介绍其采用大规模跨节点专家并行技术实现高效推理。文章还披露了DeepSeek的成本、利润等关键信息,并推出夜间错峰优惠活动。同时,DeepSeek在“开源周”期间陆续开源了多项最新技术进展。

3月1日,Deepseek在知乎官方账号发布题为《DeepSeek-V3/R1推理系统概览》的文章,详细介绍了其最新技术进展。该文章指出,DeepSeek-V3/R1推理系统采用大规模跨节点专家并行(EP)技术,实现了更大的吞吐和更低的延迟。为提升系统效率和GPU利用率,DeepSeek为每个GPU分配了均衡的计算和通信负载。

同时,文章还揭示了DeepSeek的成本和利润等关键信息。DeepSeek-V3和R1服务均使用H800 GPU,并根据服务负荷的高低,动态调整推理节点的数量,以优化资源利用。在2月27日至28日的24小时内,DeepSeek-V3和R1推理服务峰值占用278个节点,平均占用226.75个节点,每个节点配备8个H800 GPU。假定GPU租赁成本为2美元/小时,DeepSeek每天的总成本为87072美元。

若按DeepSeek R1的定价计算,其一天的总收入理论上可达562027美元,成本利润率高达545%。然而,由于DeepSeek-V3定价较低,且部分服务免费,再加上夜间折扣,实际收入不及理论数值。为吸引用户,DeepSeek在每日00:30至08:30的夜间空闲时段推出错峰优惠活动,DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。

此外,DeepSeek在“开源周”期间陆续开源了FlashMLA、DeepEP、DeepGEMM和3FS等最新技术进展,以及DualPipe、EPLB等代码库,这些开源成果在业内引起了广泛关注。

(文章来源:中国证券报)