蚂蚁百灵大模型凭借国产芯片训练实现性能突破
3月24日晚,DeepSeek-V3发布小版本升级,实测表现远超预期。与此同时,蚂蚁百灵凭借国产芯片训练,实现同等性能突破,并将训练成本降低20%。百灵大模型分为百灵Lite和百灵Plus,实验证明,使用国产低性能GPU芯片也能完成大语言模型训练。跨异构计算与分布式集群是百灵大模型训练的创新之举。...
人形机器人技术突破,量产元年即将到来
人形机器人技术不断突破,上海人工智能实验室发布新算法,百万条真机数据开源,仿真平台有望大幅降低训练成本。业内预计2025年是人形机器人量产元年,价格逐渐降低,未来有望进一步下降。...
Janus-Pro展现卓越性能,或引领下一代多模态模型发展
长江证券发布AI产业速递,称Janus-Pro采用创新性自回归框架,展现卓越的多模态理解和文本到图像指令遵循能力,超越Stable Diffusion和DALL-E 3,同时训练成本大幅降低,有望推动AI行业整体降本。...
中国AI初创公司DeepSeek开源R1模型登顶Arena排行榜
中国AI初创公司深度求索(DeepSeek)推出的开源R1推理模型在Arena排行榜上异军突起,与OpenAI o1并列第一,且训练费用仅为OpenAI最新大模型的三十分之一,有望颠覆AI训练和推理领域的游戏规则。...
中国AI新星DeepSeek-R1模型崛起,引领开源大模型新潮流
中国AI初创公司深度求索(DeepSeek)推出的开源R1推理模型在Arena排名中升至全类别大模型第三,与OpenAI o1并列风格控制类模型第一,且训练费用仅为OpenAI最新大模型的三十分之一,有望颠覆AI训练和推理领域的游戏规则。...
大模型行业降价潮下的效率与差异化发展
岁末年初,国内外主流大模型市场迎来新一轮降价潮,行业开始反思优化路径。DeepSeek等公司推出低成本高性能大模型,引发行业热议。效率成为关键词,同时创业公司面临降价冲击,需差异化发展以赢得市场份额。...
大模型再降价,行业效率与成本并重
本文介绍了国内外主流大模型再次降价的现象,DeepSeek-V3和伯克利大学NovaSky团队的开源模型引发了行业对性价比的关注。训练成本的降低将加快大模型的应用落地,但也对大模型创业公司提出了挑战。文章还讨论了行业效率与成本并重的发展趋势。...
DeepSeek-V3模型引发热议:超越开源模型,训练成本低廉
DeepSeek-V3模型在多项评测中超越其他开源模型,且训练成本低廉,引发海外AI圈热议。然而,在使用过程中出现bug,声称自己是ChatGPT,引发质疑。...
中国AI企业Deepseek发布DeepSeek-v3模型,全球AI界为之震惊
中国杭州的AI企业Deepseek发布DeepSeek-v3模型,性能卓越且训练成本低廉,引发全球AI界关注。该模型的多项评测成绩超越其他开源模型,成为AI领域的新焦点。...
幻方量化DeepSeek-V3模型上线:性能强劲,API服务定价上调
幻方量化全新系列模型DeepSeek-V3上线并同步开源,API服务已同步更新,生成速度提升3倍,但暂不支持多模态输入输出。虽然API服务定价上调2倍有余,但DeepSeek-V3依旧极具性价比。...