梁文锋出席总理座谈会,国产大模型DeepSeek受瞩目
AI导读:
国务院总理李强主持召开座谈会,国产大模型企业深度求索(DeepSeek)创始人梁文锋出席,座谈涉及国产大模型的发展和前景。DeepSeek-V3大幅降低训练成本,性能超越ChatGPT-4o,备受科技界关注。
20日下午,国务院总理李强主持召开了一场汇聚了众多专家、企业家以及教科文卫体等领域代表的座谈会,旨在广泛听取各方对《政府工作报告(征求意见稿)》的宝贵意见和建议。
值得关注的是,国产大模型领域的佼佼者——深度求索(DeepSeek)创始人梁文锋也应邀出席了此次座谈会。梁文锋不仅以深度求索创始人身份闻名,同时还是头部量化私募幻方的创始人,其创业足迹横跨金融与人工智能两大前沿领域,展现了卓越的跨界能力。
市场各方尤为好奇的是,梁文锋在新年首场总理座谈会上究竟发表了哪些真知灼见?据多方记者深入了解,此次座谈的核心议题聚焦于国产大模型的发展与前景,无疑为行业未来发展指明了方向。
梁文锋的职业生涯同样令人瞩目。17岁便考入浙江大学,30岁创办幻方量化,并在2021年成功将公司规模推向千亿大关,此时的他年仅36岁。两年后,他再次出发,于2023年7月创立了深度求索(DeepSeek),迅速成为国内少有的拥有万卡集群算力的AI大模型公司。
深度求索(DeepSeek)在国内外的影响力正逐步超越幻方量化。成立仅一年半后,其国产大模型DeepSeek-V3便在2024年底风靡全球,这一成就也成为了梁文锋受邀出席新年首场总理座谈会的重要原因之一。
DeepSeek之所以备受科技界关注,得益于DeepSeek-V3在大幅降低大模型训练和应用成本方面的突出贡献。据悉,DeepSeek-V3的训练成本仅为557.6万美元,而OpenAI训练ChatGPT-4o的成本则高达7800万美元至1亿美元之间,双方的成本差距至少达到了10倍。
在性能方面,DeepSeek-V3在数学、代码能力和中文知识问答方面均超越了ChatGPT-4o,这一高性价比令行业震惊。DeepSeek更是将DeepSeek-V3开源给全世界的技术开发团队,赢得了“AI界的拼多多”的美誉。
在团队配置上,DeepSeek团队虽仅有139名研发人员,却展现出了强大的创新能力。相比之下,ChatGPT背后的OpenAI团队拥有1200名研究人员,团队规模是DeepSeek的近9倍。近期,“雷军千万年薪挖95后天才AI少女”的热门话题更是让DeepSeek团队备受瞩目,这位AI少女正是DeepSeek团队的一员。
就在1月20日,深度求索(DeepSeek)正式发布了DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上的性能与OpenAI o1正式版不相上下。DeepSeek透露,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型的推理能力。更为开放的是,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型开源给社区,允许用户借此训练其他模型。
尽管取得了诸多成就,但据此前资料显示,DeepSeek目前尚无商业化的打算,专注于技术创新与开源共享。
此次国产大模型公司代表梁文锋列席总理座谈会,被业内视为国家对科技创新与AI领域高度重视的信号。会上,李强总理强调,要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。这一精神与DeepSeek等国产大模型公司的创新实践不谋而合。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。