AI导读:

DeepSeek在春节假期期间意外走红,迅速成为热门AI应用。为应对业务增长,DeepSeek放出高薪职位吸引AI人才。同时,国内外主流云厂商和芯片厂商纷纷宣布接入DeepSeek模型,形成DeepSeek“生态圈”。

DeepSeek在春节假期期间意外走红,迅速成为最热门的AI应用之一。其火爆程度导致应用数次宕机,联网搜索功能一度中断。为了应对业务量的急剧增长,DeepSeek在招聘网站上发布了一系列高薪职位,不惜以百万年薪吸引AI人才加盟。

上线20天日活破2000万,百万年薪广纳贤才

据国内AI产品榜数据显示,DeepSeek应用上线仅20天,日活跃用户便突破了2000万大关。更令人瞩目的是,其上线5天的日活已超越ChatGPT同期表现,成为全球增速最快的AI应用。这一数据无疑证明了DeepSeek对C端用户的强大吸引力。

然而,面对激增的用户量,DeepSeek也显得有些应接不暇。春节期间,不少网友反映应用频繁出现服务崩溃的情况,联网搜索功能一度无法使用。业内人士分析指出,DeepSeek亟需扩大算力基础设施,以满足更多用户的访问需求,并持续提升模型性能。

除了算力需求,DeepSeek的人才队伍建设同样迫在眉睫。据悉,DeepSeek现有员工约150人,与OpenAI的1700名员工相比,规模尚小。在某招聘平台上,DeepSeek已发布了37个招聘岗位,涵盖客户端研发工程师、深度学习研发工程师、全栈开发工程师、自然语言处理算法工程师、深度学习研究员等多个领域。

其中,深度学习研究员岗位的薪资水平高达50—80k*14薪,工作地点位于北京,主要招聘在校或应届硕士生。若按最高月薪8万元计算,应届生入职DeepSeek的年薪可达112万元。此外,顶尖高校的在校生若通过校招获得DeepSeek的Offer,在校实习期间即可享受与正式员工相同的薪资待遇。

该职位要求应聘者精通机器学习或深度学习,具备创新研究能力和出色的编程能力,拥有丰富的研究成果,并在国际顶级会议或期刊上发表过相关论文。工作内容包括设计开拓性的深度神经网络、构建科学严谨的算法评测体系以及推动基础研究。

除了正式员工岗位,DeepSeek还提供了AGI大模型-数据百晓生实习生、深度学习-AGI实习生等实习岗位,实习工资约为每天500元,公司提供中餐,并享受80元的晚餐补贴。这意味着,一名在校本科生在DeepSeek实习,月薪也能达到万元水平。

值得注意的是,DeepSeek不仅在国内受到热捧,在海外多个国家也备受关注。据媒体报道,自今年初发布以来,DeepSeek迅速攀升至140个国家的苹果App Store下载排行榜首位,其中印度成为新用户增长的最大“引擎”,下载量占总量的15.6%。

或许是因为在海外市场的持续火爆,DeepSeek也在加大国际业务的布局。在AGI大模型-数据百晓生实习生岗位要求中,明确提到“小语种专业优先考虑”以及“涉猎广泛、博闻强识,对各行各业的知识都拥有强烈的兴趣”。

DeepSeek创始人梁文锋曾表示,公司团队主要由Top高校的应届毕业生、在读博士生以及毕业不久的年轻人组成。从DeepSeek发布的招聘岗位来看,其招聘偏好依然倾向于在校生或应届生,核心要求具备创新意识和较好的编程能力或学术研究成果。

DeepSeek“生态圈”持续壮大

在应用日活飙升的同时,国内外主流云厂商和芯片厂商也纷纷宣布接入DeepSeek模型。

海外市场方面,微软Azure云服务于1月31日正式上线DeepSeek-R1模型,亚马逊AWS也宣布全面上线该模型,英伟达则宣布NVIDIA NIM已支持使用DeepSeek-R1模型。

国内方面,2月1日,华为云宣布与硅基流动团队联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。得益于自研推理加速引擎的加持,双方支持的DeepSeek模型效果可媲美全球高端GPU部署模型。

随后,腾讯云于2月2日宣布DeepSeek-R1大模型可一键部署至腾讯云HAI平台,开发者仅需3分钟即可接入调用。阿里云、百度智能云也于2月3日宣布正式接入DeepSeek-V3、DeepSeek-R1模型。至此,国内四大云巨头均已正式接入DeepSeek。

业内人士分析称,在大模型领域,OpenAI、Anthropic等市场领先者选择了闭源路线,而DeepSeek则选择了开源路线,任何人都可以部署、修改、优化其模型。这类似于传统软件时代的Windows和Linux之争。DeepSeek不仅代表了一个模型,更代表了一种新的行业范式与游戏规则。随着越来越多云厂商选择接入DeepSeek,将有更多企业采用这种开源方案,从而形成DeepSeek“生态圈”。

中航证券研报指出,DeepSeek在基础模型训练和推理模型训练方面均有创新,有效克服了FP8训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本。同时,DeepSeek的研究还表明,较大的基础模型发现的推理模式对于提高较小模型的推理能力至关重要。在大模型蒸馏技术的加持下,端侧小模型的普惠化指日可待。

此外,研报还提到,美国科技巨头英伟达NIM、微软Azure、亚马逊AWS等智能云平台已上线部署支持用户访问DeepSeek-R1模型。DeepSeek以创新的技术路线吸引了全球科技巨头,表明国产科技在开放创新的开源环境中具备强大的竞争力,有望涌现出更多普适技术,我国本土科技企业的价值理应得到重估。

(文章来源:证券时报)