AI导读:

国家发改委等部门联合发布《关于促进数据标注产业高质量发展的实施意见》,提出到2027年产业规模大幅增长,年均复合增长率超20%。政策将推动行业规范化、标准化,提升数据供给质量,助力人工智能产业发展。

财中社1月21日电山西证券近期发布了一份关于计算机行业政策的点评报告,该报告聚焦于国家数据标注产业的发展趋势。1月13日,国家发改委、国家数据局等四部门携手出台了《关于促进数据标注产业高质量发展的实施意见》,明确提出至2027年,数据标注产业的专业化、智能化以及科技创新能力要实现显著提升,产业规模也将大幅度增长,预计年均复合增长率将超过20%。

这份《实施意见》作为首个国家层面的系统性规划文件,预示着数据标注产业即将迈入一个快速增长的新阶段。报告从标注需求、技术创新、生态建设等多个维度为数据标注产业提供了全面的指导。在标注需求方面,政策将重点挖掘智能制造、信息服务等领域的公共数据标注需求,并加强对交通、医疗、金融等关键行业的企业数据标注力度。技术创新方面,政策要求加快突破跨领域跨模态语义对齐、4D标注等关键技术,并加强研发自主可控的智能化标注工具。生态建设方面,政策将推动数据采集、标注、AI应用产业链上下游的协同发展。

目前,国内数据标注产业格局呈现出碎片化的特征,市场参与者包括百度(众测)等自建数据标注平台的科技大厂,以及海天瑞声、云测数据等专业数据服务商,同时还有大量中小数据标注众包厂商。这些参与者的数据标注质量和从业人员素质参差不齐。而《实施意见》的出台,将通过制定统一的行业标准,有效淘汰不规范企业,推动行业走向规范化、标准化,并有望通过支持并购重组培育一批具有行业影响力的龙头企业。

数据标注技术的广泛应用,将有效提升数据供给质量,进而助推国内人工智能产业的快速发展。当前,高质量中文语料短缺的问题日益突出。据阿里研究院24年5月发布的《大模型训练数据白皮书》显示,在全球网站中,英文占比高达59.8%,而中文占比仅为1.3%。中文语料的电子化和网络化程度明显不足,同时受版权、隐私等限制,许多优质的中文语料库也无法公开获取。数据标注作为提升数据质量的关键技术,随着国家政策层面的大力推行,数据供给质量将得到显著提升,进而增强我国人工智能产业的国际竞争力。

投资建议方面,随着首个国家层面的系统性规划文件的出台,数据标注产业有望迎来快速发展,并将显著提升数据供给质量,从而解决制约国内人工智能产业发展的高质量数据短缺问题。投资者应关注在数据标注领域具有技术优势和场景落地经验的厂商,如海天瑞声、科大讯飞、影谱科技、云从科技等。同时,也应关注为运行数据标注任务提供计算资源的服务器厂商,如浪潮信息、中科曙光等。

(图片及文章来源:财中社)