AI导读:

合肥近日发布《合肥数据标注产业发展规划(2025—2027年)》,旨在打造国际领先的数据标注创新基地,预计到2027年底,数据标注规模将达到3000TB,产业规模突破30亿元,为人工智能产业发展提供有力支撑。

数据标注是对数据进行添加标记、说明、解释、分类和编码的过程,这一环节对提升人工智能算法与模型的核心能力至关重要。近日,我国首个关于数据标注产业的专项规划——《合肥数据标注产业发展规划(2025—2027年)》(以下简称《规划》)正式发布。

《规划》以安徽合肥的产业基础为依托,旨在打造国际领先的数据标注创新基地,为城市的数字化转型提供坚实支撑。合肥市数据资源管理局党组成员、总工程师彭辉在接受采访时表示,预计到2027年底,合肥的数据标注规模将达到3000TB,产业规模将突破30亿元,带动相关产业规模迈上千亿元的台阶。

合肥的产业优势与多元化的市场需求相融合,为数据标注产业的发展注入了强劲动力。位于合肥高新区的飞友科技有限公司,通过采集标注航空器保障视频画面,实现了运行节点的自动提取和安全事件的实时监测,显著提升了工作效率。

合肥在大数据企业认定方面走在全国前列,早在2017年就启动了相关工作。目前,合肥市的大数据企业存量已达2246家,涌现出一批行业佼佼者。这些企业依托人工智能、智能网联汽车等战略性新兴产业,为数据标注产业提供了丰富的应用场景。

此外,合肥地处长三角区域,该区域的自动驾驶、金融科技产业对高质量标注数据有着旺盛的需求。截至目前,合肥的数据标注总规模已达933.3TB,相关企业总数突破35家,数据标注总产值累计达8.63亿元,形成了覆盖数据采集、清洗、标注、应用的全链条产业生态。

数据标注员为人工智能模型提供准确的指导和示范,助力模型识别不同的模式和特征。安徽飞数信息科技有限公司的谭昶形象地比喻道:“如果把人工智能模型比作学生,那么数据标注员就是老师。”他以讯飞星火大模型为例,说明了数据标注在提升模型回答能力方面的重要作用。

合肥的数据标注产业已为国家人工智能产业的发展提供了有力支撑。去年,合肥被列入国家数据局发布的首批承担数据标注基地建设任务的城市名单。目前,合肥正在积极推进“人机协同多模态众智标注平台”的建设,并已为多个大模型提供数据支撑。

未来,合肥将充分发挥区域优势,以合肥为总部基地,覆盖全省、服务长三角,推动数据标注产业与国家人工智能重大生产力协同发展。

(文章来源:科技日报)