AI导读:

教育部联合国家语委、中央网信办印发《关于加强数字中文建设推进语言文字信息化发展的意见》,旨在推进语言文字和信息技术深度融合,全方位释放数据要素价值,明确了两步走发展目标及三项重大任务。

3月31日,教育部举行发布会,介绍深入贯彻落实《教育强国建设规划纲要(2024—2035年)》,推进语言文字信息化发展情况。教育部语言文字信息管理司司长刘培俊表示,教育部、国家语委、中央网信办联合印发了《关于加强数字中文建设推进语言文字信息化发展的意见》,旨在推进语言文字和信息技术深度融合,全方位释放语言文字在经济社会发展中的数据要素价值。

该《意见》明确了加强数字中文建设的理念、政策、行动和项目,将其作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的重点。刘培俊强调,要规范、有效、批量地将中文资源信息转化为智能数据,促进中文数据的规模生产、优质集成、规范治理和复用增效。

《意见》提出了“两步走”发展目标:到2027年,形成语言文字信息化推进机制,基础支撑能力显著增强;到2035年,中文在全球数字空间、网络空间及生成式人工智能等关键场景中的使用占比和价值引领作用显著提高。为此,《意见》部署了三项重大任务,包括技术创新、体系保障和关键赋能。

在技术创新方面,将重点服务大语言模型等人工智能技术创新应用,夯实国家关键语料基础设施。在体系保障方面,将系统建设五大保障体系,提升语言文字信息化的基础能力。在关键赋能方面,将实施五大赋能行动,推进语言技术与关键领域需求深度融合应用。

此外,《意见》还着眼于创新长效化机制协同行动,构建数字中文建设赋能全局新格局。刘培俊表示,将加快建设国家语言文字大数据中心、国家关键语料库和国家语言资源信息库,分类建设各类语言资源,支持语言文字信息技术新产品、新职业和新业态发展。

教育部语言文字应用管理司副司长王晖在发布会上介绍,教育部已启动布局新型国家语料库建设的工作,这将突破传统语料库单一文本模式和领域应用壁垒,为通用领域和细分领域多场景应用及创新发展提供规范、可信、高质量的语言文化语料资源。

在关键学科、重点行业、战略区域、民生期待和社会急需领域,将分批建设规范、安全、优质的国家关键语料库。我国还将统筹推进语言文字基础性标准和信息化标准一体建设,重点推进语料库、数据标注、数据评价等规范标准的制修订。

为了助力科技创新行动,我国将支持面向重点行业、战略区域和关键学科等的垂直领域大语言模型建设与应用,加快布局支持一批新型语言文字交叉领域科研机构,支持前沿领域的学术研讨和竞赛活动。

(文章来源:中国经营报)