教育部推进数字中文建设,赋能经济社会发展
AI导读:
教育部、国家语委等部门联合发布《关于加强数字中文建设推进语言文字信息化发展的意见》,旨在抢抓大语言模型迭代升级新机遇,全方位释放语言文字在经济社会发展中的数据要素价值,推动中文数字化传播与学习,赋能经济社会发展。
对语言文字,我们“日学而不察、日用而不觉”。语言文字不仅是文化交流的基石,更是国家在教育、科技、经济等多个领域的重要战略资源。近日,教育部、国家语委、中央网信办联合发布了《关于加强数字中文建设推进语言文字信息化发展的意见》(简称《意见》),旨在抢抓大语言模型迭代升级的新机遇。3月31日,教育部专门召开新闻发布会,对《意见》进行了全面解读。
教育部语言文字信息管理司司长刘培俊介绍,《意见》明确提出,数字中文建设将作为服务数字中国建设的关键任务,全方位释放语言文字在经济社会发展中的数据价值。这意味着,我们需要将中文资源有效转化为智能数据,促进中文数据的规模生产、集成、治理和复用,构建新型中文服务体系。
为何如此重视数字中文?刘培俊指出,中文在国家通用语言文字推广、文化传承、国际交流等方面扮演着重要角色,而这些任务都需要中文数字化的赋能。中文的数字化传播能扩大其影响力,数字化学习则能满足广泛的学习需求。同时,大规模的中文数据对推动中国特色大语言模型的创新发展至关重要。
在技术创新应用方面,刘培俊表示,将加快领域大语言模型的应用试点,并研制相关的语言资源建设、管理和应用标准。在数据资源建设上,将实施国家关键语料库建设计划,建设大规模的中文语料库。此外,还将推动中华文化优秀课程的数字化传播。
北京大学王选计算机研究所所长汤帜提到,上世纪80年代的激光照排技术让中文在互联网上获得新生。如今,大语言模型对大规模高质量语料的需求前所未有,中文信息处理技术正迎来全方位突破。
汤帜强调,数字中文建设将重塑中文信息处理技术的发展格局,推动其进入新阶段。语言文字将从静态符号转变为动态数字资产,成为重要的生产要素。为此,需要重点推动语料库、数据标注与评价等标准的研制,构建支持大模型训练的高质量中文数据集。
汤帜还指出,语言文字信息处理技术的创新应用正在经历范式变革,与信息技术的深度融合将形成良性循环,服务于教育、科技创新、文化传承、产业升级和社会进步。
(文章来源:科技日报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

