AI导读:

教育部协同国家语委等部门共同印发《关于加强数字中文建设推进语言文字信息化发展的意见》,旨在实施数字中文服务教育发展行动,推动中文信息处理技术创新发展,到2027年基本建成国家语言文字大数据中心。同时,AI赋能古籍数字化成果亮眼,为非遗传承提供新路径。

3月31日,记者从教育部发布会上获悉,近日教育部协同国家语委等三部门共同印发了《关于加强数字中文建设推进语言文字信息化发展的意见》(以下简称《意见》)。根据《意见》,我国将实施数字中文服务教育发展行动,助力打造中国版人工智能教育大模型;到2027年,要基本建成国家语言文字大数据中心,推动中文信息处理技术的创新发展。

创新中文信息处理技术应用,以数字化构建新型中文服务体系

人工智能技术快速发展,中文信息处理技术迎来新机遇。发布会上,教育部语言文字信息管理司司长刘培俊介绍,《意见》明确提出,将数字中文建设作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的突出重点,全方位释放语言文字在经济社会发展中的数据要素价值。通过数字化手段,实现中文资源的智能转化和复用增效。

中文数字化赋能多项重大任务。刘培俊表示,中文在数字中国建设中扮演着重要角色,加大国家通用语言文字推广力度、深化中华优秀语言文化传承等都需要中文数字化支撑。中文数据价值突出,有利于推动中国特色大语言模型创新发展。

在数据资源建设上,实施国家关键语料库建设计划,建设大规模中文语料库。在关键领域赋能上,推进甲骨文数字化共享,实施中华文化优秀课程多语种数字化传播计划等。

北京大学王选计算机研究所所长汤帜指出,要加强数字中文建设,推动中文信息处理技术发展进入新阶段。新形势下,语言文字要实现从‘静态符号’向‘动态数字资产’的转型,重点支持文本生成与理解、语言翻译等任务。

同时,语言文字要从基础支撑提高到赋能全局发展,实现与信息技术的深度融合。

AI赋能古籍数字化成果亮眼

文脉重赓续,芸帙焕新颜

在数字中国建设落地推进过程中,已涌现出多种中文信息处理技术应用实践和生态场景。昨天闭幕的2025中关村论坛上,南都记者体验了通过裸眼3D建模和AI交互技术,将古籍转化为生动数字资源的创新应用。

据《天工开物》“乃服篇”还原的宋代织布作坊蚕桑工艺裸眼3D效果图,展现了古代纺织智慧。

中科数字商务总监封旭阳介绍,这项技术已覆盖多家文化公共机构的数字基建体系,以AI技术赋能古籍数字化,为非遗传承提供新路径。

当前,AI交互技术正让中文古籍呈现更多学术、文化价值。首都图书馆古籍数字资源发布平台已上线,读者可通过数据库了解古籍,在线实时转换简体字、横版阅读。

其中,“微剧场”版块利用AIGC技术生成短片,为首图读者提供梦幻视觉呈现。创新实践风起云涌,政策指引助力中文信息处理技术发展。

北京师范大学副校长康震提到,北师大将训练出理解力强、准确率高的“AI太炎”古汉语大语言模型,应对人工智能技术对教育变革的挑战。

刘培俊表示,未来要加快领域大语言模型应用试点,研制面向人工智能的语言资源建设标准。

(文章来源:南方都市报)