AI技术助力古籍数字化,字节跳动面向高校和社会征集“校书官”

AI技术助力古籍数字化,字节跳动面向高校和社会征集“校书官”
2025年03月27日 13:56 leiphone_com

快速发展的AI技术,正在提升古籍的整理效率与推广成果。3月26日,“我用AI校古籍——我是‘校书官’古籍大众智能整理计划(2025年)”启动仪式暨“古籍数字化前沿论坛”在武汉大学召开。活动由全国高等院校古籍整理研究工作委员会、北京大学数字人文研究中心和字节跳动公益联合主办,将征集全国高校大学生和社会公众,利用“识典古籍”整理平台,共同参与古籍数字化整理工作。

 “我用AI校古籍”启动仪式合影

启动仪式上,字节跳动公益相关负责人介绍了活动的整体规划。本次活动面向对古籍整理感兴趣的高校大学生和社会上的古籍整理爱好者开放,覆盖春季(3月26日-5月31日)、夏季(7月1日-8月20日)、秋季(9月22日-11月30日)三个阶段,分为初阶和进阶两类任务。初阶组参与“识典古籍”自动古籍文字识别(OCR)结果的文字校对,进阶组负责文字精校和标点校对等高阶任务。目前已有22所院校承办,参与者将获得实践证书、徽章、校书俑周边等奖励。

活动将依托“识典古籍”平台进行。该平台结合了字节跳动的AI技术优势、产品研发能力,以及北京大学数字人文研究中心的学术能力,具备分词检索、AI助手等阅读功能,以及自动古籍文字识别(OCR)、自动标点等古籍整理功能,可有效提升古籍的阅读、理解、研究和利用效率。“识典古籍”平台对公众免费开放,已上线超16000部古籍资源,累计有上亿人次通过该平台阅读和利用古籍。

本次活动中,参与者将充分利用“识典古籍”的古籍整理功能,对人工智能根据古籍图片自动生成的文字、标点等进行校对。据介绍,“识典古籍”可对自动识别过程中不确定的文本进行颜色标记,快速定位可能存在问题的文字和图片位置,自动命名人名、地名、书名、时间、职官等实体,并支持撰写数字校勘记。根据实际使用反馈,“识典古籍”AI技术可以数倍提升古籍的整理效率。

“识典古籍”整理平台截图

AI技术的加持,不仅提升了古籍的数字化效率,同时也降低了参与古籍整理的门槛,普通大学生乃至社会爱好者均可参与其中。本次活动将对参与者进行专业化、体系化的实操培训,并精选与现代生活、现代学科体系紧密相连的古籍进行整理。随着古籍整理任务的进行,参与者还有机会接触并深入了解诸如哈佛燕京藏书、敦煌文献、永乐大典等极具影响力和文化价值的古籍,在校对过程中了解古籍中蕴含的文化与智慧。

据了解,“我是‘校书官’古籍大众智能整理计划”已举办至第二届。2024年举办的首届活动吸引了1210所高校学生报名,整理古籍1643部。参与者中,大学本科占绝大多数,包含汉语言文学、历史学等古籍整理相关专业学生。在AI技术的加持下,许多医学、金融学专业学生乃至社会人士也加入其中。活动满足了大学生和社会爱好者对于古籍阅读的需求,降低了古籍整理的门槛,也促进了古籍数字化。

作为此次活动的主办方之一,字节跳动公益从2021年6月起就开始通过公益捐赠助力古籍修复,并持续投入技术、平台资源来开展古籍数字化与活化。2022年10月,由字节跳动公益联合北京大学数字人文研究中心共建的“识典古籍”平台上线,为整理和阅读古籍提供了便捷渠道。此外,字节跳动公益还通过“寻找古籍守护人”“识典杯·古籍内容创意季”等活动,推出《穿越时空的古籍》纪录片、《重回永乐大典》短剧等方式推动古籍活化,让古籍更好地走向大众。

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部