近日,由华东师范大学与丽江师范学院组成的社会实践团队,联合丽江市东巴文化研究院,依托语言文字基础理论与多种人工智能技术,成功研发并发布东巴古籍智能翻译系统。
东巴文是纳西族的独特文字,拥有1400多个单字,是目前世界上唯一存活着的象形文字,被誉为文字的“活化石”。丽江市东巴文化研究院编著的《纳西东巴古籍译注全集》于2003年被联合国教科文组织列入《世界记忆名录》。然而,由于其字符的多样性和非标准化特征,传承复杂且充满挑战。
基于此,2021年底,华东师范大学、丽江师范学院和丽江市东巴文化研究院组建跨领域专家团队,启动东巴古籍智能翻译系统研发项目。系统以实际翻译流程建模,构建“图像-语音-直译-意译”级联式智能翻译流程。在人工采集与专家协作基础上,建立包含257760个手写东巴文的数据库,集成563580组“形、音、义”多模态数据集。通过深度学习技术,实现对东巴古籍中象形文字的智能化识别与分割处理,并以华东师范大学智能教育研究院自主研发的教育大模型EduChat为基座,经过大量语料数据训练,实现东巴文智能翻译的领域适应。
经过近3年的努力,该系统初步实现东巴古籍的智能识别与翻译功能,不仅可以实时反馈提供修改建议,优化翻译流程,还支持用户对翻译结果进行个性化调整,以满足专业研究的需求。此外,支持嵌入编辑和一键导出功能,便于用户将翻译结果快速输出和后续编辑出版。“该系统为识别、翻译与研究东巴文字提供了全新的技术支持,加速这一古老文字的深层含义得以在现代语境下重新解读和传播。”华东师范大学计算机科学与技术学院、上海智能教育研究院院长周爱民说。
“我们使用部分经典古籍对该系统进行全流程翻译试验,发现基本契合东巴古籍的翻译流程,另外数据库功能为学科研究提供了极大便利。”丽江市东巴文化研究院研究员李英、和虹,副研究员李四玉深度参与该系统功能的开发咨询和测试,并作出客观全面的评价。
丽江市东巴文化研究院院长和洁蕾表示,该系统的研发是数智时代背景下人工智能与多学科交叉融合的探索,各界专家碰撞思维,有利于携手推动东巴古籍文献的深度保护、研究和利用。
云南网记者李兴文李铁成和茜
责任编辑:李享
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有