欢迎光临
我们一直在努力

合合信息用AI 抢救古彝文 发布业内首个编码数据库

第一财经消息,近日,合合信息联合上海大学、华南理工大学,发布了业内首个古彝文基础编码数据库。该数据库通过人工智能技术,对云贵地区流传的古彝文字符进行数字化编码,编制成类似“大字典”的数据库,以帮助相关人士更便捷地查询古彝文的读音和释义。

图源备注:图片由AI生成,图片授权服务商Midjourney

据介绍,古彝文指民间流传使用的原生态彝文,有87046个字符,远多于汉字。其中,《西南彝志》是目前发现的篇幅最长、内容最丰富的古彝文典籍。但由于古彝文异体字繁多,一个字可有几十种不同写法,给古籍数字化带来巨大挑战。

为突破难点,项目组采用智能图像处理、文字识别等人工智能技术,对7万6千余个样本进行训练,建立古彝文统一的数字编码。数据库发布后,相关用户只需输入一串编码,就可查询到字的读音、释义等信息,大大降低了阅读古籍的门槛。

合合信息表示,数据库的发布是基础性工作,有助更多人认识、研究古彝文,也为语言文明的保护提供了新路径。当前,数字化已成为文化传承的重要途径。数据库项目表明,人工智能可以发挥重要作用,助力传统文化走向数字化。

赞(0) 打赏
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《合合信息用AI 抢救古彝文 发布业内首个编码数据库》
文章链接:http://www.suanliquan.com/1063.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

评论前必须登录!

 

龙泽智能云 - 云安全管理服务商

提供一站式云安全解决方案,使云端部署化简为零,轻松快捷运用云服务

产品官网联系我们

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将提供更多内容,一起创建美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册