在安阳师范学院甲骨文信息处理教育部重点实验室,博士张展正在给学生们展示甲骨缀合。河南日报社全媒体记者 赵阿娜 摄
本报讯(记者 杨之甜)7月12日,记者获悉,前不久在上海举办的世界人工智能大会上,“数字甲骨共创中心”宣布将全球最大的甲骨文多模态数据集正式开源。
该数据集包含10000片甲骨拓片、摹本,以及甲骨单字对应的位置、字头、隶定字以及辞例分组、释读顺序等数据。研究人员可根据该数据集开发甲骨文检测、识别、摹本生成、字形匹配以及释读等方向的智能算法,助推甲骨文研究加速数字化和智能化。
据介绍,数字甲骨共创中心成立于5月28日,由安阳师范学院甲骨文信息处理教育部重点实验室、腾讯SSV数字文化实验室、中国社会科学院考古研究所安阳工作站、郑州大学汉字文明研究中心等单位共同发起建立,吸纳了国内外众多高校和研究机构的专业科研力量支持。
会上,数字甲骨共创中心发布甲骨文AI破译需求,期待与有技术储备、有意愿共创、致力于AI助力甲骨文破译的科研机构共同形成解决数字文化演示方案,助力甲骨文破译。经过最终遴选评审的合作伙伴将获得20万元资助,一起共创甲骨文AI考释破译的新算法、新工具、新方法。
甲骨文是迄今为止中国发现的年代最早的成熟文字系统,但其研究存在诸多难点。近年来,随着AI技术的快速发展,探索AI与甲骨文研究相结合,成为研究人员的解题思路。“高质量的AI算法非常依赖高质量的甲骨文数据集。”安阳师范学院甲骨文信息处理教育部重点实验室负责人刘永革说。
此次开源的甲骨文多模态数据集集合了甲骨文数字化研究的最新成果,吸收了当前业界最先进的甲骨文研究资料,AI相关技术的应用也为数据集的信息丰富提供了支撑。
“甲骨文研究不仅有助于揭示中国上古信史,还能为现代汉字由来和汉语研究提供标志性依据。AI技术应用有望加快甲骨文探析进程,解决长期困扰学界的疑难问题。”中国社会科学院学部委员宋镇豪表示,希望更多的科研机构和专家学者加入这一伟大事业,共同拓展甲骨文研究工作新天地。