
近日,厦门大学与腾讯公司、安阳师范学院联合研发的全球首个甲骨文智能体“殷契行止”正式上线。这个智能体能够通过上传一张甲骨图片,完成文字识别、释义查询和文献溯源。金泰松表示,这是三方三年潜心研究的结果,旨在解决甲骨文研究中的“识别难、比对难、共享难”问题。

“殷契行止”使AI首次具备了“理解古文字”的能力,让每一片甲骨“读得懂、找得到、用得上”。目前,该智能体已面向专家和公众免费开放,任何人都可以体验。金泰松强调,这项技术不是为了替代甲骨文研究专家,而是帮助他们从重复劳动中解脱出来,将精力集中在真正的破译与思考上。

用户只需上传一张甲骨图片,“殷契行止”就能自动识别单字,并查找相关资料。针对某个单字,AI会快速汇聚相关的学术研究成果、各家释读观点及演变历史,节省大量翻阅资料的时间。此外,智能体还具有拓片重见检索功能,可以快速比对海量数据库,找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,帮助研究者发现重复收录的文献或追踪甲骨流传轨迹。

甲骨拓本是研究甲骨文的基础,但数量庞大且需要系统整理。传统上,这项工作耗费了研究者大量时间。而“殷契行止”团队开发的拓片校重和重见检索系统有效解决了这一难题,原本需要数年的比对工作现在仅需10分钟即可完成。此外,AI还可以将甲骨拓本转化为甲骨文摹本,方便研究者看清笔画细节,无需手动临摹。

对于公众而言,可以通过微信小程序“了不起的甲骨文”与智能体对话。例如,你可以问它:“家”字的甲骨文长什么样?它不仅会展示字形,还会解释这个字在殷商时代的含义。此外,小程序还提供了一系列互动游戏和甲骨文体操,帮助人们更好地理解和传播甲骨文。

金泰松介绍,随着通用大模型的涌现,团队意识到AI能为甲骨文研究带来实质性变革。因此,他们开始研发专门针对甲骨文识别的智能体。经过三年努力,团队研发出多项关键技术,包括甲骨字形检测与分类算法、AI摹本生成与字形匹配技术等。这些技术整合在“殷契行止”中,实现了高效的研究辅助功能。
“殷契行止”背后还有“数字甲骨共创计划”,目前已完成1525片甲骨的数字化采集工作,其中950片流失海外的甲骨以数字形式回归。通过该计划,研究团队构建了全球规模最大的甲骨文多模态数据集,包含143万个甲骨文字形数据、1.5万片甲骨多模态数据及3000篇研究文献。这些数据已在2024年世界人工智能大会上发布,供研究人员和公众免费使用。
)
)
)
)
)
)
)
)
)
)
)
)
)
)
)
)