3000多年前的甲骨文,AI能读懂它吗?厦大团队尝试破译古老文字

AI百科5个月前更新 快创云
59 0

  甲骨文与AI:一场古老文字与现代科技的跨界探索

  在厦门大学信息学院自然语言处理实验室,史晓东教授团队正利用AI技术,探索甲骨文这一古老文字的奥秘。他们计划通过多模态大模型,结合图像和文本数据,找出甲骨文与现代汉字之间的对应关系,为考释甲骨文提供新的可能。

  这项计划名为“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”,并成功入选“探元计划2024”的“创新探索型项目”TOP10榜单。该计划由国家文物局科技教育司指导,联合多个机构共同发起,旨在通过科技手段,推动甲骨文的保护与研究

  甲骨文,作为汉字的源头和中华优秀传统文化的根脉,主要流行于商周时期,距今已有3000多年历史。然而,尽管无数顶尖语言学家的百年探索,考释出的甲骨文数量仍不足总数的三分之一。为了吸引更多人才参与破译,中国文字博物馆曾发布“甲骨文释读优秀成果奖励计划”,破译一个未解甲骨文字即可获得10万元奖励。但至今,仅有复旦大学蒋玉斌教授成功破解了一个“屯”字。

  史晓东团队在古籍和人工智能跨领域方面已有多年探索。他们曾编写了一本异体字字典,收字接近9万个,是大陆最详尽的异体字字典之一。此外,他们还研制了甲骨文手写输入法,并积累了大规模的甲骨文相关语料。这些工作为他们的AI考释模型提供了宝贵的数据支持。

  在史晓东团队的计划中,他们将设计一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体IDS解码和甲骨文现代字对译关系等,以有效训练多模态大模型。未来设想是上传甲骨文图像,让AI告诉你这个图像可能对应的现代汉字候选以及每个候选字的概率。这将为甲骨文的考释提供极大的便利和可能性。

  然而史晓东也强调,甲骨文破译是一项非常困难的任务不可能一蹴而就。尽管如此AI的发展无疑为这项研究带来了新的可能。随着技术的不断进步和数据的不断积累相信在不久的将来我们或许能看到更多关于甲骨文的奥秘被一一揭开。

© 版权声明

相关文章