5月6日,我院2018级本科生张浚哲、陈振华为共同第一作者的论文被人工智能计算语言学领域权威国际学术会议The 59th Annual Meeting of the Association for Computational Linguistics(ACL 2021)录用,学院何琨教授为论文通讯作者,这是继2019年何琨团队的论文首次被ACL录用后,再次被ACL录用。
论文“Crafting Adversarial Examples for Neural Machine Translation”的研究工作揭示了基于人工智能的神经机器翻译(Neural Machine Translation,NMT)技术中隐含的安全性问题,展示了对源语言施加微小扰动即可让NMT模型翻译出糟糕甚至语义相反的结果。因此,如何发现此类扰动成为了NMT技术安全可靠应用中亟待解决的重要基础问题。针对这一关键问题,论文作者作出了NMT对抗样本(Adversarial Example)的公理定义,并进一步原创提出了一种高效算法以生成自然流利的NMT对抗样本。其区别于现有NMT对抗样本生成算法的显著优势在于:所构造的词显著性加速局部搜索算法在选取源语句扰动位置时充分利用了预训练语言模型对源语言的理解能力,有效地加速了扰动搜索过程与提高了攻击效果;同时基于对偶NMT模型,利用NMT对抗样本的相对重构损失质量实现其合理评价。该研究在目前先进NMT模型上的实验结果表明,同等条件下,所提算法可显著提高对NMT模型的攻击效果与效率,并展出对Bing、Baidu等主流在线翻译器的良好攻击迁移性,在基于人工智能的神经机器翻译安全性研究领域具有重要意义与应用前景。
此文两位共同第一作者本科生均为AI派团队的成员,何琨为启明学院示范性创新团队ACM-ICPC集训队和AI派团队的负责老师。在过去几年里,何琨指导各院系学子在人工智能领域开展相关研究工作,已在人工智能领域国际顶级会议、期刊上发表论文20多篇。
稿件来源:新闻中心
作者:何琨