计算机学院团队研发的图学习模型在国际开放图基准数据集挑战赛中打破两项世界纪录

作者:赵娜编辑:赵娜发布:2022-10-24点击量:

2022年10月16日,华中科技大学计算机学院“大数据技术与系统国家地方联合工程研究中心”、“服务计算与系统教育部重点实验室”曁“集群与网格计算湖北省重点实验室”张宇副教授领导的图计算团队在该团队自主研制的“亿图”图计算平台上研发的新型图学习模型GIDN,在2022年国际开放图基准数据集OGB (Open Graph Benchmark)挑战赛的链接属性预测赛道中,在药物联合作用预测和作者合作关系预测两个领域的数据集上预测精度分别达到0.9542和0.7096,分别打破世界记录,排名世界第一。

此次夺冠的图学习模型GIDN由2022级博士生王梓骁带领2022级博士生郭渝洛、2021级硕士生黄志颖、2020级博士生余辉、2022级硕士生吴奕洋完成。国际开放图基准数据集OGB由图学习领域的国际顶级学者建立,是目前公认最权威的国际顶级图学习基准评测榜单,以质量高、规模大、场景复杂、难度高著称,旨在评测国际上最新的图学习模型精度。国际开放图基准数据集挑战赛包括图顶点属性预测、链接属性预测、图属性预测三个赛道。

图能够有效表达事物之间的关联关系。现实生活中的诸多应用场景都需要用到图。图学习作为大数据处理和人工智能的关键技术之一,可用于获取隐藏在复杂图数据中的丰富信息,在医疗、金融、教育、军事、科学发现等多个领域有着广阔的发展前景,例如预测药物与病毒是否相互反应、分子性质预测、蛋白质结构预测、金融反欺诈等,担负起服务“数字中国”战略等重要使命,促进国家经济与社会的数字转型、智能升级和融合创新,成为全球科技竞争新的战略制高点。

国际开放图基准数据集挑战赛的应用都来自现实应用中的挑战性问题。例如,国际开放图基准数据集挑战赛的ogbl-ddi数据集和ogbl-collab数据集分别来自于美国食品药品监督管理局批准的或实验性的药物数据库和微软学术图谱作者信息数据库。此次夺冠的图学习模型GIDN能够高精度预测原本不相关的两个事物之间是否存在某种关联关系,可用于药物联合作用预测和作者合作关系预测等。ogbl-ddi数据集包含4267种药物,有超过100种相互作用的类型。GIDN可以将药物相互作用的信息输入到图学习模型中,高精度预测具有联合作用的药物,能够极大地减少药物研发过程中临床验证时间和研发经费。ogbl-collab数据集包含20多万个作者以及120多万个合作关系。GIDN通过分析ogbl-collab数据集中现有作者及其合作关系,可以对未来作者之间的合作关系进行高精准预测,对于管理人员来说,可以用于帮助管理人员极大地提高管理效率,例如可用于在分派科研项目评审专家和论文评审专家时精准识别潜在利益关系,对于科研人员来说,可以快速、高质量地帮其找到合适的科研合作者。

Copyright © 2022 HUST SCHOOL of COMPUTER of SCIENCE and TECHNOLOGY , Powered By , All Rights Reservered Hust Cs