引言
基于常识图谱嵌入的方法在实体对齐畛域取得了渺小成功。本文以生成模型的视角从新解构了目前实体对齐方法的范式,展现了其与生成模型间的相似之处,并从切实上提醒了现有的基于生成反抗网络的方法的局限性。经过引入新的互变分自编码器(Mutual-VAE)作为生成模型,本文构建了一个生成式实体对齐框架(GEEA)。GEEA成功了常识图谱之间的实体转换,并且能够从随机噪声中生成新的实体。经过切实剖析、实体对齐试验,以及实体分解试验等,系统地展现了生成模型在实体对齐及实体分解义务上的弱小才干。
背景
实体对齐的结果往往被用于丰盛不同的常识图谱,但不同的常识图谱中通常存在一些指标常识图谱中没有的实体,这些实体被称为“悬挂实体(dangling entity)”。假设可以将这些实体从源常识图谱转换到指标常识图谱,将在许多义务中节俭少量期间和精神。
从随机变量生成新实体可以运行到多个新兴畛域,如元宇宙、游戏、剧本设计等。在这些畛域中虚构角色仍依赖于手工编写或随机算法,而丰盛、相互咨询的角色对构建沉迷式虚构环球至关关键。这些内容可以应用常识图谱来存储,并经过实体分解生成新的具备丰盛相关的角色消息。
方法
如下图所示,本文设计的生成式实体对齐框架可分为5个模块:
试验
如下图所示,在多个实体对齐数据集上,引入了生成指标的GEEA清楚优于其余方法。
同时,在实体分解结果上,本文所提出的GEEA也要优于一些生成模型或是生成模型与实体对齐模型的联合:
下表展现了一些实体分解的结果,其中输入的源常识图谱实体在指标常识图谱中并不存在。可以看出,GEEA所生成的属性和街坊甚至蕴含了一些原本常识图谱中并不存在但正确的内容。关于图片消息,因为目前方法均驳回预训练的图片向量而非引入视觉模型的缘故,在GEEA中间接取距离最近的指标常识图谱图片作为输入。
总结
本文对如何应用生成模型启动实体对齐与实体分解启动了切实剖析,并提出GEEA来处置现有基于生成模型方法的局限性。试验证实,GEEA在实体对齐和实体分解义务均较现有方法有着清楚长处。未来上班将专一于设计新的多模态编解码器以进一步增强模型的生成才干。
作者: