一种不对称的流行性相似性优化方法，将定向网络嵌入到双曲线空间中

摘要

网络嵌入是当前网络科学的前沿课题。复杂网络的无标度特性是双曲空间的指数扩张的结果。最近发展了一些嵌入模型来探索复杂网络的双曲几何性质，特别是对称网络。本文提出了一种将有向网络嵌入到双曲空间中的模型。该方法根据有向网络的二部结构和多重节点信息，再现了双曲空间中非对称网络的生成规律，利用模型中的非对称流行相似度优化方法估计有向网络中各节点的双曲坐标。在多个真实网络中的实验表明，该模型具有较好的稳定性，扩大了现有方法的应用范围。

1.介绍

复杂网络可以在很大程度上简化实际系统，并保留交互结构的基本信息。因此，它是研究复杂系统的理想工具。然而，复杂网络是具有非几何属性的模型，其中包括大量几何学中开发的工具和方法，这些工具和方法不能应用于复杂网络。在此背景下，出现了一波探索复杂网络几何性质的研究，旨在将复杂网络映射为潜变量(即隐变量和高斯潜变量)或低维度量空间(即欧几里德空间或双曲空间)[1-3.］.

网络几何研究的进展表明，从真实复杂系统推导出的无标度网络中观察到的结构特性可以作为几何特性出现[4.那5.］.双曲几何是非欧几里得几何的一个分支，在实际工程技术中有着广泛的应用。更重要的是，生长的随机几何模型和双曲嵌入模型[3.那6.]可以很容易地解释无标度网络的异质性和高聚类性，甚至给出每个坐标的明确含义。这些模型不仅可以模拟网络的增长，而且可以解释经典BA网络模型在复杂网络中的动态过程。因此，相关的研究越来越受欢迎，具有几何性质的网络模型已经成功地应用于网络科学和其他学科的许多领域，包括脑科学[7.那8.]、国际贸易[9.]，路线转移[10-12]和蛋白质形成机制[13那14］.

该研究框架提出后，引起了学者们的广泛关注，并为此开发了模型和双曲空间嵌入方法[3.那6.那15-17］.这些型号在研究网络的潜在结构方面具有很大的性能。特别地，在普及相似性优化方法中，复杂网络的双曲性与隐藏的空间属性组合，并且节点的空间位置通过统计推断估计。但是，这些模型无法完全描述真实系统。一个缺点是那些模型忽略了链接的方向性。在大多数真实网络中，节点之间的关系可能是不相等的，这是链路的所谓的不对称性。虽然不对称性能可能会带来许多对网络嵌入的挑战，但忽略了定向网络的不对称将失去许多重要信息，并且无法充分表示实际系统的结构和功能。

另一个研究分支是通过机器学习方法和矩阵分析嵌入的网络表示学习或图形[1那18-22]，包括定向网络[23那24］.这些模型为我们提供了许多有用的建模灵感，如图案、随机游走、图卷积的中心性信息[25，高度接近[26，以及空间和时间上的邻近性[27］.不幸的是，这些模型在获取节点的向量表示时不能识别空间坐标的真正含义，这是一个明显的限制。更重要的是，由于已证明了无标度分布是双曲空间嵌入的基本条件[3.]，迫切需要建立双曲空间中有向网络嵌入模型。

为了进一步解决这个问题，我们探讨了有向链路和网络拓扑之间的内在关系。有趣的是，在一种非平凡的方式下，有向网络有一个隐藏的二部结构[28］.我们检查了各种定向网络都有这样的结构，这种现象是定向网络的普遍规律。我们的作品的贡献是，我们提供基于节点信息复用和识别潜在拓扑结构（二分层结构）的定向网络嵌入方案，以及指向网络数据的维度降低的新思路。此外，使用可视化技术，我们在双曲线空间中提供了一个新的定向网络快照，这使我们能够显示节点的状态和MacRoLevel结构和功能。

摘要基于有向网络的拓扑信息及其特点，提出了一种利用有向网络的二部结构将有向网络嵌入到双曲空间的非对称流行度-相似度优化方法。从这个角度出发，我们首先引入了有向网络的二部结构的概念。在此基础上，本节讨论了节点从有向网络映射到双曲空间的映射模型2．在本节中，四个真实世界的有向网络被用来测试我们的映射方法的适用性3.．部分4.用结束语结束文章。

2.材料和方法

2.1。数据

在仿真中，我们使用了四个经验网络数据集，并给出了完整的数据源描述，包括领域Caenorhabditis elegans.（C. Elegans.)神经系统，国际贸易，电子邮件关系，国际迁移。(1)电子邮件数据集是中型制造企业员工之间的内部电子邮件通信网络[29那30.］.该网络是针对的，节点代表两个节点之间的员工和边缘是单独的电子邮件。（2）国际迁移数据集是一个有153个节点的加权定向网络，可以从世界银行（http://www.worldbank.org/)．邻接矩阵描述了来自该国的移民到迁移流程．（3)C. Elegans.神经数据集是一种定向网络，描述了通过化学突触和间隙结的神经互连，可以从Wormatlas数据库获得[31.］.（4）国际贸易数据集描述了从联合国商品贸易统计数据库获得的国家（或地区）之间的贸易关系（https://comtrade.un.org/)．如果国家进口国家重量那邻接矩阵是．

2.2。方法

2.2.1。复杂网络与双曲空间

双曲空间是一个具有负曲率的各向同性空间，它不能嵌入任何欧几里得空间。复杂网络的拓扑几何和双曲几何是密切相关的，这已经在数学中得到了很好的探索[32.]因为网络中的最短路径，那些定义化学距离的路径，因为它们在潜在空间中密切关注其双曲线测地测器。Poincaré圆顶的半径可以用来表示双曲空间，参考文献[3.］.双曲几何的主要性质是空间的指数扩张:面积一种（R.）二维双曲盘的成长R.作为．从双曲几何的角度来看，无标度网络的出现产生了两个指数:节点密度随距离呈指数增长从圆盘中心开始，平均度数呈指数递减．在早期的研究中，双曲几何模型和隐几何模型可以等效地将无标度网络拓扑嵌入到度量空间中。

隐藏的几何模型分配给他们预期的度数的节点和那在哪里是由幂律分布推导出来的那为节点的最小期望度，是网络的平均程度，和是权力指数。是均匀随机地从．然后，每个节点对，有概率那是连通的，有效距离在哪里那其中角距离那和参数和受到限制．

为建立复杂网络的双曲几何模型，设−1为双曲空间的曲率。Poincaré模型将它们的径向分配给节点坐标与密度和角坐标与密度．测地线距离X节点之间和满足．节点通过概率连接．构建复杂网络的过程反映了这一模型中两种力量的竞争：人气（R.和相似性（ )．

另外，网络的隐度量空间模型和双曲几何模型等效地通过转型：．

2.2.2。有方向链接与二部结构之间的相互作用

有向链路作为网络模式的重要连接特征，越来越多地用于反映实际系统的动态演化和节点状态。网络的非对称性增加了网络嵌入的难度。在复杂系统的拓扑信息中可以识别出链路的不对称，即二部结构[33.］.与指向网络不同，每个节点都分为两个非实际组，根据其唯一的特征在二分层结构中。因此，修改定向网络的建模方法对于克服困难至关重要。

在有向网络中，节点可以分为两部分，链路的每一边来自于不同的集合。这种建模方法称为二部结构的有向网络，如图所示1（a）和1(b).具体地说，每个节点在有向网络中包含在集和在B集合中是二部结构。一个有向链接从到（）并可由( )．这样做，节点的数量增加了一倍，但不影响后续的工作，有向网络将转化为二部网络。此外，该方法通过将节点划分为两类来重建几何有向网络，但这两类网络并非完全独立，参数将考虑其内在关系在建模。

图1

有向网络嵌入算法流程图。给出了算法步骤和中间输入输出。(a, b)将有向网络(a)转换为具有二部结构(b)的有向网络的一个例子。具体来说，(a)中的一个非对称链接可以表示为(b)中集合a和集合b中的任意一对节点之间的链接。采用非对称流行相似度隐度量模型构造嵌入过程，其中估计和优化方法(MLE和LMH)获得节点的度量空间坐标。(d)映射实现了双曲线平面中定向网络的表示和可视化。

由于已经发现二分支结构是潜在度量空间中的隐藏几何属性[16，我们也期望在多尺度节点复用的视角下，起始节点和结束节点能够形成有向链接。方向和拓扑之间的关系为空间映射和有向链接预测提供了强有力的思想。不同于二部网络，节点分两组( ）是一对一的吗，它们代表了节点的某种属性．例如，就定向网络而言，就国际贸易网络而言，出口能力较强的国家更有可能成为进口水平较高的国家的贸易伙伴。为了证明这一点，我们提出了一种在双曲空间中显示网络邻接矩阵不对称的新方法。

2.2.3。双曲空间中有向网络的几何模型

有向网络嵌入模型描述了生成式几何有向网络如何嵌入到双曲空间中。该模型通过识别有向网络的二部结构，将节点信息复用为嵌入基础，并考虑节点的径向坐标表示的流行度与角坐标距离表示的相似度之间的权衡作为连接概率的定义。

在二元网络嵌入模型中，相似度越大的节点之间的流行度越高，概率越大。与二进制网络不同，有向网络应该通过权衡四种力量来连接，即每个集合(集合A或集合B)的相似性和流行度。和）角坐标(和）分别表示节点的受欢迎度和相似度。在定向网络中，一对节点的连接将平衡四种力量:受欢迎程度那out-similarity 那受欢迎那和相似性．有向网络嵌入算法流程图如图所示1．

定向嵌入模型的计算实现如下。

步骤1。从具有二部结构的有向网络中获取模型参数。
无标度特性在现实网络中是普遍存在的，双曲几何学捕获了复杂网络的这种特性。根据节点复用信息的原理，可以计算出节点的基本属性:平均度那度分布( )，和幂律分布的指数在集合．
然而，并不是所有的现实网络都具有定向无标度特性。此外，大多数网络在节点度和权重上都是异构的，这些异构性使得我们能够解决以下问题:通过链路过滤来找到复杂网络的骨干结构[17那34.]捕获指示网络中的幂律属性。在纸上构建骨干网络的方法是，依次删除具有最小权重的链路并被阈值停止。要找到阈值的适当值，我们绘制了骨干中剩余节点的分数vs.剩余链路的分数用于每个删除步骤。根据参考文献[9.]时，阈值的最佳选择是与对角线垂直距离最大的平面上的点，这样系统中大部分节点都保留下来，大部分权重较小的环节都会被删除。
我们模型的另一个重要参数是．控制复杂网络的聚类特性，由于其对拓扑结构的非平凡依赖而难以处理[16］.对称网络嵌入模型中的参数估计是通过比较真实网络和使用不同拓扑属性值的模型生成的合成网络来实现的[9.那11那35.］.但在实验中，该方法无法计算出有向网络的值。需要注意的是，嵌入模型将每个节点划分为两个集合，但这两个集合在直观上应该是有一定的依赖性的。因此,在有向网络嵌入模型中，需要考虑两个集合节点之间的聚类特性和内在关系。
普通邻居符合上面讨论的条件。一方面，从公共邻居派生的二分层结构中的聚类定义能够在两组之间表示内在关系，例如基于四边形的聚类系数和4环密度[5.］.另一方面，实证结果表明有利于在较小的角度距离下的连接，以及常见邻居的数量m作为角相似性的幂律函数渐近增长:[16］.在这里，我们使用公共邻居的数量作为角度相似度的粗粒度表示来估计（那是，在集和，最后，取曲线下面积(AUC)为(即, ）通过模型中映射效果的表现来确定参数。具体来说，对于国际贸易网络、国际移民网络和电子邮件网络，；这C. Elegans.网络使用．

步骤2。嵌入双曲线空间。
几何模型——双曲几何模型和隐藏几何模型——已经成功地捕捉到了真实复杂网络下的自然几何。同样，嵌入到双曲空间中的有向网络也有两个等价模型。接下来，将介绍两种有向网络的几何模型。
在有向网络的双曲模型中，无标度有向网络是由散射产生的节点随机成一个半径为双曲的圆盘．每个节点被指定为径向坐标和角坐标：在集合A，然后呢集合b，连接概率( ）有向连杆的从到在Poincaré盘代表的双曲线中由Fermi-Dirac分布定义：．双曲线距离之间的和由双曲线余弦功能提供：．注意，双曲距离可以很好地近似为．
在有向网络的隐几何模型中，节点之间的连接概率为任意积分函数: 节点之间的有效距离是多少那和为模型参数。和分别表示集合A和集合B中节点的期望度。期望程度对于每个节点，从幂律分布中汲取：在哪里那最小期望度那平均学位那那和．注意径向坐标和预期的学位有一个内在的关系，如和．为了便于参数的求解，我们在Step中对有向网络嵌入应用了隐藏的几何模型3.．

第3步。空间位置和参数估计。
给定一个真实有向网络的快照我们使用隐藏的几何模型来表示一个有向网络。提出了一种非对称流行度-相似度优化方法来计算径向(流行度)。和角度（相似性）每个节点的坐标．特别地，非对称链路的嵌入过程旨在找到每个节点的坐标，使得给定导致的网络拓扑的可能性由上述模型产生的最大值。
从统计的角度来看，推断坐标就是通过给定的邻接矩阵找到与双曲模型的最佳匹配。在双曲嵌入中，极大似然估计法被广泛应用于坐标推断[9.那11那36.］.隐藏的变量采用特定值{ 那 }，可以从观察到的邻接矩阵中找到使用贝叶斯的规则如下：在哪里．隐变量的先验概率为可能性是在哪里邻接矩阵;如果两者之间有联系和那 = 1,否则 = 0. The hidden variables are { 那 }和有效距离．通过最大化方程(3.)及其对数: 常数在哪里是独立于和．
然后，通过似然函数得到节点位置．首先，推断径向坐标相对容易。我们通过部分推导出来的分析解决方案（6.)的期望程度：通过这样做，我们可以得到参数（预期的节点度）从预期的程度如下:和．
类似于那角坐标通过最大化似然函数方程(6.)．然而，很难得到解析解，因此使用数值方法来估计角坐标，包括标准的Metropolis-Hastings算法(SMH) [37.]和本地化的Metropolis-Hastings算法(LMH) [11］.由于LMH方法在不知道全局网络拓扑的情况下，可以分布式精确地估计和计算角坐标[11[我们将LMH方法应用于推断角坐标。全局对数似然方程（5.）由以下等式表示：在LMH方法中，当地贡献每个节点的一世到全局对数似然将首先定义为那在哪里．接下来，一个接一个地访问节点。当特定节点访问时，所有其他节点都有固定的位置，而一世根据适应度移动，使每个节点访问时的局部对数似然最大化。角度位置的采样间隔为．

3.结果

3.1。验证非对称流行度相似性优化方法

为了评估非对称流行相似度优化(A-PSO)方法的性能，我们通过比较A-PSO方法推断的拓扑与真实有向网络的嵌入精度。通过实验分析了以下方法的有效性C. Elegans.神经网络，国际贸易网络，电子邮件网络，国际移民网络。此外，通过重复实验分析了嵌入模型的鲁棒性和性能，结果是稳定的。我们采取两种措施:(1)对比原始网络的拓扑结构，即程度分布、聚类系数分布和间中心性分布;(2)进行全局检验:用双曲距离方程将数据的经验联系概率与理论预测联系起来(1)．

根据标准实践，第一次评估嵌入精度的测试是我们实验和比较节点的一阶邻居，包括程度，聚类系数和中心地位。我们代表了学位累积分布，聚类累积分布，以及图中的累计分布之间的累计分布2并观察到由我们的模型所构造的合成网络的性质与实有向网络的性质很好地匹配。

(一)

(b)

(c)

（d）

（e）

（F）

（G）

（H）

(我)

(j)

(k)

(左)

第二个检查是我们从经验网络数据计算连接概率，并将其与等式给出的理论预测进行比较（1)．观察到图中的经验和理论连接概率的亲近3.提出双曲度量空间是有向网络的合理表示。此外，我们还找到了曲线下面积(AUC)，它作为一种精度评价指标在链路预测领域得到了广泛的应用。AUC统计量衡量了我们的模型在双曲空间中复制网络的能力，最好的可能结果对应于AUC = 1。从表1，具有较高AUC的嵌入结果表明，在双曲线空间中可以再现有向网络，特别是AUC值远高于0.88的社会经济网络:国际贸易网络和电子邮件网络。

(一)

(b)

(c)

（d）

图3.

经验联系概率与理论联系概率。有向网络的双曲嵌入是成功的，因为经验连接概率与几何隐藏模型预测非常接近。(a-d)结果C。elegans神经网络，国际贸易网络，电子邮件网络和国际迁移网络。黑色虚线是通过的连接概率的理论结果．注意，在理论模拟中使用的参数与相应的经验网络相同。粉色点是实证指导分析的结果。整个范围的双曲距离和连接概率被装箱，每个装箱是其中值的平均值。


							节点	链接

	3．00	2.76	0.918	0.922	3．50	3．50	241	13666
	2.92	2.16	0.912	0.917	2.49	3．50	153.	8749
电子邮件	3．50	3．50	0.867	0.881	3．50	3．50	167.	5784
	3.42	3．00	0.728	0.732	3.42	3．00	297.	2345

3.2。链接双曲性和经验网络

在上节中，我们使用A-PSO方法将有向网络嵌入到双曲空间中，展示了理论模型和经验网络之间的联系。在本节中，我们首先比较双曲性质(人气、距离和核心-外围结构)和经济措施，以说明它们如何关联货币宏观经济指标，并在双曲空间中代表经济系统及其时间演化。接下来，我们通过比较不同的距离(相似度，实距离，双曲距离)来分析磁盘分区和实功能区之间的关系C. Elegans.神经系统。

3.2.1之上。双曲空间中的经济系统

国际贸易网络是一个由国家及其贸易关系组成的复杂系统，研究它的目的是从数量和机制方面理解国际贸易[38.-40］.国际贸易体制的三个关键特征——全球化、层次化、本土化——为国际贸易体制的几何解释奠定了基础[9.］.从定向网络生成机制的角度来看，越是紧密的国家，越有可能因其在底层贸易空间中的国家地位和相似性而连接在一起。

通过统计推断技术和网络结构信息，将有向国际贸易网络嵌入到双曲空间中。这种嵌入模型使用每个国家的两个维度的国家信息，进口流行度和出口流行度。提取更高维度的国家地位测度有助于分析多边贸易关系如何改变世界贸易，甚至重塑世界贸易体系。但国际贸易网络往往不具有定向无标度属性;我们使用步骤中提到的过滤链接方法1解决问题，如图所示4 (d)．

(一)

(b)

(c)

（d）

图4.

国际贸易网络的嵌入结果。（a，b）在Poincaré盘上的国际贸易网络的可视化。为了便于显示节点的位置，我们突出显示原点节点和结束节点。（a）突出显示原点节点，边缘上的黄色节点是结束节点，以便可见光盘中的原点节点的流行度和相似性。（b）突出显示结束节点。（c）由圆盘中心距离测量的主要国家的中心地质的排名进化。（d）曲线表示节点的分数相对于链接的比例．和表示骨干网中节点和链路的数量。粉色点表示提取过程中适当的阈值。

为了进一步研究这一问题，我们将我们的模型应用于国际贸易系统的可视化，并推断出受欢迎度和相似度( 那那那）节点，根据20年(1996-2016年)的国际贸易数据。最近有研究将径向坐标的相关性等价于节点度与国民经济规模的相关性[38.那39.］.同样，径向坐标与GDP具有显著的负相关关系(约为- 0.5)，这表明国家的空间位置可以用来识别国家的经济规模，特别是国家的出口能力(进口与GDP的相关系数高于出口)。也就是说，出口状况可以作为衡量国民经济规模的粗粒度指标。此外，角度距离与地理距离的相关系数不显著(约为0.1)，表明国际贸易网络在双曲线空间中不存在地理聚类。双曲网络的核心-外围结构表明，只有约35%的节点位于双曲空间的中心位置。

基于网络双曲嵌入方法的国际贸易体系的长期演进如图所示3 (c)．从出口能力的角度来看，它将世界能源商品贸易视为不平衡，多元化和多极化发展。美国和俄罗斯一直占据了核心位置，反映了能源是出口能力的决定性因素的事实。特别是，随着北海油田的枯竭，英国在能源贸易的出口地位逐渐被边缘化。有趣的是，沙特阿拉伯的能源出口地位由于沙特能源政策方向的变化而逐渐被边缘化。亚洲，非洲和欧洲大陆成为积极的地区，并注入了能源贸易市场的新生命力。欧洲共同体，中国和印度在进口统治的增加后，中国和印度已经搬到了中央阵地。虽然印度在过去几年中，在过去几年中，在过去的几年里，美国是贸易超级大国领导者的更加中心地位，这一直是国际贸易的核心。

3.2.2。双曲线空间中的复杂生态系统

秀丽隐杆线虫是一种生活在土壤中的线虫，在进化上处于初级阶段。它包含大约300个神经元，神经连接是通过化学突触和缝隙连接形成的。尽管经过了一个世纪的研究，关于线虫神经元网络的知识仍然不完整[41.那42.］.在这里，我们使用一个定向的双曲网络嵌入式框架和神经元的潜在几何形状作为进入点，以提供研究神经网络的拓扑和可视化的新视角。

这C. Elegans.神经网络与神经元和几何距离（双曲距离）的几何特征嵌入了双曲线空间中，并且发现拓扑符合双曲线嵌入的简单且强大的基于概率的链接规则。我们将嵌入式结果与神经元的实际位置进行比较：神经元的位置距离是神经元之间的相对位置，并且几何距离是双曲距离和角度距离。然而，我们模型中的双曲线距离是不对称的，并且一些实际任务很难，例如节点聚类分析和节点中心计算。为了进一步比较不同的公制空间中的距离，我们定义了对称距离，如下所示：．结果如图所示5(一个)和5 (b)．从结果中，我们发现角距离与位置距离类似。双曲线距离和位置距离之间的差异相反，更大。这不仅示出了神经元之间的有效距离包括与位置距离的其他尺寸的距离，而且还有神经系统的有效距离是拓扑信息和空间信息的非线性混合的结果。

(一)

(b)

(c)

图5.

的映射结果C双曲空间中的Elegans神经网络。(a, b)双曲距离、角距离和空间距离的关系。横坐标表示节点之间的距离，纵坐标是距离数量的统计值。(c)价值根据不同分区的起始点，用来找到最优的磁盘分区结果．蓝色和粉红色的线表示结果那分别由角距离和双曲距离计算得到。

现实网络可以在双曲线空间中再现集群性、小世界性、无标度性和富俱乐部性等特性。复杂网络另一个常见的重要特征是群落结构，其中群落内部的链接比较密集，而群落之间的链接比较稀疏[43.］.由于连接概率是双曲距离的递减函数，所以没有一个角区域包含空间紧密的节点集群，这些节点彼此之间的连接比它们与网络其他部分的连接更紧密。而双曲圆盘的角距表示节点的相似性，圆盘的划分为几何空间中定义的势模[13］.为了获得神经网络在双曲空间中的群落结构，我们将Poincaré圆盘分区的最佳分区定义为从一个分区到其他分区的平均距离最小的比例。

由于有10个神经功能区，我们将双曲椎间盘分为10个36度的部分，并与真实的神经功能区进行比较。注意，节点的角坐标分布在其中一个关键因素是初始位置选择的差异，这可能会改变分区效果。为了解决这个问题，我们定义了索引那表示社区内部距离(Poincaré磁盘分区)与外部距离(分区的其余部分)的比率，以描述最佳分区，那如下: 在哪里N分区数是和吗表示社区内外节点之间的平均距离。的范围是[0,1]。越接近1，社区划分越好。

在此过程中，我们通过选择不同的起始分区位置，以节点间的最小距离作为初始分区跨度的参考，并最大化得到双曲空间的最优分区．我们进一步考虑了双曲距离和角距离作为计算的基础结果如下图所示5 (c)．由于神经元函数具有较强的空间位置依赖性，社区结构和功能划分的公共信息熵非常低。有趣的是，一些向外流行度排名较高的神经元属于同一神经功能区域，即外侧神经节，如RIAL、RIAR、SAAVR、RMDR和SMDVR，但双曲线空间的划分更为分散。这表明在神经元之间有大量的长程连接C. Elegans.；例如前面的神经元RIAL和后面的VD12在双曲盘上有相似的角距离，这也是拓扑划分与功能划分不一致的原因。另外，双曲嵌入的函数分类是对函数划分的补充。

4.讨论

在这项工作中，我们在双曲线空间中开发了一种定向网络的映射模型，并突出显示了定向网络的二分支结构。我们特别专注于两个主要问题：（1）如何识别拓扑信息的不对称链路，以及（2）如何将定向网络嵌入到双曲线空间，以及使用经验数据是否可行测试模型。结果表明，指向链接以非浪潮方式隐藏在拓扑信息中。根据经验数据，我们将一些真实的网络映射到双曲线空间，包括经济系统和生物生态系统。我们发现我们的方法可以揭示定向网络的拓扑特征，例如节点，度分布，聚类系数和核心周边结构。

并通过可视化技术分析节点和进化规则的重要性。结果表明，节点在双曲空间中的空间位置可以量化节点的重要性。节点在空间中的位置变化与经济系统中状态状态的演化是一致的。更重要的是，在社会经济系统和神经系统中都观察到类似的现象;即空间聚集性与拓扑结构的群落结构存在显著差异。这表现在两个方面:一是双曲空间的群落结构与节点空间分布之间的公共信息熵特别低，二是节点双曲距离与真实距离之间的皮尔逊相关系数不显著。长程链接削弱了系统功能的空间集聚，即双曲嵌入反映了系统功能的集聚。网络的有效距离是拓扑信息与几何特征权衡的结果。

需要重申的是，与二进制网络不同，有向网络构建的基础是四个坐标之间的权衡那那那和．无向网络嵌入仅仅是基于流行度和相似性之间的权衡，这可能会使网络链接的预测在某一时刻产生偏差。例如，考虑极端情况:如果两个节点的出度很大，入度为0，那么这两个节点必须没有链接。当无向网络被嵌入时，它们被连接的几率很大。最后，非对称链接增加了嵌入难度，这在一定程度上体现在嵌入精度上。网络几何的前沿点在于，社区结构可以作为其嵌入到具有双曲几何的隐藏空间中的粗糙版本[44.那45.］.从Mescle结构的角度来看，社区结构的贡献应该在未来的研究中纳入嵌入式模型，这可以提高嵌入精度并降低算法复杂性。

附录

在本节中，将从角坐标估计方面进一步讨论嵌入方法的性能。目的是通过生成合成有向网络来观察推断的角坐标是否接近真实的角坐标。具体地说，合成有向网络是通过遵循A-PSO模型来创建的。利用合成网络和嵌入方法估计推断角坐标。这个过程可以总结如下:第一步:预期学历来自PDF并通过蒙特卡罗模拟得到步骤2:角坐标从[0,2]均匀随机采样第三步:利用连接概率和模型参数构造综合有向网络

在此基础上，利用合成有向网络的拓扑信息，利用嵌入方法计算出推断的角坐标。推导出的角坐标和实坐标可以通过散点图进行比较[11］.结果表明，B集合的坐标估计效果较好，如图所示6(一)．具体地，散射点聚集在两条线附近，这可以在沿着翻译后拼接到一条线上X设在。但是，图中的散点6 (b)是无序的，说明集合A中节点角度的估计偏差较大。产生这种结果的原因更可能与节点角估计的过程和不对称的挑战有关。

(一)

(b)

数据可用性

本文使用的数据来自公共数据库，可从相关网站下载。代码可从作者的网站获得bnuzonywu@163.com.．

的利益冲突

作者声明他们没有利益冲突。

致谢

国家自然科学基金面上项目(71731002和61573065);北京师范大学博士研究生一年级跨学科研究基金面上项目(no . BNUXKJC1921)。

参考文献

崔鹏，朱伟，“网络嵌入研究综述”，IEEE知识与数据工程汇刊第31卷第1期5，第833-852页，2019。视图:谷歌学术
M. A. Serrano, D. Krioukov, M. Boguná，“复杂网络和隐藏度量空间的自相似性”，物理评论快报，卷。100，不。7，2008年物品ID 078701,2008。视图:出版商网站|谷歌学术
D. Krioukov，F.Papadopoulos，M. Kitsak，A. Vahdat和M.Boguná，“复杂网络的双曲几何”，“物理评论E，卷。82，没有。3，图1036106，2010。视图:出版商网站|谷歌学术
D. Krioukov, F. Papadopoulos, A. Vahdat, M. Boguná，《复杂网络的曲率和温度》，物理评论E，第80卷，第2期。3、Article ID 035101, 2009。视图:出版商网站|谷歌学术
D. Krioukov，“群集意味着网络中的几何结构”，物理评论快报，第116卷，第116期20、Article ID 208302, 2016。视图:出版商网站|谷歌学术
F. Papadopoulos, M. Kitsak, M. Á。Serrano, M. Boguñá，和D. Krioukov，《不断增长的网络中的受欢迎程度与相似性》，自然，第489卷，第2期。2012年。视图:出版商网站|谷歌学术
A. Cacciola, A. Muscoloni, V. Narula等人，“在双曲空间中无监督地融合嵌入揭示大脑的隐藏几何”，2017，https://arxiv.org/abs/1705.04192．视图:谷歌学术
C. Seguin，M.P.Van Den Heuvel，And A. Zalesky，“脑网络导航”，美国国家科学院院刊第115卷第1期24, pp. 6297-6302, 2018。视图:出版商网站|谷歌学术
G. García-Pérez, M. Boguñá， A. Allard和M. Á。塞拉诺，《隐藏的国际贸易双曲几何:1870-2013年世界贸易地图集》科学报告，卷。6，p。33441,2016。视图:出版商网站|谷歌学术
R. Kleinberg，“利用双曲线空间的地理路线”，在Infocom 2007的诉讼程序.26TH IEEE计算机通信国际会议， pp. 1902-1909, IEEE，巴塞罗那，西班牙，2007年5月。视图:出版商网站|谷歌学术
M.Boguná，F.Papadopoulos和D. Krioukov，“使用双曲线映射维持互联网”，“自然通信，卷。1，p。62,2010。视图:出版商网站|谷歌学术
J. Zhang，“嵌入在双曲线空间中的移动社交网络的贪婪转发”ACM SIGCOMM 2013年度协议会议（SIGCOMM'13）的诉讼程序， vol. 43, pp. 555-556, ACM，中国香港，2013年8月。视图:出版商网站|谷歌学术
m·A。Serrano, M. Boguñá，和F. Sagués，“揭示代谢网络背后隐藏的几何结构”，分子生物系统，第8卷，第2期3，页843 - 850,2012。视图:出版商网站|谷歌学术
G. Alanis-Lobato, P. Mier, M. Andrade-Navarro，《人类蛋白质相互作用网络的潜在几何结构》，生物信息学， 2018年第1卷第9页。视图:谷歌学术
A. Allard, M. Á。Serrano, G. García-Pérez，和M. Boguñá，《真实复杂网络中权值的几何性质》自然通信，第8卷，第14103条，2017。视图:出版商网站|谷歌学术
M. Kitsak, F. Papadopoulos，和D. Krioukov，“二部网络的潜在几何”，物理评论E，卷。95，没有。3，第2017号文章ID 032309。视图:出版商网站|谷歌学术
K.-K。克雷恩伯格，M. Boguñá， M. Ángeles Serrano，和F. Papadopoulos，《真实多重网络中的隐藏几何关联》，自然物理，第12卷，第2期11, pp. 1076-1081, 2016。视图:出版商网站|谷歌学术
Y. Bengio，A. Courville和P. Vincent，“代表学习：审查和新的观点，”模式分析与机器智能学报第35期8，页1798-1828,2013。视图:出版商网站|谷歌学术
B. Perozzi, R. Al-Rfou, S. Skiena，《Deepwalk:在线学习的社会表征第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集，第701-710页，ACM，纽约，纽约，美国，2014年8月。视图:出版商网站|谷歌学术
P. Goyal和E. Ferrara，“图形嵌入技术、应用和性能:调查”，基于知识的系统，卷。151，pp。78-94,2018。视图:出版商网站|谷歌学术
石颖，朱琪，郭飞，张超，韩杰，“基于异构信息网络综合转录的嵌入学习”第24届ACM SIGKDD关于知识发现和数据挖掘的国际会议，页2190-2199，伦敦，英国，2018年8月。视图:出版商网站|谷歌学术
尹华，邹磊，黄志华，“基于事件的社交网络中的联合事件-合作伙伴推荐”第34届IEEE国际数据工程会议论文集，页929-940,IEEE，巴黎，法国，2018年4月。视图:出版商网站|谷歌学术
欧敏，崔平，裴建平，张志章，朱伟，“保持非对称传递性的图嵌入”第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集(KDD’16)，第1105-1114页，ACM，旧金山，加州，美国，2016年8月。视图:出版商网站|谷歌学术
J. Tang，M.Qu，M.王，M.张，J. Yan和Q. Mei，“线：大规模信息网络嵌入，”第24届世界范围内的国际会议的诉讼程序（www'15），pp.1067-1077，佛罗伦萨，意大利，2015年5月。视图:出版商网站|谷歌学术
陈慧珍，尹慧珍，陈涛，阮庆伟，文正。Peng，和X. Li，“利用图卷积的中心性信息进行网络表示学习”，inIEEE第35届国际数据工程会议论文集， pp. 590-601, IEEE，中国澳门，2019年4月。视图:出版商网站|谷歌学术
陈慧，王伟，王慧，“Pme:基于投影度量嵌入的异构网络链路预测”，《中国科学(d辑)》第24届ACM SIGKDD关于知识发现和数据挖掘的国际会议，pp.1177-1186，伦敦，英国，2018年8月。视图:谷歌学术
王颖，尹华，郑凯，“基于图卷积的客运需求预测方法研究”，航空学报，vol . 21, no . 1, pp . 369 - 372第25届ACM SIGKDD国际知识发现与数据挖掘会议，第1227-1235页，安克雷奇，AK，美国，2019年8月。视图:出版商网站|谷歌学术
R. Guimerà， M. sale - pardo，和L. A. N. Amaral，《二部和定向网络中的模块识别》，物理评论E，卷。76，没有。3，物品ID 036102,2007。视图:出版商网站|谷歌学术
R. Michalski，S. Palus和P. Kazienko，“匹配组织结构和社交网络从电子邮件通信中提取”商业信息处理课程讲稿， vol. 87, pp. 197-206，施普林格，德国柏林，2011。视图:出版商网站|谷歌学术
J. Kunegis，“konect -科布伦茨网络收藏”，出版第22届万维网国际会议论文集(WWW’13 Companion)，pp.1343-1350，里约热内卢，巴西，2013年5月。视图:出版商网站|谷歌学术
J. G. White, E. Southgate, J. N. Thomson, and S. Brenner，《线虫的神经系统结构》，伦敦皇家学会哲学汇刊。B组，生物科学第314卷第1期1165页1-340,1986。视图:谷歌学术
诉Nekrashevych,自相似组，第117卷，美国数学学会，普罗维登斯，罗德岛，美国，2005。
J. G. Foster，D .V.Foster，P. Grassberger和M. Paczuski，“边缘方向和网络结构”，美国国家科学院院刊，第107卷，第2期24, pp. 10815-10820, 2010。视图:出版商网站|谷歌学术
M. A. Serrano, M. Boguna, and A. Vespignani，《提取复杂加权网络的多尺度主干》，美国国家科学院院刊，卷。106，没有。16，pp。6483-6488，2009。视图:出版商网站|谷歌学术
F. Papadopoulos, R. Aldecoa，和D. Krioukov，“使用共同近邻的网络几何推断”，物理评论E，第92卷，第2期2、文章编号022807,2015。视图:出版商网站|谷歌学术
F. Papadopoulos, C. Psomas, D. Krioukov，《通过重复双曲线增长的网络映射》，IEEE/ACM网络汇刊，卷。23，不。1，pp。198-211,2014。视图:谷歌学术
M. Newman和G. Barkema，统计物理第1-4章的蒙特卡罗方法，牛津大学出版社，美国纽约，1999。
M. A. Serrano和M. Boguná，《世界贸易网络拓扑学》，物理评论E第68卷第2期文章编号015101,2003。视图:出版商网站|谷歌学术
D. Garlaschelli和M. I. Loffredo，“世界贸易网络的适格性依赖拓扑性质”，物理评论快报第93卷第5期18, p. 188701, 2004。视图:出版商网站|谷歌学术
A. Almog，T. Squartini和D. Garlaschelli，“国际贸易网络的二元和加权结构的GDP驱动模型”，新物理杂志，第十七卷，第二期1、文章编号013009,2015。视图:出版商网站|谷歌学术
L. R.Varshney，B.L.L.Chen，E.Paniagua，D. H. Hall和D.B.Chklovskii，“Caenorhabditis elegans神经元网络的结构性质”，“PLoS计算生物学，第7卷，第5期2、文章编号e1001066, 2011。视图:出版商网站|谷歌学术
G. Yan，P.E.Vértes，E.K.Towlson等，“网络控制原理预测了Caenorhabdiseltegans Connectome的神经元功能”，“自然，卷。550，没有。7677，pp。519-523,2017。视图:出版商网站|谷歌学术
M. E. J. Newman，“检测网络中的社区结构”，欧洲物理杂志B:凝聚态物质，卷。38，不。2，pp。321-330,2004。视图:出版商网站|谷歌学术
A. Muscoloni和C. V.同类优化(npso)模型，有效地生成真实的社区复杂网络，新物理杂志，第20卷，第2期。5、文章ID 052002, 2018。视图:出版商网站|谷歌学术
A. Faqeeh, S. Osat，和F. Radicchi，“描述复杂网络的双曲线嵌入和社区结构之间的类比”，物理评论快报号，第121卷。9、文章ID 098301, 2018。视图:出版商网站|谷歌学术

复杂性

一种不对称的流行性相似性优化方法，将定向网络嵌入到双曲线空间中

摘要

1.介绍

2.材料和方法

2.1。数据

2.2。方法

2.2.1。复杂网络与双曲空间

2.2.2。有方向链接与二部结构之间的相互作用

2.2.3。双曲空间中有向网络的几何模型

3.结果

3.1。验证非对称流行度相似性优化方法

3.2。链接双曲性和经验网络

3.2.1之上。双曲空间中的经济系统

3.2.2。双曲线空间中的复杂生态系统

4.讨论

附录

数据可用性

的利益冲突

致谢

参考文献

版权

更多相关文章

相关文章