复杂性 复杂性 1099 - 0526 1076 - 2787 Hindawi 10.1155 / 2020/8372928 8372928 研究文章 非对称Popularity-Similarity优化方法将定向网络嵌入双曲空间 Zongning Zengru https://orcid.org/0000 - 0001 - 5321 - 588 x 风扇 道德化 学校的系统科学 北京师范大学 100875年北京 中国 bnu.edu.cn 2020年 22 4 2020年 2020年 16 10 2019年 28 02 2020年 02 04 2020年 22 4 2020年 2020年 版权©2020吴Zongning et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

网络嵌入在当前网络科学是一个前沿的话题。复杂网络的无标度特性可以成为双曲空间的指数扩张的结果。目前已经开发出了一些嵌入模型探索双曲几何属性的复杂网络,特别是对称网络。在这里,我们提出一个模型,将定向网络嵌入双曲空间。按照导演的一式两份的结构网络和多路复用节点信息,代定律不对称网络回放的方法在双曲空间中,估计每个节点的双曲坐标在一个有向网络的不对称popularity-similarity优化方法模型。此外,实验表明,我们的嵌入算法在一些真正的网络模型已经稳定和扩大现有方法的应用范围。

中国国家自然科学基金 71731002 61573065 为一年级的博士候选人北师大跨学科研究的基础 BNUXKJC1921
1。介绍

复杂网络可以很大程度上简化实际系统和保护的基本信息交互结构。因此是一种理想的研究复杂系统的工具。然而,复杂网络模型与nongeometric属性,其中包括大量的工具和方法开发的几何,不能用于复杂网络。在这种背景下,一波又一波的研究探索复杂网络的几何性质,针对复杂网络映射到潜在的变量(也就是说,隐藏变量和高斯潜变量)或低维度量空间(也就是说,欧几里得空间或双曲空间)( 1- - - - - - 3]。

网络几何方面的进展表明,在无标度网络结构属性源自真实复杂系统可以成为几何属性( 4, 5]。双曲几何非欧几里得的几何学的一个分支,它有许多应用程序在实际工程技术。更重要的是,经济增长的随机几何模型和双曲嵌入模型( 3, 6]提出后可以很容易地解释无标度网络的异构性和高聚类,甚至给每个坐标的清晰的定义。这些模型不仅可以模拟网络的增长,但也解释了经典的BA网络模型的动态过程复杂的网络。相关研究也变得越来越流行,网络模型和几何性质在许多领域已经被成功运用在网络科学和其他学科,包括大脑科学( 7, 8),国际贸易( 9)、路由传输( 10- - - - - - 12),和蛋白质形成机制( 13, 14]。

当这个研究框架,提出了吸引了学者们的广泛关注,然后模型和双曲空间嵌入方法是( 3, 6, 15- - - - - - 17]。这些模型有很大的性能研究的潜在结构网络。特别是在popularity-similarity优化方法中,复杂网络的双曲性质结合隐藏的空间属性,和空间节点的位置估计的统计推断。然而,这些模型不能完全描述真实系统。一个缺点是,这些模型忽略链接的方向性。节点之间的关系可能不平等在大多数实际网络,这就是所谓的不对称属性的链接。虽然不对称属性可能为网络嵌入带来许多挑战,忽略定向网络将失去很多重要信息的不对称,不能导致真正的系统结构和功能的完整体现。

学习或研究的另一个分支是网络表示图嵌入通过机器学习方法和矩阵分析 1, 18- - - - - - 22),包括定向网络( 23, 24]。这些模型为我们提供了许多有用的建模的灵感,如主题、随机漫步,与图形旋转中心信息 25),高阶距离( 26),空间和时间距离( 27]。不幸的是,一个明显的限制,这些模型不能识别时的真正意义空间坐标获取节点的一个向量表示。更重要的是,因为它已经证明了一个无标度程度分布双曲空间的嵌入是一个基本条件( 3),迫在眉睫的是培养一个有向网络嵌入在双曲空间模型。

为了进一步解决这一问题,我们探索直接链接和网络拓扑结构之间的内在关系。有趣的是,在一个非凡的方式,引导网络有一个隐藏的结构由两部分构成的 28]。我们检查,各种各样的定向网络这样的结构,这一现象是指导网络的普遍规律。我们工作的贡献是,我们提供一个有向网络嵌入方案基于节点信息复用和识别潜在的拓扑结构(一式两份的结构)以及一个新的想法定向网络数据的降维。此外,利用可视化技术,我们提供一个新的快照直接网络的双曲空间,这使我们能够显示节点的状态和宏观的结构和特性。

在本文中,我们提出一个不对称popularity-similarity优化方法将定向网络嵌入双曲空间通过导演的一式两份的结构网络,我们的方法是基于网络拓扑信息及其特点。从这个角度来看,我们首先引入的概念指导网络首先由两部分构成的结构。在此基础上,从定向网络映射节点的映射模型双曲空间中讨论部分 2。四个实际定向网络是用来测试映射方法的适用性 3。部分 4关闭本文结束语。

2。材料和方法 2.1。数据

在仿真中,我们使用四个经验网络数据集和给数据源的完整描述,包括的领域<我talic> 秀丽隐杆线虫(<我talic> 秀丽隐杆线虫)神经系统、国际贸易、电子邮件的关系,以及国际迁移。(1)电子邮件数据集之间的内部邮件通信网络是一个中型的员工制造公司( 29日, 30.]。网络是直接和节点代表员工和两个节点之间的边个人电子邮件。(2)与153年国际迁移数据集是加权有向网络节点,可以要求从世界银行( http://www.worldbank.org/)。邻接矩阵<我nl我ne-formula> 一个 j 描述了移民的国家<我nl我ne-formula> 来<我nl我ne-formula> j 迁移流<我nl我ne-formula> w j 。(3)<我talic> 秀丽隐杆线虫神经数据集,一个有向网络,描述了通过化学突触和神经连接缝隙连接,可获得从Wormatlas数据库( 31日]。(4)国际贸易数据集描述了国家(或地区)之间的贸易关系,这是来自联合国商品贸易统计数据库( https://comtrade.un.org/)。如果国家<我nl我ne-formula> 进口国家<我nl我ne-formula> j 与重量<我nl我ne-formula> w 邻接矩阵是<我nl我ne-formula> 一个 j = w

2.2。方法 2.2.1。复杂网络和双曲空间

与负曲率双曲空间是一个各向同性空间,无法嵌入到任何欧几里得空间。复杂网络的拓扑几何和双曲几何是密切相关的,一直在探索在数学( 32],因为网络的最短路径,这些定义化学距离,密切关注他们的双曲测地线的潜在空间。庞加莱磁盘半径为<我nl我ne-formula> R = 2 ln N / π μ κ 0 2 可以用来表示双曲空间根据裁判。 3]。双曲几何的主要属性是指数的扩张空间:该地区<我talic> 一个(<我talic> R)的一个二维双曲盘生长<我talic> R作为<我nl我ne-formula> 一个 R e R 。从双曲几何的角度来看,无标度网络的出现产生两个指数:节点密度随距离呈指数级增长<我nl我ne-formula> r 从中心的磁盘,平均度指数下降<我nl我ne-formula> r 。在早期的研究中,双曲几何模型和隐藏的几何模型进行等价嵌入无尺度网络拓扑度量空间。

一个隐藏的几何模型分配节点他们的期望度<我nl我ne-formula> κ 和<我nl我ne-formula> θ ,在那里<我nl我ne-formula> κ 来源于幂律分布呢<我nl我ne-formula> ρ κ = κ 0 γ 1 γ 1 κ γ ,<我nl我ne-formula> κ 0 = k ¯ γ 2 / γ 1 预计的最低程度的节点,<我nl我ne-formula> k ¯ 网络的平均度,<我nl我ne-formula> γ 力量指数。<我nl我ne-formula> θ 均匀随机选择来自哪里<我nl我ne-formula> 0,2 π 。然后,每对节点的概率<我nl我ne-formula> f χ = 1 + χ β 1 连接,有效距离<我nl我ne-formula> χ j = d j / μ κ κ j = Δ θ N / 2 μ π κ κ j 角距离<我nl我ne-formula> d j = Δ θ N / 2 π ,参数<我nl我ne-formula> β 和<我nl我ne-formula> μ 受制于<我nl我ne-formula> μ = β π / β / 2 π k ¯

为复杂网络构建一个双曲几何模型,−1设置为双曲空间的曲率。庞加莱模型分配径向节点<我nl我ne-formula> r 坐标与密度<我nl我ne-formula> ρ r = α h α r / 因为 h α R 1 和角坐标<我nl我ne-formula> θ 与密度<我nl我ne-formula> ρ θ = 1 / 2 π 。测地线距离<我talic> x节点之间<我nl我ne-formula> r , θ 和<我nl我ne-formula> r j , θ j 满足<我nl我ne-formula> 因为 h x = 因为 h r 因为 h r j h r h r j 因为 Δ θ 。节点连接的概率<我nl我ne-formula> f x = 1 + e x R β / 2 1 。构建复杂网络的过程反映了两种力量的竞争在这个模型:流行(<我talic> r)和相似度(<我nl我ne-formula> θ )。

此外,请注意,隐藏的度量空间模型和双曲几何模型的网络执行等同于通过<我nl我ne-formula> κ r 转换:<我nl我ne-formula> r = R 2 ln κ / κ 0

2.2.2。之间的交互与方向,由两部分构成的结构

直接链接,因为重要的连接特性的网络模式,正越来越多地用于合并的动态演化和节点状态的系统。网络嵌入的不对称属性增加了困难。链接的不对称可以识别在复杂系统的拓扑信息,也就是说,双方的结构( 33]。不同于网络,每个节点分为两个不重叠的组织,根据其独特的特性,在由两部分构成的结构。修改建模方法指导网络,因此,是克服困难的关键。

定向网络中的节点可以分为两部分,每个来自不同的链接。这种建模方式称为定向网络由两部分构成的结构,如图 1(一)和 1(b)。具体来说,每个节点<我nl我ne-formula> v 在一个有向网络包含<我nl我ne-formula> 一个 在设置一个和<我nl我ne-formula> b 在B组由两部分构成的结构。从一个直接链接<我nl我ne-formula> v 来<我nl我ne-formula> v j (<我nl我ne-formula> v v j ),可以映射(<我nl我ne-formula> 一个 b j )。通过这样做,特别是变得两倍大的节点数量,但这并不影响后续的工作,指导网络将被转换成一个由两部分构成的网络。此外,该方法重建几何定向网络通过将节点分为两类,但这两类并不是完全独立的,其内在关系将被考虑的参数<我nl我ne-formula> β 在建模。

因为发现了由两部分构成的结构是一个隐藏的潜在指标空间的几何性质( 16),我们也希望原点节点和结束节点能够形成直接联系下多尺度节点多路复用的角度。方向和拓扑之间的关系提供了一种强大的思想空间映射和直接链接预测。与由两部分构成的网络,节点<我nl我ne-formula> 在两组(<我nl我ne-formula> 一个 , b )是一对一的,它们代表了一种特定的属性节点<我nl我ne-formula> 。指导网络,例如,国际贸易网络的情况下,出口能力较强的国家更有可能成为贸易伙伴的高水平的导入。显示这个,我们开发一种新方法用于显示网络的邻接矩阵的不对称双曲空间混合的方向和拓扑。

2.2.3。定向网络在双曲空间的几何模型

直接网络嵌入模型描述如何生成几何定向网络嵌入在双曲空间。模型的多放映场影剧院节点信息作为嵌入基金会通过识别导演的一式两份的结构网络和节点之间的权衡考虑受欢迎,由径向坐标,和相似,由角坐标距离,是连接概率的定义。

在二进制网络嵌入模型中,受欢迎程度更高和节点之间的概率更大更大的相似性。与二元网络、定向网络应由交易有关四种类型的力,即每组的相似性和受欢迎程度(设置一个或一组B)。径向坐标(<我nl我ne-formula> r 一个 和<我nl我ne-formula> r b )和角坐标(<我nl我ne-formula> θ 一个 和<我nl我ne-formula> θ b )分别代表节点的受欢迎程度和相似。一对节点的连接在定向网络平衡四种力:out-popularity<我nl我ne-formula> r 一个 ,out-similarity<我nl我ne-formula> θ b ,受欢迎<我nl我ne-formula> r b j ,相似度<我nl我ne-formula> θ 一个 j 。定向网络嵌入算法的流程图如图 1。

计算的实现直接嵌入模型如下。

步骤1。

从直接获得模型参数与由两部分构成的网络结构。

无标度特性是无所不在地观察到在实际网络中,和双曲几何捕获这样的复杂网络的特性。根据节点多路信息的原则,基本性质可以计算:平均程度<我nl我ne-formula> k ¯ 度分布(<我nl我ne-formula> P k k γ )和指数的幂律分布<我nl我ne-formula> γ 在集合<我nl我ne-formula> 一个 , B

然而,并不是所有的现实世界的网络直接无标度性质。除此之外,大多数网络异构节点度和权重,以及那些异构性问题使我们能够解决这个问题:发现复杂网络的主体结构通过过滤链接( 17, 34)来捕获指导网络的幂律特性。骨干网络的构建方法与最小重量的纸是将被删除在转弯和停止阈值。找到合适的阈值,我们把剩下的部分骨干节点<我nl我ne-formula> N B / N 0 与剩余的链接的一部分<我nl我ne-formula> l B / l 0 对于每一个删除的步骤。根据文献[ 9),最好的选择的阈值点在平面上的最大化对角线的垂直距离,所以大多数节点保留在系统和大多数与小重量将被删除。

我们的模型的另一个重要参数<我nl我ne-formula> β 1 , + 。<我nl我ne-formula> β 控制复杂网络的聚类特性,棘手的拓扑结构(由于其重要的依赖 16]。估计参数对称网络中嵌入模型通过比较执行真正的网络合成网络生成与模型使用不同的值数拓扑属性( 9, 11, 35]。然而,这种方法无法计算的值直接网络实验。注意,嵌入模型将每个节点分为两组,但这两组直观地应在一定程度上的依赖。因此,<我nl我ne-formula> β 直接网络嵌入模型需要考虑聚类属性和内在两个组节点之间的关系。

常见的邻居满足上述条件。首先,集群定义由两部分构成的结构来自共同的邻居使两组代表一种内在的关系,比如quadrilateral-based聚类系数和4-loop密度( 5]。另一方面,实证结果表明,价值就越高<我nl我ne-formula> β 支持连接在小角的距离,以及共同邻居的数量<我talic> 米长角相似的渐近幂律函数:<我nl我ne-formula> Δ θ β ( 16]。在这里,我们使用共同邻居的数量作为相似性的角度估计的粗粒度的表示<我nl我ne-formula> β (即,<我nl我ne-formula> p β 一个 在设置一个和<我nl我ne-formula> p β b 在B)。我们,最后,将曲线下的面积(AUC)的函数<我nl我ne-formula> β (即,<我nl我ne-formula> AUC β )确定参数映射效应在我们的模型的性能。具体而言,国际贸易网络,国际移民网络和电子邮件网络,<我nl我ne-formula> β = 3所示。5 ;的<我talic> 秀丽隐杆线虫网络使用<我nl我ne-formula> β = 3.42

步骤2。

嵌入到双曲空间中。

隐藏几何models-hyperbolic几何模型和几何模型已经成功地捕捉到自然几何基础真正的复杂网络。同样,一个有向网络嵌入到双曲空间也有两个等效模型。接下来,两个定向网络将被引入的几何模型。

在双曲模型指导网络,无标度网络是由散射<我nl我ne-formula> N 节点随机的双曲磁盘半径<我nl我ne-formula> R 。每个节点<我nl我ne-formula> v 分配径向坐标<我nl我ne-formula> r 和角坐标<我nl我ne-formula> θ :<我nl我ne-formula> v 一个 r 一个 , θ 一个 在设置一个,<我nl我ne-formula> v b r b , θ b 在设置连接概率(<我nl我ne-formula> p j )的直接链接<我nl我ne-formula> v j 从<我nl我ne-formula> 一个 来<我nl我ne-formula> b j 在双曲空间中所代表的庞加莱磁盘是由费米狄拉克分布定义:<我nl我ne-formula> f x 一个 , b j = 1 + e β x 一个 , b j R / 2 1 。双曲距离<我nl我ne-formula> x 一个 , b j 之间的<我nl我ne-formula> 一个 和<我nl我ne-formula> b j 是由双曲余弦函数:<我nl我ne-formula> 因为 h x 一个 , b j = 因为 h r 一个 · 因为 h r b j h r 一个 · h r b j 因为 Δ θ 。注意,双曲距离可以很近似<我nl我ne-formula> r 一个 + r b j + 2 ln d 一个 , b j / 2

隐藏的几何模型的网络,节点之间的连接概率积分函数: (1) f χ = 1 + χ β 1 , 节点之间的有效距离在哪里<我nl我ne-formula> χ = d 一个 , b j / μ κ 一个 κ b j ,<我nl我ne-formula> μ = β π / β / 2 π k ¯ 是模型的参数。<我nl我ne-formula> κ 一个 和<我nl我ne-formula> κ b 表示节点的期望程度组A和B,分别。期望程度<我nl我ne-formula> κ 对于每一个节点从幂律分布: (2) ρ κ = κ 0 γ 1 γ 1 κ γ , 在哪里<我nl我ne-formula> κ κ 0 , + ,最低期望的程度<我nl我ne-formula> κ 0 = k ¯ γ 2 / γ 1 ,平均度<我nl我ne-formula> k ,<我nl我ne-formula> d 一个 , b j = N Δ θ / 2 π ,<我nl我ne-formula> Δ θ = 最小值 θ θ j , 2 π θ θ j 。请注意,径向坐标<我nl我ne-formula> r 和预期的程度<我nl我ne-formula> κ 有一个内在的关系,<我nl我ne-formula> r = R ln κ / κ 0 和<我nl我ne-formula> R = 2 ln N / π μ κ 0 2 。为了方便解决参数,我们应用隐藏几何模型为一个有向网络嵌入步骤 3。

步骤3。

空间位置和参数估计。

给定一个快照真正的指导网络组成的<我nl我ne-formula> N 节点,我们使用隐藏的几何模型表示一个有向网络。非对称popularity-similarity我们提出的优化方法是计算径向(流行)<我nl我ne-formula> r 和角(相似性)<我nl我ne-formula> θ 为每个节点坐标<我nl我ne-formula> 。特别是,不对称的嵌入过程链接的目标是找到每个节点的坐标,这样的可能性考虑到生成的直接生成的网络拓扑模型上面描述的是最大的。

形成一个统计的角度来看,推断坐标是找到最佳匹配的双曲线模型给定的邻接矩阵。最大似然估计方法已被广泛应用于推断坐标在双曲嵌入 9, 11, 36]。隐藏变量取特定值{<我nl我ne-formula> κ ,<我nl我ne-formula> θ }在网络,从观察到的邻接矩阵可以找到<我nl我ne-formula> 一个 j 使用贝叶斯规则如下: (3) κ , θ 一个 j , γ , β , k ¯ = κ , θ , 一个 j γ , β , k ¯ 一个 j γ , β , k ¯ , 在哪里<我nl我ne-formula> κ , θ , 一个 j γ , β , k ¯ = 概率 κ 0 , θ 一个 j κ 0 , θ , γ , β , k ¯ 。的隐藏变量的先验概率 (4) 概率 κ , θ = 2 π N = 1 N ρ κ , ,可能是 (5) 一个 j κ , θ , γ , β , k ¯ = 1 j N f χ 一个 j 1 f χ 1 一个 j , 在哪里<我nl我ne-formula> 一个 j 邻接矩阵;如果有联系<我nl我ne-formula> 和<我nl我ne-formula> j ,<我nl我ne-formula> 一个 j = 1,否则<我nl我ne-formula> 一个 j = 0。隐藏的变量是{<我nl我ne-formula> κ ,<我nl我ne-formula> θ }和有效距离<我nl我ne-formula> χ = N k ¯ Δ θ / β π / β κ 一个 κ b 。获得隐藏坐标被最大化优化的可能性在方程( 3)及其对数: (6) ln κ , θ 一个 j , γ , β , k ¯ = C γ = 1 N ln κ + < j 一个 j ln p χ + < j 1 一个 j ln 1 p χ , 的常数<我nl我ne-formula> C 是独立于<我nl我ne-formula> κ 和<我nl我ne-formula> θ

接下来,节点位置可以得到似然函数<我nl我ne-formula> 。首先,推断径向坐标是相对容易的。我们推导出解析解的部分推导方程( 6)对预期的程度<我nl我ne-formula> κ : (7) κ ln = γ κ β κ j l p χ j 一个 j

通过这样做,我们可以获得的参数<我nl我ne-formula> κ (预期的程度的节点<我nl我ne-formula> 从预期的程度<我nl我ne-formula> κ 如下:<我nl我ne-formula> κ = k γ / β 和<我nl我ne-formula> κ = 马克斯 k γ / β , κ 0

类似于<我nl我ne-formula> r 角坐标是通过最大化似然函数方程( 6)。然而,很难获得一个解析解,与数值方法因此被用来估计角坐标,包括标准pmmh算法(SMH) [ 37)和本地化pmmh算法(LMH) [ 11]。自从LMH方法执行在估计和计算角坐标完全在一个分布式的方式不知道全球网络拓扑结构( 11),我们应用LMH方法来推断角坐标。全球对数似方程( 5)是由以下方程: (8) ln 一个 j κ , θ , γ , β , k ¯ = < j 一个 j ln p χ + < j 1 一个 j ln 1 p χ

在LMH方法中,当地的贡献<我nl我ne-formula> ln 每个节点的<我talic> 我全球对数似<我nl我ne-formula> ln 将首先定义为<我nl我ne-formula> ln = j 一个 j ln p χ + j 1 一个 j ln 1 p χ ,在那里<我nl我ne-formula> ln = 1 / 2 ln 。接下来,节点访问了一个接一个。当特定的节点<我nl我ne-formula> 访问,所有其他节点有固定的位置,和角位置的<我talic> 我移动根据健身,最大化每个节点的本地对数似访问。角位置的采样间隔<我nl我ne-formula> Δ θ = 1 / N

3所示。结果 3.1。验证不对称Popularity-Similarity优化方法

来评估非对称popularity-similarity优化(A-PSO)方法执行,我们检查嵌入精度通过比较A-PSO方法的拓扑推断实际指导网络。几个实验的有效性进行分析,以下方法:<我talic> 秀丽隐杆线虫神经网络,国际贸易网络,电子邮件网络,国际移民网络。此外,我们分析了嵌入模型的鲁棒性和性能通过重复实验,结果是稳定的。我们采取两项措施:(1)比较原始的网络拓扑结构,即。,我nterms of the degree distribution, clustering coefficient distribution, and betweenness centrality distribution; and (2) performing a global test: linking the empirical connection probability with data to the theoretical prediction with hyperbolic distance equation ( 1)。

第一个测试评估嵌入的准确性是我们实验和比较的一阶邻居节点和高阶情况下,包括度、聚类系数、中间性中心,根据标准的做法。我们代表累积分布程度,集群累积分布和中间性累积分布在图 2并观察之间的良好匹配的属性合成网络由我们的模型和实际指导网络。

第二个检查是我们从经验网络数据连接概率计算和比较它与理论预测由方程( 1)。观察到亲密的实证和理论连接概率图 3表明,双曲线度量空间的合理表示指导网络。此外,我们还发现曲线下的面积(AUC),这是广泛使用的领域的链接预测精度评价指标。AUC统计测量我们的模型可以复制在双曲空间网络,和最好的结果对应于AUC = 1。从表 1高AUC,嵌入的结果表明,定向网络可以复制在双曲空间,尤其是社会经济网络的AUC值远高于0.88:国际贸易网络和电子邮件网络。

3.2。连接双曲性质和网络经验

使用A-PSO方法将定向网络嵌入到双曲空间在上面的部分中,我们展示了理论模型和实证网络之间的联系。在本节中,我们首先提供对比双曲性质(流行,距离,中心-外围结构)和经济措施来展示他们相关货币宏观经济指标和代表在双曲空间经济系统及其时间演化。接下来,我们分析了磁盘分区和实函数之间的关系方面通过比较不同措施的距离(相似,真正的距离,和双曲距离)<我talic> 秀丽隐杆线虫神经系统。

3.2.1之上。在双曲空间经济系统

国际贸易网络是一个复杂系统的状态和他们的贸易关系,并检查的目的是理解国际贸易的数量和机制( 38- - - - - - 40]。国际贸易的三个关键特征system-globalization,分层,localization-lay几何解释的基础的国际贸易体系 9]。从导演的角度网络生成机制,加强国家有更大的机会成为连接由国家地位和相似性在潜在的贸易空间。

通过统计推断技术和网络的结构信息,指导国际贸易网络可以嵌入在双曲空间。这样一个嵌入模型使用二维的国家信息对于每一个国家,进口的人气和出口的声望。提取高维国家地位测量可以帮助分析multitrade关系如何改变世界贸易,甚至重塑世界贸易体系。但国际贸易网络通常没有直接无标度性质;我们使用过滤方法中提到的步骤的链接 1为了解决一个问题,如图 4 (d)。

进一步研究这个问题,我们运用我们的模型可视化国际贸易系统和推断的声望和相似属性(<我nl我ne-formula> r 一个 ,<我nl我ne-formula> r b j ,<我nl我ne-formula> θ 一个 ,<我nl我ne-formula> θ b j )的节点,根据数据从20年(1996 - 2016)的国际贸易。最近,研究讨论了径向坐标的关系相当于节点度之间的相关性和国家经济规模( 38, 39]。同样,径向坐标和GDP显著负相关(大约−0.5),这表明国家的空间位置可以用来识别国家经济规模,特别是国家的出口能力(进口和国内生产总值(GDP)的相关系数高于出口)。,出口状态可以作为国民经济的一个粗粒度的测量尺寸。此外,角距离和地理距离之间的相关系数不显著(约0.1),这表明国际贸易网络没有地理集群在双曲空间。双曲网络的中心-外围结构显示,只有约35%的节点在双曲空间的中心位置。

国际贸易的长期演进系统基于网络双曲嵌入方法如图 3 (c)。从出口能力的角度,提出了世界能源大宗商品贸易不平衡,多元化、多极化发展。美国和俄罗斯一直占据中心位置,反映这一事实的决定性因素是能源出口能力。特别是,与北海油田的损耗,英国在能源贸易的出口地位已逐渐被边缘化。有趣的是,沙特阿拉伯的能源出口地位已逐渐被边缘化,因为沙特能源政策的方向的变化。亚洲、非洲和欧洲大陆变得活跃的地区,能源贸易市场注入了新的活力。欧洲共同体、中国和印度搬到中央位置后,增加进口的主导地位。而印度已经走向中心地位的超级大国的地位在过去的几年里,美国,这是一个领导人之间的贸易大国,一直是国际贸易的核心。

3.2.2。在双曲空间中复杂的生态系统

秀丽隐杆线虫是一种进化基本的土壤中线虫。它包含大约300个神经元,通过化学突触和神经连接和缝隙连接。尽管一个世纪的调查,线虫神经网络的知识是不完整的 41, 42]。在这里,我们使用一个导演双曲网络嵌入式框架和神经元的潜在几何的入口点来提供一个新的视角研究神经网络的拓扑结构和可视化。

的<我talic> 秀丽隐杆线虫神经网络嵌入在双曲空间几何特性的神经元和几何距离(双曲距离),和拓扑发现符合双曲线的简单的概率和强大的连接规则嵌入。我们比较嵌入结果与真正的神经元的位置和几何距离:神经元的位置距离是神经元之间的相对位置和双曲几何距离距离和角距离。然而,双曲距离在我们的模型是不对称的,它是困难的对于一些真正的任务,如节点聚类分析和节点计算中心。进一步比较在不同的度量空间的距离,我们定义对称距离如下:<我nl我ne-formula> x j = x 一个 , b j + x b , 一个 j 。结果如图 5(一个)和 5 (b)。从结果中,我们发现角距离相似位置的距离。双曲线的距离和位置距离之间的区别,相反,比较大。这不仅表明,神经元之间的有效距离包括其他维度的距离比位置距离而且有效距离的神经系统是一个非线性混合的结果的拓扑信息和空间信息。

现实的网络可以复制的属性聚类,small-worldness, scale-freeness,峰会在双曲空间。的另一个重要特性通常观察到复杂网络的社区结构,在社区内密集的链接,和社区之间的联系是稀疏的 43]。自连接概率是一种双曲递减函数距离,没有角区域包含一个空间关闭集群节点比它们更密集彼此连接的网络。然而,双曲的角距离圆盘显示节点的相似性,和分区的盘是潜在的模块中定义的几何空间( 13]。获得神经网络的社区结构在双曲空间节点坐标获得解决后,庞加莱的最佳分区盘分区被定义为最小化的比例平均距离一个分区。

因为有10个神经功能区域,我们将双曲盘分为10部分36度,比较真实的神经功能区域。注意,角坐标的节点分布<我nl我ne-formula> 0 , 360年 一个关键因素是初始位置的不同选择,这可能改变分区的效果。为了解决这个问题,我们定义了索引<我nl我ne-formula> η 代表社区内的距离的比值(庞加莱磁盘分区)外部距离(剩下的分区),来描述最优分区,<我nl我ne-formula> η ,如下所示: (9) η = = 1 n C j = 1 , j n 1 C j , 在哪里<我talic> n分区和数量吗<我nl我ne-formula> C 代表节点之间的平均距离内部和外部的社区。的范围<我nl我ne-formula> η 是[0,1]。<我nl我ne-formula> η 更接近于1,社会分工越好。

在这一过程中,我们获得的最优分区双曲空间通过选择不同分区的位置开始,以节点之间的最小距离为参考初始分区跨度和最大化<我nl我ne-formula> η 。我们进一步考虑双曲距离和角距离作为计算的基础<我nl我ne-formula> η 结果,如图 5 (c)。由于神经元功能,强大的空间位置的依赖关系的共同信息熵群落结构和功能分区非常低。一个有趣的发现是,一些神经元out-directed排名较高的声望属于相同的神经功能区,外侧神经节,如里亚尔,RIAR, SAAVR RMDR, SMDVR,但分区在双曲空间更分散。这表明有大量的远程的神经元之间的联系<我talic> 秀丽隐杆线虫;例如,神经元里亚尔,在前方,VD12,落后地区,也有类似的双曲盘角的距离,这也是为什么拓扑分区不符合功能分区。此外,双曲嵌入的功能分类是一个补充的功能分区。

4所示。讨论

在这项工作中,我们开发了一个在双曲空间定向网络的映射模型,强调了双方的直接网络的结构。我们特别关注两个主要问题:(1)如何识别不对称的链接拓扑信息,和(2)如何定向网络嵌入双曲空间和使用经验数据来测试是否可行的模型。结果表明,直接链接是隐藏在拓扑信息的重要的方式。基于经验数据,我们将一些真正的定向网络映射为双曲空间,包括经济系统和生物生态系统。我们发现,我们的方法可以揭示定向网络的拓扑特性,如节点的度、度分布、聚类系数、和中心-外围结构。

此外,我们分析了节点的重要性,通过可视化技术进化规则。结果表明,空间位置的节点在双曲空间可以用来量化节点的重要性。节点在空间的位置变化是一致的国家地位在经济制度的演化。更重要的是,类似的现象都观察到社会经济系统和神经系统;即有显著差异的空间聚合和社区的拓扑结构。这反映在两个方面:一个是常见的信息熵在双曲空间的群落结构和空间分布的节点尤其低,和其他节点之间的皮尔逊相关系数双曲距离和真正的距离并不重要。远程链接削弱系统功能的空间集聚,这意味着双曲嵌入反映了集群系统的功能。网络的有效距离是拓扑之间的权衡的结果信息和几何特性。

它需要重申,与二进制网络,指导网络建设的基础是四坐标之间的权衡<我nl我ne-formula> r 一个 ,<我nl我ne-formula> r b ,<我nl我ne-formula> θ 一个 ,<我nl我ne-formula> θ b 。无向网络中嵌入只是基于声望和相似性之间的权衡,这可能偏差预测网络的链接。例如,考虑极端的例子:如果两个节点拥有庞大的出度和入度为0,两个节点必须没有链接。有关的机会当无向网络嵌入很大。最后但并非最不重要,不对称的链接增加嵌入困难,这在一定程度上反映在嵌入的准确性。的前沿网络几何点的群落结构可以用作粗版嵌入在一个隐藏的空间与双曲几何( 44, 45]。视角的中尺度结构、群落结构的贡献应该被纳入嵌入模型在未来的研究中,这可能提高嵌入精度,降低了算法的复杂性。

附录

在本节中,将讨论嵌入方法的性能方面的进一步评估角坐标。目的是观察推断角坐标是否接近真正的角坐标,通过生成合成网络。具体来说,合成后定向网络是由A-PSO模型。推断出角坐标估计的合成网络和嵌入方法。这个过程可以概括如下:

步骤1:预期的程度<我nl我ne-formula> κ 来源于pdf吗<我nl我ne-formula> ρ κ 使用蒙特卡罗模拟和获得的

步骤2:将采样角坐标统一随机从(0,2)

步骤3:合成直接网络可以由连接概率和模型参数

通过这样做,推断角坐标计算的嵌入方法,使用合成的直接网络的拓扑信息。推断出角坐标和实际的散点图可以比较的( 11]。结果表明估计的坐标集B表现良好,如图 6(一)。具体来说,散射点是两条线附近聚集,可拼接成翻译之后沿着一条线<我talic> X设在。然而,散点图 6 (b)无序,这表明该节点的估计偏差角的设置一个很大。这个结果的原因是更有可能相关的过程节点角估计和不对称的挑战。

数据可用性

本文使用的数据从公共数据库和可以从相关网站下载。代码可以从作者 bnuzonywu@163.com

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由中国国家自然科学基金(国家自然科学基金委,批准号。71731002和61573065),为一年级的博士候选人北师大跨学科研究的基础(格兰特BNUXKJC1921)。