文摘

了解客户偏好考虑决定选择建模在工程设计中是至关重要的。现有文献表明,外生影响时(例如,产品和客户属性)是客户考虑的决定,决定因素目前尚不清楚如何内生效应(如产品之间的intercompetition)将影响这些决定。本文提出一种基于网络的方法基于指数随机图模型来研究客户根据工程设计考虑的行为。我们建议的方法能够通过各种网络结构建模中内生影响产品(例如,明星和三角形)除了外生影响和预测两个产品是否conisdered在一起。评估该模型,我们比较反对二元网络模型,只考虑外源效应。使用来自中国的买家调查数据automarket在2013年和2014年,我们评价拟合优度和两个模型的预测能力。结果表明,我们的模型有一个更好的选择比二元网络模型和预测精度。这强调了内生影响客户的重要性考虑决策。本研究获得的见解帮助解释如何内生效应与exogeous交互效应影响客户的决策。

1。介绍

复杂网络建模与仿真显示自己的能力在许多工程应用,如无线网络、传感器网络、智能电网,供应链,交通系统,和许多其他人。最近的事态发展在数学建模技术和计算算法研究复杂网络工程设计领域的也备受关注。复杂网络研究已用于工程设计的关系模式,有效的网络可视化的关联产品,社会互动和建模(1和横向校正客户和产品之间的交互2,3]。在复杂产品的设计,网络分析被用来描述一个产品的网络组件共享技术接口或连接。各种网络指标,如聚类系数和路径长度,用于描述产品结构和研究设计质量和产品结构之间的相关性。基于网络的度量标准,例如,向心性,索萨et al。4)定义了三种模块化的措施来改善产品架构的理解。最近工作索萨et al。5)发现,主动管理网络结构(如中心)的使用有助于提高复杂产品设计的质量。网络分析也被应用于研究设计师的网络了解组织行为(6,7和提高多学科设计效率8]。在这篇文章中,而不是专注于产品或设计师,我们利用复杂网络建模与仿真技术研究的另一个关键利益相关者在产品设计、客户。我们的目标是利用复杂网络来研究客户偏好支持产品设计和开发。特别是,在本文中,我们研究客户的考虑决策的建模产品coconsideration关系在购买,同时,两种产品被认为是一个复杂的网络。

2。背景和文献综述

选择建模是极大的兴趣在工程设计预测产品需求和市场份额作为工程设计的函数属性和目标市场客户档案(9]。选择模型集成到优化设计考虑到客户偏好在支持工程设计决策(9- - - - - -12]。先前的模型大多假设顾客选择有限理性和有潜在的实用工具来排名选择考虑设置”,一组可用的产品替代个人将认真评估通过比较前做最后的选择”(13]。构建选择模型的一个关键步骤是确定考虑设置(14]。作为豪泽et al。15表示“如果客户不考虑你的产品,他们不能选择它。”

从企业的角度来看,了解顾客的偏好,考虑是很重要的对于识别至关重要的产品特性,消费者愿意支付。现有的研究(16,17)还透露考虑集现象,考虑集的大小往往是小得多(约5 - 6品牌)的总数比选择在一个市场。因此,小改变个人的考虑集(大小或选项)可能显著改变整个市场的格局和重塑在现有市场的竞争关系。因此,了解顾客的偏好,考虑优化产品配置带来了新的机遇,解决客户需求,建立有竞争力的设计策略,并使品牌和定位等战略举措。

管理行为影响了客户的直接考虑的决定,例如,通过改变品牌的可访问性(18和通过控制使用量和知名度19]。然而,定量研究客户的考虑决定是挑战性的考虑是一个中间的构造,不是最终的选择(15]。不确定性的决策环境和大量改变决策规则。现有文献主要集中在推理决策规则启发式(20.- - - - - -22),如认知简单规则(23],它已被证明是有效的在汽车和基于web的采购。有三个方法来揭示考虑决策规则启发式(15]。第一种方法只利用最后的选择和产品特性考虑集。它采用两级consider-then-choose决策过程,并使用贝叶斯推断模型参数或最大似然估计。典型的方法包括贝叶斯(24),选择集合爆炸(25- - - - - -27),和软约束(28]。第二种方法通过设计实验措施的考虑在体外,类似于选择聚合分析练习(15]。最好的决策规则解释观察到的考虑决定与贝叶斯估计29日和机器学习的模式匹配算法30.]。第三种方法措施决策规则直接通过self-explicated问题[31日]。

尽管考虑集的多样性研究,很少有研究关注理解底层的过程生成客户考虑集。之间的联系考虑集和驱动因素的形成原因还不是很清楚。特别是,我们知之甚少如何固有的市场结构,包括现有产品之间的相互依存协会之间的客户,影响考虑的决定。为了解决这个研究缺口,我们开发一个基于网络的方法模型建模产品coconsideration关系客户考虑的行为。如图1,提出网络方法的核心思想是将客户考虑集转换为产品协会网络中,节点代表产品和链接代表两个产品之间的coconsideration。因此,理解客户考虑的问题可以通过预测来解决特定的网络结构的函数协会网络形成的产品属性和客户人口统计数据。值得注意的是,作为客户的链接是一个聚合形成决策,链接(即。coconsideration关系)暗示产品之间的竞争。因此,我们的方法使我们能够研究客户偏好和市场结构以集成的方式。这是不同于研究选择建模(例如,选择单项分对数模型(32对个人),专注于建立模型。同样值得注意的是,我们的研究不同于基于主体的模型,假设某些个人上打规则(33]。相反,我们的方法是数据驱动的,利用观测数据来驱动建立coconsideration模型使用模型参数估计和预测分析。

最近,网络方法已经在推荐系统也广泛使用34- - - - - -38]。推荐系统是常用的推荐产品给客户基于他们搜索(考虑)。从网络表示的角度来看,我们的方法类似于由两部分构成的投影方法(39)中使用推荐系统的研究。然而,该网络的方法是不同于基于网络的推荐系统的算法(37,38在两个方面:第一,最终目标是不同的。推荐算法的尝试预测未来喜欢和兴趣挖掘数据在过去的用户活动。常用方法包括相似性方法(例如,协同过滤(38),基于内容分析(40),和狄利克雷分配(41])和最近开发了混合方法36,42]。本文中提出的方法依赖于网络统计推断模型,它强调扣除解释。它的目标是为客户提供一个解释框架考虑行为,这样一个反馈回路可以创建工程设计从客户的偏好。因此,本研究的最终目标是向产品设计对于更大的市场份额。在这样一个背景下,预测在这个研究是用于比较和验证目的。第二,网络在建模的作用是不同的。在现有的基于网络的推荐算法,输入需要各种基于特定于节点的属性(例如,学位),本质上是外生因素,生成相似性度量。在我们的方法中,模型的输入可以考虑现在的网络结构(例如,三角形和循环),代表产品之间的相互依赖性,这样的效果可以评估固有的竞争关系。在考虑这种能力支持更好的理解行为和可能提供额外的洞察的设计研究主要由用户的偏好工程属性。

当前工作建立在我们先前的研究工作。在我们最近的研究中,傅et al。43)开发了一种两级由两部分构成的网络建模方法研究客户偏好选择的解耦上打过程分两个阶段,考虑阶段,我们现在的阶段。王等人。44利用一个二元网络根据分析方法来预测产品coconsideration关系外生因素,如产品属性和客户人口统计数据。通过特定的映射技术进步(例如,涡轮增压技术)产品属性的变化,作者还演示了如何促进技术变革的影响的预测模型在产品coconsideration和市场竞争。

在这篇文章中,我们将进一步研究复杂网络建模的力量在理解产品coconsideration关系通过考虑外生因素内生因素例如,产品相互依存和固有的市场竞争。的核心技术是基于指数随机图模型(ERGM) [45]。而二元网络预测模型是方便基于外生因素之间的关联产品,ERGM包含内生因素以及其他网络相互依赖关系(46]。

研究目标因此本研究是双重的:(一)建立网络模型框架,支持客户的考虑行为的解释,使预测未来的市场竞争;(b)比较ERGM和二元网络模型来研究如果将产品通过内生相互依存网络效应将更好地捕获动力学基础产品coconsideration关系的形成。剩下的论文有五个部分。部分3提出了研究的问题,介绍了产品coconsideration网络的构建方法。我们还简要提供二元网络模型的技术背景和ERGM。部分4描述了汽车的案例研究和数据源。我们提出二元模型的估计结果和ERGM说明如何使用特征相关的网络结构来表示产品相互依存,也就是说,内生效应。评估每个模型的性能,部分5评估模型适合同时在全球网络级别和当地联系的水平。部分6评估每个模型在预测未来coconsideration性能的关系。最后,部分7提出了研究结果的实际意义,为未来的研究方向。

3所示。网络建设和网络模型

3.1。网络建设

产品coconsideration网络构造从客户考虑使用数据集。一个链接(即的存在。,coconsideration) between two nodes (i.e., products) is determined by an association metric, called电梯(47]。方程(1)定义了电梯价值产品之间 相似点态互信息(48),电梯措施的可能性coconsideration的两种产品各自的频率的考虑。 在哪里 的概率是一对产品吗 被客户coconsidered在所有的可能性,根据收集到的考虑数据计算;和 的概率是个别产品 正在考虑。的电梯值表示有可能两个产品coconsidered所有客户的总水平,标准化的产品在整个市场人气。coconsideration我们使用这个概率,不同的市场份额,直接取决于总购买,捕捉产品之间的竞争。与电梯价值,可以构造一个无向coconsideration网络使用下面的二进制规则: 在哪里截止是确定的阈值的存在一个链接吗 两个节点之间 根据统计,电梯价值 表明两种产品是完全独立的44];一个电梯值大于 表明这两个产品是coconsidered更有可能比预期的机会。应用程序上下文的基础上,研究兴趣,和模型要求,不同电梯值大于 可以用作截止值。方程(1)和(2)表明,网络邻接矩阵是对称和二进制。本文的研究重点是预测两种产品是否coconsidered与否。多长时间他们coconsidered的程度(反映了竞争强度)并不是本文的研究重点。这就是为什么我们决定使用二进制网络而非加权网络。建模一个二进制网络,虽然计算简单,不是一样丰富的价值网络。因此,我们测试了我们的研究结果的鲁棒性估计基于不同截止值的多个模型电梯

3.2。研究问题在网络环境

一旦构造coconsideration网络,客户考虑的可能性两个产品可以制定coconsideration链接的可能性。预测的目的,这将导致这个问题的因素(例如,产品属性和客户人口统计)驱动的形成一对节点之间的联系,以及显著的每个因素的联系形成过程中所起的作用。前面提到的研究问题重塑是如何构建一个网络模型来预测coconsideration链接是否存在网络结构,产品属性,和客户档案。

我们认为有两个决策场景底层coconsideration关系。第一个场景(图2(一个))假设每一对产品由客户单独评估。甚至在考虑多个备选方案集,对待每一个两个的比较选择独立于其他成对比较。第二个场景需要一个更一般的相互依赖的假设,形成一个coconsideration链接不是独立于其他coconsideration链接。例如,在图的图2的可能性coconsideration产品a和B之间的关系可能会影响到他们都是与产品c coconsidered上述两种网络模型,对二元网络模型采用简单独立的假设,而ERGM假定所有coconsideration共享一个节点是相互依存的关系。在本文中,我们将检查是否ERGM的驱动因素提供了一个更准确的理解产品coconsiderations评估两个模型的拟合优度和可预测性。

3.3。介绍网络模型

二元网络模型类似于标准的逻辑回归element-wise网络矩阵,在给出的模型是:

响应 是二进制的链接 节点之间 中定义的(2)。节点属性转换为一个向量的二元变量, 。每个二元变量措施的相似或差异对节点的属性节点和一个特定的运算函数(见表1用于各种二元变量)。二元网络模型使用二元变量 预测观察到的复杂结构coconsideration链接组成的网络。系数 表明个体在形成一个二元变量的重要性coconsideration关系。注意,在这个模型中,每个链接的概率是独立评估。

3.3.1。指数分布随机图模型

除了二元属性的影响,在网络,很多链接连接到同一个节点有内生关系。这意味着一个链接的出现往往是与其他相关链接。ERGM引入的(49,50)是很出名的,能力建模之间的相互依赖在社交网络上的链接。例如,两人有一个共同的朋友更有可能互相成为朋友,因此三人友谊关系形成一个三角形结构。具体的网络配置,包括边缘,明星、三角形和周期,可以用来代表不同类型的相互依存。ERGM解释全球网络结构作为一个集体自组织出现各种本地网络配置。ERGM背后的逻辑是,它认为一个观测网络, ,作为一个特定的实现从一组可能的随机网络, ,后,分布在以下方程(45]: 在哪里 是一个向量的模型参数, 网络是一个向量的统计数据和属性,然后呢 是一个数量,以确保正常化(4)是一个合适的概率分布。方程(4)表明,观察任何特定网络的概率成正比的加权组合网络的指数特征:一个统计量 如果相应的更有可能发生 是正的。注意,在ERGM,网络本身是一个随机变量和的概率评估在整个网络,而不是一个链接(3)二元模型。总之,使用ERGM上下文中的产品的优点有三重coconsideration: 使用网络配置描述之间的内生影响coconsideration链接, 提供各种二元变量模型不同类型的外生影响产品的属性,和 集成两个外生属性效果和内源性网络效应在一个统一的框架中。

3.3.2。外生二元变量和内生网络效应

外生二元变量用于ERGM允许建模的二元模型和两种类型的一对节点之间的影响与特定的变量:基线的属性和同质性的影响效果,也就是说,两个节点的属性之间的相似或差异(44,51]。产品的上下文中coconsideration网络基线检查是否影响产品与特定的属性更容易coconsidered比没有该属性的产品;例如,进口车型可能更容易coconsidered相比国内汽车模型。是否两个产品同质性影响往往coconsideration链接相似的属性。例如,客户更有可能考虑和比较产品和类似的价格。二元变量的发展支持的研究固有的产品竞争客户偏好的理解之外。

1总结了创建二元变量的指导方针为不同类型的属性,如二进制、分类和连续。产品属性(一)——(c)下,链接的力量 是由相应的属性 与产品有关。产品属性之外,我们还将介绍nonproduct相关属性(d)。例如,客户人口统计模型中可以包含允许的预测的影响客户的关联/产品coconsideration关系相似。创建一个二元变量的相关客户的属性、多变量关联技术,例如,接头对应分析(JCA) (52),被用来计算客户相关属性的相似度作为两个产品点之间的距离( 在度量空间)。在本文中,我们遵循的方法53)开发两类距离变量,顾客感知的距离特征和人口的距离。客户感知特征user-proposed标签来显示他们对产品的看法,如年轻的、复杂的、面向业务的。客户的人口统计变量包括收入和家庭信息的每个车型的用户组。包含客户通过这些基于距离的二元关联的变量是一个独特的特性,我们的网络模型的方法。

不同的二元模型,只能考虑外源性二元影响,ERGM支持产品相互依存的建模内源性网络效应。在本文中,我们特别感兴趣的两个网络配置相互依存,星型和三角形,相互依存1]。恒星结构(图3(一个))表明一个焦点产品的概率与他人coconsidered现有coconsideration的数量关系是有条件的重点产品(例如,图中的节点上面有三个coconsideration链接)。积极的明星效应表明,产品更容易被coconsidered与另一个产品是否受欢迎,已经coconsidered和许多其他人。(图的三角形结构3 (b))表明,如果两个产品coconsidered相同的其他产品,他们更可能相互coconsidered。积极的明星效应可能包括恒星与不同数量的链接(如2、3、4、5、或者更多)。同样,一个链接可以有许多三角形连接不同的节点数量(1、2、3、4、5,也许更多)。明星和三角形的影响意味着多路产品竞争。把明星的影响与多个链接和多个三角形,我们使用两个网络配置几何加权度几何加权扁共享合作伙伴分别为(54]。

4所示。案例研究:建模工具Coconsideration网络

4.1。应用程序上下文和数据来源

当考虑购买车辆,客户决定车型(例如,福特Fusion和本田雅阁),在某种程度上,根据他们的喜好车辆属性(如价格、力量,使)和他们的人口统计数据(如收入和年龄)。了解这些因素对汽车的影响coconsideration关系,我们使用数据从一个买家automarket调查在2013年的中国。数据集由大约50000辆新车购买者的反应大约400独特的车辆模型。被调查涵盖了各种各样的问题,包括人口、车辆属性和客户感知车辆的特征。的受访者表示他们购买的汽车以及中小学选择他们认为之前最后的购买。这些反应是用来构建车辆coconsideration网络。车辆属性验证的报告的调查工具目录数据库。

4.2。车辆Coconsideration网络

以下章节中讨论的方法3.1,我们构造一个车辆coconsideration网络截止= 5,结果389个节点和2431个二进制的网络链接。一个更小的截止生成一个密集的网络,但也有类似的分析结果。我们已经测试了我们的模型截止在1、3、5、7,分别,没有明显的变化趋势模型的结果。图4显示了一个示例的部分车辆coconsideration网络有11个车型。节点大小程度成正比,和颜色显示的集群车辆更容易彼此coconsidered。在每个链接的数量电梯值指示coconsideration的强度。

2总结了一些描述性的网络特征。例如,平均程度表明,平均每辆车有12.5 coconsidered车辆和表明市场竞争的整体强度。聚类系数(CC),另一方面,措施的凝聚力或分割汽车市场(44]。的平均当地CC值0.26显示了强大的凝聚力嵌入到网络,和车辆模型经常参与多路的竞争市场。描述网络分析有助于了解automarket的选择提供指导网络配置ERGM。

4.3。独立的二元变量的描述性统计

许多外生二元变量与车辆相关的属性,如汽车价格的差异和总和变量,发动机功率、油耗、车辆和匹配变量的细分市场,并使起源,可能会改变的模式中coconsideration车辆模型。我们使用信息增益分析选择12种最重要的二元变量所有可能22二元变量之一。日志转换(基础2)应用于价格和发动机功率变量来抵消大异常值的影响。表3显示了独立变量的描述性统计。

总共六个车辆属性,进口,价格,发动机功率,燃料消耗,细分市场,和车辆的使起源在模型中,被认为是。进口是一个二进制变量描述是否进口汽车(进口= 1,37.3%)或国产(进口= 0,62.7%)。建议在表1和部分3.3.2,我们构造一个二元变量的总和进口占其基数效应是否每对汽车既是进口(13.90%的双值2),一个进口和一个国内(46.76%)值1,或国内(值为0 39.34%)。如果导入属性的基数效应是正的,总和变量的系数进口应该是积极的,也就是说,两辆汽车模型的总和值越高,他们就越有可能coconsidered在一起。同样,变量之和价格(以人民币和转换使用 ),权力(在制动马力必和必拓和转换使用 )描述了基线的影响价格和电力产品coconsideration关系。我们构建一个变量,燃料消耗,除以公升的汽油每辆车每100公里/车辆电力消耗(100马力)。因此,这个值越小,油耗更低的汽车模型。不同变量的价格、力量和燃料消耗捕获同质性效果,用于测试的车型相似属性(更小的差异)更有可能coconsidered在一起。

autoindustry竞争十分激烈,所以大多数车型都非常清楚目标客户和竞争在一个特定的细分市场。因为车辆的细分市场是类别变量,我们使用二元匹配变量模型来研究两辆车从同一段是否会影响他们coconsideration模式。所有17中的前三段在我们的样例的c级轿车轿车车型(21.6%),b轿车(11.3%),和小工具(11.1%)。同样的,使起源也是一个分类变量,它描述了该地区的汽车品牌是哪里来的。31日,11日,我们的数据显示,90年和13个车型在欧洲,日本,韩国,和美国,分别98车型在中国生产与本土品牌和其他local-foreign合资品牌来自欧洲 ,日本 ,韩国 ,和美国 匹配的变量细分市场使起源用于占人们的同质性行为比较相同的汽车品牌和起源。

4.4。使用ERGM模型实现

4显示了估计系数和相应的优势比从二元拟合和ERGM模型。除了上面描述的变量,ERGM包括三个额外的变量联系在一起网络配置。的边缘变量控制链接的数量,确保估计网络具有相同的密度与观察到的一个。从概念上讲,如果我们没有了解汽车的属性或coconsideration关系,边缘估计两辆车的可能性将随机coconsidered,像一个截距项回归或“基准利率”。的明星效应三角形的效果讨论部分3.3.2是衡量几何加权程度几何加权扁共享合作伙伴,分别。根据ERGM的结果,大多数车辆属性,除了价格基线效应和权力差异,有统计学意义( 价值< 0.001),因此车辆coconsideration中扮演很重要的角色。例如,两辆车的差异较小的价格和燃料消耗coconsidered更有可能。如果一辆车的价格模型是另一辆车的价格两倍,他们的coconsideration的几率只有45%的几率的两辆车一样的价格。同样,一升/ 100公里/ 100必和必拓燃料消耗的差异会导致93%的几率相比coconsideration汽车相同的燃料消耗。车辆匹配的属性,两辆车在同一细分市场的1.94倍是coconsidered比在不同的段,和两辆车使起源coconsidered的1.69倍更有可能比那些有不同的起源。最后,负系数的距离客户的人口统计显示,客户提供不同的人口不太可能coconsider相同的车辆。总之,结果表明,消费者更有可能考虑汽车类似的感知特性,如价格、油耗、细分市场,使来源。

如表所示4的系数三角形的效果是0.70 ( 价值< 0.001)。积极的迹象表明,两辆车coconsidered与相同的车辆更容易彼此coconsidered。这意味着一种多路分组和比较存在于客户的考虑决定。产品在一个人的选择,考虑设置是相同的时间。另一方面,积极的系数明星效应(反向衡量几何加权程度)表明,大多数的汽车往往有同样数量的coconsideration链接和没有几辆车,比其他人更可能coconsidered。与这些内源性网络效应,ERGM相比显著提高模型适合改善二元模型表示的BIC从16005年到14021年。在下一节中,我们进行系统的比较分析来评估如何模拟网络匹配观察车辆coconsideration网络。

5。模型拟合优度比较

拟合优度(GOF)执行分析比较模型的二元和ERGM模型。使用二元和ERGM模型(3)和(4),分别基于估计的参数表4之间,我们计算的预测概率coconsideration对车辆模型。与预测的概率高于阈值(如0.5)被认为是链接存在。一旦从两个模型模拟网络,我们比较他们对观察到的2013年coconsideration网络在网络层和链路的水平。网络级评估使用光谱拟合优度(SGOF)规55),而链接水平评价使用各种精度测量,如精度,回忆,F分数(见部分5.2更多的细节)。

5.1。网络级比较

光谱拟合优度(SGOF)计算如下: 在哪里 的意思是欧几里得距离谱拟合模型 是零平均欧氏距离谱模型,即Erdős-Renyi (ER)随机网络中每个链接都有一个固定的概率存在或缺席。因此,SGOF措施解释观察到的数量结构的拟合模型,对空表示百分之一的改进模型。欧几里得光谱距离计算 规范(也称为欧几里得范数)之间的误差观测网络 模拟网络, ,哪里错误 是观察到的光谱之间的绝对差网络( )和模拟网络( ),也就是说, 因为计算的光谱 需要整个网络的相邻矩阵的特征值,这个评价是在网络层进行。拟合模型准确描述数据时,SGOF达到最大值1。SGOF空零意味着没有改进模型。SGOF度量提供了一个总体的比较不同的模型。modeler时特别有用不清楚哪些网络结构的统计数据是重要的在解释观察到的网络。例如,在我们的coconsideration网络,很难说哪些网络指标,如平均路径长度或平均CC,市场结构的理解更重要。在这种情况下,SGOF还提供了一个简单的综合评价。表5列出了二元模型和ERGM SGOF分数。从每个模型,基于1000年预测网络的结果是说,5日,第95个百分位SGOF表明ERGM明显优于二元模型。

5.2。链路级别的比较

除了网络级比较,预测网络也链接级别的评估。我们定义了一个对车辆与coconsideration关系积极的,而那些没有链接。因此,真阳性(TP)链接的数量预测的积极,也积极观察网络;的假阳性(FP)链接的数量预测积极但实际上消极、错误预测的优点。类似地,真正的负(TN)链接的数量预测持负面态度,观察到负;的假阴性(FN)链接的数量预测消极但观察积极。以0.5为阈值的预测概率(它用于物流功能),我们计算以下三个指标来评估性能的预测二元模型和ERGM。精度是真阳性预测的分数在所有积极的预测;回忆是真阳性的分数预测所有积极的观察;F分数调和平均数的吗精度回忆(见表6公式)。这些指标采用,因为每个人都从不同的角度反映了模型的能力。可能的情况下,模型预测许多链接(例如,所有的链接都预测在极端情况下和FP很高),这样精度很低,回忆高,而另一个模型可以预测很少联系,导致高FN,因此高吗精度和低回忆。因此,使用精度回忆只有实际上揭示了模型的性能。因此F分数经常被推荐作为一个公平的措施,因为它认为这两个吗精度回忆并提供平均分数。在这项研究中,我们使用三个指标来提供一个完整模型的性能。

如表所示6,几乎所有性能指标表明ERGM优于二元模型。特别是,回忆ERGM是明显高于二元模型。二元模型只能预测coconsideration大约4.2%的份额,而回忆ERGM达到31.1%。这些结果暗示产品相互依存的包容ERGM的确提高了模型适应和更好的解释观察到的产品coconsideration关系。唯一指标的二元模型有更好的价值精度。阈值的概率等于0.5,二元模型预测170年才联系看作是积极的,其中101是正确的。小分母精度公式,即TP + FP= 170,产生更大的精度

因为不同阈值的预测概率可以影响的价值精度回忆,我们评估precision-recall曲线(56)通过改变阈值从0到1得到一个更全面的理解。模型有较大的曲线下的面积(AUC)性能更好(57]。当评估二元分类器在不平衡数据集(更多情况下一个比另一个变量值),这是我们面临的情况,斋藤和Rehmsmeier57已经证明了精度- - - - - -回忆比其他阈值曲线曲线更有意义,比如接受者操作特征(ROC)曲线。图5表明,对于任何给定的回忆的价值,精度ERGM是严格高于二元模型和ERGM优于二元模型的全光谱阈值的概率(我们研究了ROC曲线和画相同的结论)。

总之,比较在网络层和链路级验证我们的假设产品相互依存,也就是说,内生效应,产品coconsideration的形成中起着重要作用,因此客户关系考虑的决定。在下一节中,我们研究两种模型的预测能力。

6。模型比较可预测性

在本节中,我们将进一步比较两个模型的可预测性。我们使用模型开发与2013年的数据集(例如,该模型系数见表4)来预测车辆coconsideration关系在2014年的市场。从一个说明性的例子在图6,我们可以看到一些汽车模型(例如,节点4)在2014年退出了市场,一些新车型(如节点6和节点7)被引入市场,但大多数车型(例如,节点1 2 3和5)保持在2014年的市场。在本文中,我们专注于预测未来coconsiderations重叠的车型中连续两年以来新车型可能会引入关键特性不捕获在前面的市场,如电动汽车。在我们的研究中,315年车型在2013年和2014年。因此,这里的任务是预测是否每一对的汽车在这些315年车型将在2014年coconsidered鉴于2014年新车属性,新客户人口统计,现有的市场竞争结构(市场竞争结构被模型系数的三个网络配置包括边缘,明星效应,三角形的效果讨论部分4所示。4),和模型系数估计基于2013年的数据。

最对的汽车都有相同的二元状态(即。coconsidered与否)在2013年和2014年。例如,如果两个车型没有coconsidered 2013年,客户继续不coconsider这两个2014年。这种情况下并不感兴趣,因为预测不存在更容易是因为网络数据集的不平衡性质,它不提供新的见解。同样地,持久coconsideration也预计在2013年和2014年。因此,我们关注两个预测场景的变化:出现和消失的coconsideration链接从2013年到2014年。如表所示7在47724对汽车没有coconsidered 2013年,1202对被认为是在2014年。改变的事件不是coconsidered变成coconsidered表明市场竞争的变化可能引起车辆属性,如价格的变化。另一方面,1731对2013年汽车coconsidered在315车型,但1087对2014年不再coconsidered。我们表明了两例表的最后一列72014网络使用2013的预测模型在哪里感兴趣的事件。这两个“是”情况下,预测新兴coconsideration和消失coconsideration链接,都代表coconsideration状态的变化从2013年到2014年,模型预测的积极成果。这样的预测更加困难(然而,实质上更有用)获得比其他两个“不”nochange病例。通过测试二元和ERGM模型,我们检查模型有更好的预测能力,假设coconsideration的驱动因素和客户偏好的特征模型系数表4从2013年到2014年不变。

在预测场景中,我们输入车辆和客户配置文件属性的新值从2014年到模型中。当使用ERGM,的特点网络配置基于2013年的数据计算也为预测作为输入。一旦每一对的概率模型预测的汽车模型,我们计算性能指标分别在两个场景: 精度回忆预测新兴coconsideration coconsidered车型,47724对中 精度回忆预测的消失coconsideration 1731对2013年汽车coconsidered之一。的精度回忆预测计算中使用同样的部分5.2。的精度分数的比例是正确预测链接的数量(如纠正预测新兴coconsideration coconsideration或失踪)的数量预测模型。的回忆分数的比例是正确预测链接的数量在感兴趣的事件的数量(2014年真正的新兴coconsideration coconsideration或失踪)。

8显示的结果预测精度回忆基于预测的概率的计算0.5作为阈值在两个场景。预测新兴coconsideration ERGM比二元模型有更好的性能。具体来说,基于车辆属性的二元模型往往是训练过度,只有一小部分最可能预测链接,即9 1202年新兴coconsideration关系。另一方面,ERGM预测111年(超过10倍)新兴coconsideration相同精度。概率阈值为0.5,ERGM和二元模型有类似的性能预测的差异消失coconsideration链接。图7 (b)表明ERGM优于二元模型在几乎所有点的精度- - - - - -回忆曲线。事实上,公共关系曲线(图7)表明,ERGM在整个范围的阈值优于二元模型在预测场景。

因此,我们得出这样的结论:ERGM比二元模型具有更好的可预测性。除了GOF健康测试,上述预测试验进一步验证我们的假设,在相互依赖关系在网络建模更好解释了coconsideration网络。在这个案例研究中,在GOF中执行的这些分析和预测分析表明,车辆coconsideration关系受到他们现有的市场上竞争。

7所示。关闭评论

在本文中,我们提出一个基于网络的方法来研究客户偏好在考虑决策。具体来说,我们应用电梯协会度量客户考虑转化为产品coconsideration网络中节点展示产品和链接代表coconsideration产品之间的关系。coconsideration创建网络,我们采用两个网络模型、二元模型和ERGM,预测两种产品是否coconsideration关系。使用车辆的设计作为一个案例研究中,我们进行系统的研究,确定影响客户coconsideration决策的重要因素。这些因素包括车辆属性(价格,权力,燃料消耗,进口,使起源,细分市场)客户人口统计数据的相似性,和现有的竞争结构(即。间的相互依存,coconsideration被选择网络配置)。执行统计回归得到模型的参数估计,执行和比较分析来评估模型的拟合优度和预测能力的车辆coconsideration网络。我们的研究结果表明,ERGM优于二元模型在GOF测试和预测分析。本文两个贡献相关工程设计:(a)一个严格的基于网络的分析框架来研究产品coconsideration支持工程设计决策的关系,和(b)一个系统的评价框架,比较不同网络模型使用GOF和预测技术精度回忆

这项研究提供了三种实用的见解coconsideration automarket在中国的行为。首先,客户是在考虑潜在的车型。两种模型显示明显的同质性的影响汽车价格和客户人口统计形成coconsideration链接,也就是说,车型等类似的价格和定位类似的人口收入和家庭规模更有可能被认为是在相同的考虑集。然而,ERGM显示更有影响力的司机,如汽车细分市场的同质性效应和起源。这些发现证实了内部automarket集群。第二,ERGM模型表明,恒星结构明显减少但coconsideration网络更多的三角形。除了车辆和客户属性的影响,ERGM还说明了汽车模型,获得等量的考虑可能会参与多路coconsideration。第三,基于GOF和预测模型的比较分析表明,ERGM方法,捕获coconsideration的相互依存关系,有助于提高产品coconsiderations的预测。

最后,有一个分析模型在这个应用程序上下文可以提高未来探索包括如果场景分析,旨在预测现有产品的市场反应在不同设置属性,作为证明(44]。ERGM以来一个更好的模式和可预测性,这将有助于更准确地预测未来市场趋势和援助产品功能满足客户需求的优先级以及工程设计和产品开发的支持。未来的研究应该扩展网络方法纵向加权网络模型框架,它不仅预测一个链接的存在还coconsideration车型之间的强度在随后的年。加权网络模型将有助于发现的细微不同的客户考虑集,因此产品设计提供更多的洞察和市场预测。

信息披露

的一个早期版本的一部分工作是在2017年国际会议上提出工程设计(58]。

的利益冲突

作者宣称没有利益冲突有关的出版。资金来源中提到的应答不导致任何利益冲突有关出版的手稿。

确认

作者欣然承认金融支持从NSF cmmi - 1436658和Ford-Northwestern联盟项目。