文摘
互联网的快速发展和广告市场的快速扩张,广告已经成为最受欢迎的宣传手段。准确的广告推荐是互联网平台的保障收入,和准确的广告点击率预测的前提是准确的推荐。根据需求的更新速度和实时广告平台,广告业务模块的耦合关系可分为两类:离线业务模块和在线业务模块。线下广告管理模块主要是基于数学模型的建设,用于矿山用户和商品特征之间的复杂关系;在线广告管理模块主要是基于用户的实时反馈和推荐策略变化实时通过收集反馈信息。线下广告管理模块,广告点击率预测模型提出了基于注意机制和神经网络,即可以。这种方法提供了更丰富的功能交互信息神经网络层。在线广告管理模块,提出了一种基于高斯过程的实时推荐算法。这个方法可以解决特定功能的普遍性假设在各种环境中。通过耦合的广告点击率预测模型由线下广告管理模块和实时推荐算法的在线广告管理模块,可以实现广告的准确交货。
1。介绍
时代互联网不受欢迎,主要由传统新闻媒体传播广告,和沟通的主要方式是电视,路边广告牌,报纸、广播等等(1]。这些传统广告显示方法需要大量的人力来宣传,投入成本高和收入是慢,,很难有效地管理。网络广告是指广告放在多媒体或网络,于1995年诞生。外观改变了传统的宣传方式,和广告服务提供商开始展示他们的产品和网页浏览器作为主要宣传媒体(2]。随着移动终端的发展,网络广告出现在主要的应用程序。与传统媒体相比,网络广告覆盖面广,针对性强,和大型的受众基础。网络提供了一种新的、高效的连接模式对消费者和企业,这使得网络广告灵活和互动。企业可以立刻通过网络收集消费者反馈数据,如搜索查询记录,广告点击记录,问题反馈,和其他信息。因此,线下广告管理模块之间的耦合关系模型和在线广告管理模块基于机器学习模型提出了可以定量分析收集到的数据平台,进一步提出改进方案,如炼油交付目标,改变交付方法,调整预算分配策略。深层神经网络的广泛应用,传统的点击率和转化率预测模型基于机器学习的算法逐渐取代了深度学习模式3]。深层神经网络模型可以提取用户的兴趣特征和延迟的关系从多源信息和预测未来用户的行为和广告效果(4]。它总结了特征学习和在线广告点击率预测技术研究和分析的研究现状国内外在线广告点击率预测方面的原始数据特征和解决方案,功能学习点击率预测,点击率预测模型建设、评价指标的选择,等等5]。点击率估计可以应用于互联网广告、推荐系统等领域,具有很高的研究价值6]。
2。机器学习模型
2.1。功能分类
离线推荐和在线推荐系统越来越关注功能学习。特性包含商品和用户的属性。充分利用特征信息可以大大提高推荐效率(7]。从机器学习的角度来看,可分为连续特性和离散特性。(1)连续特征:特征值是一个持续的价值。(2)离散的特点:功能是固定的类型属性的值。通常情况下,离散特性可以给一个属性列表,特定特性的值可以在列表中一个或多个值。
逻辑回归算法在机器学习已经大量应用于广告推荐工业化,把每个功能作为一个独立的属性,每个属性被赋予不同的权重。这种方法认为,特征是独立的,因此忽略了特征之间的相关性。在最新的算法理论,交叉特性也称为特性组合。作为一个新概念,它被认为是进一步提高推荐的准确性的关键。根据交叉功能的复杂性,功能交叉分为低阶交叉特性和高阶交叉特性,和一个交叉功能由n特性被定义为立项交叉功能。一阶和二阶特性的组合被定义为低阶交叉特性,和三阶以上的组合特性被定义为高阶交叉功能。
从功能组合的方法,它包括以下两个方案(8]:(1)人工特征组合:交叉特征主要是由专家根据经验选择特性。(2)自动功能组合:由算法自动生成相应的结合特性。
自动功能组合可分为两类:(1)显式特性组合:选择组合的特性,使用启发式搜索来找到最好的特征组合。该方法定义了提前特性结合,具有较强的解释能力。合并后的特性可以作为训练获得的其他机器学习算法的基础。缺点是很难找到最优的特征组合解决方案,这需要大量的计算空间来支持它。(2)隐式特征组合:主要通过神经网络结合的特性,非常适合处理连续的特性,如图片和演讲。由于使用深神经网络,它几乎不解释。
2.2。线下广告管理模块
离线推荐系统主要将推荐问题转换为广告点击率的预测问题。算法主要依赖于建立一个具体的数学模型和与大型数据集训练优化模型参数(9]。该模型准确地预测用户推荐广告的点击率,向用户推荐最好的广告。传统的线下广告推荐算法描述用户和产品之间的关系通过构造低阶交叉特性,叫做低阶点击率预测模型。深度学习的蓬勃发展,越来越多的研究将深层神经网络与离线推荐模型构建丰富的非线性隐式特征,进一步提高了预测精度和被称为高阶点击率预测模型。
本节介绍了一些低阶和高阶点击率预测模型的算法。低阶预测模型包括逻辑回归、因子分解机器,和现场感知分解机。高阶预测模型包括广而深,DeepFM(深层分解机),NFM(神经分解机),并通过神经网络(产品)。
2.2.1。逻辑回归
机器学习中最经典逻辑回归算法也广泛应用于广告点击率预测(10]。首先,该算法假设商品x有k特性,表示为x= (x1,x2、…xk),和习近平代表我特色商品的价值x。之间的关系特点和用户反馈由一阶线性模型,定义如下公式所示:
在向量形式,我们得到的
反馈的结果f(x)被转换为用户点击率的乙状结肠函数,如下公式所示:
的参数和b计算了最大似然估计的概率理论。考虑到数据集,最大对数似然
让β= ( ;b),x= (x;1),然后+b可以缩写为βTx。然后,让p1(x;β)=p(y= 1│x;β),p0(x;β)=p(y= 0│x;β)= 1−p1(x;β),则公式(4)可以写成
公式(6)是一种高阶连续可微凸函数β。根据最优化理论,优化解决方案可以获得的最速下降法和经典牛顿法。LR(逻辑回归)算法具有更少的参数,简单的模型,简单的迭代,和相对简单的参数调整。然而,LR算法非常依赖于特征选择的质量,成本很高。与特征信息的数量的增加,原有的特征维数增加迅速,和功能的数量急剧增加。很难准确地提取信息的手工方法。此外,这种方法不考虑交叉功能的影响,因此模型的预测能力是有限的。
2.2.2。分解机
分解机(FM)是Rendle提出的一种新的模式11]在2010年将一个矩阵分解模型和支持向量机。它关注二阶交叉特性对预测精度的影响。根据逻辑回归算法的概念,最简单的二阶交叉方法公式所示(7)。然而,实际商品的特点主要是离散特性。单热后编码,数据维度大,有效的数据非常稀疏,大部分的特征值是0。在这个时候,简单实现的公式(7),交叉乘积项x我xj大多数的特性是0,所以这个实现不能直接训练。
重量上的分解机执行矩阵分解的因素并设置两个隐藏的向量系数矩阵和构造乘以。隐藏的向量系数矩阵表示如下: 在哪里是我th隐藏因子向量,k是隐藏的系数向量的维数,计算重量的公式吗二阶交叉的特性x我xj下列公式所示:
结合公式(9),分解机的预测函数表示为如下公式所示:
分解机算法可以通过隐式自动构造二阶交叉特征向量内积,和时间复杂度O(kn)。结合逻辑回归算法,它可以在线性时间内完成预测,这是简单而高效。
2.2.3。场传感分解机
Field-aware分解机叫做Field-aware分解机(FFM),这是进一步提高的基础上分解机。算法认为隐藏向量不仅相关功能,而且相关特性所属领域。功能域被定义为类似功能的分类。以衣服的属性为例:服装柔软,材料,和其他特性可以分为材料领域,和服装风格和颜色可分为外观域。每个特性的交集和其他特性进一步提炼成十字路口之间的关系特性和其他类FFM算法。调频认为一个特性是一个领域,所以调频算法可以被视为FFM算法的一个特例。
FFM算法的预报函数如下公式所示:
与FM相比,参数的数量由一个学特性x我被扩展为f×k,f域的数量,k是一个隐藏的因素维度,和整体的时间复杂度是什么O(kn2)。FFM算法具有大量的参数,不能优化成一个线性模型,所以它有大量的计算和大规模数据下效率低。
2.2.4。广而深的
广而深的模型是一个广告点击率谷歌在2016年提出的算法并应用于GoogleStore [12]。该算法提出了两个概念:记忆和泛化。模型的记忆被定义为系统发现已知的商品和相关特征的用户浏览信息记录到日志中。模型的泛化是指系统的能力来获得很少或没有功能相关历史数据。广而深的算法中,记忆是反映在该算法使用专家系统手动选择特性,根据经验对预测结果有很大的影响,而概括反映在模型中使用深神经网络挖掘隐藏的功能组合。
然而,广而深的两部分模型的输入是不同的,和宽阔的部分需要手动选择,所以该算法不是一个端到端的模型中,有一些缺点在处理大规模数据集。然而,广而深的奠定了基础,如何结合神经网络广告点击率预测。
2.2.5。神经分解机(NFM)
广而深的和DeepFM是典型的并行预测模型。线性模型和神经网络模型训练的同时,并给出预测结果与两个模型的结果。他Xiangnan博士和其他人提出,这种并行结构将使模型训练困难,提出了一种连续模型神经分解机器,有机地结合了调频线性模型和神经网络非线性模型在高阶功能交叉。模型图如图1。
NFM算法提出了一系列层前bi-interaction高阶神经网络层。这一层结合任何两个输入特性来构造一个新的向量,然后添加所有向量作为神经网络的输入层,如以下公式所示: 在哪里o被定义为的一些计算向量,所以假设输入向量的维数是什么k,bi-interaction的输出k。bi-interaction层是紧随其后的是由神经网络构造高阶特征交互层(13]。与DeepFM和广而深的算法相比,款层的输入维数大大减少,和时间复杂度O(kn),这使得模型在线性时间内完成计算,和训练难度小于之前的算法。
2.2.6款。并通过
并通过算法的不足的跨业表示原始特征输入神经网络(14),进一步提高了在NFM bi-interaction层,如图2。
模型的核心部分是产品层,分为两个部分:Z功能和R函数,并使用两种方法来构造之间的交互功能。
为了描述,本文假定商品的特性集x= {x1,x2、…xn},x我= {x我1,x我2、…x本土知识},k代表每个特性的维度。的Z函数部分直接连接的原始特性级数作为输入功能,如以下公式所示:
的部分使用向量内积的形式来表达功能的相互作用关系和繁殖原始特性成对获取一个向量的长度 ,如以下公式所示:
产品层连接向量和本系列矢量Z作为神经网络的输入层与数据集和火车。与NFM相比,并通过算法增加了低阶线性的输出属性交互层,其中包含原始功能和交互特性信息,进一步减轻神经网络的训练难度。
2.3。在线广告管理模块
Mandai等人改进的联合算法,建模在线推荐作为一个基于上下文的赌博机器的问题,并提出了一个动态推荐算法使用序列化特性的物品做出决策(15]。在上下文的情况下,该算法根据项目的特点决定推荐和调整整个决策策略基于用户的点击反馈用户的点击效果最大化。对于新生成的物品,该算法可以立即处理它们的特征,然后将它们添加到建议决策序列。
LinUCB算法假设x每一项对应一个d维特征向量x∈Rd,假设有一个期望的奖励之间的线性关系rx一个项目及其特征向量,可以表达的系数向量 对应的项目x。本文假定项目的特征向量x在时间txt和奖励t是rx t期望的奖励,那么满足以下公式:
尽管LinUCB营造学习模式与项目为主体,它构建一个模型θx为每个项目x并修改参数θx通过不断与用户反馈的信息交互。然而,该算法每次观察的特性实际上是用户特性从项目的角度观察。这之后,对每一项建议,计算预期的回报和置信区间的上限,目标用户可以获取和选择适当的项目推荐给用户从两个方面。
3所示。分析耦合关系的广告管理模块
3.1。CTR模型基于注意机制和神经网络
线下广告管理模块的惯例是将推荐问题转化为用户点击率CTR的预测问题,改善推荐效果通过展示广告的高点击率的预测。
算法深入描述了复杂的用户点击广告的行为和特性之间的关系,探讨了低阶和高阶相互作用特性通过注意的结合机制和深层神经网络。该模型框架如图3。该算法首先使用嵌入技术压缩和减少维度的原始编码功能。之后,注意力机制是用来构造低阶交叉特性,然后低阶张量包含交互信息注入深层神经网络对我的高阶非线性的相互作用。最后,张量的非线性特性是转换成相应的预测广告点击概率通过预测层。本节的其余部分介绍了整个算法模块。
3.1.1。输入和嵌入层
每个离散特性是由大量的0和1组成的单个或并编码后,虽然连续特性是由连续的值。算法可以处理这两种功能在同一时间。
3.1.2。交互层的注意机制
输入的注意机制交互层嵌入层降维后的特征。注意机制交互层进行二阶交叉建模输入功能和建构新的特征向量之间根据关注体重值特性。原理图所示4。
从维度的角度来看,的维数e米是一样的原始功能的输入,但向量重建的注意机制包含相关信息与其他特性。
3.1.3。神经网络层
神经网络层使用完全连接神经网络我的高阶非线性特性之间的关系。
这一层的输入输出向量Z重建的注意机制交互层,每一层的神经元之间的权重相乘。神经元之间的计算下列公式所示:
3.1.4。预测层
预测层集成神经网络的输出层和预测用户的点击率根据相应的张量,它显示了推荐系统直观的效果。计算过程如下:
预测结果压缩通过s形的函数。西格蒙德的功能如图5,预测结果映射到0和1之间的数字,这表明实际意义的巧合概率值在0和1之间。
3.2。基于高斯过程的动态推荐模型
基于高斯过程,提出了两种在线广告管理模型。这两种方法都可以在线调整建议策略根据实时反馈的用户和用户最喜爱的产品更少的尝试。此外,提出的两个方法是上下文相关的,也就是说,网上的推荐算法结合用户和项目的特点,可以立即推荐商品池动态变化。
3.2.1之上。高斯过程
高斯过程是一个广泛使用的数学模型,这通常是用来表达的分布函数。与传统的基于模型的机器学习方法不同,高斯过程不表达的模型参数但使用表达相应的分布函数。参数表示方法的优点是,它可以适应所有黑盒功能,这使得该模型不再坚持超参数的调整,并可以有效地模拟的不确定性函数。量化的不确定性,有限的训练数据可以用来探索的数据区域最不可能实现有效的培训。
3.2.2。算法设计
本节首先给出了建议在线推荐系统的流程图,如图6。
商品平台选择一定数量的商品从内容库商品候选人池我。在t圆的建议,推荐系统推荐产品我t用户根据相应的推荐策略preapplication训练模型,和用户对产品作出相应的反馈。每一轮后,系统调整推荐策略根据用户的实时反馈。
4所示。实验仿真分析
4.1。评价指标
摘要LogLoss和AUC是用来分析广告管理模块的耦合关系。这两个指标有不同的推荐效果的担忧。LogLoss直接反映了预测值和真实值之间的差异通过交叉信息熵,而AUC更多关注排名推荐结果的合理性。(1)LogLoss:这个指标主要是法官推荐的准确性基于预测值和实际值之间的差异。LogLoss值越小,越接近推荐的结果是用户的真实评价,系统的和更好的预测效果。这个索引作为损失函数可以和对比模型的训练。评估标准如下公式所示: 在哪里P我的点击率我th广告;y我是真正的点击广告的用户;N是广告的总数在测试集。(2)AUC: AUC值等于样本的概率随机选择积极的排名高于随机选择的负样本。AUC越高,广告管理模块的耦合性能越好。
在实际的模拟中,公式(20.)用于计算AUC值: 在哪里米代表阳性样本的数量;N代表负样本的数量;r我是积极的样本的预测评分;r我负样本的预测评分;δδ(x)是一个指标函数;x是一个布尔变量。当x是真的,δ(x)是1,相反,δ(x)= 0。
4.2。预测精度的比较
根据两个验证标准,算法性能更好。,NFM,并通过算法,结合款和浅交互模型,和LogLoss AUC值明显改善与算法款。这证明了添加一个低阶特性交互模型的神经网络层和重建原始输入特性可以有效地减轻网络的训练难度,提高预测精度。这是显示在图7。
此外,这三个方案比调频在两个索引算法。这个简单线性特征交叉验证能力不足以描述用户和商品之间的复杂关系,我和深层神经网络可以更复杂的非线性交互关系。比较这三种算法,可以进一步改善的预测效果比并和窄带调频。这表明使用注意力机制构建低阶特征交叉比并更有效和NFM算法简单地把原来的功能。此外,在仿真结果,发现款的预测效果不如调频的算法。对于这一现象,猜测MovieLens数据小集体数量,一些特性,和简单的交互关系,和更好的结果可以通过简单的二阶线性交叉,而一个复杂的神经网络的模型复杂,增加了计算开销和降低了预测的准确性。
为了验证上述猜想,相同的仿真实验进行Criteo数据集较大的数据和功能。结果如图8。
Criteo数据集,FM模型的预测结果明显比其他模型与神经网络相结合。这个结果验证数据与多个功能类型和高度稀疏数据,模型只使用低阶特征交叉不能代表复杂的功能关系。此外,在这个实验中,NFM算法的效果略逊于款算法,表明简单的乘法功能的神经网络层起着消极的作用。款,并通过相比,可以提高的影响在某种程度上,这意味着在一个环境极其复杂的功能,更有效的使用注意机制构建低阶特征交互比在NFM,并使用简单的价值倍增。
4.3。低阶相互作用
从图可以看出9,连续模型的训练在训练集的AUC值两种算法不断改进训练集。然而,在验证集,算法获得最佳预测效果款后13轮,AUC值迅速下降,下降的趋势逐渐被夷为平地后30日。虽然可以算法具有相同的现象,随着培训的增加,AUC验证组逐渐减少。然而,同款算法相比,下降率大大降低,这表明,相比原来的特性,将特征向量包含交互信息注入到神经网络层确实有助于降低训练难度和矿业的负担交互式信息网络在某种程度上,从而减轻过度学习的现象。
4.4。Hyperparametric影响
在这一节中,本文将研究嵌入层输出大小,神经网络层的数量,每一层的神经元数量的推荐效果。所有的实验都是基于MovieLens数据集,这两个指标的实验参数设置相同。
固定的尺寸大小的设置嵌入层(命名为嵌入大小)会影响随后的输出尺寸模型。本文观察预测效果的变化通过改变嵌入的大小,结果如图10。
LogLoss实验,增加嵌入大小,LogLoss逐渐降低,当嵌入大小增加到32,LogLoss到达最小值。LogLoss还是AUC值,当嵌入规模太大或太小,预测精度会下降。当嵌入大小太大,转换特征过于复杂,从而增加了模型的训练难度,导致培训不足和影响预测效果。当嵌入规模太小,压缩向量将失去大量的原始信息。
神经网络层的数量大大影响深度学习的性能模型。在这个实验中,不同的网络层将验证对模型性能的影响。为了消除单个算法的机会,本文在NFM算法做同样的实验。结果如图11。
从图11,同一个网络条件下的深度,可以和NFM显示巨大的差异在不同的测试场景。然而,LogLoss值的两个实验也截然不同,这表明,算法的稳定性是有差异的。在所有的网络深度,LogLoss和AUC的可以比NFM,再次证明了效率高的可以。除了神经网络层,每一层的神经元数量也会影响算法的效率。本文对预测效果的影响探索通过改变在每一层神经元的数目。神经网络的数量设置为2层,和结果如图所示12。
从曲线图可以得出结论,神经元的数量相对较少的影响推荐的准确性,该指数变化不到相同的规模。的AUC值可以是NFM略高于,但LogLoss的AUC指数两个算法基本上是相同的从宏观的角度来看,这表明,增加神经元的数量不能增加网络的性能。从图12的不稳定可以NFM也不同条件下的相同数量的神经元。整体性能的一个测试,可以比NFM,而在另一项实验中,NFM的性能优于可以在150 - 500个神经元。
5。结论
随着互联网的快速发展,研究和应用的广告管理模块的耦合关系模型将成为热点。在实际应用程序中,网络广告的特点是高维度,稀疏分布,和快速更新。根据产品的需求率和实时更新,广告管理模块分为离线推荐算法的基础上,构建培训模型和基于决策的在线推荐算法。本文的研究工作主要是基于广告的点击率的预测。通过分析和挖掘用户的特点和产品在真实数据集,数据集预处理。基于注意机制和深层神经网络,本文提出了一种基于高斯过程的在线广告的推荐算法。基于用户和产品的特点,广告管理模块耦合基于机器学习模型为用户提供了最合理的广告推荐。
数据可用性
使用的实验数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者声明,关于这项工作他们没有利益冲突。
确认
这项工作是支持的特殊研发和推广项目批准号下的河南省212102210492,下南洋的科技计划项目批准号KJGG102。