TY -的A2 -卡诺,胡安·c . AU - Asheralieva艾莉雅盟——Miyanaga Yoshikazu PY - 2016 DA - 2016/12/12 TI -动态资源分配与整合强化学习D2D-Enabled LTE-A网络访问未经授权的乐队SP - 4565203六世- 2016 AB -我们建议设备间的动态资源分配算法(D2D)沟通潜在的长期进化先进(LTE-A)网络与强化学习(RL)申请未授权信道分配。在考虑系统中,inband和外圈框石资源分配的LTE进化NodeB (eNB)不同设备对网络效用最大化的目标signal-to-interference-and-noise比(SINR)约束。因为没有一个既定的控制无证和蜂窝无线电接口之间的联系,eNB不能获得任何未经授权的质量和可用性的信息渠道。因此,考虑问题成为一个随机优化问题,可以通过部署学习理论(估计随机无照通道环境)。因此,我们制定外圈框石D2D访问作为一个动态的单人游戏,玩家(eNB)估计其可能的策略和基于期望效用为它的所有行为只在自己的地方观察使用基于联合效用和战略评估的强化学习算法(JUSTE-RL)与遗憾。提出了资源分配方法演示了算法性能经过少量的RL迭代和超越其他同类方法在能源效率和吞吐量最大化。SN - 1574 - 017 - 2016/4565203 / 10.1155 x你——https://doi.org/10.1155/2016/4565203——摩根富林明-移动信息系统PB Hindawi出版公司KW - ER