TY -的A2 Bangyal Waqas海德尔盟——刘应非盟-乔,Nidan盟——Altinel Yuksel PY - 2021 DA - 2021/02/23 TI -强化学习在Neurocritical和神经外科护理:原理和可能的应用SP - 6657119六世- 2021 AB -动态决策至关重要手术病人的临床护理。强化学习(RL)算法计算方法找到序列在多个次优选择最优决策。本文旨在介绍RL的基本概念,包括三个基本组成部分:国家、行动和奖励。大多数医学研究使用强化学习方法训练在一个固定的观测数据集。本文还回顾了现有实际应用的文献利用强化学习方法,它可以进一步分为统计计算RL RL研究研究。审查提出了几个潜在方面强化学习可以应用在neurocritical和神经外科护理。这些包括序贯治疗策略的颅内肿瘤和创伤性脑损伤,术中内镜运动控制。强化学习的一些局限性是表征的基本组件,积极性违反,验证方法。SN - 1748 - 670 - 2021/6657119 / 10.1155 x你——https://doi.org/10.1155/2021/6657119——摩根富林明——计算和数学方法在医学PB - Hindawi KW - ER