TY -的A2施密德马提亚盟——Krautenbacher Norbert盟泰斯,费边j . AU -福克斯,克丽丝汀PY - 2017 DA - 2017/09/24 TI -纠正分类器对样本选择偏差的两阶段病例对照研究SP - 7847531六世- 2017 AB -流行病学研究通常利用分层数据中罕见的结果或暴露在人为地丰富。这个设计可以提高精度协会测试但扭曲对nonstratified数据预测应用分类器时。几种方法纠正这种所谓的样本选择偏差,但他们的表现仍不清楚尤其是对机器学习分类器。重点是两阶段病例对照研究中,我们的目标是评估,修正执行设置和获取方法适用于机器学习技术,特别是随机森林。我们提出两个新的resampling-based方法类似于原始数据和协方差结构:随机反概率采样过密和参数反概率装袋。我们比较所有随机森林和其他分类器技术,理论上和模拟和真实的数据。实证结果表明,随机森林的利润只有参数反概率装袋提出的我们。对于其他分类器,校正主要是有利的,执行统一的方法。我们讨论的后果不合适的分布假设和原因不同的行为之间的随机森林和其他分类器。总之,我们提供指导选择校正方法在训练分类器有偏见的样本。 For random forests, our method outperforms state-of-the-art procedures if distribution assumptions are roughly fulfilled. We provide our implementation in the R package
荷德。SN - 1748 - 670 - 2017/7847531 / 10.1155 x你——https://doi.org/10.1155/2017/7847531——摩根富林明——计算和数学方法在医学PB - Hindawi KW - ER