研究文章
纠正分类器对样本选择偏差两阶段病例对照研究
表1
属性和性能校正方法的逻辑回归和随机森林。属性如下:(i)校正尝试了;(2)数据的协方差结构学习试图公正;(3)学习是基于一个包含大量的数据集
的观察比原来的分层数据集(见(
3))。标准是实现(“✓”),显然不满足(“✓”),或没有履行(“
”)。
|
| 校正方法 |
根据部分属性3.1.3 |
足够的性能 |
| (我) |
(2) |
(3) |
逻辑回归 |
随机森林 |
|
| 没有校正 |
|
|
|
|
|
| IP采样过密 |
✓ |
|
✓ |
✓ |
|
| IP装袋 |
✓ |
✓ |
|
✓ |
|
| 成本核算 |
✓ |
✓ |
|
(✓) |
|
| 修改后的击杀 |
✓ |
(✓) |
✓ |
(✓) |
|
| 随机IP采样过密 |
✓ |
✓ |
✓ |
✓ |
|
| 参数IP装袋 |
✓ |
✓ |
✓ |
✓ |
✓ |
|
|