研究文章

学会辨别敌对的例子IoHT敏感度不一致的系统

图2

NEs的概率值的可视化和AEs扰动之前预测的标签。生成了AEs TextFooler攻击CNN-based模型。的x设在和y设在表明真正的标签之前和之后的概率值扰动。因为红线 IMDB数据集是一个二进制分类、红线以下的元素标签的例子,预测变化。