研究文章

减轻网络表示的不相容为长尾数据分布和分类

图2

该方法的框架概述。在这里,训练数据集分成三个子集和三个专家作为教师。每个专家负责从其相应的转移知识为学生模型子集。之间的知识转移的特征图,只有渠道激活强度高,含有更多的知识,我们认为将用于蒸馏。滤波通道的详细信息介绍部分4.3