研究文章

比起一个改进的基于变压器神经机器翻译策略:Interacting-Head关注

表9

综合评价得分的interacting-head关注IWSLT16 DE-EN评价集和测试集。

模型 数据集 子集 头/头的大小
32/16 64/8

Interacting-head关注 IWSLT16 dev 24.38 19.98
测试 22.85 18.54

请注意。单元的性能是蓝色。