研究文章

联合实体和关系的提取利用强化学习和深入学习

算法1

培训过程 则将。
初始化BILSTM,注意层,Tree-LSTM随机参数
Pre-train BILSTM、注意层和Tree-LSTM分别
时代=
每个输入句子
使用上面的深度学习模型自动提取的特征 ,并生成
= 1,2
=奖励和状态后采取的行动
执行梯度下降法步骤:
更新的规则是
在哪里 更新步骤, 是奖励函数(部分3.1), 下次是政府行动的一双。
,
结束了
结束了
结束了