-
Notifications
You must be signed in to change notification settings - Fork 700
基于 PCNN 的远程监督关系抽取模型
leo edited this page Jun 23, 2022
·
3 revisions
在关系抽取任务中引入远程监督学习的方法,尤其是针对远程监督中的标记噪声问题,使用分段的 CNN(Piecewise CNN,PCNN)抽取句子特征向量表示的同时,考虑到同一个 Bag 中句子表达关系的不同重要性,引入了句子级别的 Attention 机制。
(1)句子特征向量表示: PCNN 与 CNN 模型抽取句子特征向量方法相同,组合词和词相对位置的 embedding 表示输入 CNN 模型进行卷积。不同的是,在池化部分,使用分段池化取代前面的最大值池化操作。分段池化根据句子中两个实体的位置将句子分为三个片段,再分别进行池化操作,这样能捕捉句子中的结构信息以及更加细粒度的特征。
(2)针对同一个 Bag 的句子进行 特征抽取,同一个 Bag 的句子中,有些句子对于关系的表达有着比较重要的作用,而有些句子的作用很小,因此,引入 Attention 机制对同一个 Bag 中的句子施加不同的权重。
使用方法:
python main.py --model_name CNN
更多配置见
config.py
文件
参考文献:
- i, G., Liu, K., He, S., Zhao, J.: Distant supervision for relation extraction with sentence-level attention and entity descriptions. In: AAAI. pp. 3060–3066. AAAI Press (2017)