文章摘要:在知识库构建中,最重要的部分就是提取文本中的三元组,而三元组的提取需要实体抽取和实体关系抽取技术。针对实体抽取提出了一种CWATT-BiLSTM-LSTMd (Character Word Attention-Bidirectional Long Term and Short Term Memory - long short-term memory)模型。该模型可以有效解决实体抽取中一词多义问题,并且可以模拟标签的依赖问题。在实体抽取的基础之上进行实体关系的抽取,为解决实体关系抽取中远程监督的局限性,提出一种基于强化深度学习的RL-TreeLSTM(Reinforcement Learning Tree Long Short Term Memory)模型。该模型分为选择器和分类器,选择器选择有效的句子传入分类器,分类器对句子中实体对的关系标签进行预测。选择器和分类器共同训练以优化选择和分类过程,可以有效降低远程监督带来的噪音。通过实验表明提出的模型和方法能有效地提高实体及其关系的抽取。
文章关键词:
论文分类号:G350;TP391.1
文章来源:《地质科技通报》 网址: http://www.dzkjqbzz.cn/qikandaodu/2021/1025/835.html
地质科技通报投稿 | 地质科技通报编辑部| 地质科技通报版面费 | 地质科技通报论文发表 | 地质科技通报最新目录
Copyright © 2018 《地质科技通报》杂志社 版权所有
投稿电话: 投稿邮箱: