期刊文献+
共找到242篇文章
< 1 2 13 >
每页显示 20 50 100
基于关联数据的命名实体识别 预览
1
作者 刘晓娟 刘群 余梦霞 《情报学报》 CSSCI CSCD 北大核心 2019年第2期191-200,共10页
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对... 命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia 构造了跨领域的中英文命名实体词典;设计了一个基于Hive 的分布式管理数据存储模型,基于该模型实现了对DBpedia 数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus 对算法进行测试,并将算法结果与DBpediaSpotlight、NERSO以及Zwmanta 三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。 展开更多
关键词 命名实体识别 命名实体消歧 关联数据
在线阅读 下载PDF
加权平均Word2Vec实体对齐方法 预览
2
作者 罗钰敏 刘丹 +1 位作者 尹凯 赵宏森 《计算机工程与设计》 北大核心 2019年第7期1927-1933,共7页
针对已有文本相似度计算方法应用在实体对齐上准确率低的问题,提出一种加权平均Word2Vec的实体对齐方法。利用Word2Vec训练文本,得到词向量模型;使用LTP(language technology platform)工具抽取文本中的命名实体并对其进行分词、去停用... 针对已有文本相似度计算方法应用在实体对齐上准确率低的问题,提出一种加权平均Word2Vec的实体对齐方法。利用Word2Vec训练文本,得到词向量模型;使用LTP(language technology platform)工具抽取文本中的命名实体并对其进行分词、去停用词处理,由Word2Vec得到处理后的词向量;根据分词后出现相同词的情况进行加权归一,得到各实体的特征向量;利用特征向量计算余弦相似度得到对齐结果。实验结果表明,与已有的文本相似度方法及未改进的Word2Vec方法对比,所提方法降低了实体对齐的漏检率,提高了准确性。 展开更多
关键词 词嵌入 命名实体识别 中文组织机构名 实体对齐 词向量
在线阅读 下载PDF
基于混合方法的含动词名词短语识别研究
3
作者 方芳 王石 +2 位作者 王亚 符建辉 曹存根 《山西大学学报:自然科学版》 CAS 北大核心 2019年第1期31-40,共10页
随着计算机技术的迅猛发展,知识变成人工智能领域中的一个重要资源。在面向自由文本的自动知识抽取中,名词短语识别是基础的任务之一,尤其是含动词的名词短语。已有的名词短语识别研究更多地着眼于命名实体的识别,范围较窄且不能解决其... 随着计算机技术的迅猛发展,知识变成人工智能领域中的一个重要资源。在面向自由文本的自动知识抽取中,名词短语识别是基础的任务之一,尤其是含动词的名词短语。已有的名词短语识别研究更多地着眼于命名实体的识别,范围较窄且不能解决其他含动词的名词短语,加之含动词名词短语识别存在分词错误、边界确定、特殊结构、标记数据少等难点,含动词名词短语识别目前仍然是一个巨大的挑战。基于此,文章提出了一种神经网络与规则、统计相结合的方法。首先对语句进行预处理,其中包含包括词性、助词、时间、数量词等内容的修正和合并;然后,使用双向LSTM与条件随机场融合的方法对含动词命名实体进行识别;接着使用百度词条、固定搭配、语义分类和描述框架文法的方式对含动词名词短语识别;最后使用随机抽取的多动词文本进行实验和分析,实验结果表明,本文方法达到89%的准确率。 展开更多
关键词 含动词名词短语识别 命名实体识别 语义分类和描述框架文法
基于BGRU-CRF的中文命名实体识别方法 预览
4
作者 石春丹 秦岭 《计算机科学》 CSCD 北大核心 2019年第9期237-242,共6页
针对传统的命名实体识别方法存在严重依赖大量人工特征、领域知识和分词效果,以及未充分利用词序信息等问题,提出了一种基于双向门控循环单元(BGRU)神经网络结构的命名实体识别模型。该模型利用外部数据,通过在大型自动分词文本上预先... 针对传统的命名实体识别方法存在严重依赖大量人工特征、领域知识和分词效果,以及未充分利用词序信息等问题,提出了一种基于双向门控循环单元(BGRU)神经网络结构的命名实体识别模型。该模型利用外部数据,通过在大型自动分词文本上预先训练词嵌入词典,将潜在词信息整合到基于字符的BGRU-CRF中,充分利用了潜在词的信息,提取了上下文的综合信息,并更加有效地避免了实体歧义。此外,利用注意力机制来分配BGRU网络结构中特定信息的权重,从句子中选择最相关的字符和单词,有效地获取了特定词语在文本中的长距离依赖关系,识别信息表达的分类,对命名实体进行识别。该模型明确地利用了词与词之间的序列信息,并且不受分词错误的影响。实验结果表明,与传统的序列标注模型以及神经网络模型相比,所提模型在数据集MSRA上实体识别的总体F1值提高了3.08%,所提模型在数据集OntoNotes上的实体识别的总体F1值提高了0.16%。 展开更多
关键词 命名实体识别 双向门控循环单元 注意力机制
在线阅读 免费下载
PU场景下的生物医学命名实体识别算法研究 预览
5
作者 高冰涛 翟振刚 刘斌 《智能物联技术》 2019年第1期22-28,47共8页
传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实... 传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。 展开更多
关键词 正例未标注学习 隐马尔科夫模型 命名实体识别 文本挖掘
在线阅读 下载PDF
基于强化学习的实体关系联合抽取模型 预览
6
作者 陈佳沣 滕冲 《计算机应用》 CSCD 北大核心 2019年第7期1918-1924,共7页
针对现有的基于远程监督的实体和关系抽取方法存在着标签噪声问题,提出了一种基于强化学习的实体关系联合抽取方法。该模型有两个模块:句子选择器模块和实体关系联合抽取模块。首先,句子选择器模块选择没有标签噪声的高质量句子,将所选... 针对现有的基于远程监督的实体和关系抽取方法存在着标签噪声问题,提出了一种基于强化学习的实体关系联合抽取方法。该模型有两个模块:句子选择器模块和实体关系联合抽取模块。首先,句子选择器模块选择没有标签噪声的高质量句子,将所选句子输入到实体关系联合抽取模型;然后,实体关系联合抽取模块采用序列标注方法对输入的句子进行预测,并向句子选择器模块提供反馈,指导句子选择器模块挑选高质量的句子;最后,句子选择器模块和实体关系联合抽取模块同时训练,将句子选择与序列标注一起优化。实验结果表明,该模型在实体关系联合抽取中的F1值为47.3%,与CoType为代表的联合抽取模型相比,所提模型的F1值提升了1%;与LINE为代表的串行模型相比,所提模型的F1值提升了14%。结果表明强化学习结合实体关系联合抽取模型能够有效地提高序列标注模型的F1值,其中句子选择器能有效地处理数据的噪声。 展开更多
关键词 强化学习 联合抽取 序列标注 命名实体识别 关系分类
在线阅读 下载PDF
BioTrHMM:基于迁移学习的生物医学命名实体识别算法 预览 被引量:1
7
作者 高冰涛 张阳 刘斌 《计算机应用研究》 CSCD 北大核心 2019年第1期45-48,共4页
为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题转换为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目... 为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题转换为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目标领域的识别分类;以相关领域数据为辅助数据集,利用数据引力的方法评估辅助数据集的样本在目标领域学习中的贡献程度,在辅助数据集和目标领域数据集上计算权值进行迁移学习。基于权值学习模型,构建基于迁移学习的隐马尔可夫模型算法BioTrHMM。在GENIA语料库的数据集上的实验表明,BioTrHMM算法比传统的隐马尔可夫模型算法具有更好的性能,仅需要少量的目标领域标注数据即可具有较好的命名实体识别性能。 展开更多
关键词 迁移学习 隐马尔可夫模型 命名实体识别 文本挖掘
在线阅读 下载PDF
基于注意力迭代扩张卷积网络的医学实体识别 预览
8
作者 徐凯 王崎 +2 位作者 康培培 李振彰 刘文印 《现代计算机》 2019年第16期3-6,16共5页
医学命名实体识别对于促进医学研究具有重要作用。针对现有方法计算效率低,精度不高的问题,提出基于注意力迭代扩张卷积(AIDC)的识别方法。使用迭代扩张卷积神经网络计算隐状态,融入多头注意力机制解析句子结构,结合CRF计算出最优标签... 医学命名实体识别对于促进医学研究具有重要作用。针对现有方法计算效率低,精度不高的问题,提出基于注意力迭代扩张卷积(AIDC)的识别方法。使用迭代扩张卷积神经网络计算隐状态,融入多头注意力机制解析句子结构,结合CRF计算出最优标签序列。在NCBI疾病和BC5CDR化学数据集上,AIDC比双向长短时记忆网络快1.9倍,同时也获得较高F1值分别为0.856和0.901。 展开更多
关键词 命名实体识别 卷积 神经网络
在线阅读 免费下载
基于深度学习的法院命名实体识别模型 预览
9
作者 龚启文 程玉 +3 位作者 陈建峡 李超 张帝 龙逸舒 《湖北工业大学学报》 2019年第4期68-72,共5页
命名实体识别作为信息抽取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在法院判决书信息抽取系统中也得到了广泛应用。然而,已有的技术模型在文本中存在大量专有名词或术语时,实体识别的提取效果会变得很差。双向循环神... 命名实体识别作为信息抽取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在法院判决书信息抽取系统中也得到了广泛应用。然而,已有的技术模型在文本中存在大量专有名词或术语时,实体识别的提取效果会变得很差。双向循环神经网络-条件随机场判别模型可对现有的法院判决书条件随机场模型进行优化,实现自动化特征的选取过程,准确率比已有的条件随机场模型更高。 展开更多
关键词 命名实体识别 深度学习 条件随机场模型 双向循环神经网络
在线阅读 下载PDF
基于注意力机制的包装命名实体识别 预览
10
作者 冀相冰 朱艳辉 +2 位作者 徐啸 梁文桐 詹飞 《包装工程》 CAS 北大核心 2019年第15期24-29,共6页
目的为了解决包装行业相关文本命名实体识别困难问题,提出在BiLSTM(Bidirectional Long Short-Term Memory)神经网络中加入注意力机制(Attention)和字词联合特征,构建一种基于注意力机制的BiLSTM深度学习模型(简称Attention-BiLSTM),以... 目的为了解决包装行业相关文本命名实体识别困难问题,提出在BiLSTM(Bidirectional Long Short-Term Memory)神经网络中加入注意力机制(Attention)和字词联合特征,构建一种基于注意力机制的BiLSTM深度学习模型(简称Attention-BiLSTM),以识别包装命名实体。方法首先构建包装领域词典匹配包装语料中词语的类别特征,同时将包装语料转换为字特征和词特征联合的向量特征,并且在过程中加入POS(词性)信息。然后将以上特征联合馈送到BiLSTM网络,以获取文本的全局特征,并利用注意力机制获取局部特征。最后根据文本的全局特征和局部特征使用CRF(Conditional Random Field)解码整个句子的最优标注序列。结果通过对《中国包装网》新闻数据集的实验,获得了85.6%的F值。结论所提方法在包装命名实体识别中优于传统方法。 展开更多
关键词 命名实体识别 包装 注意力机制 BiLSTM 字词联合特征
在线阅读 免费下载
基于深度主动学习的信息安全领域命名实体识别研究 预览
11
作者 彭嘉毅 方勇 +2 位作者 黄诚 刘亮 姜政伟 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第3期457-462,共6页
针对通用领域模型不能很好地解决信息安全领域的命名实体识别问题,提出一种基于字符特性,双向长短时记忆网络(Bi-LSTM)与条件随机场(CRF)相结合的信息安全领域命名实体识别方法.该方法不依赖于人工选取特征,通过神经网络模型对序列进行... 针对通用领域模型不能很好地解决信息安全领域的命名实体识别问题,提出一种基于字符特性,双向长短时记忆网络(Bi-LSTM)与条件随机场(CRF)相结合的信息安全领域命名实体识别方法.该方法不依赖于人工选取特征,通过神经网络模型对序列进行标注,再利用CRF对序列标签的相关性进行约束,提高序列标注的准确性.而且,针对信息安全领域标注数据样本不足的问题,采用主动学习方法,使用少量标注样本达到较好的序列标注效果. 展开更多
关键词 信息安全 命名实体识别 主动学习 神经网络 双向长短时记忆网络 条件随机场
在线阅读 免费下载
基于BLSTM-CRF模型的安全漏洞领域命名实体识别 预览
12
作者 张若彬 刘嘉勇 何祥 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第3期469-475,共7页
非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特... 非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务.该文针对安全漏洞领域,提出一种双向长短期记忆网络BLSTM与条件随机场CRF相结合的安全漏洞领域实体识别模型,并使用基于词典的方法对结果进行校正,F值可达到85%以上.实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量. 展开更多
关键词 安全漏洞 实体识别 BLSTM CRF
在线阅读 免费下载
关于命名实体识别的生成式对抗网络的研究
13
作者 冯建周 马祥聪 +1 位作者 刘亚坤 宋沙沙 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1191-1196,共6页
本文结合条件生成式对抗网络(CGAN)和改进的Wasserstein生成式对抗网络(WGAN-GP),提出一种适合于命名实体识别任务的条件Wasserstein生成式对抗网络模型(CWGAN).该模型借鉴CGAN以文本描述为条件的图像概率分布的思想,来完成以句子序列... 本文结合条件生成式对抗网络(CGAN)和改进的Wasserstein生成式对抗网络(WGAN-GP),提出一种适合于命名实体识别任务的条件Wasserstein生成式对抗网络模型(CWGAN).该模型借鉴CGAN以文本描述为条件的图像概率分布的思想,来完成以句子序列为条件获得标注序列概率分布的任务.该模型的生成器和判别器都采用BiLSTM结构,不同的是生成器生成命名实体标签的概率分布,判别器则为生成器的生成质量打分并反馈给生成器,生成器根据反馈更新梯度从而提升生成标签概率的质量.另外,CWGAN采用梯度惩罚的方法来保证梯度在反向传播的过程中保持平稳,通过拉近真实样本分布和生成样本之间的Wasserstein距离,优化目标函数.最后通过实验验证了该方法的可行性和优越性. 展开更多
关键词 命名实体识别 生成式对抗网络 BiLSTM Wasserstein距离 CWGAN
基于改进seq2seq模型的英汉翻译研究 预览
14
作者 肖新凤 李石君 +2 位作者 余伟 刘杰 刘倍雄 《计算机工程与科学》 CSCD 北大核心 2019年第7期1257-1265,共9页
目前机器翻译主要对印欧语系进行优化与评测,很少有对中文进行优化的,而且机器翻译领域效果最好的基于注意力机制的神经机器翻译模型—seq2seq模型也没有考虑到不同语言间语法的变换。提出一种优化的英汉翻译模型,使用不同的文本预处理... 目前机器翻译主要对印欧语系进行优化与评测,很少有对中文进行优化的,而且机器翻译领域效果最好的基于注意力机制的神经机器翻译模型—seq2seq模型也没有考虑到不同语言间语法的变换。提出一种优化的英汉翻译模型,使用不同的文本预处理和嵌入层参数初始化方法,并改进seq2seq模型结构,在编码器和解码器之间添加一层用于语法变化的转换层。通过预处理,能缩减翻译模型的参数规模和训练时间20%,且翻译性能提高0.4BLEU。使用转换层的seq2seq模型在翻译性能上提升0.7~1.0BLEU。实验表明,在规模大小不同的语料英汉翻译任务中,该模型与现有的基于注意力机制的seq2seq主流模型相比,训练时长一致,性能提高了1~2BLEU。 展开更多
关键词 深度学习 神经机器翻译 seq2seq模型 注意力机制 命名实体识别
在线阅读 下载PDF
基于深度学习的文本中细粒度知识元抽取方法研究
15
作者 余丽 钱力 +1 位作者 付常雷 赵华茗 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第1期38-45,共8页
【目的】改进Bootstrapping方法,建立深度学习模型从文本中抽取多类型细粒度的知识元。【方法】利用搜索引擎和Elsevier关键词构建知识元词库;基于Bootstrapping技术自动构建大规模的标注语料库,利用知识元评分模型和模式评分模型控制... 【目的】改进Bootstrapping方法,建立深度学习模型从文本中抽取多类型细粒度的知识元。【方法】利用搜索引擎和Elsevier关键词构建知识元词库;基于Bootstrapping技术自动构建大规模的标注语料库,利用知识元评分模型和模式评分模型控制标注的质量;基于已标注多类型知识元的语料库训练LSTM-CRF模型,从文本中抽取新的知识元。【结果】基于17 756篇ACL论文摘要抽取'研究范畴'、'研究方法'、'实验数据'、'评价指标及取值'这4种知识元,其人工评价平均正确率为91%。【局限】模型参数的预设与调整需要人工参与,未对不同领域文本进行适用性验证。【结论】引入知识元与模式的评分模型,能够有效缓解'语义漂移'问题;基于深度学习模型抽取知识元实现快速且正确率高,为情报大数据智能分析提供了一种高效可靠的数据获取手段。 展开更多
关键词 知识元抽取 命名实体识别 深度学习 BOOTSTRAPPING LSTM-CRF
基于刑事案例的知识图谱构建技术 预览
16
作者 陈彦光 刘海顺 +2 位作者 李春楠 刘静 孙媛媛 《郑州大学学报:理学版》 CAS 北大核心 2019年第3期85-90,共6页
以2004—2017年公开的30余万份涉毒类案件刑事判决书为研究对象,利用文本分类和信息抽取技术构建面向刑事案例的知识图谱,介绍了知识图谱的构建流程和技术方法.基于所构建的知识图谱,可实现对相关案件关键情节和判决结果的统计应用,为... 以2004—2017年公开的30余万份涉毒类案件刑事判决书为研究对象,利用文本分类和信息抽取技术构建面向刑事案例的知识图谱,介绍了知识图谱的构建流程和技术方法.基于所构建的知识图谱,可实现对相关案件关键情节和判决结果的统计应用,为司法文书的智能化处理提供数据基础. 展开更多
关键词 知识图谱 司法案例 信息抽取 命名实体识别
在线阅读 免费下载
基于BLSTM-CRF中文领域命名实体识别框架设计 预览
17
作者 张俊飞 毕志升 +1 位作者 王静 吴小玲 《计算技术与自动化》 2019年第3期117-121,共5页
为在不依赖特征工程的情况下提高中文领域命名实体识别性能,构建了BLSTM-CRF神经网络模型。首先利用CBOW模型对1998年1月至6月人民日报语料进行负采样递归训练,生成低维度稠密字向量表,以供查询需要;然后基于Boson命名实体语料,查询字... 为在不依赖特征工程的情况下提高中文领域命名实体识别性能,构建了BLSTM-CRF神经网络模型。首先利用CBOW模型对1998年1月至6月人民日报语料进行负采样递归训练,生成低维度稠密字向量表,以供查询需要;然后基于Boson命名实体语料,查询字向量表形成字向量,并利用Jieba分词获取语料中字的信息特征向量;最后组合字向量和字信息特征向量,输入到BLSTM-CRF深层神经网络中。实验结果证明,该模型面向中文领域命名实体能够较好的进行识别,F1值达到91.86%。 展开更多
关键词 BLSTM-CRF CBOW BOSON 命名实体识别
在线阅读 下载PDF
多场景文本的细粒度命名实体识别 预览
18
作者 盛剑 向政鹏 +2 位作者 秦兵 刘铭 王莉峰 《中文信息学报》 CSCD 北大核心 2019年第6期80-87,共8页
命名实体识别一直是数据挖掘领域的经典问题之一,尤其随着网络数据的剧增,如果能对多来源的文本数据进行多领域、细粒度的命名实体识别,显然能够为很多的数据挖掘应用提供支持。该文提出一种多领域、细粒度的命名实体识别方法,利用网络... 命名实体识别一直是数据挖掘领域的经典问题之一,尤其随着网络数据的剧增,如果能对多来源的文本数据进行多领域、细粒度的命名实体识别,显然能够为很多的数据挖掘应用提供支持。该文提出一种多领域、细粒度的命名实体识别方法,利用网络词典回标文本数据获得了大量的粗糙训练文本。为防止训练文本中的噪声干扰命名实体识别的结果,该算法将命名实体识别的过程划分为两个阶段,第一个阶段先获得命名实体的领域标签,之后利用命名实体的上下文确定命名实体的细粒度标签。实验结果显示,该文提出的方法使F1值在全领域上平均值达到了80%左右。 展开更多
关键词 命名实体识别 细粒度类别划分 语料回标
在线阅读 下载PDF
命名实体识别在中药名词和方剂名词识别中的应用 预览
19
作者 龚德山 梁文昱 +1 位作者 张冰珠 马星光 《中国药事》 CAS 2019年第6期710-716,共7页
目的:利用命名实体识别(Named Entity Recognition)技术识别文本中出现的中药名词和方剂名词,并比较两种命名实体识别方法在识别中药名词和方剂名词时的表现。方法:方法一为利用现有的分词工具(如'结巴'中文分词工具等)对文本... 目的:利用命名实体识别(Named Entity Recognition)技术识别文本中出现的中药名词和方剂名词,并比较两种命名实体识别方法在识别中药名词和方剂名词时的表现。方法:方法一为利用现有的分词工具(如'结巴'中文分词工具等)对文本进行分词,之后使用分词后的结果进行中药名词和方剂名词的匹配。方法二为搭建并训练用于中药名词和方剂名词识别的双向长短期记忆(Bidirectional Long Short Term Memory,BLSTM)神经网络模型。首先,采用两种可行的方法实现命名实体识别。其次,比较这两种方法的表现。结果:现有分词工具对中药名词和方剂名词的分词不准确,因此,会导致接下来的匹配阶段出现错误。而通过BLSTM神经网络模型进行命名实体识别,不但可以避免分词错误,而且在实验中表现出较强的歧义处理能力。结论:在应用命名实体识别技术于识别中药名词和方剂名词时,相比使用分词工具先分词后识别,通过训练神经网络模型对中药名词和方剂名词直接识别的方法更合适。 展开更多
关键词 自然语言处理 命名实体识别 BLSTM神经网络 中文分词
在线阅读 下载PDF
融合词位字向量的军事领域命名实体识别 预览
20
作者 车金立 唐力伟 +1 位作者 邓士杰 苏续军 《火炮发射与控制学报》 北大核心 2019年第3期50-55,65共7页
针对军事领域的命名实体识别问题,提出了一种融合词位字向量的命名实体识别方法。该方法将由大规模语料无监督训练得到的字向量与蕴含字在军事词语中词位信息的词位向量进行拼接,使用拼接后的词位字向量用于提出的BI-GRU-CRF命名实体识... 针对军事领域的命名实体识别问题,提出了一种融合词位字向量的命名实体识别方法。该方法将由大规模语料无监督训练得到的字向量与蕴含字在军事词语中词位信息的词位向量进行拼接,使用拼接后的词位字向量用于提出的BI-GRU-CRF命名实体识别模型的训练。在爬取的网络军事语料上对人名、军用地名、军事机构名、军职军衔、军事装备名、军用物资名、军事设施名7类实体进行识别,结果表明,该方法可有效提高军事领域命名实体识别的准确率。 展开更多
关键词 军事 命名实体识别 词位字向量 BI-GRU-CRF 深度神经网络 序列标注
在线阅读 免费下载
上一页 1 2 13 下一页 到第
使用帮助 返回顶部 意见反馈