期刊文献+
共找到410篇文章
< 1 2 21 >
每页显示 20 50 100
基于双向注意力机制图像描述方法研究 预览
1
作者 陶云松 张丽红 《测试技术学报》 2019年第4期346-350,364共6页
大多数图像描述任务中每个单词的生成都依赖于图像全部信息和生成的上文信息,其中包括许多无关的图像信息,而且没有学习下文信息.为解决该问题,提出了一种双注意力机制,先使用上一次的图像显著信息与词向量一起预测当前的隐层状态,再使... 大多数图像描述任务中每个单词的生成都依赖于图像全部信息和生成的上文信息,其中包括许多无关的图像信息,而且没有学习下文信息.为解决该问题,提出了一种双注意力机制,先使用上一次的图像显著信息与词向量一起预测当前的隐层状态,再使用当前的隐层状态预测当前图像显著信息.将双注意力机制与双向长短期记忆网络结合起来构成双向双注意力网络,并与卷积神经网络共同构成图像描述系统框架.该框架首先采用卷积神经网络提取图像特征,然后将图像特征输入到含有注意力机制的双向长短期记忆网络中,双向双注意力网络同时获取前向和后向的图像显著信息与隐层状态,产生图像描述.在数据集Flickr30k与MSCOCO上进行模型训练与测试.结果表明,模型分别与只含有注意力机制和只含有双向循环神经网络模型相比,图像描述准确率获得了提高. 展开更多
关键词 图像描述 注意力机制 双向长短期记忆网络 双注意力机制 双向双注意力网络
在线阅读 免费下载
基于改进混合CTC/attention架构的端到端普通话语音识别 预览
2
作者 杨鸿武 周刚 《西北师范大学学报:自然科学版》 CAS 北大核心 2019年第3期48-53,共6页
端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进... 端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率. 展开更多
关键词 语音识别 链接时序分类 注意力机制 混合CTC/attention 端到端系统
在线阅读 免费下载
基于Self-Attention模型的机器翻译系统 预览
3
作者 师岩 王宇 吴水清 《计算机与现代化》 2019年第7期9-14,共6页
近几年来神经机器翻译(Neural Machine Translation,NMT)发展迅速,Seq2Seq框架的提出为机器翻译带来了很大的优势,可以在观测到整个输入句子后生成任意输出序列。但是该模型对于长距离信息的捕获能力仍有很大的局限,循环神经网络(RNN)、... 近几年来神经机器翻译(Neural Machine Translation,NMT)发展迅速,Seq2Seq框架的提出为机器翻译带来了很大的优势,可以在观测到整个输入句子后生成任意输出序列。但是该模型对于长距离信息的捕获能力仍有很大的局限,循环神经网络(RNN)、LSTM网络都是为了改善这一问题提出的,但是效果并不明显。注意力机制的提出与运用则有效地弥补了该缺陷。Self-Attention模型就是在注意力机制的基础上提出的,本文使用Self-Attention为基础构建编码器-解码器框架。本文通过探讨以往的神经网络翻译模型,分析Self-Attention模型的机制与原理,通过TensorFlow深度学习框架对基于Self-Attention模型的翻译系统进行实现,在英文到中文的翻译实验中与以往的神经网络翻译模型进行对比,表明该模型取得了较好的翻译效果。 展开更多
关键词 神经机器翻译 Seq2Seq框架 注意力机制 Self-Attention模型
在线阅读 下载PDF
基于序列到序列模型的抽象式中文文本摘要研究
4
作者 余传明 朱星宇 +1 位作者 龚雨田 安璐 《图书情报工作》 CSSCI 北大核心 2019年第11期108-117,共10页
[目的/意义]为更好地处理文本摘要任务中的未登录词(out of vocabulary, 00V ),同时避免摘要重复,提高文本摘要的质量,本文以解决00V问题和摘要自我重复问题为研究任务,进行抽象式中文文本摘要研究。[方法/过程]在序列到序列(sequence t... [目的/意义]为更好地处理文本摘要任务中的未登录词(out of vocabulary, 00V ),同时避免摘要重复,提高文本摘要的质量,本文以解决00V问题和摘要自我重复问题为研究任务,进行抽象式中文文本摘要研究。[方法/过程]在序列到序列(sequence to sequence, seq2seq)模型的基础上增加指向生成机制和覆盖处理机制,通过指向生成将未登录词拷贝到摘要中以解决未登录词问题,通过覆盖处理避免注意力机制(attentionmechanism)反复关注同一位置,以解决重复问题。将本文方法应用到LCSTS中文摘要数据集上进行实验,检验模型效果。[结果/结论]实验结果显示,该模型生成摘要的ROUGE ( recall -oriented understudy for gisting evaluation)分数高于传统的seq2seq模型以及抽取式文本摘要模型,表明指向生成和覆盖机制能够有效解决未登录词问题和摘要重复问题,从而显著提升文本摘要质量。 展开更多
关键词 抽象式文本摘要 序列到序列模型 注意力机制 覆盖机制 指向生成机制
融合Attention多粒度句子交互自然语言推理研究
5
作者 程淑玉 郭泽颖 +1 位作者 刘威 印鉴 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1215-1220,共6页
自然语言推理的很多问题都可以抽象为句子匹配问题,传统的匹配方法采用的是对句子向量或句子间的词向量做匹配,这些方法都只关注句子自身的语义信息,忽略句子之间的组合特征,造成语义损失.本文提出多粒度句子交互匹配方法,引入Attentio... 自然语言推理的很多问题都可以抽象为句子匹配问题,传统的匹配方法采用的是对句子向量或句子间的词向量做匹配,这些方法都只关注句子自身的语义信息,忽略句子之间的组合特征,造成语义损失.本文提出多粒度句子交互匹配方法,引入Attention机制,通过不同粒度、不同层次的句子交互,利用深度神经网络模型(BiLSTM)对句子蕴含关系进行分类.本文方法在SNLI语料库上进行了丰富的实验,结果表明该方法在自然语言推理任务上比当前最优的方法获得了更好的表现. 展开更多
关键词 自然语言推理 句子匹配 Attention机制 多粒度
基于BLSTM_attention_CRF模型的新能源汽车领域术语抽取 预览 被引量:1
6
作者 马建红 张亚梅 +2 位作者 姚爽 张炳斐 郭昌宏 《计算机应用研究》 CSCD 北大核心 2019年第5期1385-1389,1395共6页
为提高新能源汽车领域术语抽取准确率,面向新能源汽车专利文本提出一种领域术语抽取模型。传统的领域术语抽取方法过度依赖人工定义特征和领域知识,无法自动挖掘隐含特征,其识别性能过度依赖所选特征的质量。从深度学习的角度出发,提出... 为提高新能源汽车领域术语抽取准确率,面向新能源汽车专利文本提出一种领域术语抽取模型。传统的领域术语抽取方法过度依赖人工定义特征和领域知识,无法自动挖掘隐含特征,其识别性能过度依赖所选特征的质量。从深度学习的角度出发,提出了一种基于attention的双向长短时记忆网络(bidirectional long short-term memory,BLSTM)与条件随机场(conditional random fields,CRF)相结合的领域术语抽取模型(BLSTM_attention_CRF模型),并使用基于词典与规则相结合的方法对结果进行校正,准确率可达到86%以上,方法切实可行。 展开更多
关键词 领域术语抽取 attention机制 双向长短时记忆网络 条件随机场 词典 规则
在线阅读 下载PDF
面向图像自动语句标注的注意力反馈模型 预览
7
作者 吕凡 胡伏原 +2 位作者 张艳宁 夏振平 盛胜利 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第7期1122-1129,共8页
图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的... 图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的基础上引入注意力反馈机制,利用关注信息的图像特征指导文本生成,同时借助生成文本中的关注信息进一步修正图像中的关注区域,该过程不断强化图像和文本中的关键信息匹配、优化生成的语句.针对常用数据集Flickr8k, Flickr30k 和MSCOCO 的实验结果表明,该模型在一定程度上解决了注意力分散和语句顺序错乱问题,比其他基于注意力机制方法标注的关注区域更加准确,生成语句更加通顺. 展开更多
关键词 图像自动语句标注 注意力机制 注意力反馈
在线阅读 下载PDF
基于双向多维度自注意力机制的文本情感分析方法 预览
8
作者 尹良亮 孙红光 +2 位作者 贾慧婷 索朗卓玛 李世鼎 《信息与电脑》 2019年第9期45-48,共4页
针对循环神经网络或者长短时记忆网络,远距离的相互依赖特征,要经过若干时间步骤的信息累积才能将两者联系起来,而距离越远,有效捕获的可能性越小的问题,笔者提出一种多维度,双向自注意网络(MDiSAN)的情感分析研究方法。引入双向多维度... 针对循环神经网络或者长短时记忆网络,远距离的相互依赖特征,要经过若干时间步骤的信息累积才能将两者联系起来,而距离越远,有效捕获的可能性越小的问题,笔者提出一种多维度,双向自注意网络(MDiSAN)的情感分析研究方法。引入双向多维度自注意会在计算过程中直接将句子中任意两个单词的联系通过一个计算步骤直接联系起来,使得远距离依赖特征之间的距离被极大缩短,能有效地利用特征。在计算每个特征时,能获取更准确的语义特征。在使用斯坦福情绪树库(SST)进行实验,将之前的模型与MDiSAN进行比较测试准确性。MDiSAN提高了最高精度(由CNN-Tensor给出)0.52%。与大量现有结构使用树的模型相比,MV-RNN,RNTN和Tree-LSTM,MDiSAN的表现分别优于7.32%,6.02%和0.72%。此外,MDiSAN比基于CNN的模型有更好的性能。 展开更多
关键词 文本评论 情感分析 注意力机制 自注意网络 循环神经网络 长短时记忆网络
在线阅读 下载PDF
面向文本结构的混合分层注意力网络的话题归类 预览
9
作者 车蕾 杨小平 +2 位作者 王良 梁天新 韩镇远 《中文信息学报》 CSCD 北大核心 2019年第5期93-102,112共11页
针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组... 针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字-词语-句层次。TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用。在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率。 展开更多
关键词 深度学习 注意力机制 混合分层注意力网络 话题归类
在线阅读 下载PDF
Attention机制在脱机中文手写体文本行识别中的应用
10
作者 王馨悦 董兰芳 《小型微型计算机系统》 CSCD 北大核心 2019年第9期1876-1880,共5页
脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的... 脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的方法实现脱机中文手写体文本行的识别.该方法基于encoder-decoder框架,首先用CNN提取特征,然后通过BLSTM进行编码,最后将BLSTM的输出结果再结合Attention,输入到LSTM进行解码.该方法在针对具有语义信息的CASIA-HWDB2. 0-2. 2数据集上字符准确率达到了95. 76%,比传统的encoder-decoder框架提升了12. 83%. 展开更多
关键词 文本行识别 脱机中文手写体 Attention机制 LSTM
电力市场中基于Attention-LSTM的短期负荷预测模型
11
作者 彭文 王金睿 尹山青 《电网技术》 EI CSCD 北大核心 2019年第5期1745-1751,共7页
电力市场环境下,精准的短期负荷预测可以保障电网安全稳定运行,但电价的实时波动增加了负荷变化的复杂性,加大了预测难度。针对这一问题,采用最大信息系数法分析电价及历史负荷与当前时刻负荷的相关性,为预测模型输入特征的确定提供依... 电力市场环境下,精准的短期负荷预测可以保障电网安全稳定运行,但电价的实时波动增加了负荷变化的复杂性,加大了预测难度。针对这一问题,采用最大信息系数法分析电价及历史负荷与当前时刻负荷的相关性,为预测模型输入特征的确定提供依据。在此基础上,提出了基于Attention-LSTM (attention long short-term memory,Attention-LSTM)网络的短期负荷预测模型。该模型充分利用负荷的时序特性,并采用Attention机制突出对负荷预测起到关键作用的输入特征。以澳大利亚某地区真实数据为算例,分别应用Attention-LSTM模型与其他模型进行仿真实验。结果表明,所提方法在预测精度和算法鲁棒性方面均优于其他模型。 展开更多
关键词 负荷预测 电力市场 最大信息系数 LSTM Attention机制
基于Attention机制的卷积神经网络文本分类模型 预览
12
作者 赵云山 段友祥 《应用科学学报》 CAS CSCD 北大核心 2019年第4期541-550,共10页
文本分类是自然语言处理的重要内容,而有效提取文本全局语义是成功完成分类任务的关键.为了体现卷积神经网络提取特征的非局部重要性,在模型中引入Attention机制并建立了包含4个AttentionCNN层的A-CNN文本分类模型.其中,AttentionCNN层... 文本分类是自然语言处理的重要内容,而有效提取文本全局语义是成功完成分类任务的关键.为了体现卷积神经网络提取特征的非局部重要性,在模型中引入Attention机制并建立了包含4个AttentionCNN层的A-CNN文本分类模型.其中,AttentionCNN层中普通卷积层用于提取局部特征,Attention机制用于生成非局部相关度特征.最后,使用A-CNN模型分别在情感分析、问题分类、问题答案选择等数据集上进行了实验和对比分析.结果表明:相比于其他对比模型,A-CNN模型完成上述3个文本分类任务时的最高精度分别提高了1.9%、4.3%、0.6%,可见A-CNN模型在文本分类任务中具有较高的精度和较强的通用性. 展开更多
关键词 文本分类 卷积神经网络 Attention机制 非局部相关度
在线阅读 下载PDF
基于路径相互关注的网络嵌入算法 预览
13
作者 钱付兰 黄鑫 +1 位作者 赵姝 张燕平 《南京大学学报:自然科学版》 CAS CSCD 北大核心 2019年第4期573-580,共8页
网络嵌入,或者称为网络表示学习,旨在将网络中的节点映射到表示空间中,生成低维稠密的向量,从而在保留网络结构信息的前提下对网络中的节点进行表示,而后通过已有的机器学习方法解决诸如链接预测、节点分类、社团发现和网络可视化等下... 网络嵌入,或者称为网络表示学习,旨在将网络中的节点映射到表示空间中,生成低维稠密的向量,从而在保留网络结构信息的前提下对网络中的节点进行表示,而后通过已有的机器学习方法解决诸如链接预测、节点分类、社团发现和网络可视化等下游任务.随机游走算法可以很好地探索网络中节点的局部结构,然而之前的基于随机游走的表示学习算法只能为节点产生一种角色嵌入,没有考虑到和不同邻居进行交互时节点扮演的不同角色嵌入.因此,提出一种基于路径相互关注的网络嵌入算法,使用节点随机游走产生的上下文信息,通过注意力机制为每个节点生成上下文相互关注的节点嵌入.在真实数据集上的实验结果表明,与三个经典的网络嵌入算法相比,该算法具有更好的表现。 展开更多
关键词 网络表示学习 随机游走 相互关注 注意力机制
在线阅读HTML 免费下载
融合元数据及attention机制的深度联合学习推荐 预览
14
作者 张全贵 李志强 +1 位作者 张新新 曹志强 《计算机应用研究》 CSCD 北大核心 2019年第11期3290-3293,共4页
融合元数据的协同过滤推荐即混合推荐算法是目前推荐系统领域研究的热点,能一定程度地解决数据稀疏及冷启动等问题。但融合元数据现有的建模方法大多数建立于用户/项目属性权重相同的情景下,以至于用户项目间重点关系表达不显著,难以获... 融合元数据的协同过滤推荐即混合推荐算法是目前推荐系统领域研究的热点,能一定程度地解决数据稀疏及冷启动等问题。但融合元数据现有的建模方法大多数建立于用户/项目属性权重相同的情景下,以至于用户项目间重点关系表达不显著,难以获得较好的推荐性能。针对上述问题,提出一种融合元数据及attention机制的深度联合学习推荐方法。它利用双深度网络联合学习,其中一个网络基于隐反馈数据实现矩阵非线性分解以学习用户/项目个性化关系,另一个利用attention机制自动捕捉用户/项目关键属性对推荐工作的影响,通过赋予不同属性权重凸显的用户偏好关系建模辅以扩展模型。实验结果表明,所提推荐算法在MovieLens 100K和MovieLens 1M两个公开数据集上均表现出较为优越的推荐性能。 展开更多
关键词 元数据 属性权重 attention机制 深度联合学习 非线性分解
在线阅读 下载PDF
基于seq2seq和Attention机制的居民用户非侵入式负荷分解
15
作者 王轲 钟海旺 +1 位作者 余南鹏 夏清 《中国电机工程学报》 EI CSCD 北大核心 2019年第1期75-83,共9页
非侵入式负荷分解(nonintrusive load monitoring,NILM)是大数据分析在智能配电系统中为终端用户提供的重要应用之一,能够提升对负荷的认知水平,显著提升需求侧响应的潜力。长期以来,传统的NILM算法存在误判率高,功率分解值准确度低等... 非侵入式负荷分解(nonintrusive load monitoring,NILM)是大数据分析在智能配电系统中为终端用户提供的重要应用之一,能够提升对负荷的认知水平,显著提升需求侧响应的潜力。长期以来,传统的NILM算法存在误判率高,功率分解值准确度低等问题。为此,采用深度学习的框架,提出一种基于序列到序列和Attention机制的NILM模型。该模型首先将输入的有功功率时间序列通过词嵌入映射到高维向量,并利用基于长短时记忆模型的编码器进行信息提取;然后通过引入Attention机制的解码器,从提取的信息中选取与当前时刻相关度最高的信息,用于解码并最终得到负荷分解结果。提出的深度学习网络模型能够显著提升对信息的提取与利用能力。基于REFITPowerData数据集的测试结果验证了方法的有效性。 展开更多
关键词 非侵入式负荷分解 深度学习 序列到序列 Attention机制
基于attention机制的LSTM神经网络超短期负荷预测方法 预览 被引量:1
16
作者 李昭昱 艾芊 +1 位作者 张宇帆 肖斐 《供用电》 2019年第1期17-22,共6页
随着电力系统中分布式能源及可调控柔性负荷等的增多,电力系统负荷的随机性增强,且电力系统智能化发展,使得可获得数据急剧增长。为充分利用历史负荷数据,提高超短期负荷的预测精度,提出一种基于attention机制的LSTM超短期负荷预测方法... 随着电力系统中分布式能源及可调控柔性负荷等的增多,电力系统负荷的随机性增强,且电力系统智能化发展,使得可获得数据急剧增长。为充分利用历史负荷数据,提高超短期负荷的预测精度,提出一种基于attention机制的LSTM超短期负荷预测方法。首先,通过分析负荷数据的自相关性,选取预测点前168h的负荷数据作为网络输入,并针对坏数据进行辨识修正,随后通过Adam算法实现网络训练。最后,通过与标准BP神经网络的预测结果的MAPE指标进行对比,验证了所提方法的可行性及效果。 展开更多
关键词 超短期负荷预测 LSTM网络 attention机制 相关性 标准BP神经网络
在线阅读 下载PDF
神经机器翻译的系统融合方法 预览
17
作者 谭敏 殷明明 段湘煜 《厦门大学学报:自然科学版》 CAS CSCD 北大核心 2019年第4期600-607,共8页
为了提高机器翻译模型的泛化能力,基于神经机器翻译系统,将系统融合技术应用于模型训练过程.在神经机器翻译系统的基本结构——编码器-解码器结构的基础上,提出5种融合方法(平均融合、权重融合、拼接融合、门机制融合和注意力机制融合)... 为了提高机器翻译模型的泛化能力,基于神经机器翻译系统,将系统融合技术应用于模型训练过程.在神经机器翻译系统的基本结构——编码器-解码器结构的基础上,提出5种融合方法(平均融合、权重融合、拼接融合、门机制融合和注意力机制融合)分别应用于多个编码器-一个解码器的融合、多个编码器-多个解码器的融合和一个编码器-多个解码器的融合.在中英翻译任务上进行实验,相对于基准系统,系统融合方法改进的机器翻译模型的机器双语互译评估(BLEU)值最终提升了0.59~3.01个百分点.实验结果表明,系统融合能有效地提升译文质量. 展开更多
关键词 神经机器翻译 循环神经网络 系统融合 注意力机制 门机制
在线阅读 免费下载
基于指针生成网络的自动摘要 预览
18
作者 赵增顺 孙骞 +2 位作者 杨皓然 滕升华 常发亮 《计算机工程与设计》 北大核心 2019年第9期2692-2696,共5页
通过对生成式自动摘要常用方法中的基于注意力机制的序列到序列基本模型进行研究,发现基本模型存在摘要细节错误、摘要短语重复、训练效率低等问题。针对这些问题,对基本模型进行改进。通过引入指针网络的复制机制,将其与基本模型的生... 通过对生成式自动摘要常用方法中的基于注意力机制的序列到序列基本模型进行研究,发现基本模型存在摘要细节错误、摘要短语重复、训练效率低等问题。针对这些问题,对基本模型进行改进。通过引入指针网络的复制机制,将其与基本模型的生成机制相结合,共同指导摘要的生成,有效提高摘要细节的准确率;通过引入覆盖率向量,对注意力机制进行二次利用,使摘要的重复短语大大降低。实验结果表明,改进模型优于基本模型,基本解决了摘要细节错误和短语重复的问题,验证了其有效性。 展开更多
关键词 序列模型 注意力机制 指针网络 复制机制 覆盖率向量
在线阅读 下载PDF
基于序列到序列模型的文本到信息框生成的研究 预览
19
作者 鲍军威 周明 赵铁军 《智能计算机与应用》 2019年第3期1-5,10共6页
本文展示了一种序列到序列的模型(Seq2Seq)来基于文本生成信息框(Infobox),信息框指的是一组"属性-值"对。该模型以端到端的方式工作,可利用一个编码器将一个文本段落表示成一个隐向量序列,然后通过解码器来生成信息框。本文... 本文展示了一种序列到序列的模型(Seq2Seq)来基于文本生成信息框(Infobox),信息框指的是一组"属性-值"对。该模型以端到端的方式工作,可利用一个编码器将一个文本段落表示成一个隐向量序列,然后通过解码器来生成信息框。本文在WIKIBIO数据集上进行实验。研究提出的序列到序列模型取得了58.2的F1值,该结果比流水线式的基准方法显著提升了21.0个百分点。实验结果表明,本模型具有以生成序列的方式来生成"属性-值"对的能力。引入注意力与拷贝机制可以提升模型的准确率。更重要的是,研究观察到该拷贝机制有能力从输入文本中拷贝稀有词来生成目标端信息框中的"值"。 展开更多
关键词 文本到信息框生成 序列到序列模型 注意力机制 拷贝机制
在线阅读 免费下载
基于注意力机制的群组行为识别方法 预览
20
作者 王传旭 龚玉婷 《数据采集与处理》 CSCD 北大核心 2019年第3期406-413,共8页
在基于视频图像的群组行为识别方法中,传统的深度学习方法大多使用标准(最大/平均)池化操作对卷积特征进行处理,并且未考虑群组行为中的关键人物对群组行为分类的重要性。针对以上问题,本文提出一种基于注意力机制的模型来检测群组行为... 在基于视频图像的群组行为识别方法中,传统的深度学习方法大多使用标准(最大/平均)池化操作对卷积特征进行处理,并且未考虑群组行为中的关键人物对群组行为分类的重要性。针对以上问题,本文提出一种基于注意力机制的模型来检测群组行为视频中的行为,重点关注活动中的关键人物,根据注意力权重的不同分配动态地对卷积特征进行池化,最终正确识别视频图像中的群组行为。此模型在群组行为数据集CAD(Collective activity dataset)和CAE(Collective activity extendeddataset)上的识别准确率优于许多使用标准池化结构的现有模型。 展开更多
关键词 群组行为 图像处理 注意力机制 行为识别
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部 意见反馈