期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
IoTGuardEye:一种面向物联网服务的Web攻击检测方法 认领
1
作者 刘新 黄缘缘 +1 位作者 刘子昂 周睿 《计算机科学》 北大核心 2021年第2期324-329,共6页
在包括物联网(Internet of Things,IoT)设备的绝大部分边缘计算应用中,基于互联网应用技术(通常被称为Web技术)开发的应用程序接口(Application Programming Interface,API)是设备与远程服务器进行信息交互的核心。相比传统的Web应用,... 在包括物联网(Internet of Things,IoT)设备的绝大部分边缘计算应用中,基于互联网应用技术(通常被称为Web技术)开发的应用程序接口(Application Programming Interface,API)是设备与远程服务器进行信息交互的核心。相比传统的Web应用,大部分用户无法直接接触到边缘设备使用的API,使得其遭受的攻击相对较少。但随着物联网设备的普及,针对API的攻击逐渐成为热点。因此,文中提出了一种面向物联网服务的Web攻击向量检测方法,用于对物联网服务收到的Web流量进行检测,并挖掘出其中的恶意流量,从而为安全运营中心(Security Operation Center,SOC)提供安全情报。该方法在对超文本传输协议(Hypertext Transfer Protocol,HTTP)请求的文本序列进行特征抽取的基础上,针对API请求的报文格式相对固定的特点,结合双向长短期记忆网络(Bidirectional Long Short-Term Memory,BLSTM)实现对Web流量的攻击向量检测。实验结果表明,相比基于规则的Web应用防火墙(Web Application Firewall,WAF)和传统的机器学习方法,所提方法针对面向物联网服务API的攻击具有更好的识别能力。 展开更多
关键词 威胁感知 双向长短期记忆 边缘计算 WEB攻击 物联网
在线阅读 免费下载
基于BLSTM网络的改进EAST文本检测算法 认领
2
作者 郭闯 邱晓晖 《计算机技术与发展》 2020年第7期21-24,共4页
尽管前人在文本检测和文本识别方面已经取得了显著的研究进展,但是在场景文本检测方面仍然存在着较大的不足。即使是深度学习模型,也不会达到很好的性能。因为整体性能取决于流程中的多个阶段和组件的相互作用。基于深度学习神经网络模... 尽管前人在文本检测和文本识别方面已经取得了显著的研究进展,但是在场景文本检测方面仍然存在着较大的不足。即使是深度学习模型,也不会达到很好的性能。因为整体性能取决于流程中的多个阶段和组件的相互作用。基于深度学习神经网络模型的EAST算法可以在进行场景文本检测时避免传统文本检测方法不必要的中间步骤(例如候选区域和字分区域),从而得到了快速准确的检测效果,准确率和召回率都有大幅度的提高。然而由于其感受野范围较短,对长文本的检测效果仍存在问题,因此文中对EAST算法进行改进,在EAST算法的基础上,引入BLSTM网络,提高其感受野,增强文本定位的效果。实验结果表明,该算法在ICDAR2015文本定位任务的召回率为78.07%,准确率为85.10%,F-score为81.64%,优于经典EAST算法。 展开更多
关键词 文本定位 EAST BLSTM 感受野 自然场景
在线阅读 下载PDF
An Improved Deep Learning Model for Predicting DNA Sequence Function 认领
3
作者 Dongfeng Li Xiao Huang 《智能信息管理(英文)》 2020年第1期36-42,共7页
Since a complete DNA chain contains a large data (usually billions of nucleotides), it’s challenging to figure out the function of each sequence segment. Several powerful predictive models for the function of DNA seq... Since a complete DNA chain contains a large data (usually billions of nucleotides), it’s challenging to figure out the function of each sequence segment. Several powerful predictive models for the function of DNA sequence, including, CNN (convolutional neural network), RNN (recurrent neural network), and LSTM [1] (long short-term memory) have been proposed. However, all of them have some flaws. For example, the RNN can hardly have long-term memory. Here, we build on one of these models, DanQ, which uses CNN and LSTM together. We extend DanQ by developing an improved DanQ model and applying it to predict the function of DNA sequence more efficiently. In the most primitive DanQ model, the regulatory grammar is learned by the regulatory motifs captured by the convolution layer and the long-term dependencies between the motifs captured by the recurrent layer, so as to increase the prediction accuracy. Through the testing of some models, DanQ has greatly improved in some indicators. For the regulatory markers, DanQ achieves improvements above 50% of the area under the curve, via the measurement of the precision-recall curve. 展开更多
关键词 BLSTM Convolutional NEURAL Network DanQ Model RANDOM DROPOUT
在线阅读 免费下载
交通信息标准条款BLSTM和CNN链式模型分类方法 认领
4
作者 范维克 张绍阳 +1 位作者 陈博远 王珂 《江苏大学学报:自然科学版》 EI CAS 北大核心 2020年第2期143-148,共6页
为了有效获取交通运输信息标准中的一致性条款,简化标准测试方法,针对现有文本分类方法中卷积神经网络存在的缺少上下文含义和循环神经网络存在的梯度消失及梯度弥散等问题,提出一种基于BLSTM的文本增强表示方法和基于CNN网络的语句分... 为了有效获取交通运输信息标准中的一致性条款,简化标准测试方法,针对现有文本分类方法中卷积神经网络存在的缺少上下文含义和循环神经网络存在的梯度消失及梯度弥散等问题,提出一种基于BLSTM的文本增强表示方法和基于CNN网络的语句分类相结合的方法进行一致性条款分类.其核心思想是将BLSTM前向和后向过程产生的向量相加,然后与原文本向量拼接作为文本的向量表示,将文本向量作为CNN网络的输入进行文本分类.为验证所提模型的有效性,设置了与传统机器模型TF-IDF+SVM、单CNN、BLSTM神经网络模型及经典混合模型的对比试验.通过构造的交通运输信息标准条款数据集测试表明,基于改进的BLSTM和CNN的链式混合神经网络模型准确率达到93.77%. 展开更多
关键词 文本分类 文本表示 BLSTM 卷积神经网络 交通信息标准条款 语义增强
在线阅读 免费下载
音视频双模态情感识别融合框架研究 认领
5
作者 宋冠军 张树东 卫飞高 《计算机工程与应用》 CSCD 北大核心 2020年第6期140-146,共7页
针对双模态情感识别框架识别率低、可靠性差的问题,对情感识别最重要的两个模态语音和面部表情进行了双模态情感识别特征层融合的研究。采用基于先验知识的特征提取方法和VGGNet-19网络分别对预处理后的音视频信号进行特征提取,以直接... 针对双模态情感识别框架识别率低、可靠性差的问题,对情感识别最重要的两个模态语音和面部表情进行了双模态情感识别特征层融合的研究。采用基于先验知识的特征提取方法和VGGNet-19网络分别对预处理后的音视频信号进行特征提取,以直接级联的方式并通过PCA进行降维来达到特征融合的目的,使用BLSTM网络进行模型构建以完成情感识别。将该框架应用到AViD-Corpus和SEMAINE数据库上进行测试,并和传统情感识别特征层融合框架以及基于VGGNet-19或BLSTM的框架进行了对比。实验结果表明,情感识别的均方根误差(RMSE)得到降低,皮尔逊相关系数(PCC)得到提高,验证了文中提出方法的有效性。 展开更多
关键词 音视频 双模态 特征层融合 情感识别 BLSTM
在线阅读 下载PDF
融合CNN与BLSTM神经网络的面部表情识别 认领
6
作者 王忠民 缑田田 衡霞 《计算机与数字工程》 2020年第12期2978-2983,共6页
为了有效处理面部表情识别中特征提取不完整和特征选择偏差较大等问题,研究了一种新的融合多种卷积神经网络的融合算法。首先通过采用三维卷积神经网络(3-dimensional Convolutional Neural Network,3D CNN)对连续的多张图片中的特征进... 为了有效处理面部表情识别中特征提取不完整和特征选择偏差较大等问题,研究了一种新的融合多种卷积神经网络的融合算法。首先通过采用三维卷积神经网络(3-dimensional Convolutional Neural Network,3D CNN)对连续的多张图片中的特征进行提取。然后把特征信息送至双向长短记忆网络(Bidirectional Long Short-Term Memory,BLSTM)递归神经网络得到这些特征在时域上的映射信息,最后通过softmax分类器得到分类结果。通过真实的数据集实验,将新的融合算法与其他几种常见方法进行了对比分析,结果表明能够有效提高分类准确度。 展开更多
关键词 面部表情识别 3D CNN BLSTM
在线阅读 下载PDF
基于BERT-BLSTM-CRF的政务领域命名实体识别方法 认领
7
作者 杨春明 魏成志 +2 位作者 张晖 赵旭剑 李波 《西南科技大学学报》 CAS 2020年第3期86-91,共6页
政务领域的命名实体通常是一些政务事项名,这类实体与开放域实体比较,具有长度较长、实体并列、别称等特点,目前还未见公开可用的训练数据集。构建了具有25176个句子的政务领域命名实体识别数据集,并提出一种基于BERT-BLSTM-CRF的神经... 政务领域的命名实体通常是一些政务事项名,这类实体与开放域实体比较,具有长度较长、实体并列、别称等特点,目前还未见公开可用的训练数据集。构建了具有25176个句子的政务领域命名实体识别数据集,并提出一种基于BERT-BLSTM-CRF的神经网络识别模型,该模型在不依赖人工特征选择的情况下,使用BERT中文预训练模型,然后采用BLSTM-CRF识别实体。实验结果表明,该模型识别效果优于CRF,BLSTM-CRF,CNN-BLSTM-CRF,F1值达到92.23%。 展开更多
关键词 政务事务 命名实体识别 BLSMT CRF BERT
在线阅读 下载PDF
融合位置注意力机制和改进BLSTM的食品评论情感分析 认领
8
作者 李勇 金庆雨 张青川 《郑州大学学报:工学版》 CAS 北大核心 2020年第1期58-62,共5页
为了对食品评价的情感倾向进行更加精确的分类,在进行情感语义分析时,卷积神经网络(convolutional neural networks,CNN)方法情感分析是近年来自然语言处理领域的研究热点。然而,目前现有的深度学习模型在对文本句子进行情感分析时缺少... 为了对食品评价的情感倾向进行更加精确的分类,在进行情感语义分析时,卷积神经网络(convolutional neural networks,CNN)方法情感分析是近年来自然语言处理领域的研究热点。然而,目前现有的深度学习模型在对文本句子进行情感分析时缺少研究情感词位置对整个情感分析的重要性。在对电商商品评论数据进行情感语义分析时,CNN方法在提取目标的结构特征方面具有一定的优势,可以提取到多种局部特征,循环神经网络(recurrent neural networks,RNN)具有记忆功能,在序列特征提取方面具有一定的优势,双向长短时记忆网络(bidirectional long short-term memory,BLSTM)在提取远距离依赖序列语义特征方面可以得到很好的效果。在BLSTM的基础上,又引入基于食品领域的语义角色标注与位置相结合的位置注意力机制,来实现距离相关的序列语义特征提取,利用CNN实现序列语义特征的情感语义分类,从而构造出了一种基于BLSTM和位置注意力机制的食品评论情感分析模型。实验结果表明,设计的模型在情感分类方面取得了很好的分类效果,与之前的情感分类模型进行比较,在准确率结果上有所提高。 展开更多
关键词 情感分析 评论 双向长短时记忆网络 卷积神经网络 位置注意力机制
在线阅读 免费下载
基于BLSTM的语音识别解码优化算法探讨 认领
9
作者 郭川玉 苏一敏 《科学技术创新》 2020年第18期86-87,共2页
语音识别是技术进步和社会发展的重要产物,能够给人们生产生活提供极大便利条件,然而实现这一技术难度较高。从语音识别的基本情况分析入手,阐明了语音识别的内涵和技术特性,介绍了基于BLSTM语音识别解码优化算法的可行性,还提出了一些... 语音识别是技术进步和社会发展的重要产物,能够给人们生产生活提供极大便利条件,然而实现这一技术难度较高。从语音识别的基本情况分析入手,阐明了语音识别的内涵和技术特性,介绍了基于BLSTM语音识别解码优化算法的可行性,还提出了一些科学合理的解码优化算法,主要说明了以状态拷贝为基础的上下文相关块解码算法的优势,为提升语音识别系统的总体应用效果,提供一定借鉴和参考。 展开更多
关键词 BLSTM 语音识别 解码 优化算法
在线阅读 下载PDF
基于BERT的文本情感分析 认领 被引量:1
10
作者 刘思琴 冯胥睿瑞 《信息安全研究》 2020年第3期220-227,共8页
现有情感分类模型大都采用Word2Vec,GloVe(global vectors)等获取文本的词向量表示,忽略了词的上下文关系,针对此问题,提出基于BERT(bidirectional encoder representations from transformers)预训练语言模型与双向长短时记忆网络(bidi... 现有情感分类模型大都采用Word2Vec,GloVe(global vectors)等获取文本的词向量表示,忽略了词的上下文关系,针对此问题,提出基于BERT(bidirectional encoder representations from transformers)预训练语言模型与双向长短时记忆网络(bidirectional long short-term memory network,BLSTM)及注意力机制相结合的神经网络模型进行文本情感分析.首先通过BERT预训练模型获取包含上下文语义信息的词向量,然后利用双向长短时记忆网络提取上下文相关特征进行深度学习,最后引入注意力机制对提取出的信息分配权重,突出重点信息,进行文本情感分类.在SST(stanford sentiment treebank)数据集上测试准确率可达到88.91%,表明该方法较其他方法在分类准确率上有一定程度的提高. 展开更多
关键词 文本情感分析 BERT 双向长短时记忆网络 注意力机制 词向量
在线阅读 下载PDF
基于BERT和双向LSTM的微博评论倾向性分析研究 认领
11
作者 谌志群 鞠婷 《情报理论与实践》 CSSCI 北大核心 2020年第8期173-177,共5页
[目的/意义]微博是一种重要的社会媒体,微博评论反映了网民对公共事件的态度和意见,对微博评论进行即时的倾向性分析对于网络舆情管控具有重要意义。[方法/过程]针对传统语言模型在词向量表示中无法解决词语多义性的问题,提出采用BERT... [目的/意义]微博是一种重要的社会媒体,微博评论反映了网民对公共事件的态度和意见,对微博评论进行即时的倾向性分析对于网络舆情管控具有重要意义。[方法/过程]针对传统语言模型在词向量表示中无法解决词语多义性的问题,提出采用BERT模型来提取微博评论文本的语义特征表示,然后将获取的词语语义特征输入到双向LSTM模型中进行倾向性分类。[结果/结论]选取新浪微博评论数据进行了对比实验。实验结果表明,提出的基于BERT和双向LSTM的微博评论倾向性分类模型的F1值达到91.45%,优于其他主流的倾向性分析模型,证明了方法的有效性。[局限]双向LSTM模型训练的计算复杂度较高,BERT模型只能依赖于谷歌发布的预训练模型。 展开更多
关键词 微博评论 深度学习 BERT 双向LSTM 倾向性分析
基于BLSTM-CRF的领域知识点实体识别技术 认领
12
作者 周海华 曹春萍 《软件》 2019年第2期1-5,共5页
传统的中文分词方法是一种基于单词标注的传统机器学习方法,但学习方法需要人工配置和提取中文文本的特征。缺点是同义词库维度较高且CPU训练模型较长。本文针对以上问题进行了研究,构建了内嵌条件随机场的长短时神经网络模型,使用长短... 传统的中文分词方法是一种基于单词标注的传统机器学习方法,但学习方法需要人工配置和提取中文文本的特征。缺点是同义词库维度较高且CPU训练模型较长。本文针对以上问题进行了研究,构建了内嵌条件随机场的长短时神经网络模型,使用长短时神经网络隐含层的上下文向量作为输出层标注的特征,使用内嵌的条件随机场模型表示标注之间的约束关系采用双向LSTM和CRF相结合的训练方法进行特定领域知识点的中文分词。对中文分词测试常用语料库的实验比较表明,基于BLSTM和CRF网络模型的方法可以获得比传统机器学习方法更好的性能;使用六字标记并添加预训练的字嵌入向量可以实现相对较好的分词性能;BLSTM-CRF网络模型方法更易于推广并应用于其他自然语言处理中的序列标注任务。 展开更多
关键词 实体识别 神经网络 BLSTM CRF
在线阅读 下载PDF
基于稀疏逻辑回归和多元融合算法的慢性肾病进展预测模型 认领
13
作者 杨金山 李智 《计算机与现代化》 2019年第3期13-18,22共7页
只有一部分慢性肾病(Chronic Kidney Disease, CKD)3期的患者会进展到4期,观察临床数据发现进展和非进展患者部分生理指标有较大的区别。本文首次将基于L1/2范数正则化的逻辑回归(Sparse Logistic Regression, SLR)用于筛选影响CKD患者... 只有一部分慢性肾病(Chronic Kidney Disease, CKD)3期的患者会进展到4期,观察临床数据发现进展和非进展患者部分生理指标有较大的区别。本文首次将基于L1/2范数正则化的逻辑回归(Sparse Logistic Regression, SLR)用于筛选影响CKD患者进展的关键因素,然后利用SLR、支持向量机(SVM)、提升决策树(AdaBoost Decision Tree, BOOSTDT)建立进展风险预测模型。另外,本文引入堆叠算法Stacking(STKSSD)克服样本量不足使得模型泛化性能不稳定的缺陷。作为对比,本文分别利用神经网络(ANN)、循环神经网络(BLSTM)对数据建模。实验结果表明,当SLR算法选择磷、血清肌酐等11个关键特征时, STKSSD融合模型效果最好,其中测试查全率、查准率、F1值分别为86.97%、92.86%和89.82%。 展开更多
关键词 SLR Stacking融合算法 SVM 提升决策树 BLSTM ANN 慢性肾病 进展预测
在线阅读 免费下载
基于深度学习和CRFs的产品评论观点抽取方法 认领 被引量:1
14
作者 睢国钦 那日萨 彭振 《情报杂志》 CSSCI 北大核心 2019年第5期177-185,共9页
[目的/意义]产品评论观点抽取任务是细粒度评论挖掘的核心任务,其面临的主要挑战是如何自动抽取评论文本中由评价对象、程度词、观点词构成的三元组。[方法/过程]针对条件随机场(CRFs)模型需要人工构造语言学特征的缺陷,提出一种基于深... [目的/意义]产品评论观点抽取任务是细粒度评论挖掘的核心任务,其面临的主要挑战是如何自动抽取评论文本中由评价对象、程度词、观点词构成的三元组。[方法/过程]针对条件随机场(CRFs)模型需要人工构造语言学特征的缺陷,提出一种基于深度学习和CRFs的产品评论抽取方法,该方法首先在连续词袋模型(CBOW)获得词向量基础上,利用双向长短期记忆神经网络(BLSTMRNN)自动学习评论语句的文本特征,再以CRFs层进行解码标注,进而识别出三元组。[结果/结论]为验证方法的有效性,针对从京东商城等电商平台上抓取的手机和酒店评论集,人工标注部分评论用于训练模型并进行测试,实验结果表明,该方法在产品评论观点抽取任务上取得了平均F值大于80%的效果。 展开更多
关键词 观点抽取 CRFs深度学习 词向量 CBOW BLSTM
在线阅读 下载PDF
汉藏双语旅游领域知识图谱系统构建 认领 被引量:1
15
作者 冯小兰 赵小兵 《中文信息学报》 CSCD 北大核心 2019年第11期64-72,共9页
旅游业是藏族地区主要的经济来源之一。然而,目前互联网上缺乏藏文旅游信息智能化服务系统,且藏文景点介绍文本也十分匮乏;相反,汉文旅游网站信息量大,但各旅游网站包含的景点不尽相同,景点介绍文本篇幅较长,且各旅游网站对同一个景点... 旅游业是藏族地区主要的经济来源之一。然而,目前互联网上缺乏藏文旅游信息智能化服务系统,且藏文景点介绍文本也十分匮乏;相反,汉文旅游网站信息量大,但各旅游网站包含的景点不尽相同,景点介绍文本篇幅较长,且各旅游网站对同一个景点描述侧重点不同。为便于不同语言使用者能快速准确地了解景点相关的知识,该文首先在汉文旅游领域分别采用基于BLSTM神经网络模型、基于维基百科以及基于网络爬虫等形式获取与景点相关的共8种属性知识;并通过采用基于维基百科等方法构建的旅游领域汉藏词典,将获取的汉文知识迁移到藏文,其翻译覆盖率平均值达70.44%。最终,构建汉藏双语旅游领域知识图谱。 展开更多
关键词 旅游领域关系抽取 知识图谱 BLSTM
在线阅读 下载PDF
基于BLSTM-CRF模型的安全漏洞领域命名实体识别 认领 被引量:6
16
作者 张若彬 刘嘉勇 何祥 《四川大学学报:自然科学版》 CAS CSCD 北大核心 2019年第3期469-475,共7页
非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特... 非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务.该文针对安全漏洞领域,提出一种双向长短期记忆网络BLSTM与条件随机场CRF相结合的安全漏洞领域实体识别模型,并使用基于词典的方法对结果进行校正,F值可达到85%以上.实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量. 展开更多
关键词 安全漏洞 实体识别 BLSTM CRF
在线阅读 免费下载
Text Detection and Recognition for Natural Scene Images Using Deep Convolutional Neural Networks 认领
17
作者 Xianyu Wu Chao Luo +3 位作者 Qian Zhang Jiliu Zhou Hao Yang Yulian Li 《计算机、材料和连续体(英文)》 SCIE EI 2019年第7期289-300,共12页
Words are the most indispensable information in human life.It is very important to analyze and understand the meaning of words.Compared with the general visual elements,the text conveys rich and high-level moral infor... Words are the most indispensable information in human life.It is very important to analyze and understand the meaning of words.Compared with the general visual elements,the text conveys rich and high-level moral information,which enables the computer to better understand the semantic content of the text.With the rapid development of computer technology,great achievements have been made in text information detection and recognition.However,when dealing with text characters in natural scene images,there are still some limitations in the detection and recognition of natural scene images.Because natural scene image has more interference and complexity than text,these factors make the detection and recognition of natural scene image text face many challenges.To solve this problem,a new text detection and recognition method based on depth convolution neural network is proposed for natural scene image in this paper.In text detection,this method obtains high-level visual features from the bottom pixels by ResNet network,and extracts the context features from character sequences by BLSTM layer,then introduce to the idea of faster R-CNN vertical anchor point to find the bounding box of the detected text,which effectively improves the effect of text object detection.In addition,in text recognition task,DenseNet model is used to construct character recognition based on Kares.Finally,the output of Softmax is used to classify each character.Our method can replace the artificially defined features with automatic learning and context-based features.It improves the efficiency and accuracy of recognition,and realizes text detection and recognition of natural scene images.And on the PAC2018 competition platform,the experimental results have achieved good results. 展开更多
关键词 Detection RECOGNITION resnet blstm FASTER R-CNN densenet
在线阅读 下载PDF
基于Attention+Bi-LSTM的公交出行意图和语义槽填充联合识别 认领
18
作者 陈婷婷 林民 李艳玲 《青海师范大学学报:自然科学版》 2019年第4期13-18,共6页
对话系统的口语理解通常涉及意图识别和语义槽填充两个任务.目前意图和语义槽填充联合识别成为口语理解研究的主流方法.本文采用一种基于注意力机制(Attention Mechanism)的双向长短时记忆(Bi-directional long short-term memory,Bi-LS... 对话系统的口语理解通常涉及意图识别和语义槽填充两个任务.目前意图和语义槽填充联合识别成为口语理解研究的主流方法.本文采用一种基于注意力机制(Attention Mechanism)的双向长短时记忆(Bi-directional long short-term memory,Bi-LSTM)模型,对呼和浩特市公交问路查询语句进行意图和语义槽填充的联合识别.实验结果表明,该模型在意图识别准确率和语义槽填充F1值方面,均达到了较好的水平,优于基于长短时记忆(long short-term memory,LSTM)模型的其他方法,并且该模型基于字切分的结果优于基于词切分的结果,证实了该方法的有效性. 展开更多
关键词 口语理解 意图识别 语义槽填充 双向长短时记忆 注意力机制
在线阅读 下载PDF
基于BLSTM和CTC的藏语语音识别 认领
19
作者 南措吉 才让卓玛 都格草 《青海师范大学学报:自然科学版》 2019年第4期26-33,共8页
随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特... 随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特征参数,建立了以音素为建模单元的藏语语音声学模型.在不同建模单元下LSTM-CTC模型和BLSTM-CTC模型的对比实验表明,该方法能够充分利用上下文信息,具有较强的建模能力和语音识别效果. 展开更多
关键词 藏语语音 建模单元 BLSTM CTC
在线阅读 下载PDF
嵌入注意力机制并结合层级上下文的语音情感识别 认领 被引量:1
20
作者 程艳芬 陈垚鑫 +1 位作者 陈逸灵 杨益 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2019年第11期100-107,共8页
由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入... 由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入注意力机制并结合层级上下文学习的双向长短时记忆(BLSTM)网络模型.模型分3个阶段完成语音情感识别任务,第1阶段提取情感语音特征全集后采用SVM-RFE特征排序算法降维得到最优特征子集,并对其进行注意力加权;第2阶段将加权后的特征子集输入BLSTM网络学习特征层上下文获得最初情感预测结果;第3阶段利用情感标签值对另一独立BLSTM网络训练学习标签层上下文信息并据此在第2阶段输出结果基础上完成最终预测.模型嵌入注意力机制使其自动学习调整对输入特征子集的关注度,引入标签层上下文使其联合特征层上下文实现层级上下文信息融合提高鲁棒性,提升了模型对情感语音的建模能力,在SEMAINE和RECOLA数据集上实验结果表明:与基线模型相比RMSE和CCC均得到较好改善. 展开更多
关键词 语音情感识别 注意力机制 上下文 双向长短时记忆网络
在线阅读 免费下载
上一页 1 2 3 下一页 到第
使用帮助 返回顶部 意见反馈