期刊文献+
共找到2,770篇文章
< 1 2 139 >
每页显示 20 50 100
肿瘤大数据中心和单病种科研平台建设及应用 认领
1
作者 朱梦婷 陈明 +3 位作者 王慈勇 李少品 饶安邦 许祖振 《中国数字医学》 2021年第1期100-103,共4页
目的:建立基于医院肿瘤大数据中心的单病种科研平台,为科研工作者提供一个肿瘤数据价值可挖掘、科研流程规范化的工作平台,提高科研效率,增加科研产出。方法:利用大数据技术对医院各业务系统数据抽取、整合,建立肿瘤大数据中心。通过自... 目的:建立基于医院肿瘤大数据中心的单病种科研平台,为科研工作者提供一个肿瘤数据价值可挖掘、科研流程规范化的工作平台,提高科研效率,增加科研产出。方法:利用大数据技术对医院各业务系统数据抽取、整合,建立肿瘤大数据中心。通过自然语言处理等技术对非结构化文本数据进行后结构化处理,使数据更具分析价值。结果:建成基于数据中心的肺癌、胃癌、乳腺癌、宫颈癌、鼻咽癌、食管癌、直肠癌、结肠癌、肝癌9大单病种的科研平台,实现了科研灵感搜寻、研究对象自动入组、CRF数据智能填充、填充数据及时溯源、科研数据辅助统计等系统化、全流程的科研管理。结论:提升了医院的科研效率并加速成果产出。 展开更多
关键词 肿瘤数据中心 自然语言处理 后结构化处理 单病种科研平台
在线阅读 下载PDF
基于多节点组合特征和模糊聚类的中文词义消歧方法 认领
2
作者 贺佳 杜建强 +4 位作者 聂斌 熊旺平 雷银香 罗计根 曾青霞 《计算机应用与软件》 北大核心 2021年第2期152-157,220,共7页
词义消歧是自然语言处理中的难点问题,为提高消歧效果,提出一种基于多节点组合特征的词义消歧方法。根据依存语法理论,选择歧义词的祖父+父亲+孩子节点组合,并将其作为消歧特征。利用模糊C均值聚类算法,建立消歧模型,最终确定歧义词词... 词义消歧是自然语言处理中的难点问题,为提高消歧效果,提出一种基于多节点组合特征的词义消歧方法。根据依存语法理论,选择歧义词的祖父+父亲+孩子节点组合,并将其作为消歧特征。利用模糊C均值聚类算法,建立消歧模型,最终确定歧义词词义类别。采用哈工大信息检索研究中心语言技术平台的词义语料进行实验。实验结果表明,相比现有的两种方法,该方法不仅使特征维度平均值分别降低了5和25,且F1值分别提高了1.56个百分点和0.84个百分点,在一定程度上提升了词义消歧效果。 展开更多
关键词 自然语言处理 词义消歧 多节点组合特征 依存语法理论 依存结构树 模糊C均值聚类算法
在线阅读 下载PDF
美国著名智库文本成果研究——以人工智能领域为例 认领
3
作者 张誉曜 陈媛媛 《图书馆论坛》 北大核心 2021年第2期152-160,共9页
从文本视角分析智库文本型成果,可为智库研究、决策分析等领域提供新思路。文章基于自然语言处理技术以及可视化计量分析对美国主流智库的人工智能研究文献进行研究,并结合时事政策事件等进行综合分析,洞察美国智库背后特点,掌握该领域... 从文本视角分析智库文本型成果,可为智库研究、决策分析等领域提供新思路。文章基于自然语言处理技术以及可视化计量分析对美国主流智库的人工智能研究文献进行研究,并结合时事政策事件等进行综合分析,洞察美国智库背后特点,掌握该领域内智库专家的思想动态,为我国智库研究提供参考。 展开更多
关键词 美国智库 文本分析 自然语言处理 人工智能
在线阅读 下载PDF
NLP在中医医案症状信息自动化抽取中的应用研究 认领
4
作者 屈丹丹 杨涛 胡孔法 《软件导刊》 2021年第2期44-48,共5页
从自然语言处理技术(NLP)入手,对比TFIDF与Word2vec方法抽取结果,探讨更适用于中医医案症状信息自动化抽取的研究思路,为发展中医医案的自动化分析提供参考。在构建好的医案词典基础上,利用TFIDF与Word2vec方法分别对心系医案数据进行... 从自然语言处理技术(NLP)入手,对比TFIDF与Word2vec方法抽取结果,探讨更适用于中医医案症状信息自动化抽取的研究思路,为发展中医医案的自动化分析提供参考。在构建好的医案词典基础上,利用TFIDF与Word2vec方法分别对心系医案数据进行症状抽取,并对结果进行对比分析。在医案中,病人发病往往伴有心悸、胸闷、胸痛、气喘、头晕等症状,且发现症状与症状之间也存在某些联系。实验评估结果表明,Word2vec方法抽取的精确率和召回率均高于TFIDF方法抽取的结果。相比TFIDF方法,将Word2vec方法应用于中医医案症状信息自动化抽取任务中效果更佳。 展开更多
关键词 中医医案 自然语言处理 自动化抽取
在线阅读 免费下载
基于自然语言技术进行血管超声报告智能生成诊断提示的探索 认领
5
作者 费晓璐 刘蓓蓓 +5 位作者 李嘉 魏岚 黄跃 陈鹏宇 赵贝尔 李玉莹 《中国数字医学》 2021年第2期21-25,共5页
目的:探索基于血管超声报告进行自然语言处理并智能生成诊断提示的方法。方法:对血管超声报告采用Bi-LSTM-CRF模型进行分词及命名实体识别,根据专家指南构建知识图谱,通过查询实体及关系属性,实现超声诊断的智能建议。结果:Bi-LSTM-CRF... 目的:探索基于血管超声报告进行自然语言处理并智能生成诊断提示的方法。方法:对血管超声报告采用Bi-LSTM-CRF模型进行分词及命名实体识别,根据专家指南构建知识图谱,通过查询实体及关系属性,实现超声诊断的智能建议。结果:Bi-LSTM-CRF模型识别了4类实体,其识别准确度均在90%以上,单个报告的处理速度在毫秒量级,同时构建包括4类关系的知识图谱。结论:自然语言处理结合知识图谱可以用于血管超声报告的智能诊断提示生成。 展开更多
关键词 自然语言处理 血管超声报告 Bi-LSTM-CRF 智能诊断提示
在线阅读 下载PDF
网络评论文本驱动的汽车设计规划方法 认领
6
作者 张国方 寇姣姣 陈令华 《机械设计》 北大核心 2021年第2期139-144,共6页
为将网络评论文本中的关键信息应用于汽车设计开发中,利用词频-逆文档频率算法(Term Frequency-Inverse Document Frequency,TF-IDF)及依存句法分析提取产品特征,基于BERT(Bidirectional Encoder Representation from Transformers)预... 为将网络评论文本中的关键信息应用于汽车设计开发中,利用词频-逆文档频率算法(Term Frequency-Inverse Document Frequency,TF-IDF)及依存句法分析提取产品特征,基于BERT(Bidirectional Encoder Representation from Transformers)预训练模型进行文本情感分析。通过搭建质量屋进行用户需求转化,完成工程技术特性重要度评价,把握产品设计方向,得到评论数据驱动的产品规划方法。以微型汽车设计规划为例,获取了部分工程技术特性优先级,验证了该方法的可行性,不仅能快速获取用户的客观反馈,缩短产品开发周期,并能有效地将用户需求转化为可执行的设计问题。 展开更多
关键词 汽车设计 质量屋 自然语言处理 词频-逆文档频率算法 需求分析
面向社交媒体评论的上下文语境讽刺检测模型 认领
7
作者 韩虎 赵启涛 +1 位作者 孙天岳 刘国利 《计算机工程》 CAS 北大核心 2021年第1期66-71,共6页
讽刺是日常交际中一种常见的语用现象,能够丰富说话者的观点并间接地表达说话者的深层含义。讽刺检测任务的研究目标是挖掘目标语句的讽刺倾向。针对讽刺语境表达变化多样以及不同用户、不同主题下的讽刺含义各不相同等特征,构建融合用... 讽刺是日常交际中一种常见的语用现象,能够丰富说话者的观点并间接地表达说话者的深层含义。讽刺检测任务的研究目标是挖掘目标语句的讽刺倾向。针对讽刺语境表达变化多样以及不同用户、不同主题下的讽刺含义各不相同等特征,构建融合用户嵌入与论坛主题嵌入的上下文语境讽刺检测模型。该模型借助ParagraphVector方法的序列学习能力对用户评论文档与论坛主题文档进行编码,从而获取目标分类句的用户讽刺特征与主题特征,并利用一个双向门控循环单元神经网络得到目标句的语句编码。在标准讽刺检测数据集上进行的实验结果表明,与传统Bag-of-Words、CNN等模型相比,该模型能够有效提取语句的上下文语境信息,具有较高的讽刺检测分类准确率。 展开更多
关键词 自然语言处理 上下文语境讽刺检测 深度学习 ParagraphVector模型 双向门控循环单元模型
在线阅读 下载PDF
基于位置感知能力胶囊网络的实体关系提取 认领
8
作者 刘博闻 范春晓 《计算机工程与应用》 北大核心 2021年第6期101-107,共7页
目前实体关系提取大都使用卷积神经网络(CNN)和循环神经网络(RNN)。但CNN和RNN均以标量形式进行特征表达,对位置信息的敏感度不够理想。同时,CNN和RNN的最大池化(max-pooling)导致特征信息丢失。针对这两个问题,引入胶囊网络(CapsuleNe... 目前实体关系提取大都使用卷积神经网络(CNN)和循环神经网络(RNN)。但CNN和RNN均以标量形式进行特征表达,对位置信息的敏感度不够理想。同时,CNN和RNN的最大池化(max-pooling)导致特征信息丢失。针对这两个问题,引入胶囊网络(CapsuleNet),构建了具备位置感知能力的Position Perception CapsuleNet(PPCNet)。胶囊(Capsule)是一组神经元,特征表达基于向量形式。PPCNet将词间的位置关系转化为位置向量(position embedding)融入Capsule以获得位置感知能力。此外,PPCNet使用动态路由(Dynamic routing)替代池化,以减少特征损失,在SemEval-2010task8数据集上得到82.84%的F1值。 展开更多
关键词 自然语言处理 实体关系提取 胶囊网络(CapsuleNet) 位置感知能力 PPCNet
在线阅读 下载PDF
融合知识图谱与注意力机制的短文本分类模型 认领
9
作者 丁辰晖 夏鸿斌 刘渊 《计算机工程》 CAS 北大核心 2021年第1期94-100,共7页
针对短文本缺乏上下文信息导致的语义模糊问题,构建一种融合知识图谱和注意力机制的神经网络模型。借助现有知识库获取短文本相关的概念集,以获得短文本相关先验知识,弥补短文本缺乏上下文信息的不足。将字符向量、词向量以及短文本的... 针对短文本缺乏上下文信息导致的语义模糊问题,构建一种融合知识图谱和注意力机制的神经网络模型。借助现有知识库获取短文本相关的概念集,以获得短文本相关先验知识,弥补短文本缺乏上下文信息的不足。将字符向量、词向量以及短文本的概念集作为模型的输入,运用编码器-解码器模型对短文本与概念集进行编码,利用注意力机制计算每个概念权重值,减小无关噪声概念对短文本分类的影响,在此基础上通过双向门控循环单元编码短文本输入序列,获取短文本分类特征,从而更准确地进行短文本分类。实验结果表明,该模型在AGNews、Ohsumed和TagMyNews短文本数据集上的准确率分别达到73.95%、40.69%和63.10%,具有较好的分类能力。 展开更多
关键词 短文本分类 知识图谱 自然语言处理 注意力机制 双向门控循环单元
在线阅读 下载PDF
电子病历文本挖掘研究综述 认领
10
作者 吴宗友 白昆龙 +2 位作者 杨林蕊 王仪琦 田英杰 《计算机研究与发展》 EI 北大核心 2021年第3期513-527,共15页
电子病历是医院信息化发展的产物,其中包含了丰富的医疗信息和临床知识,是辅助临床决策和药物挖掘等的重要资源.因此,如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来,随着计算机技术尤其是机器学习以及深度学习... 电子病历是医院信息化发展的产物,其中包含了丰富的医疗信息和临床知识,是辅助临床决策和药物挖掘等的重要资源.因此,如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来,随着计算机技术尤其是机器学习以及深度学习的蓬勃发展,对电子病历这一特殊领域数据的挖掘有了更高的要求.电子病历综述旨在通过对电子病历研究现状的分析来指导未来电子病历文本挖掘领域的发展.具体而言,综述首先介绍了电子病历数据的特点和电子病历的数据预处理的常用方法;然后总结了电子病历数据挖掘的4个典型任务(医学命名实体识别、关系抽取、文本分类和智能问诊),并且围绕典型任务介绍了常用的基本模型以及研究人员在任务上的部分探索;最后结合糖尿病和心脑血管疾病2类特定疾病,对电子病历的现有应用场景做了简单介绍. 展开更多
关键词 电子病历 自然语言处理 数据挖掘 机器学习 深度学习
在线阅读 下载PDF
基于多特征双向门控神经网络的领域专家实体抽取方法 认领
11
作者 张柯文 李翔 +2 位作者 严云洋 朱全银 马甲林 《南京师大学报:自然科学版》 CAS 北大核心 2021年第1期128-135,共8页
命名实体识别是自然语言处理和信息提取的基本任务,传统专家命名实体识别方法存在过度依赖人工特征标注和分词效果、专家简介中大量专业新词无法识别等问题.本文提出一种基于多特征双向门控神经网络结构并结合条件随机场模型进行领域专... 命名实体识别是自然语言处理和信息提取的基本任务,传统专家命名实体识别方法存在过度依赖人工特征标注和分词效果、专家简介中大量专业新词无法识别等问题.本文提出一种基于多特征双向门控神经网络结构并结合条件随机场模型进行领域专家实体抽取方法.该方法首先通过构建领域专家语料库以训练实体抽取模型;接着,使用Bert方法进行字嵌入表示,对语料库专业领域词汇构造要素进行特征分析并提取边界特征;然后,利用双向门控神经网络和注意力机制有效获取特定词语长距离依赖关系;最后,结合条件随机场模型实现命名实体识别.在同一数据集上进行5种方法实验比较分析,结果表明该模型较BiLSTM-CRF和IDCNN-CRF方法F1值提高9.98%以上. 展开更多
关键词 命名实体识别 自然语言处理 信息提取 多特征 边界特征
在线阅读 下载PDF
面向自然语言处理的深度学习对抗样本综述 认领
12
作者 仝鑫 王斌君 +1 位作者 王润正 潘孝勤 《计算机科学》 北大核心 2021年第1期258-267,共10页
深度学习模型被证明存在脆弱性并容易遭到对抗样本的攻击,但目前对于对抗样本的研究主要集中在计算机视觉领域而忽略了自然语言处理模型的安全问题。针对自然语言处理领域同样面临对抗样本的风险,在阐明对抗样本相关概念的基础上,文中... 深度学习模型被证明存在脆弱性并容易遭到对抗样本的攻击,但目前对于对抗样本的研究主要集中在计算机视觉领域而忽略了自然语言处理模型的安全问题。针对自然语言处理领域同样面临对抗样本的风险,在阐明对抗样本相关概念的基础上,文中首先对基于深度学习的自然语言处理模型的复杂结构、难以探知的训练过程和朴素的基本原理等脆弱性成因进行分析,进一步阐述了文本对抗样本的特点、分类和评价指标,并对该领域对抗技术涉及到的典型任务和数据集进行了阐述;然后按照扰动级别对主流的字、词、句和多级扰动组合的文本对抗样本生成技术进行了梳理,并对相关防御方法进行了归纳总结;最后对目前自然语言处理对抗样本领域攻防双方存在的痛点问题进行了进一步的讨论和展望。 展开更多
关键词 自然语言处理 深度学习 人工智能安全 对抗样本 鲁棒性
在线阅读 免费下载
基于BiLSTM-IDCNN-CRF模型的生态治理技术领域命名实体识别 认领
13
作者 蒋翔 马建霞 袁慧 《计算机应用与软件》 北大核心 2021年第3期134-141,共8页
在生态治理技术领域中,有大量的文献数据没有得到充分的开发与利用。提出基于字嵌入的BiLSTM-IDCNN-CRF模型,结合BiLSTM网络和IDCNN网络获取到的不同粒度的特征。在生态治理技术数据集中取得的F1值为0.7207,均高于现有主流模型取得的成... 在生态治理技术领域中,有大量的文献数据没有得到充分的开发与利用。提出基于字嵌入的BiLSTM-IDCNN-CRF模型,结合BiLSTM网络和IDCNN网络获取到的不同粒度的特征。在生态治理技术数据集中取得的F1值为0.7207,均高于现有主流模型取得的成绩。实验验证了字嵌入方法的有效性和模型的性能,同时也为其他文本书写规范不统一且专业性较强的领域命名实体识别提供了思路。 展开更多
关键词 命名实体识别 自然语言处理 生态治理技术 神经网络 字嵌入
在线阅读 下载PDF
基于BERT的短文本相似度判别模型 认领
14
作者 方子卿 陈一飞 《电脑知识与技术:学术版》 2021年第5期14-18,共5页
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该神经网络模型利用BERT的迁移学习,并在词向量编码阶段引入对抗训练方法,训练出包括句的语义和结构特征的... 短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值。本文提出了BERT_BLSTM_TCNN模型,该神经网络模型利用BERT的迁移学习,并在词向量编码阶段引入对抗训练方法,训练出包括句的语义和结构特征的且泛化性能更优的句特征,并将这些特征输入BLSTM_TCNN层中进行特征抽取以完成对短文本的语义层面上的相似判定。在相关数据集上的实验结果表明:与最先进的预训练模型相比,该模型在有着不错的判定准确率的同时还有参数量小易于训练的优点。 展开更多
关键词 词向量模型 自然语言处理 短文本相似度 卷积神经网络 循环神经网络
在线阅读 下载PDF
基于大数据文本分析的大学生校园贷情感态度研究 认领
15
作者 潘文浩 《经济技术协作信息》 2021年第4期20-21,共2页
选取公众广为关注的大学生校园贷事件,分析线上用户对事件的情感态度特点,以便更好地把握用户的心理动态并加速事件的有效解决。借助大数据深度学习技术与自然语言处理方法,对453684条校园贷相关的微博文本数据进行关键词词云与情感态... 选取公众广为关注的大学生校园贷事件,分析线上用户对事件的情感态度特点,以便更好地把握用户的心理动态并加速事件的有效解决。借助大数据深度学习技术与自然语言处理方法,对453684条校园贷相关的微博文本数据进行关键词词云与情感态度分析。根据不同性别微博用户的特点,考察网络用户的关注动态与情感态度差异。结果显示,网络用户主要关注对非法校园贷的谴责、对国家取缔非法校园贷的赞同以及对校园贷受害大学生的同情等方面;对事件的关注存在东部沿海地区多于西部内陆地区的特点;男性情感态度倾向高于女性,尤其是消极情感态度方面。 展开更多
关键词 自然语言处理 校园贷 大数据 心理动态 网络用户 消极情感 情感态度 文本分析
在线阅读 免费下载
智能科学技术概述 认领
16
作者 李咏豪 《科技风》 2021年第8期7-8,共2页
智能科学技术的重要研究方向包括机器是否具有智能的判断,以及自然语言的处理。本文分析了人类抽象推理方面的能力难以植入现阶段机器,以及判断一台机器是否智能的方法。另外,利用隐马尔可夫模型来解决自然语言中的许多问题,同时,基于... 智能科学技术的重要研究方向包括机器是否具有智能的判断,以及自然语言的处理。本文分析了人类抽象推理方面的能力难以植入现阶段机器,以及判断一台机器是否智能的方法。另外,利用隐马尔可夫模型来解决自然语言中的许多问题,同时,基于规则以及基于统计的自然语言处理有着各自的优缺点,而从基于规则的方法逐步过渡到基于统计的方法有深层次的原因。 展开更多
关键词 智能科学 自然语言处理 马尔可夫模型
在线阅读 下载PDF
大气污染领域本体的半自动构建及语义推理 认领
17
作者 刘博 张佳慧 +2 位作者 李建强 李永 郎建垒 《北京工业大学学报》 CAS 北大核心 2021年第3期246-259,共14页
为了明确大气污染物、污染源、影响因素、评价指标、危害等之间的关系,分析大气污染传播路径,建立了一个较为清晰、完善的大气污染领域本体.首先,基于机器学习和自然语言处理等技术,提出一种基于注意力机制的序列标注联合抽取实体关系... 为了明确大气污染物、污染源、影响因素、评价指标、危害等之间的关系,分析大气污染传播路径,建立了一个较为清晰、完善的大气污染领域本体.首先,基于机器学习和自然语言处理等技术,提出一种基于注意力机制的序列标注联合抽取实体关系的方法,在双向长短时记忆(long short-term memory,LSTM)网络模型中加入注意力机制,并将实体和关系联合标注,从而进行实体关系抽取.其次,结合词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)核心概念挖掘方法进行知识抽取,并将概念、属性、关系和实例组织起来,从而实现大气污染本体模型的半自动构建.最后,在本体和实例的基础上通过Protégé的SPARQL Query模块和HermiT推理机分别进行条件推理和可视化推理.结果表明,基于注意力机制的序列标注实体关系联合抽取方法所构建的大气污染领域本体包含核心实体68个,实例数360个,相较于现有的本领域本体,在全面性、有效性、准确性和可重用性方面都有较好表现,同时推理出了Ca~(2+)和K~+等污染离子的传播路径.因此,基于注意力机制的序列标注联合抽取实体关系的方法能够有效地半自动构建大气污染领域本体,推理出清晰的大气污染传播路径. 展开更多
关键词 本体 大气污染 自然语言处理 注意力机制 实体关系抽取 语义推理
在线阅读 下载PDF
教师教学情绪综合评价分析 认领
18
作者 郑誉煌 《计算机时代》 2021年第3期104-106,109,共4页
教师教学情绪对课堂教学效果和学生的学习状态有重大的影响。基于自然语言处理理论,建立了分析教师教学情绪的情感倾向指标、情感波动指标和敏感词指标。为了对比不同教师之间的总体教学情绪,采用离差权评价模型建立了教师情绪综合评价... 教师教学情绪对课堂教学效果和学生的学习状态有重大的影响。基于自然语言处理理论,建立了分析教师教学情绪的情感倾向指标、情感波动指标和敏感词指标。为了对比不同教师之间的总体教学情绪,采用离差权评价模型建立了教师情绪综合评价方法。实验表明,上述指标和综合评价方法能有效体现教师课堂教学情绪和他们的情绪差异。本研究成果为智能分析教师教学情绪提供了客观依据,为教师及时改善教学效果提供有力支持。 展开更多
关键词 教师教学情绪 自然语言处理 综合评价 指标
在线阅读 下载PDF
基于语义加权的引文网络社区划分研究 认领
19
作者 刘璐 蔡永明 《新世纪图书馆》 2021年第1期50-56,共7页
为提高引文网络社区划分的准确性,以文档之间的语义关系以及引文之间的引用关系为基础,结合词汇在文档中的位置关系等信息,构建基于词汇语义加权的引文网络。通过GloVe模型对词汇向量化以充分利用词汇语义信息,结合WMD模型度量文献之间... 为提高引文网络社区划分的准确性,以文档之间的语义关系以及引文之间的引用关系为基础,结合词汇在文档中的位置关系等信息,构建基于词汇语义加权的引文网络。通过GloVe模型对词汇向量化以充分利用词汇语义信息,结合WMD模型度量文献之间的相似度,把文档相似度的计算转变为在约束条件下求线性规划最优解的问题,结合文本的内容及结构特征对网络中的边进行赋权,以Louvain社区发现算法对加权后的引文网络进行社区划分,并对划分后的社区进行分析与检验,实验证明GloVe-WMD模型可提高引文网络社区划分的准确度。 展开更多
关键词 引文网络 语义加权 社区划分 文本挖掘 自然语言处理 词嵌入
在线阅读 下载PDF
一种COVID-19病例个体时空轨迹交互式提取与质量评估方法 认领
20
作者 张国永 龚建华 +7 位作者 孙麇 周洁萍 李文航 张利辉 汪东川 李文宁 胡卫东 樊鸿奎 《武汉大学学报:信息科学版》 EI 北大核心 2021年第2期177-183,共7页
针对当前新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)病例个体时空轨迹描述文本高度非结构化的特点,提出了一种基于自然语言处理(natural language processing,NLP)辅助的交互式轨迹提取方法,用于提高轨迹提取的效率和质量。... 针对当前新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)病例个体时空轨迹描述文本高度非结构化的特点,提出了一种基于自然语言处理(natural language processing,NLP)辅助的交互式轨迹提取方法,用于提高轨迹提取的效率和质量。设计了交互式轨迹提取和质量评估流程,研究并实现了地址分割与组合算法、轨迹质量评估算法等关键技术。以黑龙江本土COVID-19聚集病例为例,通过轨迹提取效率和质量对比实验,验证了该方法的有效性和实用性。实验结果表明,与无NLP辅助的提取方法相比,该方法的轨迹提取效率得到了显著提升;同时,依据轨迹定量可信度评价结果,人机交互式的提取方法还可有效解决算法轨迹自动提取中存在的轨迹点遗漏、位置错误等问题。 展开更多
关键词 COVID-19 时空轨迹 轨迹提取 自然语言处理 轨迹质量评估
上一页 1 2 139 下一页 到第
使用帮助 返回顶部 意见反馈