期刊文献+
共找到512篇文章
< 1 2 26 >
每页显示 20 50 100
CLS-Miner: efficient and effective closed high-utility itemset mining
1
作者 Thu-Lan DAM Kenli LI +1 位作者 Philippe FOURNIER-VIGER Quang-Huy DUONG 《中国计算机科学前沿:英文版》 SCIE EI CSCD 2019年第2期357-381,共25页
High-utility itemset mining (HUIM) is a popular data mining task with applications in numerous domains. However, traditional HUIM algorithms often produce a very large set of high-utility itemsets (HUIs). As a result,... High-utility itemset mining (HUIM) is a popular data mining task with applications in numerous domains. However, traditional HUIM algorithms often produce a very large set of high-utility itemsets (HUIs). As a result, analyzing HUIs can be very time consuming for users. Moreover, a large set of HUIs also makes HUIM algorithms less efficient in terms of execution time and memory consumption. To address this problem, closed high-utility itemsets (CHUIs), concise and lossless representations of all HUIs, were proposed recently. Although mining CHUIs is useful and desirable, it remains a computationally expensive task. This is because current algorithms often generate a huge number of candidate itemsets and are unable to prune the search space effectively. In this paper, we address these issues by proposing a novel algorithm called CLS-Miner. The proposed algorithm utilizes the utility-list structure to directly compute the utilities of itemsets without producing candidates. It also introduces three novel strategies to reduce the search space, namely chain-estimated utility co-occurrence pruning, lower branch pruning, and pruning by coverage. Moreover, an effective method for checking whether an itemset is a subset of another itemset is introduced to further reduce the time required for discovering CHUIs. To evaluate the performance of the proposed algorithm and its novel strategies, extensive experiments have been conducted on six benchmark datasets having various characteristics. Results show that the proposed strategies are highly efficient and effective, that the proposed CLS-Miner algorithm outperforms the current state-ofthe- art CHUD and CHUI-Miner algorithms, and that CLSMiner scales linearly. 展开更多
关键词 UTILITY MINING high-utility ITEMSET MINING CLOSED ITEMSET MINING CLOSED high-utility ITEMSET MINING
一种快速频繁模式挖掘算法 预览 被引量:5
2
作者 石杰 《烟台大学学报:自然科学与工程版》 CAS 2015年第2期113-118,共6页
频繁模式挖掘是数据挖掘领域中一个重要的研究方向,目前已有很多算法被用于挖掘频繁模式.本文在研究FP-growth算法的基础上,提出一种新的频繁模式挖掘算法——QFP算法.首先对每一个频繁项建立一棵QFP树,进而根据设定的条件对每棵树进行... 频繁模式挖掘是数据挖掘领域中一个重要的研究方向,目前已有很多算法被用于挖掘频繁模式.本文在研究FP-growth算法的基础上,提出一种新的频繁模式挖掘算法——QFP算法.首先对每一个频繁项建立一棵QFP树,进而根据设定的条件对每棵树进行挖掘,直到找出符合条件的频繁模式.实验证明该算法能够减少条件子树的生成数量,降低对内存空间的依赖和CPU的计算时间,从而提高关联规则挖掘的效率. 展开更多
关键词 数据挖掘 频繁模式 项集
在线阅读 下载PDF
有效的矩阵加权正负关联规则挖掘算法——MWARM-SRCCCI 预览
3
作者 周秀梅 黄名选 《计算机应用》 CSCD 北大核心 2014年第10期2820-2826,共7页
针对现有加权关联规则挖掘算法不能适用于矩阵加权数据的缺陷,给出一种新的矩阵加权项集剪枝策略,构建矩阵加权正负关联模式评价框架SRCCCI,提出一种新的基于SRCCCI评价框架的矩阵加权正负关联规则挖掘算法MWARM—SRCCCI。该算法克... 针对现有加权关联规则挖掘算法不能适用于矩阵加权数据的缺陷,给出一种新的矩阵加权项集剪枝策略,构建矩阵加权正负关联模式评价框架SRCCCI,提出一种新的基于SRCCCI评价框架的矩阵加权正负关联规则挖掘算法MWARM—SRCCCI。该算法克服了现有挖掘技术的缺陷,采用新的剪枝技术和模式评价方法,挖掘有效的矩阵加权正负关联规则,避免一些无效和无趣的模式产生。以中文Web测试集CWT200g为实验数据,与现有无加权正负关联规则挖掘算法比较,MWARM—SRCCCI算法的挖掘时间减幅最大可达74.74%。理论分析和实验结果表明,MWARM—SRCCCI算法具有较好的剪枝效果,候选项集数量和挖掘时间明显减少,挖掘效率得到极大提高,其关联模式可为信息检索提供可靠的查询扩展词来源。 展开更多
关键词 数据挖掘 关联规则 矩阵加权正负关联规则 项集
在线阅读 下载PDF
基于数据挖掘关联规则Apriori改进算法的入侵检测系统的研究 预览 被引量:2
4
作者 张浩 景凤宣 谢晓尧 《贵州师范大学学报:自然科学版》 CAS 2011年第3期 84-87,共4页
在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项... 在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项集,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,改进后的算法能有效地提高关联规则挖掘的效率。 展开更多
关键词 数据挖掘 APRIORI算法 频繁项集 入侵检测系统
在线阅读 免费下载
应用于入侵检测系统的报警关联的改进Apriori算法 预览 被引量:4
5
作者 王台华 万宇文 +1 位作者 郭帆 余敏 《计算机应用》 CSCD 北大核心 2010年第7期 1785-1788,共4页
在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。提出了一种一步交集操作得到最大频繁项目集的方法。支持度由交集的次数得到而无需再去... 在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。提出了一种一步交集操作得到最大频繁项目集的方法。支持度由交集的次数得到而无需再去扫描事务数据库,将其中一些属性进行编号能减少存储空间且方便搜索候选集列表,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,优化后的算法能有效地提高关联规则挖掘的效率。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 项集 入侵检测系统
在线阅读 下载PDF
一种用作频繁项集挖掘的改进Apriori算法 预览 被引量:2
6
作者 陈宇晖 曹敦 傅明 《微计算机信息》 2010年第24期138-140,共3页
关联规则挖掘是数据挖掘领域的一个热点。Apriori算法作为进行关联规则挖掘的一种重要算法,其应用范围相当广泛。但用传统的Apriori算法做关联规则挖掘时,需要为每一个候选项集C的成员扫描整个数据库来确定其支持度。当数据库或数据仓... 关联规则挖掘是数据挖掘领域的一个热点。Apriori算法作为进行关联规则挖掘的一种重要算法,其应用范围相当广泛。但用传统的Apriori算法做关联规则挖掘时,需要为每一个候选项集C的成员扫描整个数据库来确定其支持度。当数据库或数据仓很大时,算法的运行时间非常长。为此本文提出了一种改进的Apriori算法,该算法在使用Apriori性质删除候选项集时,采用频繁子集数量多少的判别方式减少对上级频繁项集的扫描。在计算候选项集支持度时,采用FP-树作为数据结构存储数据,从而大大降低了对数据库的扫描次数,提高算法的整体效率。经过一些列的实验论证,改进的Apriori算法效率比传统的高,尤其在支持度较低,数据库较大时,优势明显。 展开更多
关键词 APRIORI算法 FP-树 数据挖掘 关联规则 项集
在线阅读 下载PDF
关联规则在图像数据挖掘中的应用 预览 被引量:5
7
作者 黄秋勇 唐爱龙 《计算机与现代化》 2009年第10期 98-100,共3页
首先分析传统用在挖掘结构化数据关联规则的基本思想。然后分析图像数据的特征,找出图像数据与传统结构化数据的区别,最后结合图像数据的特性将传统的关联规则进行改进,并将它应用在图像数据挖掘中,挖掘出图像数据的相关性。
关键词 关联规则 图像数据挖掘 项集 描述集 支持度
在线阅读 下载PDF
基于项集支持度的关联规则增量更新算法——BISIUA 预览 被引量:4
8
作者 李志刚 李峰 +1 位作者 张善姝 王汝琳 《计算机工程与设计》 CSCD 北大核心 2007年第17期 4072-4074,4078,共4页
对当最小支持度和最小置信度都不变的情况下数据库中数据量增加时的关联规则增量更新问题进行了研究。给出了一个简单的判定公式,依据项集在原数据库DB和新添加的数据库db中的实际支持度来判定该项集在更新后的数据库DB∪db中是否频繁。... 对当最小支持度和最小置信度都不变的情况下数据库中数据量增加时的关联规则增量更新问题进行了研究。给出了一个简单的判定公式,依据项集在原数据库DB和新添加的数据库db中的实际支持度来判定该项集在更新后的数据库DB∪db中是否频繁。对Apriori算法进行了改进,使其能适应本增量更新算法。对BISIUA算法思想进行了详细的论述,并在此基础上给出了该算法的形式化描述。由理论分析可知,BISIUA算法能有效提高关联规则增量更新的效率。 展开更多
关键词 数据挖掘 关联规则 增量更新 支持度 项集
在线阅读 下载PDF
序列模式挖掘导引 预览
9
作者 蔡静 《科技信息》 2007年第36期 24-25,共2页
从大量的序列数据中发现有用的模式是数据挖掘的一项重要任务,本文简单介绍了序列模式挖掘主要算法的基本框架,对算法涉及的概念给出形式化的定义。
关键词 序列模式挖掘 项集 序列 APRIORI
在线阅读 下载PDF
基于JEP平均长度的分类方法 预览
10
作者 于大东 刘东波 +1 位作者 罗睿 王建新 《计算机科学》 CSCD 北大核心 2007年第3期 165-167,185,共4页
本文研究了JEP——一种在不同数据集之间支持度从零到非零跳跃性变化的项集在数据分类中存在的问题,提出了项集独立支持度的概念。相对于传统的项集支持度来说,独立支持度能够更加全面地描述数据的分布特征,为更加准确的分类提供依... 本文研究了JEP——一种在不同数据集之间支持度从零到非零跳跃性变化的项集在数据分类中存在的问题,提出了项集独立支持度的概念。相对于传统的项集支持度来说,独立支持度能够更加全面地描述数据的分布特征,为更加准确的分类提供依据。进而,在独立支持度的基础上提出了JEP平均长度的概念,并提出了一种以测试样本所覆盖JEP的平均长度作为分类特征的分类方法,该方法可以更加有效地区分类边界上的数据,能够为数据提供更为准确的分类。 展开更多
关键词 项集 关联规则 跳跃式显露模式 分类
在线阅读 免费下载
基于关系数据库的关联规则的形式化开采 预览 被引量:1
11
作者 张博 张虹 《计算机工程与设计》 CSCD 北大核心 2006年第24期 4663-4666,共4页
从研究关联规则概念入手,探讨了项目、项目集合和交易数据库等概念在关系数据库中的具体含义,提出了一种全面的、易于理解和使用的关联规则形式化描述方法,并给出了开采关系型数据库中关联规则的一般过程,这为关系型数据库中关联规... 从研究关联规则概念入手,探讨了项目、项目集合和交易数据库等概念在关系数据库中的具体含义,提出了一种全面的、易于理解和使用的关联规则形式化描述方法,并给出了开采关系型数据库中关联规则的一般过程,这为关系型数据库中关联规则开采系统的设计奠定了基础,对系统设计者有一定的指导意义。 展开更多
关键词 数据挖掘 关联规则 关系型数据库 项目 项目集合
在线阅读 下载PDF
一种用于数据挖掘的二进制挖掘算法 预览 被引量:3
12
作者 何友全 肖建 +2 位作者 黄碧霞 雷妍 熊启军 《计算机应用研究》 CSCD 北大核心 2004年第5期 15-16,34,共3页
提出了一种用于数据挖掘的二进制挖掘算法,适用于大型数据仓库的挖掘与分析,其基本原理是运用二进制逻辑"与"运算,从其多属性值域中抽取关键信息,形成决策规则.此方法原理简单、挖掘效率高、适应性强,对电力系统的数据挖掘具... 提出了一种用于数据挖掘的二进制挖掘算法,适用于大型数据仓库的挖掘与分析,其基本原理是运用二进制逻辑"与"运算,从其多属性值域中抽取关键信息,形成决策规则.此方法原理简单、挖掘效率高、适应性强,对电力系统的数据挖掘具有重要的作用. 展开更多
关键词 电力系统 数据挖掘 二进制 支持度 可信度 项集
在线阅读 下载PDF
关联规则在医疗数据分析中的应用 预览 被引量:32
13
作者 李虹 蔡之华 《微机发展》 2003年第6期 94-97,共4页
介绍了从医疗数据中发现关联规则的方法,分析了医疗数据的特点,并以心脏疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一种改进的Apriori算... 介绍了从医疗数据中发现关联规则的方法,分析了医疗数据的特点,并以心脏疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一种改进的Apriori算法,并用数据进行测试.结果表明,此算法优于Apriori算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则. 展开更多
关键词 心脏疾病 医疗数据分析 关联规则 数据挖掘 数值属性 APRIORI算法 数据库
在线阅读 下载PDF
Efficient Mining of Association Rules by Reducing the Number of Passes voer the Database
14
作者 李庆忠 王海洋 《计算机科学技术学报:英文版》 SCIE EI CSCD 2001年第2期 182-188,共7页
This paper introduces a new algorithm of mining association rules.The algorithm RP counts the itemsets with different sizes in the same pass of scanning over the database by dividing the database into m partitions.The... This paper introduces a new algorithm of mining association rules.The algorithm RP counts the itemsets with different sizes in the same pass of scanning over the database by dividing the database into m partitions.The total number of pa sses over the database is only(k+2m-2)/m,where k is the longest size in the itemsets.It is much less than k . 展开更多
关键词 数据库系统 关联规则 数据挖掘 数据采集
基于重构的改进自然排序树算法 预览
15
作者 杜媛 张世伟 《计算机应用》 CSCD 北大核心 2019年第2期441-445,共5页
针对自然排序树(CAN-tree)算法构建的树结构节点个数过多、压缩性不高等问题,提出一种基于重构的改进CAN-tree算法。首先,使用自然排序法直接构建树结构,将频繁项集挖掘算法实现中数据库扫描次数减少至1;然后,对构建的树结构以支持度降... 针对自然排序树(CAN-tree)算法构建的树结构节点个数过多、压缩性不高等问题,提出一种基于重构的改进CAN-tree算法。首先,使用自然排序法直接构建树结构,将频繁项集挖掘算法实现中数据库扫描次数减少至1;然后,对构建的树结构以支持度降序方式结合剪枝操作实现树结构的重构,得到高压缩性的树结构;最后,对重构的树结构进行频繁项集挖掘。实验结果表明,基于重构的改进CAN-tree算法所构建的树结构节点个数减少至原来的20%以下,执行效率提高了4至6倍,在频繁项集挖掘中有效地压缩了树结构,缩短了算法的执行时间。 展开更多
关键词 频繁项集 频繁项集头表 重构 剪枝 最小支持度
在线阅读 下载PDF
一种基于FP树快速挖掘非可推导项集算法 预览
16
作者 许普乐 纪允 《淮南师范学院学报》 2019年第2期116-121,共6页
频繁项集的精简表示是数据挖掘领域中一个研究热点,非可推导项集模型利用了容斥原理压缩频繁项集的数量。传统的挖掘算法在挖掘的过程中,存在多次扫描数据库、重复生成候选项集等效率低下的问题。文章提出一种新的算法MNDIBFP,该算法利... 频繁项集的精简表示是数据挖掘领域中一个研究热点,非可推导项集模型利用了容斥原理压缩频繁项集的数量。传统的挖掘算法在挖掘的过程中,存在多次扫描数据库、重复生成候选项集等效率低下的问题。文章提出一种新的算法MNDIBFP,该算法利用利用FP树压缩数据库,同时结合一定的剪枝策略,达到快速挖掘非可推导项集的目的。实验效果证明,该算法在时间消耗和空间消耗均优于传统算法。 展开更多
关键词 频繁项集 精简表示 非可推导项集 容斥原理 FP树 剪枝策略
在线阅读 下载PDF
不确定数据频繁项集挖掘算法研究 预览
17
作者 赵学健 熊肖肖 +1 位作者 张欣慧 孙知信 《计算机技术与发展》 2019年第7期140-144,共5页
频繁项集挖掘的目标是以频繁出现的项目集的形式发掘嵌入在海量数据中的隐式的、先前未知的、潜在的有用知识,以辅助决策。随着数据采集方式和传输方式的多样化,不确定数据在各种实际应用中大量出现。因此,近年来针对不确定数据的频繁... 频繁项集挖掘的目标是以频繁出现的项目集的形式发掘嵌入在海量数据中的隐式的、先前未知的、潜在的有用知识,以辅助决策。随着数据采集方式和传输方式的多样化,不确定数据在各种实际应用中大量出现。因此,近年来针对不确定数据的频繁项集挖掘算法的研究引起了学者的广泛关注。文中首先介绍了不确定数据的定义,并分析了不确定数据频繁项集挖掘的概率模型。接下来,将主流频繁项集挖掘算法分为3类:基于候选项集生成和测试的频繁项集挖掘算法,基于模式增长的频繁项集挖掘算法和基于生物启发的频繁项集挖掘算法,详细介绍了当前针对不确定数据的主流频繁项集挖掘算法,并对这些算法的性能进行了简单分析。最后,对不确定数据的频繁项集挖掘算法进行了总结与展望。 展开更多
关键词 频繁项集 不确定数据 候选项集 模式增长 生物启发
在线阅读 下载PDF
基于快速高效用项集挖掘的大规模消息流预测算法研究与应用 预览
18
作者 穆晓芳 邓红霞 +1 位作者 郭虎升 赵鹏 《计算机应用与软件》 北大核心 2019年第11期243-249,共7页
为了提高大规模消息流话题预测的准确性与效率,提出基于高效用项集挖掘的消息流话题预测算法.计算时间窗口中词汇的内部效用与外部效用,根据会话内所有词汇的效用计算最小效用值;采用高效用项集挖掘算法产生候选话题模式集,随之提取最... 为了提高大规模消息流话题预测的准确性与效率,提出基于高效用项集挖掘的消息流话题预测算法.计算时间窗口中词汇的内部效用与外部效用,根据会话内所有词汇的效用计算最小效用值;采用高效用项集挖掘算法产生候选话题模式集,随之提取最终的话题模式.为了提高高效用项集挖掘的时间效率与存储效率,设计三角项集效用树保存项集的效用信息,设计话题搜索树保存候选话题模式集.最终基于真实消息流数据集进行实验,结果显示该算法有效地提高了话题预测的准确率,并且实现了较快的响应时间. 展开更多
关键词 高效用项集挖掘 频繁项集挖掘 数据流 话题预测 大数据 网络安全
在线阅读 下载PDF
应用于音乐节目分类的Apriori挖掘算法设计 预览
19
作者 李臻 《现代电子技术》 北大核心 2019年第19期90-94,共5页
传统Apriori挖掘算法需多次扫描数据库、多次连接频繁项集,导致挖掘效率较低,为此对Apriori挖掘算法加以改进,设计一种新的Apriori挖掘算法用于音乐节目分类。改进的Apriori挖掘算法采用莱特准则对音频数据进行野值与噪声平滑处理,改进A... 传统Apriori挖掘算法需多次扫描数据库、多次连接频繁项集,导致挖掘效率较低,为此对Apriori挖掘算法加以改进,设计一种新的Apriori挖掘算法用于音乐节目分类。改进的Apriori挖掘算法采用莱特准则对音频数据进行野值与噪声平滑处理,改进Apriori挖掘算法的音频数据库映射令两个线性表分别负责音频数据存储和对应项存储,音频数据库扫描次数降为一次;改进Apriori挖掘算法的连接次数无需对不具备交运算能力的元素进行交运算操作,减少频繁项集连接次数。基于改进频繁项集Apriori挖掘算法挖掘频繁项集、生成音频数据关联规则,基于关联规则集构建分类器,实现音乐节目分类。实验结果显示,改进Apriori挖掘算法用于音乐节目分类的效率优势突出,准确度高。 展开更多
关键词 音乐节目 节目分类 Apriori挖掘算法 分类器构建 频繁项集 关联规则
在线阅读 下载PDF
基于单向频繁模式树的频繁项集挖掘算法 预览
20
作者 蒋东洁 李玲娟 《计算机技术与发展》 2019年第10期175-180,共6页
频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针... 频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针对这一问题,设计了一种基于单向频繁模式树的频繁项集挖掘算法UFIM。此算法首先构造一种单向频繁模式树UFP-tree结构,然后在UFP-tree上引入被约束子树,并对指向不同端点和指向相同端点的被约束子树分别采用递归和非递归的方法来挖掘频繁项集。非递归的方法判断端点的支持度计数是否小于最小支持度计数,若小于最小支持度计数则该棵被约束子树无频繁项集,否则其频繁项集是除根节点外的节点的排列组合。在mushroom数据集上的实验结果表明,UFIM算法的运行速度高于同类算法。 展开更多
关键词 数据挖掘 频繁项集 单向频繁模式树 被约束子树
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部 意见反馈