期刊文献+
共找到2,293篇文章
< 1 2 115 >
每页显示 20 50 100
On the Matrices of Pairwise Frequencies of Categorical Attributes for Objects Classification 预览
1
作者 Vladimir N. Shats 《智能学习系统与应用(英文)》 2019年第4期65-75,共11页
This paper proposes two new algorithms for classifying objects with categorical attributes. These algorithms are derived from the assumption that the attributes of different object classes have different probability d... This paper proposes two new algorithms for classifying objects with categorical attributes. These algorithms are derived from the assumption that the attributes of different object classes have different probability distributions. One algorithm classifies objects based on the distribution of the attribute frequencies, and the other classifies objects based on the distribution of the pairwise attribute frequencies described using a matrix of pairwise frequencies. Both algorithms are based on the method of invariants, which offers the simplest dependencies for estimating the probabilities of objects in each class by an average frequency of their attributes. The estimated object class corresponds to the maximum probability. This method reflects the sensory process models of animals and is aimed at recognizing an object class by searching for a prototype in information accumulated in the brain. Because these matrices may be sparse, the solution cannot be determined for some objects. For these objects, an analog of the k-nearest neighbors method is provided in which for each attribute value, the class to which the majority of the k-nearest objects in the training sample belong is determined, and the most likely class value is calculated. The efficiencies of these two algorithms were confirmed on five databases. 展开更多
关键词 CATEGORICAL Attributes Classification ALGORITHMS INVARIANTS of Matrix DATA DATA Processing
在线阅读 免费下载
基于分布式数据流的网络处理器数据收集分类平台 预览
2
作者 段汝林 林德丰 《现代电子技术》 北大核心 2019年第4期117-120,共4页
自适应分布式数据流处理调整技术进行分布式数据收集与分类时,未构建精准的数据分类器,导致分类精度有所偏差,设计基于分布式数据流的网络处理器数据收集分类平台。所设计平台总体架构包括平台管理层、分布式数据收集层、分布式数据分类... 自适应分布式数据流处理调整技术进行分布式数据收集与分类时,未构建精准的数据分类器,导致分类精度有所偏差,设计基于分布式数据流的网络处理器数据收集分类平台。所设计平台总体架构包括平台管理层、分布式数据收集层、分布式数据分类层;网络处理器通过网络交换机端口接收分布式数据流,采用变压器、PHY处理所获数据,与主控芯片FPGA交互将数据保存,实现分布式数据流收集;网络处理器实现分布式数据流分类过程包括训练阶段与测试阶段,训练阶段采用分布式数据流更新规则完成数据特征选择,测试阶段进行分布式数据流分类特征更新,对关联度较大的特征数据实施筛选,实现分布式数据流的分类。实验结果表明,所设计平台分类精确度均值高达99.5%,且用时短、使用内存小。 展开更多
关键词 分布式数据流 网络处理器 数据收集 数据分类 分类平台 特征更新
在线阅读 下载PDF
基于微分方程的大数据分类系统设计 预览
3
作者 潘文秀 《现代电子技术》 北大核心 2019年第4期27-30,36共5页
基于正交分解的大数据分类系统未运用微分分类数学模型进行大数据分类,存在分类准确率低的问题。为此设计基于微分方程的大数据分类系统。该系统硬件主要包括数据采集器和存储模块,数据采集器由芯片和单片机组成,将采集的数据通过网络... 基于正交分解的大数据分类系统未运用微分分类数学模型进行大数据分类,存在分类准确率低的问题。为此设计基于微分方程的大数据分类系统。该系统硬件主要包括数据采集器和存储模块,数据采集器由芯片和单片机组成,将采集的数据通过网络接口传送给网络处理器进行处理;存储模块用于储存系统中所有数据,该模块分为应用层、功能层、语义层、设计层和数据层。系统软件部分,通过建立具有二阶时滞的微分方程,及微分分类数学模型规范集约束条件,进行微分分类数学模型的构建;根据微分分类数学模型设计大数据分类代码,实现大数据分类。实验结果表明,所设计的系统大数据分类准确率高达95%,内存占用率仅为21%~32%,具有较高的分类性能。 展开更多
关键词 微分方程 大数据 分类系统 微分分类 数学模型 数据采集
在线阅读 下载PDF
A Method for the Detection of Decrease in Power in PV Systems Using Satellite Data 预览
4
作者 Kota Kawasaki Keiichi Okajima 《智能电网与可再生能源(英文)》 2019年第1期1-15,共15页
In this paper, a method to detect a decrease in the output power of photovoltaic systems is proposed. This method is based on using satellite irradiance data. In addition, fault detection is carried out with only one ... In this paper, a method to detect a decrease in the output power of photovoltaic systems is proposed. This method is based on using satellite irradiance data. In addition, fault detection is carried out with only one day’s data in this method. Thus, the time elapses since the decrease in output is shorter than with the other methods. In order to mitigate the error in satellite data and improve the accuracy of fault detection, data extraction is carried out, which consists of two steps. In the first step, effective data are extracted by setting a lower irradiance limit. In the second step, “Calculation day” is determined depending on the number of effective data in one day. Fault detection, which is only conducted on the Calculation day, is conducted by comparing the expected power and the measured power. The parameters used in this study were optimized by testing 45 systems that appear normal. Subsequently, 340 systems were analyzed with the proposed method, using optimized parameters. The results showed the effectiveness of our method from the viewpoints of both accuracy and time required. In addition, three data extraction methods were considered to distinguish between the permanent decrease caused by failure, and the temporary decrease caused by partial shade. Fuzzy cluster analysis showed the best result among the three methods used. 展开更多
关键词 PV System FAULT DETECTION FAULT CLASSIFICATION SATELLITE Data
在线阅读 免费下载
湿地植被遥感分类研究进展
5
作者 张强 《世界林业研究》 CSCD 北大核心 2019年第3期49-54,共6页
植被是湿地生态系统的重要组成部分,湿地植被遥感分类研究能为湿地保护、管理和恢复提供实践指导。文中主要从湿地植被遥感分类的数据源和分类方法2方面综述湿地植被遥感分类研究的现状,分析目前湿地植被遥感分类研究的不足,展望未来我... 植被是湿地生态系统的重要组成部分,湿地植被遥感分类研究能为湿地保护、管理和恢复提供实践指导。文中主要从湿地植被遥感分类的数据源和分类方法2方面综述湿地植被遥感分类研究的现状,分析目前湿地植被遥感分类研究的不足,展望未来我国湿地植被遥感分类的发展趋势。 展开更多
关键词 湿地植被 遥感分类 数据源 分类方法
A new distributed feature selection technique for classifying gene expression data
6
作者 Sarah M.Ayyad Ahmed I.Saleh Labib M.Labib 《生物数学学报:英文版》 2019年第4期79-109,共31页
Classification of gene expression data is a pivotal research area that plays a substantial role in diagnosis and prediction of diseases. Generally, feature selection is one of the extensively used techniques in data m... Classification of gene expression data is a pivotal research area that plays a substantial role in diagnosis and prediction of diseases. Generally, feature selection is one of the extensively used techniques in data mining approaches, especially in classification. Gene expression data are usually composed of dozens of samples characterized by thousands of genes. This increases the dimensionality coupled with the existence of irrelevant and redundant features. Accordingly, the selection of informative genes (features) becomes difficult, which badly affects the gene classification accuracy. In this paper, we consider the feature selection for classifying gene expression microarray datasets. The goal is to detect the most possibly cancer-related genes in a distributed manner, which helps in effectively classifying the samples. Initially, the available huge amount of considered features are subdivided and distributed among several processors. Then, a new filter selection method based on a fuzzy inference system is applied to each subset of the dataset. Finally, all the resulted features are ranked, then a wrapper-based selection method is applied. Experimental results showed that our proposed feature selection technique performs better than other techniques since it produces lower time latency and improves classification performance. 展开更多
关键词 Feature selection gene expression dimensionality reduction MICROARRAY data CLASSIFICATION DISTRIBUTED learning MATHEMATICS Subject CLASSIFICATION
数据挖掘中分类算法的可扩展性探讨 预览
7
作者 曹素娥 《软件》 2019年第10期155-158,共4页
为了更加灵活的应用分类算法,针对数据挖掘中分类算法的可扩展性展开分析,首先介绍决策树分类算法、K最近邻分类算法这2种常见分类算法,并且分析分类算法的可扩展性,明确分类算法的作用以及扩展分类算法的3点原因,最后从应用快速算法、... 为了更加灵活的应用分类算法,针对数据挖掘中分类算法的可扩展性展开分析,首先介绍决策树分类算法、K最近邻分类算法这2种常见分类算法,并且分析分类算法的可扩展性,明确分类算法的作用以及扩展分类算法的3点原因,最后从应用快速算法、及时分割数据、表达与维护数据关系这3个方面着手,阐述可扩展性的实现方法。数据挖掘中分类算法的可扩展性能够充分发挥分类算法优势,提高分类结果准确性,及时完成数据挖掘。因此本文主要研究了数据挖掘中分类算法的可扩展性,希望能够提供一定的参考价值。 展开更多
关键词 数据挖掘 分类算法 可扩展性 决策树分类算法
在线阅读 下载PDF
数据集分类可用性评估的置信区间方法 预览 被引量:1
8
作者 谈询滔 顾依依 +1 位作者 阮彤 袁玉波 《计算机科学》 CSCD 北大核心 2019年第1期78-85,共8页
如何有效评价训练数据集的可用性,一直是困扰智能分类系统应用的难点问题。针对机器学习领域的数据分类问题,提出了一种基于区间分析和信息粒化的数据集分类可用性的评估方法,用于评价数据集的可分程度。该方法将待评估的数据集定义为... 如何有效评价训练数据集的可用性,一直是困扰智能分类系统应用的难点问题。针对机器学习领域的数据分类问题,提出了一种基于区间分析和信息粒化的数据集分类可用性的评估方法,用于评价数据集的可分程度。该方法将待评估的数据集定义为分类信息系统,提出了分类置信区间的概念,通过区间分析进行信息粒化。在此信息粒化策略下,定义分类可用性的数学模型,并进一步给出单个属性以及整体数据集的分类可用性的计算方法。选择18个UCI标准数据集作为评估对象,给出了部分数据集分类可用性的评估结果,并且选取3种分类器对所选数据集进行分类实验,最终通过对上述实验结果的分析证明了该评估方法的有效性和可行性。 展开更多
关键词 数据可用性 分类系统 区间分析 信息粒化 分类可用性
在线阅读 免费下载
海洋环境安全数据分类体系研究 预览
9
作者 宋晓 韩璐遥 +1 位作者 梁建峰 崔晓健 《海洋信息》 2019年第1期1-5,共5页
分析海洋环境安全数据的来源和资料类型等属性,开展海洋环境安全数据分类管理体系研究,参考海洋环境分类方法,结合海洋动力灾害、海洋生态灾害、海上突发事件等海洋环境安全事件特征,制定对应的海洋环境安全数据分类方法;按照数据来源... 分析海洋环境安全数据的来源和资料类型等属性,开展海洋环境安全数据分类管理体系研究,参考海洋环境分类方法,结合海洋动力灾害、海洋生态灾害、海上突发事件等海洋环境安全事件特征,制定对应的海洋环境安全数据分类方法;按照数据来源、学科要素、业务领域、功能用途等特征,开展海洋环境安全数据的体系设计和分类细化,为海洋环境安全数据的存储、管理和应用提供参考。 展开更多
关键词 海洋环境安全 数据分类 分类方法
在线阅读 下载PDF
基于电力大数据的用户用电行为分析研究综述 预览 被引量:3
10
作者 辛苗苗 张延迟 解大 《电气自动化》 2019年第1期1-4,27共5页
随着能源互联网与智能电网技术的不断发展,电力大数据蕴含的潜在价值也在不断被挖掘。以电力大数据为基础,介绍了电力大数据技术和国内外关于电力大数据分析用户用电行为的实例,最后介绍了应用电力大数据对用户进行分类,确定用户用电行... 随着能源互联网与智能电网技术的不断发展,电力大数据蕴含的潜在价值也在不断被挖掘。以电力大数据为基础,介绍了电力大数据技术和国内外关于电力大数据分析用户用电行为的实例,最后介绍了应用电力大数据对用户进行分类,确定用户用电行为影响因子和对用户用电行为进行分析的常用研究方法。 展开更多
关键词 电力大数据 数据挖掘 用户分类 影响因子 用电行为分析
在线阅读 下载PDF
海洋地质地球物理数据分类与组织 预览
11
作者 刘志杰 孔敏 +3 位作者 舒雨婷 王风帆 韩璐遥 田先德 《海洋通报》 CAS CSCD 北大核心 2019年第4期415-421,共7页
信息技术的快速变革,有效驱动海洋信息化的发展与创新。实现海洋信息资源的高效存储和管理,需要对海洋数据管理体系进行统筹规划。文章根据海洋地质地球物理数据特点,进行了数据层次分类研究,分析了数据标准化过程,确立了基于文件和数... 信息技术的快速变革,有效驱动海洋信息化的发展与创新。实现海洋信息资源的高效存储和管理,需要对海洋数据管理体系进行统筹规划。文章根据海洋地质地球物理数据特点,进行了数据层次分类研究,分析了数据标准化过程,确立了基于文件和数据库的海洋地质地球物理数据存储策略,提出结构化事务型数据库、结构化分析型数据库(NewSQL)和非结构化计算型数据库(NoSQL)相结合的数据组织架构。该数据分类组织方案为实现海洋地质地球物理数据规范化管理、集约利用和共享服务奠定了良好基础,也为其他海洋数据分类与组织研究提供了参考。 展开更多
关键词 海洋地质地球物理 数据组织 数据分类 数据库
在线阅读 下载PDF
基于层级规则树的跨平台基因表达数据分类 预览
12
作者 蔡瑞初 侯永杰 郝志峰 《计算机工程》 CAS CSCD 北大核心 2019年第7期26-31,共6页
基因检测技术运用至今已积累大量来自不同平台的数据,针对传统数据分类模式难以在不同平台间进行有效迁移的问题,提出一种基于层级规则树的基因表达数据分类算法k-HRT。设计数据转换与规则预筛选策略,实现算法的快速挖掘,以解决由跨平... 基因检测技术运用至今已积累大量来自不同平台的数据,针对传统数据分类模式难以在不同平台间进行有效迁移的问题,提出一种基于层级规则树的基因表达数据分类算法k-HRT。设计数据转换与规则预筛选策略,实现算法的快速挖掘,以解决由跨平台特性所带来的大规模数据问题。在真实基因表达数据集上的实验结果表明,相对k-TSP算法、SVM-RFE算法,k-HRT算法能够有效提高分类精度。 展开更多
关键词 数据分类 跨平台 规则学习 特征选择 基因表达数据
在线阅读 下载PDF
利用区域化探数据推断地质体空间分布 预览
13
作者 徐剑波 陈军林 《地质与勘探》 CSCD 北大核心 2019年第5期1214-1222,共9页
区域化探数据可以反映地层的空间分布,利用区域化探数据借助有效的数据挖掘方法,能够提取出其中包含的地质信息,对于覆盖区填图以及矿产勘查有重要意义,其中的关键问题是如何进行数据挖掘。随机森林算法是近年来热门的机器学习方法,本... 区域化探数据可以反映地层的空间分布,利用区域化探数据借助有效的数据挖掘方法,能够提取出其中包含的地质信息,对于覆盖区填图以及矿产勘查有重要意义,其中的关键问题是如何进行数据挖掘。随机森林算法是近年来热门的机器学习方法,本文应用随机森林算法结合非平衡数据集分类方法提出了一种新的化探数据挖掘方法,通过实例研究验证表明该方法准确率高,能够有效地提取出区域化探数据中的地质信息。 展开更多
关键词 化探 数据挖掘 随机森林 分类 非平衡数据
在线阅读 下载PDF
船舶航线数据库关键数据提取数学建模分析 预览
14
作者 谢慧杰 《舰船科学技术》 北大核心 2019年第6期52-54,共3页
针对传统关键数据提取模型提取准确率和召回率双低的问题,建立了一个新的船舶航线数据库关键数据提取数学模型。该模型首先需要构建一个分类器,利用分类器将数据库中的数据进行分类;然后将四叉树、R-树相结合构建一个复合型OR-树结构关... 针对传统关键数据提取模型提取准确率和召回率双低的问题,建立了一个新的船舶航线数据库关键数据提取数学模型。该模型首先需要构建一个分类器,利用分类器将数据库中的数据进行分类;然后将四叉树、R-树相结合构建一个复合型OR-树结构关键数据索引;最后利用建立好的关键数据索引在分类好的数据中提取关键数据。结果表明:与利用主成分分析或粗糙集理论建立的提取模型相比,利用本次构建的模型进行关键数据提取,提取准确率提高3.3%和9.4%,召回率提高6.2%和7.9%。 展开更多
关键词 航线数据库 关键数据 提取数学模型 分类 数据索引
在线阅读 下载PDF
基于大数据分析的增强型网络文档分类模型 预览
15
作者 孙护军 《计算机工程与设计》 北大核心 2019年第3期755-761,共7页
针对海量网络文档涵盖着广泛的主题和类别,需要使用大数据技术提取有用信息的问题,使用文本挖掘技术和进化模糊算法,基于模糊规则的分类器,提出一种增强型网络文档分类模型,将网络文档归到不同类别(领域)中,进化模糊算法可依据文档内容... 针对海量网络文档涵盖着广泛的主题和类别,需要使用大数据技术提取有用信息的问题,使用文本挖掘技术和进化模糊算法,基于模糊规则的分类器,提出一种增强型网络文档分类模型,将网络文档归到不同类别(领域)中,进化模糊算法可依据文档内容的变化实现文档分类的动态实时更新。通过和其它经典分类算法对比,验证了该分类算法能够取得较好的效果。 展开更多
关键词 网络文档 数据挖掘 大数据 分类 模糊规则
在线阅读 下载PDF
智慧广州时空信息云平台数据即服务设计与实现 预览
16
作者 张鹏程 杨梅 何华贵 《地理空间信息》 2019年第9期9-11,40,I0001共5页
以广州市为例,介绍了时空大数据的分类组成以及数据即服务的类型与方式。针对一般用户和平台管理员分别开发了云平台门户网站、辅助应用子系统和运维管理子系统,实现了数据即服务从前端预览、申请到后台审批、运维的完整服务流程。
关键词 智慧广州 时空信息云平台 数据即服务 数据分类 运维管理
在线阅读 下载PDF
网络教育数据分类与分析研究 预览
17
作者 蔡梅 孙力 《软件导刊》 2019年第5期215-218,共4页
随着互联网技术飞速发展以及网络教育普及应用,教育成为与大数据非常相关的行业,分析教育大数据将成为优化现代远程教育的重要一环。为对网络学历教育中产生的数据进行分类并提出分析建议,首先探讨了大数据、教育大数据的概念及特征;继... 随着互联网技术飞速发展以及网络教育普及应用,教育成为与大数据非常相关的行业,分析教育大数据将成为优化现代远程教育的重要一环。为对网络学历教育中产生的数据进行分类并提出分析建议,首先探讨了大数据、教育大数据的概念及特征;继而以江南大学网络教育平台数据为依托,立足学习者个体的静态数据和学习过程中产生的动态学习行为数据,以大数据下网络教育模型为依据,将网络教育数据分类为教学资源数据、教育教学管理数据、教与学行为数据、教育教学评估数据,并为数据分析提出建议。 展开更多
关键词 网络教育 教育大数据 数据分类
在线阅读 免费下载
光纤网络异常数据特征分类研究
18
作者 何艳 《激光杂志》 北大核心 2019年第5期173-177,共5页
对光纤网络异常数据特征进行分类,可有效确定光纤网络出现异常的原因,提高光纤网络安全,降低其受到网络入侵的风险。目前对光纤网络中异常数据特征分类的方法未考虑异常数据的分布特点及复杂性,易陷入局部最优解,使得异常数据特征分类... 对光纤网络异常数据特征进行分类,可有效确定光纤网络出现异常的原因,提高光纤网络安全,降低其受到网络入侵的风险。目前对光纤网络中异常数据特征分类的方法未考虑异常数据的分布特点及复杂性,易陷入局部最优解,使得异常数据特征分类效果较差,不利于异常数据检测。提出基于支持向量机的光纤网络中异常数据特征分类研究。选取数据不同异常特征,以异常数据特征选择概率作为决策变量,利用粒子群方法对决策变量进行优化求解,产生微粒的引导,确定数据集分布性,跳出局部的最优,利用重采样、数据特征空间等一些相关的理论,经过数据分层抽样,利用支持向量机分类分布性光纤网络中数据异常特征。实验的结果表明,利用所提方法分类数据异常特征,能有效提高数据异常特征分类的效率与性能,为后续数据异常检测提供依据。 展开更多
关键词 光纤网络 异常数据 特征分类 数据分析
大数据应用中的个人信息分级保护研究 预览
19
作者 高磊 李晨旸 赵章界 《信息安全研究》 2019年第5期394-399,共6页
近年来,大数据技术得到广泛应用,对促进政府和企业管理决策的科学化和精细化、提升公共服务水平都具有重大意义.但是,大数据技术自身存在诸多安全隐患,数据安全问题尤为突出,数据分类分级保护机制尚不完善,导致在个人信息应用方面数据... 近年来,大数据技术得到广泛应用,对促进政府和企业管理决策的科学化和精细化、提升公共服务水平都具有重大意义.但是,大数据技术自身存在诸多安全隐患,数据安全问题尤为突出,数据分类分级保护机制尚不完善,导致在个人信息应用方面数据泄露和滥用等问题频发.从个人信息在大数据中的应用现状进行分析,总结个人信息所面临的安全风险,同时从大数据应用背景下个人信息的属性进行分析,提出个人信息的分类、分级方法及其重要程度的判定原则,并结合系统数据安全保护等级和安全评估形式,给出各级个人信息的安全保护要求. 展开更多
关键词 大数据 个人信息 属性分析 分级保护 数据安全
在线阅读 下载PDF
基于大数据的电网设备监控信息自动分类方法 预览
20
作者 陆晓 刘翌 +2 位作者 齐敬先 霍雪松 蒋宇 《电子设计工程》 2019年第11期119-122,127共5页
采用传统方法对电网设备监控信息进行分类时,缺少对监控信息的预处理步骤,导致分类效果较差,为了解决该问题,提出了基于大数据的电网设备监控信息自动分类方法。分析电网设备监控信息数据采集结构,对信息数据进行预处理,并在大数据环境... 采用传统方法对电网设备监控信息进行分类时,缺少对监控信息的预处理步骤,导致分类效果较差,为了解决该问题,提出了基于大数据的电网设备监控信息自动分类方法。分析电网设备监控信息数据采集结构,对信息数据进行预处理,并在大数据环境下,采取信息梳理的方式合理合并相关同类事项。设计信息梳理流程,将信息进行归档,以此构建信息熵数学模型,计算电网设备出现故障的几率,获取有效预警信息文档。依据信息自动分类流程,实现对电网设备监控信息的自动分类。通过实验对比结果可知,采用基于大数据方法分类效果最高可达到98%,说明该方法适应了电力大数据快速增长趋势,能够为设备监控信息分类提供有力支持。 展开更多
关键词 大数据 电网设备 监控信息 自动分类 数据采集 预处理
在线阅读 下载PDF
上一页 1 2 115 下一页 到第
使用帮助 返回顶部 意见反馈
新型冠状病毒肺炎防控与诊疗专栏