期刊文献+
共找到2,279篇文章
< 1 2 114 >
每页显示 20 50 100
二次滑动粗粒化的快速样本熵脑电情感分析 认领
1
作者 朱永升 钟清华 +1 位作者 蔡冬丽 廖金湘 《计算机应用研究》 北大核心 2021年第1期57-60,74,共5页
针对传统单一尺度样本熵对脑电信号(EEG)序列特征提取不明显、多尺度熵在粗粒化过程中会遗漏重要信息导致情感分类性能下降以及样本熵算法效率不高的问题,提出了一种基于二次滑动均值粗粒化的多尺度快速样本熵脑电特征提取方法。由于不... 针对传统单一尺度样本熵对脑电信号(EEG)序列特征提取不明显、多尺度熵在粗粒化过程中会遗漏重要信息导致情感分类性能下降以及样本熵算法效率不高的问题,提出了一种基于二次滑动均值粗粒化的多尺度快速样本熵脑电特征提取方法。由于不同情感的脑电信号存在差异性,先采用二次滑动均值粗粒化对脑电信号进行多尺度处理,然后利用快速样本熵算法提取不同时间尺度的样本熵值作为特征向量,结合随机森林(RF)分类模型来识别不同的情感状态。提出的方法对多模态标准情感数据库DEAP进行了研究,发现大脑额区和右脑对情感比较敏感,正性、中性和负性情感在大脑侧额区获得了88.75%的平均分类准确率。实验结果表明,该方法可以有效地提取脑电特征,并且能够保证算法的效率。 展开更多
关键词 脑电信号 情感识别 二次滑动均值粗粒化 快速样本熵 随机森林
在线阅读 下载PDF
基于离散小波变换和随机森林的轴承故障诊断研究 认领
2
作者 彭成 王松松 +1 位作者 贺婧 李凤娟 《计算机应用研究》 北大核心 2021年第1期101-105,共5页
针对不同工况下数据特征选择困难和单一分类器在滚动轴承故障诊断中识别率较低等问题,提出了一种基于离散小波变换和随机森林相结合的滚动轴承故障诊断方法。该方法首先利用离散小波变换分解振动信号,得到n层近似系数;然后创新性地采用s... 针对不同工况下数据特征选择困难和单一分类器在滚动轴承故障诊断中识别率较低等问题,提出了一种基于离散小波变换和随机森林相结合的滚动轴承故障诊断方法。该方法首先利用离散小波变换分解振动信号,得到n层近似系数;然后创新性地采用sigmoid熵构造出n维特征向量,sigmoid熵能较好地提取非平稳信号的特征,提高诊断准确率;最后采用随机森林对滚动轴承不同故障信号进行分类。实验采用西储凯斯大学轴承数据中心网站提供的轴承数据,与传统分类器(KNN和SVM)以及单个分类回归树CART进行对比分析,结果表明该方法具有更好的诊断效果。 展开更多
关键词 滚动轴承 故障诊断 离散小波变换 随机森林 sigmoid熵
在线阅读 下载PDF
文章速递融合学习模型的岩石光谱特征自动分类 认领
3
作者 贺金鑫 任小玉 +3 位作者 陈圣波 熊玥 肖志强 周孩 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2021年第1期141-144,共4页
岩石光谱综合反映了岩石的物理化学性质、成分及其结构构造。岩石光谱数据已被应用于岩石分类的研究,但是不同于矿物光谱,岩石光谱并无标准数据库,且受较多干扰因素影响,例如矿物组分、结构构造、化学成分、风化力度,测量仪器的误差等... 岩石光谱综合反映了岩石的物理化学性质、成分及其结构构造。岩石光谱数据已被应用于岩石分类的研究,但是不同于矿物光谱,岩石光谱并无标准数据库,且受较多干扰因素影响,例如矿物组分、结构构造、化学成分、风化力度,测量仪器的误差等。传统岩石光谱分类模型先是对岩石光谱进行预处理排除干扰,然后采用不同方法对部分光谱特征分析,以达到分类目的。但对光谱数据特征遗失较多,使得分类准确率低下且操作过程繁琐、效率不高。因此,建立一个简单、快速、准确的岩石光谱自动分类模型具有重要意义。机器学习能够对获得的所有数据进行学习,不存在遗漏,大大提高了分类精度,且是对原始数据直接操作,不需预处理,简化流程。为此,选取辽宁兴城地区作为研究区,采集了若干种典型岩石样本,利用美国ASD便携式光谱仪实测光谱,最终获得608条数据,依据岩石光谱特征分为三类进行研究。首先利用决策树(DT)及决策树的升级模型——随机森林(RF)对数据进行分类,但当数据噪音较大时随机森林容易陷入过拟合;因而利用对异常值不敏感的K-最近邻(KNN)建模,但KNN需要对每个样本都考虑,数据量大时计算量会很大,效率不高;所以通过支持向量机(SVM)来提升分类准确率。从实验结果可以看出,4种分类模型的准确率排序为:SVM>KNN>RF>DT。为进一步提高岩石光谱特征的自动分类精度,采取了融合多个不同模型的办法,即对不同模型的分类结果进行投票,选择投票最多的作为最后分类结果。由于硬投票可在一定程度上减少过拟合现象的发生,更加适合分类模型,所以利用硬投票法融合了RF、KNN与SVM三个机器学习模型,最终的分类准确率可达到99.17%。综上所述,基于融合学习模型进行岩石光谱特征自动分类是切实可行且准确高效的。 展开更多
关键词 岩石光谱分类 决策树 随机森林 K-最近邻 支持向量机 模型融合
在线阅读 下载PDF
文章速递高光谱无损识别野生和种植黑枸杞 认领
4
作者 赵凡 闫昭如 +1 位作者 薛建新 徐兵 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2021年第1期201-205,共5页
高光谱图像技术在农产品检测及识别方面有广阔的应用前景。野生黑枸杞经济效益显著,经常被种植黑枸杞冒充。提出一种利用高光谱图像对野生黑枸杞无损快速识别的方法。主要内容和结果如下:(1)共采集256份(野生、种植各128份)黑枸杞在900~... 高光谱图像技术在农产品检测及识别方面有广阔的应用前景。野生黑枸杞经济效益显著,经常被种植黑枸杞冒充。提出一种利用高光谱图像对野生黑枸杞无损快速识别的方法。主要内容和结果如下:(1)共采集256份(野生、种植各128份)黑枸杞在900~1700 nm范围的高光谱反射光谱,每份平均光谱作为此样品的光谱;(2)采用标准正态变换(SNV)对采集的光谱预处理;基于Kennard-Stone法,按照校正集和预测集比例为2∶1对样品划分,用连续投影算法(SPA)对光谱进行降维处理,提取特征波长30个;分别将全光谱和SPA提取的30个特征波长作为模型输入,建立支持向量机(SVM)、极限学习机(ELM)和随机森林(RF)识别模型。(3)结果表明,在识别野生黑枸杞模型中,基于全光谱和SPA建立的SVM,ELM和RF模型校正集识别率均高于98.8%,基于全光谱和SPA建立的SVM,ELM和RF模型预测集识别率均高于97.7%。基于全光谱(FS)建立的三种识别模型略优于基于SPA建立的三种识别模型。但从简化模型方面,SPA提取的特征波常数仅为全光谱的11.8%,大大降低了模型运算量。三种模型中,基于随机森林模型无损识别野生黑枸杞效果最好,均达到100%。研究表明,利用高光谱图像技术结合分类模型可快速识别野生黑枸杞。 展开更多
关键词 野生黑枸杞 高光谱图像 支持向量机 极限学习机 随机森林算法
在线阅读 下载PDF
毛竹林立地与结构的关系及其对生物量的影响 认领
5
作者 杨帆 汤孟平 《浙江农林大学学报》 CAS CSCD 北大核心 2020年第5期823-832,共10页
【目的】研究立地因子和结构因子中影响毛竹Phyllostachys edulis林生物量的主导因子,并解析主导因子之间的关系及其对毛竹林生物量的影响。【方法】在浙江省10个县(市)选择少受人为干扰的毛竹林,设置52个样地,通过随机森林筛选出影响... 【目的】研究立地因子和结构因子中影响毛竹Phyllostachys edulis林生物量的主导因子,并解析主导因子之间的关系及其对毛竹林生物量的影响。【方法】在浙江省10个县(市)选择少受人为干扰的毛竹林,设置52个样地,通过随机森林筛选出影响毛竹林生物量的主导因子,在此基础上构造结构方程模型,分析各主导因子对毛竹林生物量的直接、间接和总影响。【结果】立竹度、林分平均胸径和竞争指数是林分结构因子中影响毛竹林生物量的主导因子。土层厚度和海拔高度是立地因子中影响毛竹林生物量的主导因子。结构方程模型分析结果表明:模型中所预设的路径能够被接受,也能较好体现所采集的数据。立竹度、林分平均胸径、竞争指数和土层厚度的总影响为正,对毛竹林生物量有正影响。海拔的总影响为负,对毛竹林生物量有负影响。林分平均胸径对毛竹林生物量的总影响最大,为0.739。立竹度对毛竹林生物量的直接影响大于间接影响。土层厚度对毛竹林生物量的间接影响最大,达0.492。立地因子中,土层厚度对毛竹林生物量的总影响大于海拔高度。海拔高度、土层厚度和竞争指数对毛竹林的间接影响大于直接影响。【结论】毛竹林的主要构件因子立竹度和林分平均胸径与毛竹林生物量的关系最为密切。海拔高度、土层厚度和竞争指数主要通过影响毛竹林的构件因子,间接影响毛竹林生物量。在毛竹林经营中,应当综合考虑立地因子、非空间结构和空间结构及其相互关系对毛竹林生物量的影响,在充分利用立地潜力的基础上,调控毛竹林结构,提高毛竹林生产力。 展开更多
关键词 森林生态学 毛竹林 立地因子 林分结构因子 结构方程模型 随机森林
在线阅读 免费下载
GF-6影像应用于林地与非林地识别的潜力分析 认领
6
作者 刘代超 李晓松 +2 位作者 李向晨 杨广斌 杨珺婷 《测绘通报》 CSCD 北大核心 2020年第8期5-12,17,共9页
为研究我国首颗携带红边波段的高分六影像(GF-6)在林地与非林地上的识别贡献,本文选择复杂林地类型的安徽省黄山市作为研究区,采用特征优选(RFE)与随机森林(RF)相结合的方法开展了林地与非林地识别潜力研究。首先根据实地调查、Google E... 为研究我国首颗携带红边波段的高分六影像(GF-6)在林地与非林地上的识别贡献,本文选择复杂林地类型的安徽省黄山市作为研究区,采用特征优选(RFE)与随机森林(RF)相结合的方法开展了林地与非林地识别潜力研究。首先根据实地调查、Google Earth影像及林地"一张图"样本数据构建了样本库;然后基于DEM、多时相光谱特征、植被指数、红边指数等特征开展分类,并比较不同模型精度及不同变量的重要度。结果表明:GF-6红边信息对林地非林地识别较为重要,引入红边信息可将总体分类精度提升2%,其他新增波段及地形特征对林地与非林地识别贡献并不明显;多时相数据的运用相比单时相数据可整体提高林地类型的分类精度2.93%~4.1%,单时相分类结果6月最好,9月次之,12月最差;特征优选可以有效减少数据输入维数(46到15),并取得最高分类精度,在不牺牲精度的同时保证了运算数据量的减少且明确了不同变量的贡献,具有较强的应用意义。 展开更多
关键词 GF-6 林地与非林地 RFE 随机森林 特征重要性
亚热带常绿林型遥感识别及尺度效应 认领
7
作者 张悦楠 房磊 +4 位作者 乔泽宇 陈龙池 张伟东 郑晓 江涛 《生态学杂志》 CAS CSCD 北大核心 2020年第5期1636-1650,共15页
光学遥感是获取宏观地表植被覆盖信息的重要手段,但常绿树种之间物候差异小,关于亚热带地区常绿林型的遥感识别研究相对较少。遥感林型识别存在尺度效应,从实际应用视角出发,常绿林型遥感识别的最优空间分辨率仍然不清楚。本研究以湖南... 光学遥感是获取宏观地表植被覆盖信息的重要手段,但常绿树种之间物候差异小,关于亚热带地区常绿林型的遥感识别研究相对较少。遥感林型识别存在尺度效应,从实际应用视角出发,常绿林型遥感识别的最优空间分辨率仍然不清楚。本研究以湖南省会同县为例,利用Pléiades(2 m)、RapidEye(5 m)、Landsat-8(15、30 m)4种光学遥感影像,结合光谱、纹理、植被覆盖度等特征变量与随机森林模型,探讨了3种典型亚热带常绿林型:杉木林(Chinese fir forest,CFF)、马尾松林(Masson pine forest,MPF)、常绿阔叶林(evergreen broadleaved forest,EBF)的最优遥感识别分辨率以及尺度效应问题。结果表明:研究区地表覆盖分类精度随影像空间分辨率的降低呈现先降低后上升的变化趋势,在2 m时具有最佳分类精度(Kappa=0.70,总精度=0.77)。3种林型的识别精度随空间分辨率的上升均表现出先降低后上升的变化规律,识别率(rate of identification,RI)范围分别为:RICFF=68%~87%、RIMPF=55%~84%、RIEBF=29%~74%。杉木林与马尾松林的漏分误差(omission error,OE)与错分误差(commission error,CE)低于常绿阔叶林(OECFF=0.26~0.46,CECFF=0.32~0.53;OEMPF=0.31~0.50,CEMPF=0.31~0.46;OEEBF=0.47~0.71,CEEBF=0.39~0.66)。本研究证实了亚热带常绿林型的遥感识别存在明显的尺度效应,30 m分辨率的Landsat-8影像相比高分辨率遥感影像因具备更丰富的光谱信息而具有更高的识别精度。本研究表明,常绿林型的遥感识别不宜盲目追求高空间分辨率,需要综合考虑遥感传感器光谱配置与空间分辨率之间的内在权衡。 展开更多
关键词 林型识别 尺度效应 高分辨率遥感 地表覆盖制图 随机森林 亚热带森林
Research on Dynamic Forecast of Flowering Period Based on Multivariable LSTM and Ensemble Learning Classification Task 认领
8
作者 Chao Chen Xingwei Zhang Shan Tian 《农业科学(英文)》 2020年第9期777-792,共16页
The flowering forecast provides recommendations for orchard cleaning, pest control, field management and fertilization, which can help increase tree vigor and resistance. Flowering forecast is not only an important pa... The flowering forecast provides recommendations for orchard cleaning, pest control, field management and fertilization, which can help increase tree vigor and resistance. Flowering forecast is not only an important part of the construction of agro-meteorological index system, but also an important part of the meteorological service system. In this paper, by analyzing local meteorological data and phenological data of “Red Fuji” apples in Fen County, Linfen City, Shanxi Province, with the help of machine learning and neural networks, we proposed a method based on the combination of time series forecasting and classification forecasting is proposed to complete the dynamic forecasting model of local flowering in Ji County. Then, we evaluated the effectiveness of the model based on the number of error days and the number of days in advance. The implementation shows that the proposed multivariable LSTM network has a good effect on the prediction of meteorological factors. The model loss is less than 0.2. In the two-category task of flowering judgment, the idea of combining strategies in ensemble learning improves the effect of flowering judgment, and its AUC value increases from 0.81 and 0.80 of single model RF and AdaBoost to 0.82. The proposed model has high applicability and accuracy for flowering forecast. At the same time, the model solves the problem of rounding decimals in the prediction of flowering dates by the regression method. 展开更多
关键词 Multivariable LSTM Ensemble Learning Combination Strategy Random Forest ADABOOST
在线阅读 免费下载
Predictive Models for Functional MRI Data 认领
9
作者 Guenadie Nibbs Peter Bajorski 《统计学期刊(英文)》 2020年第1期1-9,共9页
In this study, we analyze brain activity data describing functional magnetic resonance imaging (MRI) imaging of 820 subjects with each subject being scanned at 4 different times. This multiple scanning gives us an opp... In this study, we analyze brain activity data describing functional magnetic resonance imaging (MRI) imaging of 820 subjects with each subject being scanned at 4 different times. This multiple scanning gives us an opportunity to observe the consistency of imaging characteristics within the subjects as compared to the variability across the subjects. The most consistent characteristics are then used for the purpose of predicting subjects’ traits. We concentrate on four predictive methods (Regression, Logistic Regression, Linear Discriminant Analysis and Random Forest) in order to predict subjects’ traits such as gender and age based on the brain activities observed between brain regions. Those predictions are done based on the adjusted communication activity among the brain regions, as assessed from 4 scans of each subject. Due to a large number of such communications among the 116 brain regions, we performed a preliminary selection of the most promising pairs of brain regions. Logistic Regression performed best in classifying the subject gender based on communication activity among the brain regions. The accuracy rate was 85.6 percent for an AIC step-wise selected Logistic Regression model. On the other hand, the Logistic Regression model maintaining the entire set of ranked predictor was capable of getting an 87.7 percent accuracy rate. It is interesting to point out that the model with the AIC selected features was better classifying males, whereas the complete ranked model was better classifying females. The Random Forest technique performed best for prediction of age (grouped within five categories as provided by the original data) with 48.8 percent accuracy rate. Any set of predictors between 200 and 1600 was presenting similar rates of accuracy. 展开更多
关键词 FUNCTIONAL Magnetic RESONANCE Imaging Regression LOGISTIC Regression Linear DISCRIMINANT Analysis RANDOM FOREST
在线阅读 免费下载
Comparing the Area of Data Mining Algorithms in Network Intrusion Detection 认领
10
作者 Yasamin Alagrash Azhar Drebee Nedda Zirjawi 《信息安全(英文)》 2020年第1期1-18,共18页
The network-based intrusion detection has become common to evaluate machine learning algorithms. Although the KDD Cup’99 Dataset has class imbalance over different intrusion classes, still it plays a significant role... The network-based intrusion detection has become common to evaluate machine learning algorithms. Although the KDD Cup’99 Dataset has class imbalance over different intrusion classes, still it plays a significant role to evaluate machine learning algorithms. In this work, we utilize the singular valued decomposition technique for feature dimension reduction. We further reconstruct the features form reduced features and the selected eigenvectors. The reconstruction loss is used to decide the intrusion class for a given network feature. The intrusion class having the smallest reconstruction loss is accepted as the intrusion class in the network for that sample. The proposed system yield 97.90% accuracy on KDD Cup’99 dataset for the stated task. We have also analyzed the system with individual intrusion categories separately. This analysis suggests having a system with the ensemble of multiple classifiers;therefore we also created a random forest classifier. The random forest classifier performs significantly better than the SVD based system. The random forest classifier achieves 99.99% accuracy for intrusion detection on the same training and testing data set. 展开更多
关键词 Feature Reduction SINGULAR Value Decomposition INTRUSION DETECTION Correlation Analysis Association Impact Scale INTRUSION DETECTION System KDD CUP 1999 Random FOREST
在线阅读 免费下载
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 认领
11
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《数据分析和信息处理(英文)》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification Algorithms NON-PARAMETRIC K-Nearest-Neighbor Neural Networks Random Forest Support Vector Machines
在线阅读 免费下载
Multi-Level, Multi-Scale Modeling and Predictive Mapping for Jaguars in the Brazilian Pantanal 认领
12
作者 Eve Bohnett Dave Hulse +1 位作者 Bilal Ahmad Thomas Hoctor 《生态学期刊(英文)》 2020年第5期243-263,共21页
Multi-level multi-scale resource selection models using machine learning were compared and contrasted for generating predictive maps of jaguar habitat (Panthera onca) in the Brazilian Pantanal. Multiple spatial scales... Multi-level multi-scale resource selection models using machine learning were compared and contrasted for generating predictive maps of jaguar habitat (Panthera onca) in the Brazilian Pantanal. Multiple spatial scales and temporal movement levels were run within several analytical modeling frameworks for comparison. Included in the analysis were multi-scale raster grains (30 m, 90 m, 180 m, 360 m, 720 m, 1440 m) and GPS collaring temporal movement levels (point, path, and step). Various analytical methods were used for comparison of models that could accommodate data structural levels (group, individual, case-control). Models compared included conditional logistic regression, generalized additive modeling (GAM), and classification regression trees, such as random forests (RF) and gradient boosted regression tree (GBM). The goals of the study were to discuss the potential and limitations for machine learning methods using GPS collaring data to produce predictive habitat suitability mapping using the various scales and levels available. Results indicated that choosing the appropriate temporal level and raster scale improved model outputs. Overall, larger level analytical modeling frameworks and those that used multi-scale raster grains showed the best model evaluation with the inherent condition that they predict a broader scale and subset of data. The identification of the appropriate spatial scale, temporal scale and statistical model need careful consideration in predictive mapping efforts. 展开更多
关键词 Machine Learning Movement Ecology HABITAT SELECTION Resource SELECTION MULTIPLE Levels MULTIPLE Scales PREDICTIVE Models Gradient Boosting Method Random Forest
在线阅读 免费下载
Injury Analysis Based on Machine Learning in NBA Data 认领
13
作者 Wangwei Wu 《数据分析和信息处理(英文)》 2020年第4期295-308,共14页
It is a commonplace that the injury plays a vital influence in an NBA match and it may reverse the result of two teams with wide strength disparity. In this article, in order to decrease the uncertainty of the risk in... It is a commonplace that the injury plays a vital influence in an NBA match and it may reverse the result of two teams with wide strength disparity. In this article, in order to decrease the uncertainty of the risk in the coming match, we propose a pipeline from gathering data at the player’s level including the fundamental statistics and the performance in the match before and data at the team’s level including the basic information and the opponent team’s status in the match we predict on. Confined to the limited and extremely unbalanced data, our result showed a limited power on injury prediction but it made a not bad result on the injury of the star player in a team. We also analyze the contribution of the factors to our prediction. It demonstrated that player’s own performance matters most in their injury. The Principal Component Analysis is also applied to help reduce the dimension of our data and to show the correlation of different features. 展开更多
关键词 Random Forest INJURY PCA NBA
在线阅读 免费下载
Can We Predict the Change in Code in a Software Product Line Project? 认领
14
作者 Yasser Ali Alshehri 《软件工程与应用(英文)》 2020年第6期91-103,共13页
Software programs are always prone to change for several reasons. In a software product line, the change is more often as many software units are carried from one release to another. Also, other new files are added to... Software programs are always prone to change for several reasons. In a software product line, the change is more often as many software units are carried from one release to another. Also, other new files are added to the reused files. In this work, we explore the possibility of building a model that can predict files with a high chance of experiencing the change from one release to another. Knowing the files that are likely to face a change is vital because it will help to improve the planning, managing resources, and reducing the cost. This also helps to improve the software process, which should lead to better software quality. Also, we explore how different learners perform in this context, and if the learning improves as the software evolved. Predicting change from a release to the next release was successful using logistic regression, J48, and random forest with accuracy and precision scored between 72% to 100%, recall scored between 74% to 100%, and F-score scored between 80% to 100%. We also found that there was no clear evidence regarding if the prediction performance will ever improve as the project evolved. 展开更多
关键词 Software Change Proneness Software Quality Machine Learning Decision Tree J48 Logistic Regression Naïve Bayes Random Forest Data Mining
在线阅读 免费下载
基于深度森林算法的分布式WSN入侵检测模型 认领
15
作者 董瑞洪 闫厚华 +1 位作者 张秋余 李学勇 《兰州理工大学学报》 CAS 北大核心 2020年第4期103-109,共7页
针对现有的特征选择算法和分类算法在无线传感器网络(WSN)入侵检测系统中检测性能表现不佳、检测实时性差、模型复杂度高等问题,提出一种基于随机森林和深度森林算法的分布式WSN入侵检测模型.该模型首先对传感器节点流量数据进行预处理... 针对现有的特征选择算法和分类算法在无线传感器网络(WSN)入侵检测系统中检测性能表现不佳、检测实时性差、模型复杂度高等问题,提出一种基于随机森林和深度森林算法的分布式WSN入侵检测模型.该模型首先对传感器节点流量数据进行预处理;然后将轻量级随机森林分类器部署到传感器节点和簇头节点,传感器节点和簇头节点合作对流量数据进行处理,并在基站上采用深度森林算法从大量流量数据中发现攻击行为;最后对WSN中的入侵行为进行实时分类入侵检测.使用无线传感器数据集WSN-DS和NSL-KDD数据集来评估所提出的模型性能.实验结果表明,该模型与现有的入侵检测模型相比,具有良好的检测性能,实时性较高,可避免模型过度拟合. 展开更多
关键词 入侵检测 无线传感器网络 随机森林 深度森林算法 集成分类器
在线阅读 下载PDF
GEE云平台支持下的西天山森林遥感监测与时空变化分析 认领
16
作者 邵亚奎 王蕾 +4 位作者 朱长明 方晖 张新 黄端 陶莉 《测绘通报》 CSCD 北大核心 2020年第8期13-17,共5页
针对区域大尺度森林遥感调查、精确信息提取和时间序列变化监测过程中存在的数据挑选困难、计算效率较低、提取精度不高等问题,本文基于谷歌云计算平台(GEE)强大的海量遥感数据组织、存储和计算功能,根据新疆干旱区森林资源的空间分布特... 针对区域大尺度森林遥感调查、精确信息提取和时间序列变化监测过程中存在的数据挑选困难、计算效率较低、提取精度不高等问题,本文基于谷歌云计算平台(GEE)强大的海量遥感数据组织、存储和计算功能,根据新疆干旱区森林资源的空间分布特点,结合多源遥感数据和地理要素数据集,首先构建了光谱+纹理+地形等多维分类特征集;然后在地理国情监测森林地面调查样本数据的协助下建立了西天山森林分类样本数据库;进而采用随机森林分类算法实现了对西天山森林1995、2000、2005、2010、2015和2018年6期自动分类;最后通过云端与本地相结合完成了森林资源遥感分类数据编辑检查、制图与分析。研究结果表明:①1995—2018年西天山森林总体呈动态扩张趋势,森林分布面积从1995年的3953.6 km^2年增加到2018年的4243.2 km^2,增长速率为12.6 km^2/a;在结构组成上,西天山森林以针叶林为主,阔叶林、灌木林、针阔混交林较少。②在时间变化过程上,西天山森林的扩张态势呈现缓中增强,2005—2018年增长速率要明显高于1995—2005年。③在空间变化特征上,不同森林类型之间的转化很少,新增林地主要来自非林地,2000年以来非林地转林地的面积约为520 km^2。非林地转化为林地区域主要集中在特克斯县分局、尼勒克县分局、昭苏县分局、新源林场、巩留分局、伊宁分局,转入面积分别为111.14、102.19、67.16、56.45、42.76、40.71 km^2。 展开更多
关键词 林业遥感 GEE云计算 时空变化 随机森林 西天山
运用随机森林模型对北京市林分蓄积生长量的预测 认领
17
作者 卢婧 冯仲科 《东北林业大学学报》 CAS CSCD 北大核心 2020年第5期7-11,共5页
林分蓄积生长量是森林资源监测的一个重要内容,也是林业经营的决策依据。利用北京市第6~8次森林资源连续清查数据和ClimateAP软件中提取的气候信息,建立了基于随机森林的林分蓄积生长量预测模型,对北京市林分蓄积生长量进行了预测。结... 林分蓄积生长量是森林资源监测的一个重要内容,也是林业经营的决策依据。利用北京市第6~8次森林资源连续清查数据和ClimateAP软件中提取的气候信息,建立了基于随机森林的林分蓄积生长量预测模型,对北京市林分蓄积生长量进行了预测。结果表明:运用随机森林的针叶林、阔叶林、针阔混交林的林分生长模型的R 2分别为0.93、0.94、0.89,拟合效果良好;预测北京市2021年林分蓄积生长量平均值为58.1073 m^3/hm^2,变化范围为7.2846~388.7756 m^3/hm^2,蓄积量平均值由大到小的顺序为针叶林、针阔混交林、阔叶林。 展开更多
关键词 蓄积生长量预测 随机森林模型 森林资源连续清查 北京市
在线阅读 下载PDF
基于机器学习的森林蓄积量研究综述 认领
18
作者 黄宇玲 《智能计算机与应用》 2020年第4期158-161,共4页
森林蓄积量体现了森林生态系统林分信息,与森林生物量、生物多样性和碳储量等息息相关,是反映森林资源数量的重要指标,已经成为林业科学研究中的重点。本文首先对森林蓄积量的研究进展做了简单介绍;其次阐述了常见的4种机器学习算法、... 森林蓄积量体现了森林生态系统林分信息,与森林生物量、生物多样性和碳储量等息息相关,是反映森林资源数量的重要指标,已经成为林业科学研究中的重点。本文首先对森林蓄积量的研究进展做了简单介绍;其次阐述了常见的4种机器学习算法、研究进展和成果;介绍了机器学习算法在森林蓄积量方面的研究。 展开更多
关键词 机器学习 森林蓄积量 随机森林
在线阅读 免费下载
运用GF-1影像光谱和纹理信息构建森林蓄积量估测模型 认领 被引量:1
19
作者 刘伯涛 李崇贵 +2 位作者 郭瑞霞 刘思涵 马婷 《东北林业大学学报》 CAS CSCD 北大核心 2020年第1期9-12,28共5页
以GF-1遥感影像为数据源,研究区森林资源二类调查数据为样地实测数据,综合考虑光谱、地形、纹理特征,利用多元线性回归、BP神经网络、支持向量机和随机森林建立研究区森林蓄积量估测模型,并验证模型预测的性能。结果表明:4种模型预测评... 以GF-1遥感影像为数据源,研究区森林资源二类调查数据为样地实测数据,综合考虑光谱、地形、纹理特征,利用多元线性回归、BP神经网络、支持向量机和随机森林建立研究区森林蓄积量估测模型,并验证模型预测的性能。结果表明:4种模型预测评价指标的决定系数(R^2)和均方根误差(RMSE)相近,但有一定的差异,多元线性回归模型R^2和RMSE分别为0.446、39.979 6 m^3·hm^-2,BP神经网络模型R2和RMSE分别为0.474、39.703 9 m^3·hm^-2,支持向量机模型R2和RMSE分别为0.485、38.924 8 m^3·hm^-2,随机森林模型R2和RMSE分别为0.534、37.882 2 m^3·hm^-2;3种机器学习方法构建的蓄积量估测模型预测性能优于传统的多元线性回归模型,随机森林模型的预测性能最优。 展开更多
关键词 GF-1遥感影像 森林蓄积量 多元线性回归 随机森林 支持向量机 BP神经网络
在线阅读 下载PDF
基于Boruta和极端随机树方法的森林蓄积量估测 认领
20
作者 韩瑞 吴达胜 +1 位作者 方陆明 黄宇玲 《林业资源管理》 北大核心 2020年第4期127-133,共7页
森林蓄积量是反映森林资源数量的重要指标之一。本研究应用Boruta特征选择方法和极端随机树(Extremely randomized trees,Extra-trees)方法,以小班为研究单元,估测龙泉市部分区域森林资源的每公顷蓄积量,为县域尺度森林蓄积量的估测提... 森林蓄积量是反映森林资源数量的重要指标之一。本研究应用Boruta特征选择方法和极端随机树(Extremely randomized trees,Extra-trees)方法,以小班为研究单元,估测龙泉市部分区域森林资源的每公顷蓄积量,为县域尺度森林蓄积量的估测提供新的方法和思路。基于研究区的森林资源二类调查数据、高分二号(GF-2)遥感影像数据、数字高程模型数据,提取多元特征组成原始特征集。通过Boruta选择方法对原始特征集进行筛选,利用Extra-trees方法建立森林蓄积量估测模型,选用十折交叉验证法对模型进行检验,并与随机森林(Random Forest,RF)方法和梯度提升(Gradient Boosting)方法进行对比分析。研究结果显示:1)经过Boruta特征选择方法得出的特征有土层厚度、年龄、郁闭度、海拔、坡度和坡向;2)极端随机树方法采用网格搜索调参得到的最优参数组合为:树的个数为250,树的最大深度为14;3)基于Boruta和极端随机树方法的森林蓄积量估测模型的测试精度为84.14%,R2为0.92,RMSE为19.65m^3/hm^2,MAE为13.95m^3/hm^2,模型优于随机森林方法和梯度提升方法,表明Boruta特征选择方法结合极端随机树方法估测森林蓄积量可取得更好的效果。 展开更多
关键词 Boruta特征选择 极端随机树 随机森林 森林蓄积量 机器学习
在线阅读 下载PDF
上一页 1 2 114 下一页 到第
使用帮助 返回顶部 意见反馈