期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
特征工程和深度前馈网络结合的刀具磨损预测 认领
1
作者 张超标 孙延明 《机械设计与制造》 北大核心 2020年第6期190-193,共4页
针对传统刀具磨损预测中存在的自适应性不强和预测精确度低的问题,提出了特征工程和Dropout深度前馈网络相结合的刀具磨损预测方法.首先从刀具状态监测框架下的多传感器信号中提取全面的特征,与刀具的元信息进行信息融合,然后通过假设... 针对传统刀具磨损预测中存在的自适应性不强和预测精确度低的问题,提出了特征工程和Dropout深度前馈网络相结合的刀具磨损预测方法.首先从刀具状态监测框架下的多传感器信号中提取全面的特征,与刀具的元信息进行信息融合,然后通过假设检验和Benjamini-Yakutieli过程选择与目标磨损相关性强的特征,最后构建Dropout深度前馈网络学习选择的特征与目标磨损之间的映射关系.实验结果表明,提出的这种预测方法的训练过程稳定性高,而且能更精确地预测刀具的磨损. 展开更多
关键词 刀具磨损 刀具状态检测 特征工程 特征提取 特征选择 Dropout深度前馈网络
在线阅读 下载PDF
非数值化特征的条件概率区域划分(CZT)编码方法 认领
2
作者 贺亮 徐正国 +1 位作者 李赟 沈超 《计算机应用研究》 CSCD 北大核心 2020年第5期1400-1405,共6页
非数值化特征经常出现在数据中,对其有效编码是采用机器学习模型解决问题的关键。针对目前被广泛使用的one-hot编码方法的编码结果具有较大的稀疏性,并且编码出的数值仍然没有明确的物理意义等问题,提出一种基于条件概率的区域划分编码... 非数值化特征经常出现在数据中,对其有效编码是采用机器学习模型解决问题的关键。针对目前被广泛使用的one-hot编码方法的编码结果具有较大的稀疏性,并且编码出的数值仍然没有明确的物理意义等问题,提出一种基于条件概率的区域划分编码算法CZT(conditional-probability-based zone transformation coding)。该方法首先对特征进行条件概率计算,并依据条件概率划分特征区域,按照区域内的联合条件概率进行编码;然后将CZT编码算法与one-hot算法进行对比分析,从理论上推导并证明CZT编码对特征的压缩率至少为每个特征取值空间的平均大小,同时证明经过CZT编码后的问题具有更简单的优化目标形式,有利于设计后续机器学习算法;最后通过采用相同结构的神经网络进行分类,在Titanic数据集下对比CZT算法和one-hot算法编码数据后对分类器性能的影响,结果表明CZT编码的数据的分类准确率和稳定性均有提升。 展开更多
关键词 深度学习 非数值化特征 特征工程 联合条件概率编码
在线阅读 下载PDF
基于改进Mask R-CNN的火焰图像识别算法 认领
3
作者 喻丽春 刘金清 《计算机工程与应用》 CSCD 北大核心 2020年第21期194-198,共5页
传统火焰检测算法依赖于人工特征工程,具有主观性和盲目性,存在泛化能力差,检测准确率不高等问题。提出一种基于改进Mask R-CNN的火焰图像识别算法,算法在Mask R-CNN的基础上,在特征金字塔引入一条自下向上的特征融合,同时改进了损失函... 传统火焰检测算法依赖于人工特征工程,具有主观性和盲目性,存在泛化能力差,检测准确率不高等问题。提出一种基于改进Mask R-CNN的火焰图像识别算法,算法在Mask R-CNN的基础上,在特征金字塔引入一条自下向上的特征融合,同时改进了损失函数,使边框定位更准确。在自建的测试数据集上实验表明,改进后算法准确率相对于原先算法识别定位精度更高,检测准确率提升超过5%。 展开更多
关键词 火灾检测 特征工程 残差网络 特征金字塔网络
在线阅读 下载PDF
基于特征工程方法的电影评分影响因素重要性分析 认领
4
作者 程纯 《现代电影技术》 2020年第12期30-36,共7页
本次试验以电影的豆瓣评分为研究对象,从四个方面出发选择影响电影评分的因素,并用以预测。经过数据筛选后,获得了包含552个观测值的华语电影数据集。利用特征工程方法对部分特征进行赋值,将含有众多文本信息的定性特征转化为定量特征,... 本次试验以电影的豆瓣评分为研究对象,从四个方面出发选择影响电影评分的因素,并用以预测。经过数据筛选后,获得了包含552个观测值的华语电影数据集。利用特征工程方法对部分特征进行赋值,将含有众多文本信息的定性特征转化为定量特征,得到赋值后的数据集。分别建立多元线性回归、LASSO回归和随机森林回归三种模型,并根据变量重要性指标得到变量排序。结果表明适宜选入预测模型的变量包括:编剧、导演、演员、关注人数、语言、发行年份和电影类型。 展开更多
关键词 电影评分 特征工程 特征选择 LASSO 回归 随机森林回归
在线阅读 下载PDF
电商平台用户再购物行为的预测研究 认领
5
作者 吕泽宇 李纪旋 +1 位作者 陈如剑 陈东明 《计算机科学》 CSCD 北大核心 2020年第S01期424-428,共5页
电商平台上用户的购物行为研究对于电商企业来说具有重要的商业应用价值。文中针对购物者在同一电商平台上的再次消费行为的预测问题进行了研究。首先,针对用户与商家的行为和交易记录,基于特征工程方法设计了多种不同的行为预测特征,... 电商平台上用户的购物行为研究对于电商企业来说具有重要的商业应用价值。文中针对购物者在同一电商平台上的再次消费行为的预测问题进行了研究。首先,针对用户与商家的行为和交易记录,基于特征工程方法设计了多种不同的行为预测特征,基于可视化等方法对比分析了预测特征的重要性和特点,进行了属性筛选;然后,基于提出的预测特征设计使用了多种不同算法训练预测模型。实验研究表明,多lightGBM模型的融合方法能够达到很高的再购物行为预测准确度,其AUC值能够达到0.7018,同时,基于这种方法实现的预测器只需要少数特征就能对预测结果产生很好的贡献。研究的数据来源是开源的真实大数据,研究成果具有应用和学术双重价值。 展开更多
关键词 再次购物行为预测 特征工程 特征可视化 融合模型
在线阅读 免费下载
基于细粒度特征的BOA-GBDT光伏出力预测 认领 被引量:1
6
作者 谢从珍 王江储 +2 位作者 谢心昊 刘智健 白剑锋 《电网技术》 EI CSCD 北大核心 2020年第2期689-696,共8页
光伏出力与天气模式密切相关,深度挖掘天气模式特征信息能有效提高光伏出力预测精度。由于信息粒度的粗细程度对光伏出力预测的精度有影响,使用粗粒度的原始特征或聚类特征的传统光伏出力预测方法在预测精度方面存在提升空间。针对以上... 光伏出力与天气模式密切相关,深度挖掘天气模式特征信息能有效提高光伏出力预测精度。由于信息粒度的粗细程度对光伏出力预测的精度有影响,使用粗粒度的原始特征或聚类特征的传统光伏出力预测方法在预测精度方面存在提升空间。针对以上问题,提出了一种基于细粒度特征的贝叶斯优化梯度提升树(Bayesianoptimizationalgorithm gradient boosting decision tree,BOA-GBDT)光伏出力预测方法,该方法首先对日间每条气象监测数据及光伏出力监测数据构建细粒度特征,包括瞬时天气模式特征及时窗趋势性特征,然后采用贝叶斯优化算法(Bayesianoptimization algorithm,BOA)对细粒度特征的种类进行约减,最后通过(gradient boosting decision tree,GBDT)模型拟合特征与光伏曲线的关系,建立BOA-GBDT光伏出力预测模型。对实际算例进行误差分析,结果表明相比传统支持向量机(support vector machine,SVM)方法,该方法构建的预测模型运行时间平均减少97.3%,均方根误差平均减少80.4%。验证了该方法的有效性。 展开更多
关键词 光伏出力预测 天气特征 特征工程 GBDT
基于特征工程的广告点击转化率预测模型 认领
7
作者 邓秀勤 谢伟欢 +2 位作者 刘富春 张翼飞 樊娟 《数据采集与处理》 CSCD 北大核心 2020年第5期842-849,共8页
在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注。计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告。其核心... 在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注。计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告。其核心问题是通过网络广告点击转化率预测的计算,将用户点击可能性最高的广告选择出来。广告点击转化率的精确预测与媒体、广告主和用户3方的利益密切相关。该研究基于TrackMaster平台提供的真实广告数据,以特征工程的视角,分别从用户信息特征、广告信息特征、上下文特征和统计特征4个角度进行特征分析,从而挖掘出对广告点击转化率影响较大的重要特征,构建广告点击转化率预测分层模型并训练,并且结合LightGBM算法模型得出广告点击转化率的重要特征排序。实验结果表明当特征选择阈值λ=0.95,特征选择数目为19,树的颗数为100时的受试者工作特征曲线下的面积(Area under receiver operating characteristic curve,AUC)值最大,模型的对数损失函数值约为0.1368,此时模型具有最优的效果。预测模型和特征排序结果有助于企业制定最优的广告投放策略。 展开更多
关键词 数据分析 点击转化率 计算广告 特征工程 特征分析
在线阅读 下载PDF
机器学习中的特征工程方法 认领
8
作者 唐运军 孙舒畅 《汽车实用技术》 2020年第12期70-72,共3页
随着互联网的快速发展,机器学习技术得到了广泛的应用。面对海量的数据,特征工程就显得至关重要,可以说特征工程决定了机器学习模型的上线。文章介绍了对数值、文本、类别时间等不同类型数据的处理方法,总结了在面对高维数据时的特征选... 随着互联网的快速发展,机器学习技术得到了广泛的应用。面对海量的数据,特征工程就显得至关重要,可以说特征工程决定了机器学习模型的上线。文章介绍了对数值、文本、类别时间等不同类型数据的处理方法,总结了在面对高维数据时的特征选择方法并进行了比较,对机器学习的研究和工程应用具有指导意义。 展开更多
关键词 机器学习 特征工程 特征选择
在线阅读 下载PDF
结合显式和隐式特征交互的深度融合模型 认领
9
作者 倪志文 马小虎 +1 位作者 孙霄 边丽娜 《计算机工程》 CAS CSCD 北大核心 2020年第3期87-92,98共7页
特征工程是影响机器学习算法性能的关键因素之一,随着互联网数据规模的扩大,传统特征工程的人力成本不断增加。为减少对特征工程的依赖,构建一种结合显式和隐式特征交互的融合模型。将稀疏结构单元与残差单元相结合以提取隐式特征,利用... 特征工程是影响机器学习算法性能的关键因素之一,随着互联网数据规模的扩大,传统特征工程的人力成本不断增加。为减少对特征工程的依赖,构建一种结合显式和隐式特征交互的融合模型。将稀疏结构单元与残差单元相结合以提取隐式特征,利用压缩交互网络学习显式特征,在最后一层全连接层上将两种特征进行融合。在4种不同数据集上的实验结果表明,该模型相比PNN、DCN等模型具有更好的特征提取结果。 展开更多
关键词 特征工程 深度融合 特征交互 残差单元 压缩交互网络
在线阅读 下载PDF
基于特征生成方法的Android恶意软件检测方法 认领
10
作者 冯垚 王金双 张雪涛 《信息技术与网络安全》 2020年第11期8-13,共6页
针对传统特征工程中需要大量专家经验和人力的不足,研究了基于特征生成方法的Android恶意软件检测方法。基于UC Berkeley的ExploreKit自动特征生成方法,通过对原始特征计算获得大量候选特征,根据候选特征的元特征预测其性能并进行评估排... 针对传统特征工程中需要大量专家经验和人力的不足,研究了基于特征生成方法的Android恶意软件检测方法。基于UC Berkeley的ExploreKit自动特征生成方法,通过对原始特征计算获得大量候选特征,根据候选特征的元特征预测其性能并进行评估排序,使用贪心算法从中选出能够提升模型性能的新特征。从APK中提取了敏感API、危险权限等多种特征,在根据信息增益对特征进行筛选后,输入到特征生成框架中,使用C4.5、SVM和随机森林等作为分类模型。实验证明,该方法使错误率平均降低了24.6%,准确率达到了96.5%,曲线下面积(Area Under Curve,AUC)达到了0.99。 展开更多
关键词 恶意软件检测 特征工程 特征生成 ExploreKit
在线阅读 下载PDF
基于非线性特征工程的短期建筑能耗预测方法 认领
11
作者 王振亚 范成(指导) +2 位作者 李达生 曾妍洁 刘明辉 《建筑节能》 CAS 2020年第7期100-107,145,共9页
建筑自动化技术的广泛应用产生了大量的建筑运行数据。这类数据存在复杂的非线性关系、噪音多、冗余度高,因此建模分析难度较大。采用近100组不同类型建筑的实测数据为研究对象,对其短期能耗进行预测分析,进而形成具有普适性的预测方法... 建筑自动化技术的广泛应用产生了大量的建筑运行数据。这类数据存在复杂的非线性关系、噪音多、冗余度高,因此建模分析难度较大。采用近100组不同类型建筑的实测数据为研究对象,对其短期能耗进行预测分析,进而形成具有普适性的预测方法。针对整体预测过程,设计了特征工程和预测模型建立两方面内容。在特征工程方面,研究了基于主成分分析和卷积自编码器的线性和非线性特征工程方法。在预测模型建立方面,比较了传统的线性回归、极度梯度提升决策树和神经网络算法。通过分析近100组不同类型建筑的实测数据,量化了相关方法在短期建筑能耗预测中有效性和可靠性。实验结果表明,基于一维卷积自编码器的特征工程方法可以有效提升模型的泛化性能,同时也可加快模型的收敛速度。 展开更多
关键词 建筑能耗预测 特征工程 卷积神经网络 非线性建模 极度梯度提升决策树
在线阅读 下载PDF
基于CatBoost算法的P2P违约预测模型应用研究 认领
12
作者 马晓君 宋嫣琦 +2 位作者 常百舒 袁铭忆 苏衡 《统计与信息论坛》 CSSCI 北大核心 2020年第7期9-17,共9页
在互联网金融背景下,智能算法的应用能够为经济领域提供新的思路和方向,有效推动中国互联网金融向“互联网+金融+智能”模式的转变。P2P网络借贷是通过P2P公司搭建的第三方互联网平台进行“个人对个人”的直接信贷。以人人贷平台为研究... 在互联网金融背景下,智能算法的应用能够为经济领域提供新的思路和方向,有效推动中国互联网金融向“互联网+金融+智能”模式的转变。P2P网络借贷是通过P2P公司搭建的第三方互联网平台进行“个人对个人”的直接信贷。以人人贷平台为研究对象,运用特征工程技术,将CatBoost算法应用于构建P2P违约预测模型,并对违约影响因素进行综合分析。结果表明,CatBoost算法的预测准确率达96%,对实际结果的拟合效果较好,并能够对模型出错所导致的损失成本进行有效控制。此外,综合分析违约影响因素发现,借款人的信用情况对借款人违约行为影响较大,其中还清贷款次数、逾期次数与成功借款次数应作为借款人信用评估的重要参考指标。结合本文的研究成果与中国P2P行业发展状况,本文建议P2P平台积极促进数据分析与测算分析技术的革新与应用,政府及相关部门形成政策法规的同步发展,促成从平台内部到外部环境的合力发展态势。 展开更多
关键词 P2P 违约预测模型 CatBoost算法 特征工程 影响因素
在线阅读 下载PDF
一种基于用户行为的视频推荐算法 认领
13
作者 李青 冯梅 +1 位作者 申端明 张文博 《信息系统工程》 2020年第9期142-144,共3页
面对如何从海量视频数据中选择用户喜欢的类型的这一难题,利用用户行为数据、用户特征数据以及视频特征数据,通过特征工程,构造出一系列能够反映用户点击视频行为的特征,将这些特征结合到Lightgbm算法中,建立视频推荐算法来提高推荐精... 面对如何从海量视频数据中选择用户喜欢的类型的这一难题,利用用户行为数据、用户特征数据以及视频特征数据,通过特征工程,构造出一系列能够反映用户点击视频行为的特征,将这些特征结合到Lightgbm算法中,建立视频推荐算法来提高推荐精准度。实验结果表明,该算法能较好的识别出用户对视频类型的偏好,在推荐精准度方面相对其他方法也有明显的提升。 展开更多
关键词 视频推荐 Lightgbm 特征工程 行为日志
在线阅读 下载PDF
基于XGBoost算法的地下综合管廊安全状况评估方法 认领
14
作者 胡联粤 岑健 +2 位作者 许文凯 赵捷 余宗伟 《计算机应用》 CSCD 北大核心 2020年第S01期264-268,共5页
针对地下综合管廊安全状况复杂、风险评估困难的问题,提出了一种基于XGBoost算法的安全状况评估方法,利用地下综合管廊数据构建模型。首先,对采集到的地下综合管廊数据进行异常值检测、缺失值处理,用描述性统计与特征组合的方法构造统... 针对地下综合管廊安全状况复杂、风险评估困难的问题,提出了一种基于XGBoost算法的安全状况评估方法,利用地下综合管廊数据构建模型。首先,对采集到的地下综合管廊数据进行异常值检测、缺失值处理,用描述性统计与特征组合的方法构造统计特征以及交叉特征;其次,使用逻辑回归(LR)、随机森林(RF)、最近邻分类器(NC)、支持向量机(SVM)算法、XGBoost算法构建安全评估模型;最后,使用贝叶斯算法对模型参数进行优化。实验结果表明,优化后的XGBoost相较于LR、RF、NC、SVM构建的模型在地下综合管廊的安全评估上具有更高的准确率,最高可达0.9209。 展开更多
关键词 地下综合管廊 安全状况评估 XGBoost 贝叶斯优化 特征工程
在线阅读 下载PDF
融合城市行道树特征选取模型的自适应深度学习分类 认领
15
作者 乔莲花 刘民士 《测绘通报》 CSCD 北大核心 2020年第6期77-80,共4页
针对城市行道树的学习多分类问题,本文在综合分析城市行道树多分类特征的基础上,提出一种融合特征自动选取模型的自适应深度学习方法。基于随机森林法,学习行道树的特征重要性,通过特征消除方法舍弃不重要的特征,实现城市行道树多分类... 针对城市行道树的学习多分类问题,本文在综合分析城市行道树多分类特征的基础上,提出一种融合特征自动选取模型的自适应深度学习方法。基于随机森林法,学习行道树的特征重要性,通过特征消除方法舍弃不重要的特征,实现城市行道树多分类特征自动选取;在城市行道树分类特征工程提取的基础上,构建了城市行道树多分类问题的自适应深度学习方法,并采用交叉验证与参数搜索方法,对所提出的深度学习模型进行改进。试验结果表明,本文所提出的融合特征自动选取模型的自适应深度学习方法具有良好性能,解决了城市行道树多分类预测的准确性与泛化问题。 展开更多
关键词 城市行道树分类 数据表示 特征工程 深度学习 模型评估与优化
基于加速度传感器的人体运动模式识别 认领
16
作者 孙宇航 周建钦 张学锋 《计算机系统应用》 2020年第6期196-203,共8页
本文提出了一种基于MPU9250微处理器的人体运动识别的方法.用户在佩戴手环的情况下进行各类运动,手环即可自动采集并存储用户在运动过程中产生的加速度数据.分析这些数据可以判别人体运动的类别.通过手环内嵌的加速度传感器采集运动者在... 本文提出了一种基于MPU9250微处理器的人体运动识别的方法.用户在佩戴手环的情况下进行各类运动,手环即可自动采集并存储用户在运动过程中产生的加速度数据.分析这些数据可以判别人体运动的类别.通过手环内嵌的加速度传感器采集运动者在X,Y,Z 3个方向上的加速度,经过滤波算法过滤后,分别在时域和频域两个方面对数据进行分析,再经过特征工程提取34个相关特征,使用特征选择算法选取主要的16个特征,减小算法复杂度.实验比较了支持向量机(SVM),决策树(decision tree)和随机森林(random forest)3种方法,对走路、跑步、羽毛球正手挥拍、打乒乓球、划船5种运动模式进行分类,结果表明随机森林准确率最佳,可达到97%以上. 展开更多
关键词 运动识别 特征工程 数据挖掘 随机森林
在线阅读 下载PDF
基于混沌动力学的凌空手势识别 认领
17
作者 冯广宇 侯文军 +1 位作者 周湖 由振伟 《计算机集成制造系统》 EI CSCD 北大核心 2020年第8期2116-2123,共8页
鉴于传统的手势动作识别算法可能会因手势速度幅度的变化及不准确的特征提取而降低准确率,拟采用混沌理论的非线性动力模型构建思想,探索凌空手势内在的混沌运动特性,建立基于混沌动力学特征的识别算法。通过离散观察嵌入Leapmotion的... 鉴于传统的手势动作识别算法可能会因手势速度幅度的变化及不准确的特征提取而降低准确率,拟采用混沌理论的非线性动力模型构建思想,探索凌空手势内在的混沌运动特性,建立基于混沌动力学特征的识别算法。通过离散观察嵌入Leapmotion的头戴式显示器所获得的手指轨迹,假设一个特定类型的混沌动力学系统可以模拟手势动作模型,从而基于相空间重构法建立由混沌特征因子组成的特征矩阵用于分类识别。在连续字母手势识别实验中对假设进行了验证,所提方法的最高准确率可以达到96.6%。 展开更多
关键词 手势识别 虚拟现实交互 混沌动力学 特征工程
在线阅读 下载PDF
基于机器学习XGBoost集成模型的边界流量计日流量预测方法 认领
18
作者 高赫余 王圣 吴潇勇 《净水技术》 CAS 2020年第10期181-186,共6页
为了解决供水分区边界流量计在非正常工作状态下,流量计量不准的问题,以正常工作状态下的水量为基础,结合影响流量计计量的多种特征,利用特征工程对原始数据进行优化,对离散型特征进行数值化处理,采用基于机器学习XGBoost集成模型构建... 为了解决供水分区边界流量计在非正常工作状态下,流量计量不准的问题,以正常工作状态下的水量为基础,结合影响流量计计量的多种特征,利用特征工程对原始数据进行优化,对离散型特征进行数值化处理,采用基于机器学习XGBoost集成模型构建流量计流量预测模型。旨在修正流量计非正常工作状态下计量的水量,提高工作成效。与传统的通过人工以未来一段时间内取平均值的计算方法相比,此模型以流量计正常工作状态下的全数据或者供水区域水量全数据为基础,充分结合了影响流量计工作的因素,如天气、日期、相关正常流量计、相关正常压力计、相关水厂、相关供水区域等,相对平均误差在2%左右,能够在工作中产生积极意义。 展开更多
关键词 XGBoost集成模型 电磁流量计 特征工程 离散变量数值化 流量预测
在线阅读 下载PDF
基于重构的多层次分析法的楼盘综合水平评价算法 认领
19
作者 石韵虓 陈凯 +2 位作者 李沂洋 崔帅 成丽波 《长春理工大学学报:自然科学版》 2020年第3期121-129,共9页
传统的楼盘评定算法基于层次分析法,传统方法没有考虑到情感因素、无法处理结构多样的连续型,离散型,文本型数据。针对这些问题提出基于重构的多层次分析法的楼盘综合水平评定算法。根据楼盘信息重构模型层次结构,利用特征工程对楼盘连... 传统的楼盘评定算法基于层次分析法,传统方法没有考虑到情感因素、无法处理结构多样的连续型,离散型,文本型数据。针对这些问题提出基于重构的多层次分析法的楼盘综合水平评定算法。根据楼盘信息重构模型层次结构,利用特征工程对楼盘连续型、离散型、文本型数据提出新的量化方法与标准化方法,过程中考虑了情感与心理满足度等主观因素。为了验证算法的适用性,使用爬虫爬取长春新房数据,通过此算法得到长春楼盘综合水平评分,该评分具有用户主观性和数据客观性,能够合理反映楼盘满足消费者需求的程度,并可计算出楼盘性价比,进行个性化购房推荐,解决了行业痛点。与传统方法相比,该方法优点在于结合了特征工程,采用的是更适用于本行业的数据量化与标准化方法,也考虑到了情感因素,心理满足度,层次结构也更加适用于如今的房地产数据结构,同时数据样例多,验证结果更具有说服力。 展开更多
关键词 特征工程 量化与标准化 层次分析 心理满足度 情感分析
在线阅读 下载PDF
基于数据挖掘与清洗的高炉操作参数优化 认领
20
作者 刘馨 张卫军 +1 位作者 石泉 周乐 《东北大学学报:自然科学版》 EI CAS CSCD 北大核心 2020年第8期1153-1160,共8页
为了提高企业生产力,实现“智慧钢厂”,对企业的海量生产数据信息进行有效挖掘,收集了某钢厂最近4年的高炉生产数据,利用箱型图进行数据清洗,提高数据质量.采取工艺理论和专家经验结合随机森林算法筛选出23个影响铁水质量和产量的特征参... 为了提高企业生产力,实现“智慧钢厂”,对企业的海量生产数据信息进行有效挖掘,收集了某钢厂最近4年的高炉生产数据,利用箱型图进行数据清洗,提高数据质量.采取工艺理论和专家经验结合随机森林算法筛选出23个影响铁水质量和产量的特征参数.以铁水产量和铁水[Si+Ti]质量分数为目标参数,通过k-means聚类分析法将其分为3类.将分类结果与特征参数整合后进行分析,得到造成铁水产量和质量大范围波动的13个参数,同时提供了相应参数的合理控制范围.研究可对高炉稳定顺行以及数据挖掘在钢铁行业的应用提供指导. 展开更多
关键词 智慧钢厂 数据挖掘 特征工程 K-MEANS聚类 随机森林 高炉
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部 意见反馈