网站建设什么时候好,商丘创小资网络有限公司,小型企业网站系统,深圳优定软件网站建设说明#xff1a;这是一个机器学习实战项目#xff08;附带数据代码文档视频讲解#xff09;#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景
萤火虫算法#xff08;Fire-fly algorithm#xff0c;FA#xff09;由剑桥大学Yang于2009年提出 , …说明这是一个机器学习实战项目附带数据代码文档视频讲解如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景
萤火虫算法Fire-fly algorithmFA由剑桥大学Yang于2009年提出 , 作为最新的群智能优化算法之一,该算法具有更好的收敛速度和收敛精度,且易于工程实现等优点。
本项目通过FA萤火虫优化算法优化BP神经网络分类模型。
2.数据获取
本次建模数据来源于网络(本项目撰写人整理而成)数据项统计如下 编号 变量名称 描述 1 x1 2 x2 3 x3 4 x4 5 x5 6 x6 7 x7 8 x8 9 x9 10 x10 11 y 因变量
数据详情如下(部分展示) 3.数据预处理
3.1 用Pandas工具查看数据
使用Pandas工具的head()方法查看前五行数据 关键代码 3.2 数据缺失查看
使用Pandas工具的info()方法查看数据信息 从上图可以看到总共有11个变量数据中无缺失值共2000条数据。
关键代码 3.3 数据描述性统计
通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。 关键代码如下 4.探索性数据分析
4.1 y变量柱状图
用Matplotlib工具的plot()方法绘制柱状图 4.2 y1样本x1变量分布直方图
用Matplotlib工具的hist()方法绘制直方图 4.3 相关性分析 从上图中可以看到数值越大相关性越强正值是正相关、负值是负相关。
5.特征工程
5.1 建立特征数据和标签数据
关键代码如下 5.2 数据集拆分
通过train_test_split()方法按照80%训练集、20%测试集进行划分关键代码如下 6.构建FA萤火虫优化算法优化BP神经网络分类模型
主要使用FA萤火虫优化算法优化BP神经网络分类算法用于目标分类。
6.1 FA萤火虫优化算法寻找最优的参数值
最优参数 6.2 最优参数值构建模型 编号 模型名称 参数 1 BP神经网络分类模型 unitsbest_units 2 epochsbest_epochs 6.3 最优参数模型摘要信息 6.4 最优参数模型网络结构 6.5 最优参数模型训练集测试集损失和准确率曲线图 7.模型评估
7.1 评估指标及结果
评估指标主要包括准确率、查准率、查全率、F1分值等等。 模型名称 指标名称 指标值 测试集 BP神经网络分类模型 准确率 0.8850 查准率 0.8638 查全率 0.9154 F1分值 0.8889
从上表可以看出F1分值为0.8889说明模型效果较好。
关键代码如下 7.2 分类报告 从上图可以看出分类为0的F1分值为0.88分类为1的F1分值为0.89。
7.3 混淆矩阵 从上图可以看出实际为0预测不为0的 有29个样本实际为1预测不为1的 有17个样本整体预测准确率良好。
8.结论与展望
综上所述本文采用了FA萤火虫优化算法寻找BP神经网络算法的最优参数值来构建分类模型最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。
# 本次机器学习项目实战所需的资料项目资源如下# 项目说明链接https://pan.baidu.com/s/1W4A11ilhpGapgw9f2Yn1uQ
提取码19bm更多项目实战详见机器学习项目实战合集列表
机器学习项目实战合集列表_机器学习实战项目_胖哥真不错的博客-CSDN博客