ip做网站,东莞手机网站价格,上海app开发网站建设,有个网站专做品牌 而且价格便宜说明#xff1a;这是一个机器学习实战项目#xff08;附带数据代码文档视频讲解#xff09;#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景
泊松分布#xff08;一种离散分布#xff09;#xff0c;泊松分布适合于描述单位时间内随机事件发生…说明这是一个机器学习实战项目附带数据代码文档视频讲解如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景
泊松分布一种离散分布泊松分布适合于描述单位时间内随机事件发生的次数。对于试验成功概率很小而试验次数很多的随机过程都可以很自然地应用于泊松分布的理论。在泊松分布中的概率表达式只含一个参数减少了对参数的确定与修改工作量模型构建比较简单具有很重要的实际意义。
泊松分布是经济生活中的一种非常重要的分布形式尤其是经常被运用在运筹学研究中的一个分布模型。如物料订单的规划道路交通信号灯的设计生产计划的安排海港发货船期的调度等等都需要用到泊松分布。
本项目通过Poisson算法来构建泊松模型。
2.数据获取
本次建模数据来源于网络(本项目撰写人整理而成)数据项统计如下 编号 变量名称 描述 1 x1 2 x2 3 x3 4 x4 5 x5 6 x6 7 x7 8 x8 9 x9 10 x10 11 y
数据详情如下(部分展示) 3.数据预处理
3.1 用Pandas工具查看数据
使用Pandas工具的head()方法查看前五行数据 关键代码 3.2 数据缺失查看
使用Pandas工具的info()方法查看数据信息 从上图可以看到总共有11个变量数据中无缺失值共2000条数据。
关键代码 3.3 数据描述性统计
通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。 关键代码如下 4.探索性数据分析
4.1 y变量柱状图
用Matplotlib工具的plot()方法绘制柱状图 4.2 y1样本x1变量分布直方图
用Matplotlib工具的hist()方法绘制直方图 4.3 相关性分析 从上图中可以看到数值越大相关性越强正值是正相关、负值是负相关。
5.特征工程
5.1 建立特征数据和标签数据
关键代码如下 5.2 数据集拆分
通过train_test_split()方法按照80%训练集、20%测试集进行划分关键代码如下 6.构建泊松模型
主要使用Poisson算法用于目标分类。
6.1 构建模型 编号 模型名称 参数 1 Poisson模型 默认参数 6.2 模型的摘要信息 7.模型评估
7.1 评估指标及结果
评估指标主要包括准确率、查准率、查全率、F1分值等等。 模型名称 指标名称 指标值 测试集 Poisson模型 准确率 0.8800 查准率 0.8861 查全率 0.8775 F1分值 0.8818
从上表可以看出F1分值为0.8818说明模型效果较好。
关键代码如下 7.2 分类报告 从上图可以看出分类为0的F1分值为0.88分类为1的F1分值为0.88。
7.3 混淆矩阵 从上图可以看出实际为0预测不为0的 有23个样本实际为1预测不为1的 有25个样本整体预测准确率良好。
8.结论与展望
综上所述本文采用了Poisson算法来构建泊松模型最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。
# 本次机器学习项目实战所需的资料项目资源如下# 项目说明# 获取方式一# 项目实战合集导航https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tabBB08J2# 获取方式二链接https://pan.baidu.com/s/1wRUrft4nv7ME1xE-kk1vGA
提取码jcik