当前位置: 首页 > news >正文

哪个网站可以找到毕业设计wordpress底栏

哪个网站可以找到毕业设计,wordpress底栏,手机视频网站设计,购物网站设计思路基于集成学习的共享单车异常检测的研究 整体求解过程概述(摘要) 近年来#xff0c;共享单车的快速发展在方便了人们出行的同时#xff0c;也对城市交通产生了一定的负面影响#xff0c;其主要原因为单车资源配置的不合理。本文通过建立单车租赁数量的预测模型和异常检测模型…基于集成学习的共享单车异常检测的研究 整体求解过程概述(摘要) 近年来共享单车的快速发展在方便了人们出行的同时也对城市交通产生了一定的负面影响其主要原因为单车资源配置的不合理。本文通过建立单车租赁数量的预测模型和异常检测模型以期能够帮助城市合理配置资源。   首先进行探索性数据分析。主要步骤为数据预处理、描述性统计和回归分析。其中分位数回归能够表现出输入变量与输出变量各分位点间的线性关系。   其次建立单车预测模型。分别运用集成学习中的 Bagging、Boosting 和模型融合算法 Stacking 进行建模。实验结果显示Boosting 算法中的 CatBoost 模型对单车租赁数量的预测效果最好。   最后建立异常检测模型。运用孤立森林算法检测单车租赁数量的异常值并利用支持向量机分析各输入变量对租赁异常的影响程度。研究表明租赁异常可能与城市意外事件的发生、节假日的到来、温度与风速以及湿度的突变和极端恶劣天气的产生有关。预测模型能够帮助城市合理规划共享单车的投放数量而异常检测模型则有助于城市及时处理突发事件希望本文的研究能够为城市资源合理配置提供参考。 问题分析 首先本文对该共享单车数据集进行了探索性数据分析。探索性数据分析用于解释原始数据并挖掘数据的潜在规律。第一步进行数据预处理即对数值特征的归一化处理和对类别特征的哑变量处理。该预处理方法有利于数据建模分析。第二步进行描述性统计本文绘制了小提琴图和饼状图借以表现各特征变量的概率分布情况。第三步进行回归分析其中相比于线性回归分位数回归能够表现出解释变量与被解释变量各分位点之间的线性关系其解释数据效果更好。   其次本文对该数据集进行了集成学习研究。集成学习是指将若干个弱学习器通过一定的策略组合得到一个强学习器其基本分类为 Bagging、Boosting 和Stacking。第一步运用随机森林、XGBoost、LightBoost 和 CatBoost 四种模型分别对该数据集进行训练并探究其特征变量重要性。随机森林是集成决策树的Bagging 算法其学习结果由其决策树的投票产生。XGBoost、LightGBM 和CatBoost 均属于 Boosting 算法其中XGBoost 对损失函数进行改进并利用正则化减少过拟合提高了模型的泛化能力。LightGBM 支持并行化学习在处理多维问题时其计算效率更高CatBoost 在处理类别特征问题上进行了优化其模型精度往往比 XGBoost 和 LightGBM 更高。第二步运用 Stacking 方法将上述四种算法进行模型融合以期得到一个泛化能力更好的模型。Stacking 是模型融合的学习框架其核心思想是将不同模型的优点进行有机结合从而提高模型的泛化能力。   最后本文以上述模型的训练误差为样本对单车租赁数量进行异常检测研究。第一步运用孤立森林模型检测样本中的异常点以期通过误差异常来反映共享单车租赁数量异常。孤立森林是一种异常检测方法可以精准识别分布稀疏的独立离群点。第二步运用支持向量机对上述异常情况进行训练支持向量机非常擅长分类及回归问题以期通过其向量空间特征系数来反映各变量对单车租赁数量异常的影响程度。集成学习所建立的预测模型能够帮助城市合理规划共享单车的投放数量而孤立森林和支持向量机所建立的异常检测模型则有助于城市及时处理突发事件。本文研究方法的流程图如下图 1 所示   其中探索性数据分用于解释数据集成学习用于构造预测模型孤立森林和支持向量机用于构造检测模型。 模型的建立与求解(部分) 对于该数据集中的数值型变量即数值特征本文对其进行数据归一化即统一映射到[0, 1]区间上数据无量纲化有利于提升机器学习模型的训练精度和收敛速度其公式如下   其中代表原始数据′代表归一化后的数据代表原始数据中最大值代表原始数据中最小值。数值型变量的代表符号如下表 1 所示   对于该数据集中的分类型变量即类别特征本文采用哑变量的处理方式将其统一变换为 0 或 1 变量。分类型变量的代表符号如下表 2 所示 本文探索性数据分析和集成学习所用数据均为上述预处理数据。 描述性统计 探索性数据分析Exploratory Data AnalysisEDA用于解释原始数据探索数据之间的潜在规律。EDA 在数据科学工作过程中能够对多个环节产生影响是不可或缺的重要步骤。本文采用描述性统计和分位数回归两种方法进行EDA。   小提琴图是箱线图与密度图的结合可以同时反映出变量的概率密度及分布情况其中箱线图的信息在中间部分密度图的信息在两侧部分。本文主要运用小提琴图对数值型变量进行了 EDA其结果如下图 2 所示 从图 2 中可以看出单车租赁数量与时间和温度这两个变量主要集中分布在中间区域各数据间的取值无明显差异而湿度与风速这两个变量存在极值点可初步判断这两个变量与单车租赁数量有较大相关性。   对于该数据集中的分类型变量本文主要运用饼状图进行 EDA其结果如下图 3 所示   从季节变量饼状图中可以看出春夏秋冬四季约各为总体的四分之一说明该数据集的季节变量分布较为均匀从天气变量饼状图中可以看出晴天出现的次数最多约为总体的 63%而雨雪等极端天气出现的次数最少仅为 3%除此之外工作日所占比重最大约为总体的 69%而节假日所占比重最少仅 3%。 为了方便进行回归分析本文对季节和天气两个类别特征进行编码化处理其他数据仍为预处理数据并进行了线性回归分析其结果如下图 4 所示 模型的建立与求解整体论文缩略图 全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可 (代码和文档not free) X - input data, t - number of trees, ψ - subsampling size 输出a set of t iTrees 1Initialize Forest 2set height limit l ceiling(log2ψ) 3for i 1 to t do 4 X’← sample(X, ψ) 5 Forest← Forest∪iTree(X’, 0, l) 6end for 7return Forest输入X’ – input data 输出an iTree 1: if X’ cannot be divided then 2: return exNode{Size← | X’ |} 3: else 4: let Q be a list of attribute in X’ 5: randomly select an attribute q∈Q 6: randomly select a split point p between the max and min values of attribute q in X’ 7: Xl← filter(X’, q p) 8: Xr← filter(X’, q ≥ p) 9: return inNode{Left← iTree(Xl), 10: Right← iTree(Xr), 11: SplitAtt← q, 12: SplitValue← p} 13: end if输入x – an instance, T – an iTree, hlim – height limit, e – current path length; To be initialized to zero when first called 输出path length of x 1: if T is an external node or e ≥ hlim then 2: return e c(T, size) {c(.) is defined in Equation 1} 3: end if 4: α← T.splitAtt 5: if xα T.splitValue then 6: return PathLength(x, T.Left, hlim, e 1) 7: else {xα ≥ T.splitValue} 8: return PathLength(x, T.Right, hlim, e 1) 9: end if全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可
http://www.zqtcl.cn/news/59090/

相关文章:

  • 多元 集团 网站建设方案免费生成app
  • 做网站公司 郑州求职seo
  • 专业网站名词解释王野动力
  • 南宁建设网站公司医院双语网站建设的意义
  • 我公司网站开发技术优势网络门店管理系统登录
  • 广州城市建设档案馆网站网页转app工具
  • 余姚本地网站排名国内较好的网站设计公司
  • 大地保险网站wordpress谷歌字体插件
  • 电子商务网站开发与设计wordpress 新窗口
  • 公司的门户网站模版促销活动推广方法有哪些
  • 网站建设衣服抽奖小程序
  • asp做网站很少免费给我推广
  • 做的网站一直刷新项城网站
  • 泉州学校网站建设陕西省交通建设集团公司门户网站
  • 网站建设教程书籍免费下载wordpress固定连接文件夹
  • 好的网站设计制作网站建设功能规划
  • 网站规划包含哪些内容wordpress 访问统计插件
  • 写作网站云在服务器网站上做跳转页面跳转
  • 网站建设服务器软件wordpress支持手机
  • 易记域名网站大全90设计网站官网首页
  • 短故事网站模板室内装潢设计专业培训
  • seo百度网站排名软件软件开发的外包公司
  • 服装网站建设风格青海做网站
  • 收录网站有哪些wix建站教程
  • 上海做网站较好的公司浏览器为什么无法打开网页
  • 如何做网站编辑 ?]技术优化网站技术
  • 商场网站开发教程阿里 云网站
  • 做网站需要学啥山西云起时网站建设
  • 单网页网站源码东莞是哪个省
  • 网站推广的含义广东网站建设系统怎么样