官方网站建设 搜搜磐石网络,网站都有哪些类型,手机做ppt的免费模板下载网站,南昌网站建设一般多少钱一年目录 2024认证杯数学建模C题思路模型代码#xff1a;4.11开赛后第一时间更新#xff0c;获取见文末名片
以下为2023年认证杯C题#xff1a;
2024年认证杯数学建模C题思路模型代码见此 2024认证杯数学建模C题思路模型代码#xff1a;4.11开赛后第一时间更新#xff0c;获…目录 2024认证杯数学建模C题思路模型代码4.11开赛后第一时间更新获取见文末名片
以下为2023年认证杯C题
2024年认证杯数学建模C题思路模型代码见此 2024认证杯数学建模C题思路模型代码4.11开赛后第一时间更新获取见文末名片
以下为2023年认证杯C题 问题分析 问题的研究对象是正常与不正常的心搏研究的内容为其中心电波形功率谱密度的变化情况。该问题描述了心律失常时不同心搏的类别变化特点并在不同的异常心率搏动下提出了分类排序的要求 2.1对问题1的分析 针对问题1可以将问题分为两个小问题。首先对本文数据异常心搏整合并进行其特性的分析。因为每个csv的文件都是2s的时间序列数据直接使用时间序列建模明显数据过于繁琐并不可取。因此按照思路可以利用这些数据时间序列去提取统计特征、频域特征、时域特征并存储于数据集中。根据上述的特征对每个样本提取特征并对正常的标记 0异常的标记 1。 使用监督学习方法建立机器学习模型进行训练和调参。其次对心律失常的情况进行分类这部分类别 label 题目没有给因此属于无监督学习聚类分析。然后通过使用基于质心的聚类算法自己决定类的数目。 2.2对问题2的分析 针对问题2将第一问所得数据集分为数据集和测试集然后更新聚类中心。可以参考统计模型中的多元线性回归分析的标准化回归系数和机器学习模型的特征重要性分析。这一步的思想是将第一问打的 label 作为 target 进行拟合模型让模型本身来判断哪些特征是重要的分类依据。具体需要先将数据标准化将 label 作为因变量可以带入多元线性回归模型观察标准化回归系数的大小或者带入机器学习分类模型观察特征重要性的大小直接量化各个特征的分类重要性。最后将特征值可视化再去量化其标准。 2.3对问题3的分析 针对问题3这题可以根据问题1和问题2的结论去分析一般来说心搏数据与正常心搏偏离越大则越危险可以直接与其比较得出统计特征以此做出统计分类。然后采用机器学习分类中的置信度假设有3种异常将正常编号为0异常的分程度标记为1、2、3再机器学习进行数据拟合若心搏数据越偏离正常则情况越紧急标记分级更高若心搏数据偏向正常则情况越轻缓标记分级低。 问题一的模型建立与求解 由于心电监测仪的处理器数据速度和容量有限会大大限制心电监测长时间的数据计算因此如何在2s内将心率异常状况分类是一个重点问题。因此
可通过机器学习输入样本集会将数据集划分为两部分训练集和测试集。训练集用来训练模型测试集用来评估模型的性能。通过训练集可以得到一个模型然后用测试集来评估这个模型的泛化能力。如果模型在测试集上的表现很好那么就可以认为这个模型具有很好的泛化能力可以用来预测新的数据。在数学建模中建立训练集和测试集的过程与机器学习中的过程类似。通常会将数据集划分为训练集和测试集然后使用训练集来建立模型使用测试集来评估模型的性能。这个过程可以帮助确定模型的参数和超参数并且评估模型的预测能力。通过这个过程可以得到一个可靠的模型用来解决实际问题。 四种模型 使用心跳频率去分析异常情况可以通过监测心跳频率的变化来判断患者是否出现了心脏疾病等异常情况。以下是四种常用的机器学习模型对心跳频率异常情况的分析
①Logistics模型Logistics模型可以用来预测二元分类问题如判断患者是否有心脏疾病。通过输入患者的心跳频率等特征Logistics模型可以输出一个概率值表示患者是否有心脏疾病的可能性。如果概率值大于0.5则认为患者有心脏疾病否则认为患者没有心脏疾病。
Logistic回归模型对因变量y直接进行建模而是对y取某个值的概率进行建模即p{y1|x进行建模。这个概率的取值只有0或1两种情况。那么可以得到p{y1|x与x的关系建立模型
②决策树模型决策树模型可以用来预测多元分类问题如判断患者是否有不同类型的心脏疾病。通过输入患者的心跳频率等特征决策树模型可以逐步判断患者是否有不同类型的心脏疾病。例如如果患者的心跳频率小于60次/分钟则认为患者可能患有心房颤动等疾病。
③随机森林模型随机森林模型可以用来预测多元分类问题如判断患者是否有不同类型的心脏疾病。与决策树模型不同的是随机森林模型会生成多个决策树并且每个决策树都是基于不同的随机样本和特征生成的。通过对多个决策树的预测结果取平均值随机森林模型可以更准确地预测患者是否有心脏疾病。
④XGBoost模型XGBoost模型是一种高效的集成学习模型可以用来预测二元或多元分类问题。与随机森林模型类似XGBoost模型也是基于多个决策树生成的。但是XGBoost模型在生成决策树时采用了一些优化技术如梯度提升和正则化等可以更准确地预测患者是否有心脏疾病。 利用文本数据生成的决策树模型部分图 问题二的模型建立与求解
利用文本数据生成的心搏数据 由上图可知不会存在完全一致的心搏频率图因此如何衡量出一个标准应用于心电监测仪去判断心律失常的类别尤为重要。
因此在通过机器学习后将测试集整理出来 部分机器学习后心搏频率测试数据 经过大量的测试数据分析最终选用了logistic模型、决策树模型、随机森林模型和xgboost模型进行比较。 机器学习后四种模型的性能度量指标折线图 机器学习后四种模型的性能度量指标表 通过在对比分析的结果中不难发现发现随机森林模型和XGBoost模型表现更加优秀因此建议在实际应用中使用这两种模型以获得更好的预测效果。因此选用随机森林模型和XGBoost模型的前十项指标数据进行分析 随机森林最重要的十个特征索引图 XGBoost最重要的十个特征索引图 最后则是对重要的特征进行可视化。假设x1x2x3x4x5是最重要的特征则将他们三三排列组合成10种绘制三维散点图将不同label的点用不同颜 色标记这样可以直观看出哪些点在哪些取值下会严重影响分类的性能得到判断依据。 问题三的模型建立与求解
1危险程度衡量的指标分析 本题主要是对问题一和问题二的总结利用问题一中求出的异常种类以及问题二得出的异常心率标准。可以根据心率失常的类型以及临床表现将异常心率的失常程度分为低危型心率失常、中危型心率失常和高危型心率失常。
根据上述的分类不但可以以每个片段的分类顺序从上到下分为高中低三个等级还可以依据每种等级内会发生的心律失常类型进一步排序而为了实现心律失常 风险评估和排序使用了一种基于机器学习的方法具体步骤如下
Step1 像解决问题一的同样方法在标注完正常心率与异常心率的图标中对每个片段计算其各类型的特征值并将其当做改片段的特征向量。
Step2 根据心电图中已知的正常心搏频率和异常心搏频率进行区别标注方便下一步让电脑明白数据例如正常心搏数据标记为0异常拼搏数据从低到高依次为1、2、3。
Step3 在数据预处理完成后使用已经标注好的样本数据来进行训练学习采用四种聚类分析模型分别是Logistic模型、决策树模型、随机森林模型和XGBoost模型。在分析求证后最终使用了Logistic模型。
Step4 在模型训练完成后使用新的心电图数据输入模型中就可以依靠2s的心电频谱检测出每个片段的危险等级将预测的结果排序好和分级更有利于医生能够更加快速地诊断和处理。
2实际上的聚类分析得出的结论 使用logistci模型可得Logistic回归模型的认为近似0的概率分别如下
类型
近似0的概率
1
0.058
2
0.0327
3
0.046
根据逻辑回归模型进行对数据进行预估将预估值里面是心率失常而且类型不同的人分别对应求总和不同类型心率失常的人分别求其样本总数将其对应求概率该概率为求近似0正常心率的人的概率概率越低证明他与正常人的心率相差更大即表明该人心率失常就更为严重。
部分代码展示 2024年认证杯数学建模C题思路模型代码见此