深圳专业做网站案例,阿里云域名空间网站建设,蛋糕行业网站建设方案,响应式布局和弹性布局的区别【2023美国大学生数学建模竞赛】2024美赛C题 问题分析、数学模型、实现代码、完整论文
引言
题目将于2024年2月2日6:00发布。我们团队将会在8点前准时更新问题分析#xff0c;逐步更新数学模型和实现代码#xff0c;最后发布完整的论文。 更新进展#xff1a; #xff08…【2023美国大学生数学建模竞赛】2024美赛C题 问题分析、数学模型、实现代码、完整论文
引言
题目将于2024年2月2日6:00发布。我们团队将会在8点前准时更新问题分析逐步更新数学模型和实现代码最后发布完整的论文。 更新进展 12024年2月1日22:00发布博客 22024年2月2日6:00发布题目 32024年2月2日7:00发布问题分析
【2024美国大学生数学建模竞赛】2024美赛C题网球运动中的势头网球教练4.0没人比我更懂这个题了
1 题目
A题2024MCM问题C网球运动中的势头 在2023年温布尔登网球公开赛男子组决赛中20岁的西班牙新星卡洛斯-阿尔卡拉斯击败了36岁的诺瓦克-德约科维奇。这是德约科维奇自2013年以来首次在温布尔登输掉比赛也结束了这位大满贯历史上最伟大球员之一的辉煌战绩。
[1]德约科维奇似乎注定会轻松获胜他在第一盘以6-1的比分占据优势7局比赛中赢了6局。然而第二盘比赛却十分紧张最终阿尔卡雷斯在决胜盘中以7-6获胜。第三盘与第一盘相反阿尔卡拉兹以6-1的比分轻松获胜。第四盘开始后年轻的西班牙人似乎完全控制了局面但不知何故比赛的走势再次发生了变化德约科维奇完全控制了局面以6-3的比分赢得了这一盘。第五盘也是最后一盘比赛开始后德约科维奇延续了第四盘的优势但比赛的走向再次发生了变化阿尔卡拉斯以6-4取得了胜利。本场比赛的数据在提供的数据集中“match_id为2023-wimbledon-1701”。您可以使用set_no列等于1查看第一盘德约科维奇占优时的所有得分。似乎占优的一方有时会出现多分甚至多局的惊人波动这通常归因于势头。
在字典中“势头的定义是通过运动或一系列事件获得的力量或作用力。”[2]在体育运动中一支球队或一名球员可能会觉得他们在比赛中拥有势头或力量/作用力但很难衡量这种现象。此外如果存在势的话比赛中的各种事件是如何产生或改变势的也不是一目了然的。
提供2023年温布尔登网球公开赛前两轮之后所有男子比赛中每一分的数据。您可以自行决定加入其他球员信息或其他数据但必须完整记录数据来源。使用这些数据
1建立一个模型捕捉赛点发生时的比赛流程并将其应用到一场或多场比赛中。您的模型应能确定哪位球员在比赛中的某个特定时间段表现更好以及他们的表现好到什么程度。根据您的模型提供可视化的比赛流程描述。注意在网球比赛中发球的一方赢得赛点/比赛的概率要高得多。您可能希望以某种方式将这一因素考虑到您的模型中。
2一位网球教练对势头在比赛中的作用持怀疑态度。相反他假设比赛中的波动和一名球员的成功是随机的。请使用您的模型/度量来评估这一说法。
3练们很想知道是否有一些指标可以帮助判断比赛的流程何时会从偏向一名球员变为偏向另一名球员。
4利用提供的至少一场比赛的数据建立一个模型来预测比赛中的这些波动。哪些因素似乎最相关如果有的话
5考虑到过去比赛势头波动的差异您如何建议球员在新的比赛中对阵不同的球员
6在一场或多场其他比赛中测试您开发的模型。您对比赛中的波动预测得如何
如果模型有时表现不佳您是否能找出未来模型中可能需要包含的任何因素您的模型对其他比赛如女子比赛、锦标赛、球场表面和其他运动如乒乓球的通用性如何
7撰写一份不超过25页的报告介绍您的研究结果并附上一至两页的备忘录总结您的研究结果并就动力的作用以及如何让球员做好准备应对网球比赛中影响比赛进程的事件向教练提出建议。
您的PDF解决方案总页数不超过25页其中应包括
一页摘要表。
• 目录
• 您的全套解决方案
• 一至两页的备忘录。
• 参考文献列表。
• 人工智能使用报告如已使用则不计入25页限制。
注意对于提交的完整材料没有具体的最低页数要求。你可以用最多25页的篇幅来完成所有的解答工作以及你想包含的任何附加信息例如图纸、图表、计算、表格。我们接受部分解决方案。我们允许谨慎使用人工智能如ChatGPT但没有必要为这一问题创建解决方案。如果您选择使用生成式人工智能则必须遵守COMAP人工智能使用政策。这将导致一份额外的人工智能使用报告您必须将其添加到PDF解决方案文件的末尾并且不计入解决方案的25页总页数限制中。
2 提供的文件
1Wimbledon_featured_matches.csv-2023年温布尔登网球赛第二轮之后的男子单打比赛数据集。
2data_dictionary.csv-数据集说明。
3data_examples-帮助理解所提供数据的示例。
2 问题重述
比赛描述和数据 详细描述了2023年温布尔登网球公开赛男子组决赛的比赛情况以及提供的比赛数据。 解释了势头在体育运动中的定义以及难以衡量的问题。
问题 建立一个模型包括 捕捉赛点发生时的比赛流程的模型。应用到一场或多场比赛中以确定表现更好的球员并提供可视化描述。 对一位怀疑势头作用的网球教练的说法使用模型/度量来评估。 探讨一些指标用于判断比赛流程何时会从偏向一名球员变为偏向另一名球员。 利用提供的比赛数据建立一个波动预测模型并确定最相关的因素。 提出如何建议球员在新的比赛中对阵不同的球员考虑到过去比赛势头波动的差异。 在一场或多场其他比赛中测试开发的模型并评估模型的波动预测。 撰写报告和备忘录介绍研究结果并向教练提出建议。
3 问题分析
3.1 问题一捕捉赛点发生时的比赛流程的模型 2023美网比赛数据
1模型思路这是一个时间序列预测回归问题。将赛点发生时的比赛情况建模为状态转移过程根据历史比赛数据和技术统计来预测赛点的发生。由于计分的模型是按每一盘、每一局计分的大满贯的需要打5盘3胜出每一盘是赢6局或者66时一局定胜负这一局是先抢到7分的胜出如果66时需要再净胜出2分才能赢下这一局。在数据预处理部分可以将前面的赢下的盘作为一个特征如果前4盘中已经赢下2盘则直接预测第三盘是否会出现赛点。并且由于将计分转为一条时间序列的数据可以将计分数据转换为事件数据例如记录每一个赛点的发生情况赛点发生时双方的计分情况以及赛点赢家等。之后用时间序列回归模型预测即可以下给出示例代码。
2 模型
马尔可夫链模型Markov Chain Model: 将比赛状态建模为马尔可夫链推断赛点发生的概率。 隐马尔可夫模型Hidden Markov Model: 考虑比赛状态的隐含变量对赛点的发生进行建模。逻辑回归模型Logistic Regression: 根据选手的技术统计特征预测赛点的可能性。 生存分析模型Survival Analysis: 考虑赛点发生的时间建立生存分析模型来预测赛点的发生。朴素贝叶斯模型Naive Bayes: 基于历史数据和技术统计利用贝叶斯方法预测赛点的发生。
要将网球大满贯中5盘的计分数据转换为一条时间序列的数据可以将每个赛点的计分情况转换为时间序列中的事件然后使用这些事件数据来建立时间序列模型例如隐马尔可夫模型或马尔可夫链模型来预测赛点的发生。下面是举例理解Python代码
3示例举例的5盘比赛的计分数据 import pandas as pd# 假设我们有原始的比分数据包括每局的比分情况
# 这里的具体每一局的分数是我瞎编的需要根据提供的表格计算得出准确值后续我会更新正确。
score_data {Set1: [4-1, 1-4, 4-2, 4-0, 4-0, 4-3, 4-2],# 第一盘打了7局61Set2: [4-1, 1-4, 4-2, 4-0, 4-0, 4-3, 4-2, 1-4, 4-2, 4-0, 4-0, 4-3, 4-2],# 第二盘打了13局76Set3: [4-1, 1-4, 4-2, 4-0, 4-0, 4-3, 4-2],# 第三盘打了7局61Set4: [4-1, 1-4, 4-2, 4-0, 4-0, 4-3, 4-2,4-3, 4-2],# 第四盘打了9局36Set5: [4-3, 4-2,4-1, 1-4, 4-2, 4-0, 4-0, 4-3, 4-2,4-3] # 第五盘打了10局46
}# 转换成时间序列的事件数据
events []
for set_num in score_data:set_scores score_data[set_num]for game_score in set_scores:# 分割比分player1, player2 game_score.split(-)player1 int(player1)player2 int(player2)# 判断赛点情况if player1 4 and player1 - player2 2:events.append({set: set_num, game: game_score, player: Alcaraz, event: 赛点})elif player2 4 and player2 - player1 2:events.append({set: set_num, game: game_score, player: Djokovic, event: 赛点})# 转换为DataFrame
events_df pd.DataFrame(events)# 打印事件数据
print(events_df)
上述代码将原始计分数据转换为了赛点事件的时间序列数据。然后可以使用events_df进行时间序列建模例如应用隐马尔可夫模型
from hmmlearn import hmm# 建立隐马尔可夫模型
model hmm.GaussianHMM(n_components2, covariance_typefull)
X events_df[[set, game]] # 选择用于建模的特征
model.fit(X)# 进行赛点预测
predicted_states model.predict(X)# 打印预测结果
print(predicted_states)3.2 问题二评估势头作用的模型
1模型思路这是一个因子分析问题通过统计和机器学习方法评估球员的赛事表现是否受到势头的影响探索势头效应的存在和程度。
2 模型
线性回归模型Linear Regression分析球员的比赛表现与势头的相关性探索线性关系。 时间序列模型Time Series Model分析球员的比赛结果时间序列检测势头效应的存在和影响。因子分析Factor Analysis挖掘比赛数据中的潜在因子探索势头对表现的影响。 贝叶斯结构学习Bayesian Structural Learning利用贝叶斯方法建立模型评估势头作用的概率和影响。强化学习模型Reinforcement Learning通过建立马尔可夫决策过程模型来评估势头对球员战术选择的影响。
3.3 问题三 判断比赛流程转向的指标
1模型思路这是一个分类问题是球员A赢下的概率大还是球员B的概率大。建立状态转移模型来判断比赛流程何时转向另一名球员考虑技术统计和比分变化。
2 模型
隐马尔可夫模型Hidden Markov Model考虑比赛状态的隐含变量判断比赛流程的转向。 KNN模型K-Nearest Neighbors根据历史数据中邻近的比赛情况来判断比赛流程的转向。决策树模型Decision Tree利用技术统计特征来建立决策树模型判断比赛流程的转向。 时间序列分析模型Time Series Analysis分析比赛数据的时间序列特征判断比赛流程转向的规律。支持向量机模型Support Vector Machine根据技术统计特征建立支持向量机模型来判断比赛流程的转向。
3.4 问题四 建立波动预测模型
1模型思路这是时间序列预测问题将问题一的数学模型拿来用就行做一些漂亮的回归分析和可视化。利用比赛数据和技术统计建立波动预测模型来确定比赛结果的波动并找出最相关的因素。
2模型
时间序列模型Time Series Model建立时间序列预测模型预测比赛结果的波动。ARIMA模型利用自回归与移动平均模型预测比赛结果的波动情况。LSTM模型Long Short-Term Memory利用循环神经网络模型来预测比赛结果的波动。随机森林模型Random Forest利用多颗决策树组成的模型来预测比赛结果的波动。因果推断模型Causal Inference Model利用因果推断方法来确定比赛结果波动的因果关系。
3.5 问题五战术建议
1建议思路这是一个决策问题通过比较对阵不同对手时的比赛势头波动差异给出针对不同对手的战术建议简答一点做就是用决策树做要做复杂点就加入博弈论的思想方法更高级。
2模型
博弈论模型Game Theory分析不同对手之间的博弈关系给出对应的战术建议。 强化学习模型Reinforcement Learning通过与不同对手的交互学习给出对应的战术建议。决策树模型Decision Tree根据对手的特点建立决策树模型给出相应的战术建议。 概率图模型Probabilistic Graphical Model利用概率图模型分析不同对手的特点给出对应的战术建议。
3.6 问题六模型评估
以上几乎都是回归问题回归问题的模型评价方法部分举例如下
交叉验证Cross-validation对模型在其他比赛中的表现进行交叉验证评估模型的波动预测能力。均方误差Mean Squared Error计算模型在其他比赛中的均方误差评估模型的预测准确性。ROC曲线分析ROC Curve Analysis通过绘制ROC曲线评估模型的波动预测性能。查准率与召回率Precision and Recall计算模型的查准率与召回率评估模型的波动预测能力。AUC值评估AUC Value Evaluation计算模型的AUC值评估模型的波动预测性能。
对模型在其他比赛中的表现进行交叉验证评估模型的波动预测能力。
均方误差Mean Squared Error计算模型在其他比赛中的均方误差评估模型的预测准确性。ROC曲线分析ROC Curve Analysis通过绘制ROC曲线评估模型的波动预测性能。查准率与召回率Precision and Recall计算模型的查准率与召回率评估模型的波动预测能力。AUC值评估AUC Value Evaluation计算模型的AUC值评估模型的波动预测性能。
4 获取方式 完整资料请看评论区