2026Mathorcup数学建模竞赛(妈妈杯)选题建议+初步分析

提示:C君认为的难度和开放度评级如下:(注意:研究生组仅可选择AB题,而本科组ABCD均可进行选择、E题专科组可以选择)

难度排序(从难到易):A > B ≈ E > D > C

开放度排序(从开放到封闭):E > B > D ≈ C > A

适合哪些同学?

  • A题:“高精尖”挑战。适合技术驱动型、渴望接触最前沿计算技术的强队。风险在于学习曲线陡峭,且结果严重依赖对量子工具的理解。
  • B题:“软硬结合”的创意题。适合有工科背景、喜欢动态系统和策略设计的队伍。模型设计的“合理性”和“创新性”是得分关键。
  • C题:“稳扎稳打”的数据题。适合大多数队伍,尤其是初次参赛或偏好数据分析的团队。只要按步骤扎实完成,容易获得完整结果,但想出彩需要模型和解释的深度。
  • D题:“经典难题”的算法题。适合编程能力强、喜欢挑战优化算法的队伍。有大量现有研究可以参考,但做出高效、新颖的求解算法是脱颖而出的关键。
  • E题:“开放探索”的综合题。适合信息搜集能力强、思维活跃、善于进行经济建模和跨学科思考的队伍。不确定性最大,但若数据翔实、模型出彩,极易形成亮点。

以下为ABCDE题选题建议及初步分析:(要注意的是,本次选题建议会给出每道题目的题目分析、第一问建模过程和推荐算法,然后根据学生不同的专业,针对性给出选题建议)。

A题:基于量子计算的智慧物流优化建模与算法设计​

A题的核心是将经典的物流车辆路径问题(VRP)转化为量子计算机能够理解和求解的形式。你们可以把这想象成一次“翻译”工作:把现实世界中司机送货的路线规划问题,翻译成量子世界里的“能量最低”问题。题目从最简单的单辆车、无约束送一个货开始,逐步增加难度,比如要考虑时间窗口(客户要求特定时间段送达)、车辆容量、多辆车协同,最后还要处理大规模订单。最大的挑战在于理解“量子计算”的思维方式——它不像传统计算机那样一步步计算,而是通过构建一个特殊的二次无约束二值优化(QUBO)模型,让量子系统自己“寻找”能量最低的状态,这个状态就对应着最优或近似最优的路线。你们需要学习如何使用指定的Kaiwu SDK或真机,将路线、时间、车辆等变量编码成0和1的量子比特组合,并设计合理的“惩罚项”来体现各种约束条件(比如不能超载、不能超时)。这道题技术栈非常新颖,适合对前沿科技充满热情、数学功底扎实、且编程能力强的队伍。

C君建议的建模过程为:针对第一问(单车辆、单次配送、无容量和时间约束),你们的建模思路可以这样展开:首先,明确目标是让车辆从配送中心出发,访问所有客户点一次且仅一次,最后返回中心,并使得总行驶距离最短。这是一个经典的旅行商问题(TSP)。接着,你们需要将其转化为QUBO模型。核心是定义决策变量,例如,可以用一个二维变量x{i,t}来表示车辆是否在第t个顺序访问客户点i。然后,构建目标函数,即总距离的数学表达,这通常体现为访问顺序相邻的两点间距离之和。最关键的一步是设计约束条件对应的惩罚项,并加到目标函数中。对于TSP,主要约束有两个:一是每个客户点必须被访问一次,这意味着对于每个点i,在所有时间顺序t中,有且仅有一个x{i,t}为1;二是每个时间顺序t只能访问一个客户点。你们需要为违反这些约束的情况设计一个足够大的惩罚系数,将其乘以违反程度后加入目标函数。这样,整个问题就变成了一个寻找使这个“总能量”(目标函数+惩罚项)最小的0/1变量组合的问题,可以直接输入给相干伊辛机求解。

推荐算法:建议你们采用一个“前沿+传统”的组合拳。前沿算法,我强烈推荐尝试量子近似优化算法(QAOA)或其变种。虽然题目要求使用相干伊辛机(CIM)及其SDK,但QAOA是当前量子计算领域针对组合优化问题最受关注的前沿算法之一。你们可以在理解CIM原理的基础上,借鉴QAOA将经典优化循环与量子线路结合的思路,来设计或优化你们的求解流程,例如如何更好地准备初始态或进行参数优化。两个传统/基础算法方面,首先必须掌握模拟退火(Simulated Annealing),因为它是很多量子计算硬件(包括相干伊辛机)所基于的物理原理的经典对应算法,理解它有助于你们调试模型和参数。其次,推荐遗传算法(Genetic Algorithm)。在将大规模问题分解或为量子计算准备高质量初始解时,遗传算法非常有效。你们可以用它快速得到一个不错的初始路线,再交给量子模型进行精细优化,这能显著提升整体求解效率。

推荐可视化方法:推荐量子比特状态概率分布与能量景观的可视化。你们可以尝试绘制在优化过程中,量子系统所处的不同状态(对应不同路线方案)的概率分布图,或者展示目标函数(能量)随着算法迭代变化的景观图。这能直观体现量子计算的并行搜索特性,非常酷炫且有说服力。两个普通但至关重要的可视化方法:一是最优/较优路径规划图,在地图背景上清晰画出配送中心、客户点以及车辆行驶路径,这是最直接展示你们模型成果的方式。二是算法收敛曲线对比图,将你们采用的量子求解方法与传统启发式算法(如模拟退火、遗传算法)的收敛过程(目标函数值随迭代次数的变化)画在同一张图上,可以直观对比不同方法的求解效率和效果。

这道题技术栈非常新颖,适合对前沿科技充满热情、数学功底扎实、且编程能力强的队伍。

B题:机器人竞技策略的优化问题

聚焦于这道题模拟了一个机器人擂台赛的场景,充满了动态博弈的趣味。你们需要扮演机器人的“大脑”,为它制定最优的攻击和防守策略。题目分阶段推进:首先考虑单回合,机器人需要从一系列攻击动作(如直拳、摆拳)中选择一个,并可能伴随一个防守动作(如格挡、闪避)。每个动作都有其基础效果、消耗的时间、对自身平衡的影响等属性。你们的任务是建立模型,量化评估不同动作组合的“净收益”,从而做出最优选择。接着,问题会扩展到多回合连续决策,这时就要考虑机器人的“体力”或“能量”等资源约束,策略会变成一个跨时间的规划问题。最后,还需要考虑对手行为的不确定性,引入博弈论的思想。这道题的魅力在于它融合了物理(动作动力学)、优化(决策模型)和博弈(对抗策略),开放度很高。如何定义“攻击效果”、“防守成功率”、“自身风险”等关键指标,是你们建模创造力的核心体现。

C君建议的建模过程为:对第一问(单回合,已知对手攻击方式,选择己方攻击和防守动作),你们的建模可以遵循以下逻辑:首先,需要量化评估每一个可能的“动作对”(一个攻击动作+一个防守动作)的预期收益。这需要你们定义几个核心指标:一是该动作对的“攻击预期伤害”,这可能是基础伤害值乘以一个基于对手防守方式的命中概率修正;二是“防守成功概率”,即选择的防守动作能有效化解对手攻击的概率;三是“自身代价”,比如动作消耗的时间会导致自身暴露风险,或对自身平衡度造成的影响。然后,你们可以构建一个综合评分函数,例如:预期收益 = 攻击预期伤害 + 防守成功带来的收益(如避免的伤害) - 自身代价。其中,每一项都需要你们根据题目给出的动作属性表,设计合理的计算公式进行量化。最后,模型的目标就是遍历所有允许的动作组合,选择使这个综合评分函数值最大的那个“攻击-防守”动作对,作为本回合的最优策略。

推荐算法:前沿算法,可以考虑近端策略优化(PPO)这类深度强化学习算法。虽然第一问是单步决策,但为后续多回合问题做准备,PPO非常适合在连续状态和动作空间中学习最优策略。你们可以设计一个仿真环境,让智能体(机器人)通过与模拟对手的交互来学习,即使对手策略变化,也能快速适应。两个传统/基础算法:首推博弈论中的矩阵博弈求解方法(如寻找纳什均衡)。将双方可选择的动作简化为有限集后,可以构建收益矩阵,这种方法能提供坚实的理论最优解基准,尤其适用于分析对抗场景。其次,推荐多属性决策分析(MADM)方法,如TOPSIS(逼近理想解排序法)。对于第一问这种对有限方案进行排序选择的问题,TOPSIS非常直观有效。你们可以将攻击伤害、防守成功率、自身代价等作为不同属性,为每个动作对打分,最后选出综合得分最高的方案。

推荐可视化方法:推荐策略决策树的交互式可视化。可以展示在不同情境(如对手使用不同攻击)下,你们的模型是如何像一棵树一样展开决策分支,最终选择某个动作叶节点的。使用交互工具(如Plotly)可以让评委动态查看不同路径,理解模型的决策过程。两个普通但有效的可视化方法:一是动作属性雷达图/平行坐标图,将不同攻击或防守动作的多个属性(伤害、时间、平衡影响等)在一张图上展示,可以直观对比各动作的优缺点。二是收益矩阵热力图,如果采用了博弈论方法,用热力图展示双方选择不同动作组合时的收益值,能一目了然地看到均衡点所在,非常专业。

适合专业:自动化、机器人工程、机械工程、控制科学与工程、应用数学、工业工程。适合有工科背景,对系统建模、控制或博弈论感兴趣的同学。

C题:中老年人群高血脂症的风险预警及干预方案优化

这是一道非常典型的、具有现实意义的健康数据分析题。题目给出了一个包含多维度信息的数据集,包括基本体征(如年龄、BMI)、血常规指标(如胆固醇、甘油三酯)、中医体质辨识、日常活动能力评估等。你们的工作就像一位“数据医生”,需要完成三步走:第一步是“诊断”,即从这些纷繁复杂的指标中,筛选出与高血脂症最相关的关键风险因素;第二步是“分级”,基于这些因素,构建一个模型,对人群进行风险等级划分(如低、中、高);第三步是“治疗”,为不同风险等级的人,设计一套考虑成本约束的个性化健康干预方案(如运动、饮食、用药建议的强度等级)。这道题的挑战在于处理多源、异质的数据(既有连续数值,也有分类和等级数据),并建立可解释、可落地的模型。你们的分析需要兼具统计学严谨性和医学常识合理性。

由于这篇是选题建议,详细思路可以看我的后续文章/视频。就不赘述了。数据集怎么分析,可视化代码什么的,后续会更新。这道题目开放度较高,难度较易,是本次比赛获奖的首选题目。推荐所有专业同学选择门槛较低且开放度也相对较高。

C君建议的建模过程为:首先,进行数据预处理,包括处理缺失值、异常值,并对分类变量进行适当编码。接着,进入核心的特征筛选阶段。你们不能盲目地把所有变量都扔进模型,而需要运用统计和机器学习方法,识别出对高血脂症诊断最有预测力的指标。例如,可以先计算每个特征与目标变量(是否患高血脂)之间的相关性(如点二列相关、卡方检验),进行初步过滤。然后,可以使用一些能够评估特征重要性的模型(如随机森林、XGBoost),训练一个初步分类器,根据模型输出的特征重要性得分进行排序和进一步筛选。最后,基于筛选出的关键特征子集,构建最终的风险预警分类模型。这个模型需要能够输出一个风险概率或风险评分。为了将其转化为“风险等级”,你们需要根据模型输出的概率分布或业务理解(如临床指南),人工设定合理的阈值,将人群划分为低、中、高风险几个类别。

推荐算法:前沿算法,首推LightGBM或XGBoost这类高性能梯度提升决策树(GBDT)算法。它们在处理表格数据、特征交互以及提供特征重要性方面表现极其出色,是目前数据科学竞赛中的“王牌”算法,非常适合用于本题的特征筛选和最终建模。两个传统/基础算法:一是逻辑回归(Logistic Regression)。它虽然简单,但可解释性极强。在特征筛选后,用逻辑回归构建一个基线模型,其系数可以直接解释为特征对患病风险的影响方向与程度,这对于医学解释非常重要。二是决策树(如CART)。决策树模型本身就能进行特征选择(通过分裂节点),并且其规则(if-then)非常直观,易于向非技术人员解释,适合作为风险分层的可视化工具。

推荐可视化方法:前沿的可视化方法,我强烈推荐SHAP(SHapley Additive exPlanations)值可视化。SHAP能统一解释任何复杂模型(如LightGBM)的预测结果,它可以展示每个特征对于单个样本预测结果的贡献度(是推高还是拉低了风险),也能展示特征的整体重要性。绘制SHAP摘要图、依赖图,能让你们的模型变得透明可信。两个普通但必备的可视化方法:一是特征重要性柱状图,直观展示经过你们筛选后,排名前N的关键风险因素是哪些。二是风险等级分布饼图或堆叠柱状图,展示在你们构建的模型下,全体样本或不同亚组(如按年龄、性别)中,低、中、高风险人群的占比,一目了然。

这道题目的数据处理是重中之重 大家需要认真去处理。

在开始大家需要对数据进行分析和数值化处理,也就是EDA(探索性数据分析)。并且可以使用一些可视化方法,可以使用常见的EDA可视化方法:

  • 直方图和密度图:展示数值变量的分布情况。
  • 散点图:展示两个连续变量之间的关系。
  • 箱线图:展示数值变量的分布情况和异常值。
  • 条形图和饼图:展示分类变量的分布情况。
  • 折线图:展示随时间或顺序变化的趋势。
  • 热力图:展示不同变量之间的相关性。
  • 散点矩阵图:展示多个变量之间的散点图矩阵。
  • 地理图:展示地理位置数据和空间分布信息。

由于这篇是选题建议,就不赘述具体思路了。数据集怎么分析,可视化代码什么的,后续会更新。这道题目开放度较高,难度较适中。推荐所有专业同学选择门槛较低且开放度也相对较高。

D题:多场景、多目标货物运输装箱策略优化

聚焦于物流行业一个非常经典且棘手的实际问题:如何把一堆形状、重量各异的货物,最合理、最节省空间地装进有限的车厢里。这就是著名的三维装箱问题(3D-BPP),并且题目还增加了多车型选择、多目标(既要车辆少,又要成本低)等现实约束。问题从简单到复杂:先考虑一辆车如何装得最满(空间利用率最高);然后考虑多辆车,目标是最少用车;最后还要考虑不同车型的租赁成本,优化总成本。约束条件包括货物的放置方向(有的只能立放)、承重要求(下面的货物要能承受上面的重量)、装载顺序等。这道题的难点在于其组合爆炸的特性——可能的摆放方案太多。你们的智慧主要体现在设计高效的搜索策略或启发式规则,在合理的时间内找到一个非常优秀的可行解,并能在多个相互冲突的目标之间做出明智的权衡。

C君建议的建模过程为:针对第一问(单一车型,优化满载率),你们的建模思路可以聚焦于如何形式化地描述“装载”这一动作。首先,需要定义车厢的剩余空间。一个常用的方法是使用“最大剩余空间”法,即用一个列表来动态维护车厢内所有可用的、矩形的空闲空间。每次放入一个货物时,就从这些空闲空间中选择一个合适的(货物的长宽高分别小于空间的长宽高)。然后,需要制定一个“放置规则”来决定:当有多个空间和多种放置方向可选时,优先选择哪一个?常见的启发式规则包括“最佳适应递减”规则(先按体积从大到小排序货物,每次尝试将当前货物放入能容纳它的、剩余体积最小的那个空间)和“占角放置”规则(总是将货物放在某个角落)。你们的模型就是这样一个迭代过程:按某种顺序遍历货物,根据你们设计的规则为每个货物选择放置位置和方向,更新剩余空间列表,直到所有货物装完或无处可装。目标函数就是最终装载货物的总体积除以车厢容积,即满载率。

推荐算法:前沿算法,我推荐深度强化学习(DRL),特别是基于注意力机制的模型。你们可以将装箱过程视为一个序列决策问题(依次放置货物),让一个神经网络智能体学习如何选择下一个货物以及其放置位置和方向,以最大化长期回报(最终装载率)。这种方法能自动学习复杂的放置模式,潜力巨大。两个传统/基础算法:一是遗传算法(Genetic Algorithm)。这是求解装箱问题的经典元启发式算法。你们可以将一个装载方案编码成一条染色体(如货物顺序序列),通过选择、交叉、变异等操作迭代进化出更好的方案。二是贪心算法结合特定的启发式规则,如上文提到的“最佳适应递减”规则。这是最简单快速的求解方法,可以作为基线方案,也是很多复杂算法的组成部分。

推荐可视化方法:前沿的可视化方法,我推荐三维交互式装箱可视化。使用Python的PyVista、Plotly或VPython等库,可以绘制出车厢的3D模型,并将每一个货物按其实际位置和方向渲染出来,支持旋转、缩放。这能极其直观地展示你们方案的紧凑性和合理性,是论文的亮点。两个普通但重要的可视化方法:一是二维投影示意图,分别从顶视图、侧视图和正视图展示货物的布局,虽然不如3D直观,但易于在论文中排版打印。二是多目标优化帕累托前沿图,在后续考虑车辆数和成本双目标时,用散点图展示你们算法找到的一系列非劣解(帕累托解),横纵坐标分别为车辆数和成本,可以清晰展示目标之间的权衡关系。

E题:罕见病药品医保谈判定价模型及用药成本优化研究

题目要求你们研究如何为价格高昂的罕见病药品制定一个合理的医保支付价格。首先,需要基于历史谈判数据,分析影响药品成交价的关键因素,比如药品的治疗价值、患者人数、市场竞争情况等,并建立一个预测或解释模型。然后,题目鼓励你们跳出给定数据,思考并引入更多“罕见病特异性因素”(如疾病严重程度、是否有替代疗法、社会伦理考量等),来改进你们的定价模型,使其更科学、更人性化。最后,还需要为一个具体的罕见病患者案例,考虑用药方案、医保报销和可能的替代药物,制定一个个人用药成本优化方案。这道题的开放性极高,难点主要在于数据获取(需要自己查找大量补充资料)和因素量化(如何将定性因素转化为模型可用的数值指标)。

第一问建模过程:针对第一问(基于历史数据的医保谈判定价因素分析及模型构建),你们的建模过程应像一个经济学实证研究。首先,对提供的药品历史谈判数据(可能包含成交价、药品属性、企业信息等)进行深入的探索性数据分析(EDA),观察各变量与成交价之间的散点关系、分布情况。核心任务是识别关键影响因素。你们可以运用统计方法,如计算连续变量与价格的相关性系数,或对分类变量进行分组均值比较和方差分析。接着,构建一个多元回归模型(如线性回归或更稳健的岭回归、Lasso回归)。将你们认为可能的影响因素作为自变量,成交价作为因变量,进行回归分析。Lasso回归在此特别有用,因为它可以在拟合模型的同时自动进行特征选择,将不重要的变量的系数压缩为零,从而直接筛选出关键因素。通过分析最终模型的回归系数,你们就可以定量地解释:哪些因素对价格有显著正向影响,哪些有负向影响,影响程度有多大。这个模型既可以用于理解历史定价规律,也可以为预测新药谈判提供参考。

推荐算法:前沿算法,我推荐Transformer模型在时间序列预测上的应用。如果历史数据具有时间序列特性(如多年谈判数据),可以将药品定价视为一个序列预测问题。使用Transformer可以捕捉长期依赖和复杂模式,预测效果可能优于传统方法。两个传统/基础算法:一是多元线性回归及其变种(如Lasso, Ridge)。如前所述,这是进行因素分析和构建可解释基准模型的核心工具,结论清晰易懂。二是随机森林回归(Random Forest Regressor)。它在处理非线性关系和交互效应方面比线性回归更强大,同时也能提供特征重要性排序,帮助你们从另一个角度验证关键因素,可以作为对线性模型结果的补充和验证。

推荐可视化方法:

可视化:前沿的可视化方法,我推荐动态时间序列预测与残差分析仪表盘。使用Dash或Streamlit搭建一个简单交互页面,可以动态展示不同药品的成交价随时间的变化、你们模型的预测曲线、以及预测误差(残差)的分布。这能专业地展示模型的拟合效果。两个普通但核心的可视化方法:一是变量关系热力图与散点图矩阵,在因素分析阶段,用热力图展示所有变量间的相关系数,用散点图矩阵直观查看两两关系,是发现线索的必备工具。二是成本优化方案桑基图(Sankey Diagram),在最后为具体患者制定方案时,用桑基图展示总医疗费用在不同支付方(如医保、商保、自费)和不同用药选择之间的流向,可以非常直观、美观地展示你们的优化方案如何节省费用。

其中更详细的思路、各题目思路、代码、讲解视频、成品论文及其他相关内容,可以点击下方名片获取哦!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐