2020研究生数学建模竞赛总结

题目：2020年中国研究生数学建模竞赛B题

降低汽油精制过程中的辛烷值损失模型

一、背景

汽油是小型车辆的主要燃料，汽油燃烧产生的尾气排放对大气环境有重要影响。为此，世界各国都制定了日益严格的汽油质量标准（见下表）。汽油清洁化重点是降低汽油中的硫、烯烃含量，同时尽量保持其辛烷值。

欧盟和我国车用汽油主要规格

车用汽油标准	辛烷值	硫含量/(μg/g) ≯	苯含量/% ≯	芳烃含量/% ≯	烯烃含量/% ≯
国Ⅲ（2010年）	90-97	150	1	40	30
国Ⅳ（2014年）	90-97	50	1	40	28
国Ⅴ（2017年）	89-95	10	1	40	24
国Ⅵ-A（2019年）	89-95	10	0.8	35	18
国Ⅵ-B（2023年）	89-95	10	0.8	35	15
欧Ⅴ（2009年）	95	10	1	35	18
欧VI（2013年）	95	10	1	35	18
世界燃油规范（Ⅴ类汽油）	95	10	1	35	10

注: μg/g是一个浓度单位，也有用mg/kg或ppm表示的（以下同）

我国原油对外依存度超过70%，且大部分是中东地区的含硫和高硫原油。原油中的重油通常占比40-60%，这部分重油（以硫为代表的杂质含量也高）难以直接利用。为了有效利用重油资源，我国大力发展了以催化裂化为核心的重油轻质化工艺技术，将重油转化为汽油、柴油和低碳烯烃，超过70%的汽油是由催化裂化生产得到，因此成品汽油中95%以上的硫和烯烃来自催化裂化汽油。故必须对催化裂化汽油进行精制处理，以满足对汽油质量要求。

辛烷值（以RON表示）是反映汽油燃烧性能的最重要指标，并作为汽油的商品牌号（例如89#、92#、95#）。现有技术在对催化裂化汽油进行脱硫和降烯烃过程中，普遍降低了汽油辛烷值。辛烷值每降低1个单位，相当于损失约150元/吨。以一个100万吨/年催化裂化汽油精制装置为例，若能降低RON损失0.3个单位，其经济效益将达到四千五百万元。

化工过程的建模一般是通过数据关联或机理建模的方法来实现的，取得了一定的成果。但是由于炼油工艺过程的复杂性以及设备的多样性，它们的操作变量（控制变量）之间具有高度非线性和相互强耦联的关系，而且传统的数据关联模型中变量相对较少、机理建模对原料的分析要求较高，对过程优化的响应不及时，所以效果并不理想。

某石化企业的催化裂化汽油精制脱硫装置运行4年，积累了大量历史数据，其汽油产品辛烷值损失平均为1.37个单位，而同类装置的最小损失值只有0.6个单位。故有较大的优化空间。请参赛研究生探索利用数据挖掘技术来解决化工过程建模问题。

二、目标

依据从催化裂化汽油精制装置采集的325个数据样本（每个数据样本都有354个操作变量），通过数据挖掘技术来建立汽油辛烷值（RON）损失的预测模型，并给出每个样本的优化操作条件，在保证汽油产品脱硫效果（欧六和国六标准均为不大于10μg/g，但为了给企业装置操作留有空间，本次建模要求产品硫含量不大于5μg/g）的前提下，尽量降低汽油辛烷值损失在30%以上。

三、问题

\1. 数据处理：请参考近4年的工业数据(见附件一“325个数据样本数据.xlsx”)的预处理结果，依“样本确定方法”（附件二）对285号和313号数据样本进行预处理（原始数据见附件三“285号和313号样本原始数据.xlsx”）并将处理后的数据分别加入到附件一中相应的样本号中，供下面研究使用。

\2. 寻找建模主要变量：

由于催化裂化汽油精制过程是连续的，虽然操作变量每3 分钟就采样一次，但辛烷值（因变量）的测量比较麻烦，一周仅2次无法对应。但根据实际情况可以认为辛烷值的测量值是测量时刻前两小时内操作变量的综合效果，因此预处理中取操作变量两小时内的平均值与辛烷值的测量值对应。这样产生了325个样本（见附件一）。

建立降低辛烷值损失模型涉及包括7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质等变量以及另外354个操作变量（共计367个变量），工程技术应用中经常使用先降维后建模的方法，这有利于忽略次要因素，发现并分析影响模型的主要变量与因素。因此，请你们根据提供的325个样本数据（见附件一），通过降维的方法从367个操作变量中筛选出建模主要变量，使之尽可能具有代表性、独立性（为了工程应用方便，建议降维后的主要变量在30个以下），并请详细说明建模主要变量的筛选过程及其合理性。（提示：请考虑将原料的辛烷值作为建模变量之一）。

\3. 建立辛烷值（RON）损失预测模型：采用上述样本和建模主要变量，通过数据挖掘技术建立辛烷值（RON）损失预测模型，并进行模型验证。

\4. 主要变量操作方案的优化：要求在保证产品硫含量不大于5μg/g的前提下，利用你们的模型获得325个数据样本(见附件四“325个数据样本数据.xlsx”)中，辛烷值（RON）损失降幅大于30%的样本对应的主要变量优化后的操作条件（优化过程中原料、待生吸附剂、再生吸附剂的性质保持不变，以它们在样本中的数据为准）。

\5. 模型的可视化展示：工业装置为了平稳生产，优化后的主要操作变量（即：问题2中的主要变量）往往只能逐步调整到位，请你们对133号样本（原料性质、待生吸附剂和再生吸附剂的性质数据保持不变，以样本中的数据为准），以图形展示其主要操作变量优化调整过程中对应的汽油辛烷值和硫含量的变化轨迹。（各主要操作变量每次允许调整幅度值Δ见附件四“354个操作变量信息.xlsx”）。

思路

这道题总体上是一个数据处理挖掘的题目，需要仔细和耐心，一般做数据处理的题不会特别的难，但是方法要选对，不然工作量就会很大。

话不多说，直接上！

1题

看的时候，基本就是完全按照它给的附件操作来，除了拉依达准则需要跑一下代码之外。但是这道题目里面的描述不是很清楚，样本和操作变量，位点，时间等东西，使得一开始做数据处理的时候不知道怎么删除数据，后面专家解释了一下，就还好，关键过了两天又出通知说拉依达准则只使用于非操作变量，如果是正常的进度，哪估计就有点恶心了。这道题基本就这样了。

2题

这是个降维的题，一开始我直接想的是PCA，但是PCA降维后得到的不是原始变量，而是新变量，这和题意中的降维意思是不符合，从367个变量中得到30个以下的主要变量，这应该属于特征选取；同时题目上面也描述到这些特征变量之间存在非线性和强耦合的关系；所以就我个人而言，我觉得这道题肯定不能用PCA，不然后面直接血炸。

然后我又想用非线性的将维算法，这个就比较多了，可以用聚类，因子分析，可以做出来这些变量的相关性，还是不错的，只是后面队友又有点想法，最后选择了随机森林去实现特征选择，这里暂时还看不出来好坏，第3题就知道了。我觉得正确的做法还是要做相关性分析，这样后面才比较容易一点。

3题

这个问看起来也简单，就是个预测模型，不过选择一个好的预测模型也是比较重要的，它要得是预测辛烷值损失，然后以上一问筛选出来的操作变量作为因变量。这一问，估计很多人都做得心累，我一开始想的就是直接用BP神经网络预测，然后找代码开始跑数据，但是跑了一天，数据拟合效果还是很差，基本炸裂了。后面又开始想是不是因为第二问特征选的不对，又回到第二问开始重新选变量，减少变量个数，各种尝试，效果依然不行，时间也过去了，想换预测模型的时候也不行了，最后还是选择了一个看的过去的结果用了。

这里还有一个坑，等会儿在第五问提到。

4题

我个人觉得这问就是这道题的核心，这个问主要思路是优化，但是题意有点难理解，优化的对象是什么，优化后的结果是什么，都应该要比较清楚，才能更好的选择算法，建立模型。同时这里也要注意优化算法的选取，不过看网上选择粒子群算法的有，模拟退火的有，我自己选择了遗传算法；不过比赛前没仔细准备优化算法，这一问就卡在这了。

说一下优化思路，我们应该将2题选取的主要变量进行优化，然后得到优化后各个操作变量的最优值，这个最优值就是要使得在主要变量取这些最优值得时候，得到的辛烷值损失降幅要大于30%，因为这道题的目标就是降低辛烷值损失，自然降幅要高一点好，而且题目关于这个降幅的问题，我觉得专家还是没有阐述的太明白。虽然我勉强做完了，但是对这道题的理解还是不是很到位，如果有大佬，希望能够指导一下！

5题

这题就是个可视化的题，但是很关键的点来了，它让画的是汽油辛烷值和硫含量的变化轨迹图，那么在前面的几个问题中，实际上只是在反复强调必须要使硫含量在5ug/g以下，并没有清楚的说要硫含量的值，更别提汽油辛烷值了，前几个问都是辛烷值损失，这里突然出来一个汽油辛烷值，当时就在想第三问没有做这两个变量的预测，那么这里怎么得到每次调整之后的对应值呢，肯定是要将主要变量调整后的值输入到优预测模型里面去得到一个结果，然后才可以画图啊！这就是这道题比较坑的一个点了，所以建议大家在做题的时候，还是要上下问仔细分析，再选择方法建模，不然后面再要换方法时间就来不及了。

以上就是我对于本次B题的一些思路，如果有不对的地方，可以留言交流。

总结和感悟

这是第一次做这样的一个总结，以前打过美赛和其他数学建模的时候，也没做过；加上这次研究生的数学建模，一共做了三次，不过感觉自己还是渣渣，代码代码不行，论文论文不行，唯独会那么几个熟悉的评价模型还可以。其他的就不行了。做的越多的感受就是，一个完整的建模团队，必须要有一个执行力强的队长，而且就是写论文的人，其他人在比赛期间都要听他的，可以有讨论争议，但在无法抉择的情况下，队长必须尽快做出决定，往下推进，毕竟比赛是有时间的。

再有就是这次三个人的团队，中途有个队友有事，没做了，我和另外一个队友还是勉强把论文写了交上去，获奖我是不敢想了，只求退个报名费。

不过这次比赛还是有收获，又了解了一些知识，同时对于自己也是一个压力和能力的锻炼，祝大家本次建模取得好成绩，我这个渣渣就不说了！

2020华为杯数学建模总结相关推荐

2020华为杯数学建模比赛总结
2020华为杯数学建模比赛总结这次比赛我准备了一个月的时间,看了<神经网络43例>还有<matlab数据挖掘>这两本书,比赛想要速成的话,最好通过跑自己的数据集应用,最后结果 ...
2020华为杯数学建模D题交流2群
2020华为杯数学建模D题交流2群
【自我解析】2020华为杯数学建模比赛C题
C题相较于A题专业性不是那么强,更偏向对给出数据的处理.这里我看了三篇优秀论文进行此题的学习,分别为0319(同济).0034(上海理工).0095(上海交通). 题目提供两个数据附件.P300的介绍 ...
【2022年华为杯数学建模E题赛后总结加思路详细介绍配代码----10月11号写的总结】
提示:下文将介绍2022年华为杯数学建模E题赛后总结加思路详细介绍配代码傻逼队友,傻逼队友,傻逼队友一定要看好人在进行组队,这是劝告. 这里有几点总结进行描述: 第一,图一定要尽量多,对图的解释要多 ...
2022华为杯数学建模B题——方形件组批优化问题
本文章用于记录2022华为杯数学建模B题--方形件组批优化问题提醒:大家最终提交的时候记得是pdf文件,不是word文件. 第一次参加建模比赛,经验不足,准备不充分,能力也欠缺.考虑2023年继续再 ...
2021华为杯数学建模“空气质量预报二次建模” 思路
2021华为杯数学建模B题思路–共享资料 1.问题1,按照附录的公式计算对应的AQI即可 2.使用PCA方式分解,将每个变量的众多值做无量纲话处理后放到统一坐标系下,找到最大特征值对应的特征,然后找出 ...
2021华为杯数学建模D题解题-抗乳腺癌候选药物的优化建模
2021华为杯数学建模D题解题-抗乳腺癌候选药物的优化建模赛题 1. 问题一解题:特征选择 1.1. 赛题分析 1.2. 解题:特征选择方法对比 1.3. 模型评估 2. 问题二解题:预测模型 2. ...
华为杯数学建模思路整理
华为杯数学建模思路整理 1.对于题目: 1.1 题目加上使用的模型进行命名,一定要注意字眼和格式:1.2 目录格式,简洁清爽,表现出使用的模型:1.3 别人的东西,加上文献引用;(**)1.4 对于评 ...
2021年华为杯数学建模B题，四题全部代码和思路
2021年华为杯数学建模B题,四题全部代码和思路需要的请联系我,企鹅1514168893.先看视频,满意再来找我,谢谢哈四题均已做完

2020华为杯数学建模总结

2020研究生数学建模竞赛总结

题目：2020年中国研究生数学建模竞赛B题

思路

1题

2题

3题

4题

5题

总结和感悟

2020华为杯数学建模总结相关推荐

最新文章

热门文章