B题——汽油辛烷值优化

作者序言

B题当时比赛时选的人非常多,可以说占据了近一般的参赛队伍,但是这题蕴含很多小问题,诸多选手也是叫苦连天。

我们队伍利用3天的时间完成这道赛题,最终获得全国一等奖(1.3%),也是全校唯一 一等奖,在此将整体思路整理,供大家参考,也欢迎一起交流、批评、指正。

在本科时期参加的美国大学生数学建模比赛也获得M奖,后续会出一片数学建模经验的blog,有问题或备赛疑惑的同学可以私信我。

PS:很多同学私信我要代码和论文,由于特殊原因,不方便展示,十分抱歉。如果后续有优秀论文集,可以转发给你们

背景

  • 汽油是小型车辆的主要燃料,汽油燃烧产生的尾气排放对大气环境有重要影响。为此,
    世界各国都制定了日益严格的汽油质量标准。汽油清洁化重点是降低汽油中的硫、烯烃含
    量,同时尽量保持其辛烷值。
  • 辛烷值(以 RON 表示)是反映汽油燃烧性能的最重要指标,并作为汽油的商品牌号。
    现有技术在对催化裂化汽油进行脱硫和降烯烃过程中,普遍降低了汽油辛烷值。
  • 化工过程的建模一般是通过数据关联或机理建模的方法来实现的,取得了一定的成果,
    但是由于炼油工艺的复杂性以及操作变量的高度非线性及相互强耦联,传统数据关联模型
    难以对过程优化作出及时响应,效果不佳。
  • 现有某石化企业运行 4 年的催化裂化汽油精制脱硫装置并积累了大量历史数据,其汽
    油产品辛烷值损失平均为 1.37 个单位相较于同类装置的最小损失值 0.6 个单位有较大的优
    化空间。现通过数据挖掘技术来解决该场景化工过程建模问题。

数据

具体数据源参见数学建模B题资料

问题提出

  • 根据从催化裂化汽油精制装置采集的 325 个数据样本(每个数据样本都有 354 个操作
    变量),通过数据挖掘技术来建立汽油辛烷值(RON)损失的预测模型,并给出每个样本
    的优化操作条件,在保证汽油产品脱硫效果(欧六和国六标准均为不大于 10µg/g,但为了
    给企业装置操作留有空间,本次建模要求产品硫含量不大于 5µg/g)的前提下,最终完成
    降低汽油辛烷含量损失降幅在 30% 以上。
    现根据以上背景以及所提供数据完成以下任务:
  1. 参考近四年的工业数据的数据样本,对 285 号和 313 号样本原始数据根据给定的
    样本处理方法对数据样本进行预处理,填入样本数据集中对应的数据样本编号中,以便进
    一步分析。
  2. 数据样本提供了 325 个样本数据,以及建立辛烷损失值模型所需要的 367 个操作
    变量。通过降维的方法筛选出建模的主要变量,并给出详尽的分析。
  3. 采用(1)(2)中完成的数据样本以及建模变量,使用数据挖掘技术建立辛烷值
    (RON)损失预测模型,并验证。
  4. 在保证产品硫含量不大于 5µg/g 的前提下,利用(3)中的模型对应的 325 个数据
    样本可操作变量进行优化,并给出辛烷值(RON)损失降幅大于 30% 的主要变量优化后的
    操作条件。
  5. 对 133 号样本,图形展示(2)中选定的主要操作变量在优化调整过程中对应辛烷
    值和硫含量的变化轨迹。

问题一分析

本题要求对 285 号和 313 号原始数据根据指定的数据处理规范进行预处理并填入相应
的样本编号。样本的原始数据每编号各 40 组,我们将每组的数据用给定的数据处理规范
进行验证,得到最终的数据,最后对每一列求期望补充相应的样本编号。

问题二分析

本题首先对数据样本按照最大最小限幅以及拉依达法则进行列变量清洗。

  1. 第一轮筛选,将处理后的数据针对产品中硫含量、RON 损失值用 lightGBM 做特征权
    重打分并以一定规则筛选出权重排名较前以及原料性质附带待生吸附剂、再生吸附剂等 17
    个变量。
  2. 第二轮筛选,针对排名较低且独立出现的 57 个变量进行相关性分析,针对相关性 >0.8
    的两两变量避免同时出现。之后基于决策树模型再做特征,选择选出最终 5 个变量并整合
    第一轮 17 个变量,得到建模所需要的 22 个主要变量,具体流程如图1所示。

问题三分析

本题利用模型融合的方法,构建集成学习模型,分别建立产品硫含量、RON 损失值预
测的集成学习模型。

  1. 首先分别训练 4 个基学习器:多层感知机、随机森林、决策树、梯度提升决策树,构
    建 4 个相关性较低的弱学习器。
  2. 再将 4 个基学习器进行模型融合,集成到梯度下降树(GBDT)中,实现 2 层的集成
    学习模型,如图2所示。
  3. 根据评价指标均方误差(MSE)、平均绝对误差(MAE), 集成的模型对硫含量、RON
    损失值的预测准确度远高于单一基学习器,且误差都较小。模型有较好的预测效果。

问题四分析

问题要求给出操作变量的优化方案,使得依据优化操作变量生成的 RON loss 和 CP S
满足给定要求。

将此问题建模为多目标优化问题,目标函数即为第三问建立的两个模型。
遗传算法计算得到 325 个样本的操作变量的帕累托最优取值,再在其中进行筛选,删去
不满足题设要求的帕累托最优解,即可找到完全满足题设要求的优化操作变量取值。

问题五分析

根据问题四中构建的优化策略,在保证优化目标的前提下,寻找 133 号样本点的帕累
托最优解对应的最优操作变量。结合操作变量范围,将初始操作变量逐步调整至最优数值。
每一步调整都会产生 133 号新的样本,利用预测模型对其预测,得到操作变量优化调整过
程中对应的汽油辛烷值和硫含量的变化

论文架构

论文主要由以下几个部分组成

论文重要图片


2020研究生数学建模B题——汽油辛烷值优化——获奖论文思路分享相关推荐

  1. 2020研究生数学建模B题——汽油辛烷值建模 每一问的解决思路与实验结果展示

    ----------------------2021.10.18更新------------------------------           已恢复下载,同时更新论文的 百度网盘的方式下载 链 ...

  2. 2020研究生数学建模E题--AlexNet深度网络解法(大雾能见度估计与预测)(含代码)

    2020研究生数学建模E题--AlexNet深度网络解法(大雾能见度估计与预测)(含代码) 一.E题赛题 二.赛题分析 三.解题 3.1 数据预处理 3.2 AlexNet深度网络 (1)AlexNe ...

  3. 数据挖掘机器学习[七]---2021研究生数学建模B题空气质量预报二次建模求解过程:基于Stacking机器学习混合模型的空气质量预测{含码源+pdf文章}

    相关文章: 特征工程详解及实战项目[参考] 数据挖掘---汽车车交易价格预测[一](测评指标:EDA) 数据挖掘机器学习---汽车交易价格预测详细版本[二]{EDA-数据探索性分析} 数据挖掘机器学习 ...

  4. 华为杯2022研究生数学建模赛题+解压码

    免费提供华为杯2022研究生数学建模赛题+解压码 网盘提取方式如下 链接:https://pan.baidu.com/s/1ySjp-JG1fvd_TvwGQcDNCg 提取码:y74r –来自百度网 ...

  5. 2020研究生数学建模大赛F题思路代码实现

    代码已提交 仅供交流参考 赛题 2020年A题–华为题_芯片相噪算法设计.docx 2020年B题–汽油辛烷值建模.zip 2020年C题–面向康复工程的脑电信号分析和判别模型.docx 附件1-P3 ...

  6. 2020年9月份华为杯研究生数学建模C题

    报名 总共3个小组成员,超越cy队还有一位指导老师 下载压缩包文件,是MD5加密的 试题发布以后会有MD5码可以解密之前下载的题. 开始分析题目并建模 1 小组讨论,分析每个题,然后选题. 2 我们小 ...

  7. 2020研究生数学建模获奖名单_赞!浙商大研究生在全国研究生数学建模竞赛中喜获41个奖项...

    近日,"华为杯"第十七届中国研究生数学建模竞赛获奖名单揭晓.我校共有来自统计与数学学院.管理工程与电子商务学院.计算机与信息工程学院.金融学院等各学院的41支研究生队伍斩获奖项,其 ...

  8. 2020研究生数学建模结果_关于组织参加2020年 江苏省研究生数学建模科研创新实践大赛的通知...

    关于组织参加2020年 江苏省研究生数学建模科研创新实践大赛的通知 受江苏省教育厅和江苏省学位委员会委托,江苏省理学 1 类研究生教育指导委员会主办"江苏省研究生数学建模科研创新实践大赛&q ...

  9. 2020研究生数学建模结果_关于举办2020年全国研究生数学建模大赛的通知

    2020年全国研究生数学建模大赛开始啦! 各学院: 为在大学生中倡导学习统计.应用统计的良好氛围,适应大数据时代的高校统计和数据科学人才的培养要求,提高研究生的数据挖掘.数据分析.运用计算机处理数据的 ...

最新文章

  1. Golang的协程(goroutine)和同步机制
  2. 2022.2.13java学习笔记
  3. Android之RecyclerView 实现真正的Gallery效果
  4. 论文阅读(3)--SPDA-CNN: Unifying Semantic Part Detection and Abstraction for Fine-grained Recognition
  5. python 文件和目录 当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出相对路径。
  6. JDK源码解析之 java.lang.Throwable
  7. python会计实证研究_描述性统计分析在实证研究中的作用及具体软件实现——以SPSS为例...
  8. mapreduce引用第三方jar
  9. Java数据类型,Hibernate数据类型,标准sql数据类型之间的对应表
  10. 手机连接电脑wifi上网_手机设置无线路由器方法教你一分钟学会WIFI上网(无需电脑)...
  11. 二叉树性质 四种遍历方式
  12. VMware虚拟机下Ubuntu安装VMware Tools详解
  13. Mac 入门教程:如何更改你的 Mac 设备名称
  14. 发的楷体怎么写_小学生硬笔书法怎么练
  15. 计算机网络报考注册测绘师,测绘员该不该考“注册测绘师”?看过来人的心得体会.........
  16. JAVA(图形界面)
  17. 计算机如何默认一种打字法,如何设置输入法,教您如何设置电脑的默认输入法...
  18. 嵌入式学习笔记(一)嵌入式操作系统测试
  19. 【无标题】认知智能中国原生智能科技体系 一文看懂认知智能 道翰天琼认知智能奠基者领导者
  20. python有道笔记_有道笔记整理成PDF

热门文章

  1. 【数据结构——哈夫曼树及其应用】
  2. Adobe或QQ的oxc000007b错误解决方案.
  3. 【方案分享】华与华《爱的是酒》酣客品牌定位及传播咨询方案.pptx(附下载链接)...
  4. android连接小票打印机,打印小票数据的两种模式
  5. 无法安装net framework 3.5 的解决方法
  6. 【推荐系统】今日头条推荐算法原理全文详解
  7. iPhone设置手机铃声
  8. excel数据分析 - 39个快捷键&10个操作技巧
  9. MOSFET原理与应用
  10. 政务服务一网通办建设方案(ppt)