Datawhale干货

作者:小雨姑娘,康涅狄格大学,Datawhale成员

文章来自知乎提问:如何评价 2021 年美国大学生数学建模竞赛?今年赛情如何?

来凑个热闹降维打击美赛了,写一写前两题的思路。2018年读大二的时候拿了一次美赛H,现在已经读PhD了,再看当时做的跟屎一样。看了几个回答发现很多人甚至对题目的理解都是错的,私以为比赛最重要的是解决问题,而不是堆砌一堆花里胡哨的很Fancy的方法。

A题

第一问:描述 breakdown of ground litter and woody fibers 在  fungal activity in multiple species of fungi 下的情况

要解决这个问题首先要搞明白用什么来量化分解情况?有什么影响分解的情况?fungal activity真菌活动是什么?多种真菌到底是哪几种?

介于我们不是养蘑菇专家,我们能获取的信息基本都来源于A trait-based understanding of wood decomposition by fungi 这篇文章,下载下来看看有哪些信息。虽然我们不能抄袭论文里面的方法,但可以帮助我们了解一些基本概念。

在Introduction里面我们发现一句话:

Models traditionally used microbial biomass as a proxy of decomposer activity (3, 6), treating the microbial community as a single homogeneous group or a small number of functionally distinct pools (7).

传统方法一般使用 microbial biomass 生物量来代表分解者活动,这个问题里面显然fungi就是decomposer, 所以fungi的量应该就代表这个问题里面的真菌活动状况。阅读文章后,我们发现实验中的hyphal density(菌丝密度) 应该就是对应这个生物量。

To characterize the growth of each isolate, we quantified its hyphal extension rate and hyphal density (presented in ref. 34)

那么用什么来量化分解情况呢?论文里面是这样说的:

Here, we explore which fungal characteristics predict wood decomposition rate across a range of common wood decomposer fungi.

就是wood decomposition rate。具体的,这个根据木块被真菌吃掉的数量来计算的。

we measured the mass loss of wood blocks when colonized by each fungus to estimate a standardized wood decomposition rate

下一个问题是多种真菌到底有哪几种? 从第二题要求往模型里面加入Fungi不同种类之间的相互作用,我们可以大体推测第一问不需要考虑多种fungi的内部作用。

OK 第一问我们的思路已经清楚了,题目想让我们建立一个数学模型(回归模型)来刻画自变量(真菌的量fungi biomass)和因变量(分解率wood decomposition rate)的关系,这就是传统方法的做法。我觉得在下面两个文章有可能找到关于两个变量之间关系的一些基本假设。

K. L. McGuire, K. K. Treseder, Microbial communities and their relevance for ecosystem models: Decomposition as a case study. Soil Biol. Biochem. 42, 529–535 (2010)

S. Manzoni, A. Porporato, Soil carbon and nitrogen mineralization: Theory and models across scales. Soil Biol. Biochem. 41, 1355–1379 (2009).

第二问:考虑不同真菌间的相互作用,在模型里面加入Fig1和Fig2的信息

首先搞明白上一问中的遗留问题,真菌到底有哪些类型? 在文章中我们发现:

First, we use a database of 22 fungal traits previously measured in each of 34 wood rot fungi collected from a wide geographic range across North America (25, 34–36) to identify potential drivers of wood decomposition.

这里作者用了22种真菌特性进行研究,那真菌特性是什么东西?为什么里面没有出现真菌的类型?我们继续从论文中探索,发现这么一句话:

However, in recent years, the development of traitbased approaches has begun to transform our understanding of broad-scale functional patterns. By linking traits to ecosystem functioning, these approaches have been used in plant and animal ecology to infer the functioning of novel communities without prior knowledge of the taxa that are present.

大概就是现在一种新的 traitbased 研究方法,在仅知道一群真菌的特性的情况下(不需要考虑他们的种类),就可以代替知道真菌的种类进行研究。所以我们这一题的核心或许是不考虑具体的species,而是考虑一堆具有相同traits的不同类真菌(例如长得快的菌,抗冻的菌……等等),用他们的common trait作为种类的依据。

那么这些traits又是啥呢?从论文里我们发现这22种(2+11+9)traits可以分为三大类:

Hyphal extension rate and hyphal density reflect hyphal morphology and growth strategy,  ecological performance traits (11 in total) relate to combative ability.tolerance of a range of temperature and moisture conditions (25),  and finally, the production of oxidative and hydrolytic enzymes (9 traits) promotes nutrient acquisition from organic resources (26).

但要注意问题里面说了,我们只关注growth rate和moisture tolerance就好:

For this MCM Problem you should focus on just two traits of a fungus: the growth rate of the fungus and the fungus’ tolerance to moisture.

OK 那么问题明确了,这里我们需要加入growth rate和moisture tolerance到我们在第一问中建立的一元回归模型中,把它变成一个多元回归模型,相当于是在原来的传统方法上,引入这篇论文里的方法,因此需要使用这篇文章的数据:

https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.1909166117/-/DCSupplemental

要注意你最后模型的结果,要对比一下原始论文里的Fig.3,看跟这个图是不是一致。

第三问,分析模型,并刻画不同种类真菌之间长期与短期的关系

第二问建完模型之后,分析下几个自变量之间的关系(相关性和独立性),看一看大概有什么关系,根据这些关系做一些统计分析。例如是否发现自变量之间存在此消彼长的情况,可以用不同菌之间的竞争来解释等等……

重要的是注意这几点:

  • 长期与短期的动态关系,要考虑他们的变化趋势(可以参考时间序列中提取趋势的方法)。考虑他们之间的竞争关系,作者进行了pair wise的竞争对比在这篇文了的Combative ability数据里面。

  • 检验 rapid fluctuations 对各个变量影响的sensitivity (引入噪声进行假设检验)

  • 分析气候变化带来的影响。此时再加入自变量温度、湿度等指标。要用到这篇论文里的Temperature and moisture niche数据。

……

后面两问也需要用到前三问建立的回归模型做一些预测。把基本概念搞清楚以后,思路就有了。

B题

B题看了半天,直接看不懂,先说说我对于题目的理解。

题目中出现了几种对象:

  • EOC:理解为救援指挥中心,应该是一些固定位置的站点,但是Google没搜到位置,也不知道是一个还是好多个。

  • SSA drones:带摄像头和传感器的无人机,用来监视救火队的,理解为在救火队附近使用的无人机(理解为0距离,摄像头一般看不了很远)

  • Radio Repeater drones:带中继器的无人机,用来帮助EOC和救火队交流的无人机,可以离救火队远一点(20KM)

  • Firefighters :救火队

我搜了搜SSA是啥,下面有个解释。情景感知是happening around you, at or near your physical location,应该是观测很近的那种。我觉得就像是美国特战队那种,自己拿着的小型无人机。

Situational Awareness is a concept closely involved with physical security information management (PSIM, see the white papers on this subject). It is usually defined as being aware of what is happening around you, at or near your physical location, or at some other location where you are supposed to be or where there are assets or people that you must protect.

ref: https://www.titan-vision.com/pages/hot-topics/total-situational-awareness.html

几个很疑惑的问题:

  • 两种无人机之间有没有交流?在问题里面没看到。

  • 无人机从哪里开始飞? 是救火队拿着到时候飞,还是从EOC飞过去?我觉得应该是救火队拿着飞,而且从下面的飞机悬停也可以大概推测。

大概推测一下情景是这样的,K个带中继器的无人机悬停在距离EOC固定距离(20km)的圆内,保证加上救火队的交流半径(5km平地,2km市区)能够跟EOC交流。因为每个救火队拿着一个SSA无人机,所以直接把救火队小组抽象为SSA,SSA是需要跟着救火队移动的。

你要买很多SSA无人机,以及少量的带中继器的无人机。问题说带中继器和遥感的无人机一万美金很贵,应该是那种大型的用来运输东西的,SSA的小型无人机用来监视的带摄像头那种,类似大疆的,Amazon搜搜应该很便宜?

Akme Corporation's prototype WileE–15.2X hybrid drone is projected to cost approximately $10,000 (AUD) when equipped with either a radio repeater or video & telemetry capability.

损失函数可以定义一个 【失联的SSA(救火队)数量】【没有及时被救援的火场面积】 与 【买两种无人机花的钱】的加权,正好体现题目中要求的:

Your model should 【balance capability and safety】 with 【economics】,

你可以改变这三个权重去做trade-off,看看情况是什么样。

然后我想到的约束有下面几个:

  • 救火队(SSA)的距离(5km平地,2km市区)+  中继器的距离(20km) 小于与EOC的距离

  • 每个火点的多少距离内需要至少1个救火队

  • (SSA)救火队(SSA)赶到火点的时间需要小于K分钟

这些约束不需要完全满足,用拉格朗日松弛一下去求一个下界。

关于是不是SSA和中继器都用一种无人机,我倾向于不是使用一种无人机,否则第一问balance经济和安全就没法做了,只需要关注安全就好了。B题的思路是基于我理解正确的情况下,如果我理解的不对,那么思路就是不对的,大家参考下吧。

第二问我的理解是,去随机生成一些极端的大火情况,然后看第一问种哪些约束被打破了。根据那些打破的约束,看应当如何进行调整。

……

我知道美赛对于没有经过系统科研训练的本科生很难很头痛,但这也是这类比赛的意义所在,能够在三天的时间内专心独自解决一个实际问题,是很痛苦但结束后会觉得很享受的事情。贴一句我很喜欢的爆裂鼓手的一句话:"If you want the fucking core part, earn it! "

整理不易,三连

读博后降维打击数学建模!相关推荐

  1. 某程序员读博后,女友回复...

    点击上方[全栈开发者社区]→右上角[...]→[设为星标⭐ 点击领取全栈资料:全栈资料 大家好,今天想和大家聊聊读博这件事. 有人说,读博,是从青春洋溢的生命中,牺牲五六年光阴去从事艰难困苦的学习,钻 ...

  2. 他本科来自普通二本,读博后3年迎来2篇Nature,创造校史!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文来源:高分子科学前沿.Nature官网.华侨大学新闻网.华侨大学 ...

  3. 要不要读博,以及读博后如何顺利毕业并找到理想工作?五个最接地气的忠告...

    作者:無定著(来自豆瓣) Too young, too simple, always naive的我当年想读博的主要动机是被老友记里的Ross影响,觉得有一个Dr.的头衔十分酷炫!终身教职有寒暑假,有 ...

  4. 大学教师读博后违约离职,校方索赔79万!

    河南某大学一教师称离职时因违约遭学校高额索赔,并被拒办档案等手续. >>>> "学校要求我先缴纳近80万的赔偿,否则不给办理人事档案和社会保险转移手续."曾 ...

  5. 计算机 联合培养博士后,联合培养博士继续读博后的有吗 - 公派出国 - 小木虫 - 学术 科研 互动社区...

    转自老海龟的解释: 对CSC公派留学人员在外延长.转博.继续做博士后手续的答疑 CSC采取交押金.签协议的办法管理公派留学生显然是非常成功的,12年的时间里,公派人员的违约率只有800多人,比例占百分 ...

  6. 「二本生逆袭」引知乎热议,读博后三年两次发Nature,第一学历有那么重要吗?...

    作者 | 王晔 编辑 | 琰琰 近日,吉林大学.暨南大学.燕山大学及华侨大学的四篇学者研究论文被刊登在<Nature>上. 华侨大学再次引发了众人关注,更加引人注目的是该论文的第二作者. ...

  7. 数学建模清风第三次直播:excel在数学建模中的应用

    学习网址:课件下载 数学建模清风第一次直播:传染病模型和微分方程拟合 数学建模清风第二次直播:模拟退火算法 数学建模清风第三次直播:excel在数学建模中的应用 博客笔记: 数学建模清风第一次直播:传 ...

  8. 985博导:如果符合这几条,你可能不适合读博!

    昨天写了一篇<读博士可能后悔四年,不读博士可能后悔一辈子>,有朋友提出支持,也有朋友提出质疑.其中一个朋友指出,"读博士就是在玩奢侈品,青春和金钱的挥霍."本人也觉得比 ...

  9. 家境不好应不应该读博?

    在读研的第一天我就下定决心,"不读博.早工作",硕士两年也有过几位老师劝过读博,但是我还是坚持了自己的想法,两年后硕士毕业踏入工作岗位,工作后部门近两年入职的员工70%以上是来自清 ...

  10. 如何规划好自己的读博生涯

    想想不久即将离校,希望能写下自己一些读博感受,能够给正在读博或即将读博的师弟师妹一些参考,规划好自己的读博生涯.我是学工科的,因此叙述的观点可能贴近工科学生,根据我的理解,工科与文学.理学读博还是有很 ...

最新文章

  1. 一文帮你理解什么是深层置信网络(DBN)
  2. 节能电磁无线电导航信号放大电路 150kHz制版
  3. Android Studio --- [学习笔记]TCP(第2弹)、GridView、ScrollView
  4. 计算机网络实验1线缆制作,计算机网络技术实验报告1双绞线的制作
  5. Source does not fit in dest
  6. 信息隐藏技术与应用期末复习
  7. 邮票面值设计java_邮票面值设计
  8. Unable to find a @SpringBootConfiguration, you need to use @ContextConfiguration or @SpringBootTest(
  9. 0+到10+随机数+java_Java随机数总结
  10. Oxygen XML Editor(XML编辑器)中文版
  11. 互联网日报 | 美团外卖日订单量突破4000万个;《王者荣耀》动画番剧启动;360金融更名为360数科...
  12. 南京oracle认证考试,南京Oracle认证考试-Oracle认证Web组件开发专家(OCWCD)-南京万和...
  13. java 字符串中去除汉字和符号
  14. 2021年,谁发现了边缘计算的赚钱生意?
  15. [Shader]对NGUI的UISprite和UITexture进行裁剪
  16. MFC静态文本框的背景色设为透明
  17. 第一部分 开发环境配置
  18. 震惊!小猪的设计模式初涉总结!纯干货~
  19. 集成聚类之EAC方法
  20. 豆丁的文档分享与盈利模式

热门文章

  1. 使用命令行生成文件目录树
  2. 《GKT:Efficient and Robust 2D-to-BEV Representation Learning via Geometry-guided Kernel Transformer》
  3. 苹果电脑系统更新中断怎么办_苹果发布健身公告中断按需锻炼空间
  4. java fly bird小游戏_Flappy Bird 小游戏
  5. vs2017 linux unable to start debugging
  6. Linux OOM killer(转)
  7. 金融数字化平台建设的三大误区和破局之道
  8. fakeapp教程及下载
  9. flask 蓝本(blueprint)
  10. HaaS Lab 快速体验