2021年MathorCup高校数学建模挑战赛——大数据竞赛A题
赛道 A:二手车估价问题
随着我国的机动车数量不断增长,人均保有量也随之增加,机动 车以“二手车”形式在流通环节,包括二手车收车、二手车拍卖、二手 车零售、二手车置换等环节的流通需求越来越大。二手车作为一种特 殊的“电商商品”,因为其“一车一况”的特性比一般电商商品的交易要 复杂得多,究其原因是二手车价格难于准确估计和设定,不但受到车 本身基础配置,如品牌、车系、动力等的影响,还受到车况如行驶里 程、车身受损和维修情况等的影响,甚至新车价格的变化也会对二手 车价格带来作用。目前国家并没有出台一个评判二手车资产价值的标 准。一些二手车交易平台和二手车第三方估价平台都从自身的角度建 立了一系列估价方法用于评估二手车资产的价值。
在一个典型的二手车零售场景,二手车一般通过互联网等线上渠 道获取用户线索,线下实体门店对外展销和售卖,俗称 O2O 门店模式。门店通过“买手”从个人或其他渠道收购二手车,然后由门店定价 师定价销售,二手车商品和其他商品一样,如果定价太高滞销也会打 折促销,甚至直接以较低的价格打包批发,直至商品最终卖出。
基于以上背景,请你们团队根据附件给出的数据,通过数据分析 与建模的方法帮助二手车交易平台解决下面的问题:
初赛问题
问题 1:基于给定的二手车交易样本数据(附件 1:估价训练数据),选用合适的估价方法,构建模型,预测二手车的零售交易价格, 数据中会对 id 类,主要特征类等信息进行脱敏。主要数据包括车辆基础信息、交易时间信息、价格信息等,包含 36 列变量信息,其中
15 列为匿名变量。字段如下:
序号 |
Features |
Description |
1 |
carid |
车辆 id |
2 |
tradeTime |
展销时间 |
3 |
brand |
品牌 id |
4 |
serial |
车系 id |
5 |
model |
车型 id |
6 |
mileage |
里程 |
7 |
color |
车辆颜色 |
8 |
cityId |
车辆所在城市 id |
9 |
carCode |
国标码 |
10 |
transferCount |
过户次数 |
11 |
seatings |
载客人数 |
12 |
registerDate |
注册日期 |
13 |
licenseDate |
上牌日期 |
14 |
country |
国别 |
15 |
maketype |
厂商类型 |
16 |
modelyear |
年款 |
17 |
displacement |
排量 |
18 |
gearbox |
变速箱 |
19 |
oiltype |
燃油类型 |
20 |
newprice |
新车价 |
21 |
anonymousFeature |
15 个匿名特征 |
22 |
price |
二手车交易价格(预测目标) |
请采用附件 1 中的“估价训练数据”(带标签)训练模型和测试模
型,自行设置测试集,使用训练完成后的模型对附件 2 中的“估价验证数据”(不带标签)进行预测,并将预测结果保存在附件 3“估价模型结果”文件中,注意不要修改格式,单独上传到竞赛平台。其中附件 1“估价训练数据”和附件 2“估价验证数据”只相差最后1 列数据(二手车交易价格(预测目标)),附件 3“估价模型结果”文件字段如下:
问题 2:在门店模式中,车辆在被“买手”收车以后,会进入门店进行售卖,车辆能否成功交易,除了取决于销售的谈判技巧,更重要 的是车辆本身是否受消费者青睐,价格是否公道。假设你们是门店的 定价师,请你们结合附件 4“门店交易训练数据”对车辆的成交周期(从车辆上架到成交的时间长度,单位:天)进行分析,挖掘影响车辆成 交周期的关键因素。假如需要加快门店在库车辆的销售速度,你们可 以结合这些关键因素采取哪些行之有效的手段,并进一步说明这些手 段的适用条件和预期效果。
附件 4“门店交易训练数据”包括 6 个字段,如下表所示,其中所有 carid 等相关信息包含在附件 1“估价训练数据”中。各字段间采用“\t”分隔符分割,不包含表头。
问题 3:依据给出的样本数据集,你们觉得还有哪些问题值得研究,并给出你们的思路?
将问题 1、2、3 的解决过程写成一篇论文,明确你们的思路、模型、方法和结果。
2021年MathorCup高校数学建模挑战赛——大数据竞赛A题相关推荐
- 2021年MathorCup高校数学建模挑战赛—大数据竞赛A题二手车估价问题解题思路
MathorCup高校数学建模挑战赛-大数据竞赛 A题 二手车估价问题 原题再现: 随着我国的机动车数量不断增长,人均保有量也随之增加,机动车以"二手车"形式在流通环节,包括二 ...
- 2021 年 MathorCup 高校数学建模挑战赛——大数据竞赛B题
赛道 B:信息流智能推荐算法中的序列评估问题 随着互联网信息的蓬勃发展,用户在使用互联网应用时面临着信息过载的问题.推荐算法的出现,满足了用户个性化的内容消费需求, 提升了用户获取有用信息的效率,在 ...
- 2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛(baseline)
教育部<高等学校人工智能创新行动计划>教技[2018]3号,鼓励对计算机专业类的智能科学与技术.数据科学与大数据技术等专业进行调整和整合,鼓励各个领域与大数据进行深度融合,通过大数据技术促 ...
- MathorCup高校数学建模挑战赛——大数据竞赛 赛道A 移动通信基站流量预测baseline
文章目录 前言 一.简单分析 二.具体程序 1.引入库 2.读入数据 3.数据处理 4.模型训练和预测 5.结果文件输出 总结 前言 本文给出2020年MathorCup高校数学建模挑战赛--大数据竞 ...
- 2022 年 MathorCup 高校数学建模挑战赛——大数据竞赛(北京移动用户体验影响因素研究全套代码)
赛道 B:北京移动用户体验影响因素研究 移动通信技术飞速发展,给人们带来了极大便利,人们也越来越离不开移动通信技术带来的各种便捷.随着网络不断的建设,网络覆盖越来越完善.各个移动运营商,越来 ...
- 2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛
关注我后续分享更多数学建模思路~
- 第三届2022MathorCup高校数学建模挑战赛大数据论文加代码(附详解)
基于系统决策树分类的移动用户体验影响因素研究 摘要 本题主要是一个研究预测模型,以中国移动通信集团北京公司为背景,让客户根据 自身在网络覆盖与信号强度方面的体验和语音通话过程中的整体体验来进行语音通话 ...
- 2021年MathorCup高校数学建模挑战赛b题:三维团簇的能量预测(三等)
微信公众号:数学建模与人工智能 https://github.com/QInzhengk/Math-Model-and-Machine-Learning 三维团簇的能量预测 摘要 一.问题重述 1 二 ...
- 2021年MathorCup高校数学建模挑战赛B题三维团簇的能量预测解题全过程文档加程序
2021年第十一届MathorCup高校数学建模 B题 三维团簇的能量预测 原题再现 原题再现 团簇,也称超细小簇,属纳米材料的尺度概念.团簇是由几个乃至上千个原子.分子或离子通过物理或化学结合力 ...
最新文章
- UVa197 - Cube(TLE)
- [YTU]_2433( C++习题 对象数组求最大值)
- 怎么通过华为三层交换机实现VLAN间通信?
- 将yolo标注转换为tensorflow_yolov3标注生成train.txt和test.txt同时做数据清洗
- bilibili有电脑版吗_你体验过电脑版的《和平精英》吗?不用担心内存,也不用担心卡顿...
- 阿里宣布取消的周报又死灰复燃?3分钟的高效报表才是最后出路
- 计算机网络之传输层:1、概述(传输层功能、端口号、套接字、TCP、UDP)
- 2017.3.23 特别行动队 思考记录
- sql索引的填充因子多少最好,填充因子的作用?
- VBS 实现无限弹窗整人
- facebook登录我游戏_Facebook对我的位置了解多少
- HTML旅游景点网页作业制作——旅游中国11个页面(HTML+CSS+JavaScript)
- c语言怎样处理lrc文件格式,lrc文件的一般格式是什么_教你如何打开lrc文件 - 驱动管家...
- 大二实训(二)问答题
- java实现26个大写字母的遍历
- Jmeter应用-接口测试
- 微型计算机主要技术指标是啥,微型计算机的主要技术指标
- Linux三剑客之awk最佳实践
- elementui 上传请求头_element-ui上传组件多个文件同时上传请求一次后台接口(前后端代码版)...
- 计算机系统结构课后习题答案
热门文章
- 数字孪生——实现工业互联网的利器
- oracle注册表重建,一次Windows 注册表中注册表项目丢失导致的Oracle 数据库启动问题。...
- 你的代码值多少钱 ?你算过吗
- C51数字钟程序-ZT(拿来学习用)
- (附源码)springboot汽车配件销售管理系统 毕业设计131650
- 以太坊钱包开发-下载、编译 go-ethereum,搭建 eth 私有链
- 基于网络分析和文本挖掘的意见领袖影响力研究
- php中文网教程 百度云,网盘直链问题请教
- 机器学习工程师 — Udacity 创建客户细分
- 2022擎创夏洛克AIOps智慧运营平台白皮书正式发布!