来自:HyperAI超神经

内容提要:如今,大数据已经被各行各业所应用,酒店行业也不例外。充分利用大数据,使得酒店能够预测市场需求变化,进行智能化决策分析,改善经营状况。

关键词:数据科学 机器学习 二分类

如今, 各大 OTA(Online Travel Agency)平台极大地方便了人们的出行,酒店住宿、景点门票等,只需要动动手指就可以轻松完成预订。

国内外酒店民宿预订平台,多达数十种

为了吸引更多用户预订,这些平台会鼓励商家设定较为宽松的取消预订政策,比如可随时免费取消,或限时免费取消等。

全球客房销售量最大的网上酒店预订网站 Booking(缤客网),就凭借可免费取消的优势,深受广大驴友喜爱。

不过,对于用户来说,「免费取消」非常 nice,但对酒店来说,就很头大了。订单临时被取消,通常会给酒店带来以下损失:

  1. 被取消房间无法及时出售,酒店损失收入;

  2. 酒店降低价格出售被取消房间,减少了利润

  3. 为了尽快订出这些房间,酒店需要增加额外的宣传、分销渠道的费用;

在用户可以随时放酒店鸽子的情况下,酒店有没有什么办法,尽可能减少损失呢?

一位葡萄牙业务分析师(Business Analyst,简称 BA,这一职位相当于 IT 公司的产品经理) Manuel Banza,有超过 5 年的酒店管理从业经验。利用公开的欧洲酒店预订平台数据,发现了更容易取消订单的用户特点,以帮助酒店及时进行止损。

 从近 12 万条酒店预订数据中,发现规律

作为一名数据科学爱好者,Manuel Banza 从数据科学和机器学习入手。

他首先对一个「酒店预订需求数据集」(Hotel booking demand)进行了全面分析。该数据集包含了普通酒店和度假酒店共 32 个维度的数据,具体包括:

用户国籍、预订时间、住宿时间、成人和儿童或婴儿的数量、订单最终是否取消、用户在此次订单之前共取消订单次数等信息。

Hotel Booking Demand 

酒店预订需求数据集

发布机构:葡萄牙里斯本大学

包含数量:共 119390 条数据,32 个维度

数据格式:csv

数据大小:16.9 MB(压缩文件 1.3 MB)

地址:https://hyper.ai/datasets/14866

部分数据展示

通过统计,Manuel Banza 发现一年时间里,取消酒店订单的用户真不少。

2018 年 OTA 平台 Booking 上的预订订单中,有 49.8% 的用户取消了订单;在 HRS Group 上,这一比例甚至高达 66%。整体来看,多家平台在 2018 年平均预订订单取消率达到 39.6%。

各类预订渠道被取消的订单比例

接着,作者对数据进行了探索性分析,有以下几个发现:

  • 普通酒店和度假酒店相比,订单更容易被客人取消;

  • 春节和夏季的取消比例更大,而冬季的取消比例最低;

  • 各种预订渠道中,用户在 OTA 平台下单最多,同时 OTA 平台上被取消订单的也最多;

  • 用户预订时间越早,不确定性越大,取消的概率越大

作者表示,预订时间是分析酒店收益表现时,最重要的指标之一。分析结果表明,提前 1 年以上预订的取消概率最高,为 57.14%;一周内预订取消概率最低,为 7.73%。

预订提前的天数(横轴)与取消订单概率(纵轴)成正比

看来,计划越早越赶不上变化啊

 机器学习模型:预测谁最可能「放鸽子」

对数据集进行全面分析后,作者开始建立预测订单取消的模型。

第一步:数据清洗

首先,对数据集中缺失的值进行处理。如果该变量是数字变量,则必须用该特征的均值替换这些缺失值;如果该变量是分类特征,则必须用常数替换。

然后删除 reservation_status(预订状态,该变量代表订单是否被取消,0 为未取消,1 为取消),因为这是机器学习模型将要预测的值。

第二步:选择最佳模型

在开始为数据测试最佳算法之前,将数据集按 8:2 的比例分开。之后将用 80% 的数据来训练模型,并将 20% 的数据作为验证集。

在数据科学领域,预测订单取消是一个监督分类问题,也叫做二元分类。因此,作者选取了几个现有的二分类模型如 LightGBM,CatBoost、XGBoost 及 H2O 等,进行训练及对比,最终选出了实验结果最佳的模型 CatBoost。

通过 CatBoost 预测结果,发现以下几点:

  1. 如果用户的国籍是葡萄牙,则取消订单的可能性很高。不过,对于团体订票来说,酒店一般不会事先得到每个人的国籍信息。如果订单被取消,大多数酒店都会将其国籍默认为酒店所在的国家。所以,这项信息只作为参考,并不一定准确;

  2. 与至少提出一个特殊要求的用户相比,未提出任何特殊要求的用户,取消订单的可能性更高;

  3. lead_time(预订时间与入驻时间间隔天数)值越低,预订被取消的可能性就越低(这一点预测结果与之前数据分析结果相一致)。

葡萄牙人气酒店欧洲之星博物馆,店内以考古展览为特色

上线多个 OTA 平台,支持在线预订及免费取消

CatBoost 模型在验证集上的表现:

在整个「酒店预订需求」数据集上的表现:

 酒店:在取消之前,让我先抢救一波

使用这一预测模型,酒店就可以提前获知哪些用户可能取消订单,及时采取补救措施。

比如,提前联系取消可能性较大的用户,通过沟通,让他们尽可能更早地取消,给酒店预留更多的时间出售房间。

或者,也可以与有取消倾向的用户联系,向其介绍酒店的优点,给出一些入住奖励,力挽狂澜挽留他们。

机器学习,帮酒店先下手为强

新闻来源:

https://www.linkedin.com/pulse/u-hotel-booking-cancellations-using-machine-learning-manuel-banza

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

【机器学习案例】酒店用机器学习,预测哪些客人会放鸽子相关推荐

  1. 酒店用机器学习,预测哪些客人会放鸽子

    来源:HyperAI超神经 本文约1800字,建议阅读6分钟 如今,大数据已经被各行各业所应用,酒店行业也不例外.充分利用大数据,使得酒店能够预测市场需求变化,进行智能化决策分析,改善经营状况.本文为 ...

  2. 机器学习案例——生态系统蒸散速率预测

    生态系统蒸散速率预测 问题背景 概述 数据集.代码.报告下载 实验步骤分析 一.数据预处理 1. 对生态观测数据表和植被数据表进行数据预处理 2.将不同站点的多个表进行纵向合并 3.进行质量控制及去除 ...

  3. 数据科学与机器学习案例之客户的信用风险与预测

    数据科学与机器学习案例之客户的信用风险与预测 项目来源 数据处理 机器学习算法 逻辑回归 所有特征 特征选择 glmnet svm 总结 项目来源 分享的项目是来源于暑期实习的一些心得,研究的问题是客 ...

  4. Python实现经典机器学习案例——良/恶性性乳腺癌肿瘤完整数据预测

    Python实现经典机器学习案例 良/恶性性乳腺癌肿瘤完整数据预测 首先我们介绍一个概念,监督学习. 监督学习 "机器学习中监督学习模型的任务是根据已有经验知识对未知样本的目标/标签进行预测 ...

  5. 机器学习算法------3.3 案例:癌症分类预测-良/恶性乳腺癌肿瘤预测

    文章目录 3.3 案例:癌症分类预测-良/恶性乳腺癌肿瘤预测 学习目标 1 背景介绍 2 案例分析 3 代码实现 4 小结 3.3 案例:癌症分类预测-良/恶性乳腺癌肿瘤预测 学习目标 通过肿瘤预测案 ...

  6. Python实现经典机器学习案例 良/恶性性乳腺癌肿瘤预测

    Python实现经典机器学习案例 良/恶性性乳腺癌肿瘤预测 首先给出数据下载地址 http://note.youdao.com/groupshare/?token=C6B145FA919F41F8AC ...

  7. 机器学习:基于随机森林(RFC)对酒店预订分析预测

    机器学习:基于随机森林(RFC)对酒店预订分析预测 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  8. 机器学习模型 非线性模型_机器学习:通过预测菲亚特500的价格来观察线性模型的工作原理...

    机器学习模型 非线性模型 Introduction 介绍 In this article, I'd like to speak about linear models by introducing y ...

  9. 支持向量回归预测怎么做_机器学习如何在油气开发预测中发挥作用?

    机器学习主要作用是分类.回归.降维和聚类.在开发指标预测中主要是回归和降维.机器学习的主要理论基础就是使目标函数最小化,而目标函数主要由经验风险和结构风险组成.经验风险就是预测值和真实观测值的差异,结 ...

  10. Python可以这样学(第九季 机器学习案例与实战)-董付国-专题视频课程

    Python可以这样学(第九季 机器学习案例与实战)-1551人已学习 课程介绍         陆续介绍和分享一些机器学习方面的案例,Python基础知识可以参考前面的"Python可以这 ...

最新文章

  1. Android发送短消息程序的总结
  2. Leetcode PHP题解--D27 620. Not Boring Movies
  3. Asp.net与SQL一起打包部署安装
  4. 转:Hibernate中Criteria和DetachedCriteria的完整用法
  5. RocketMQ特性、专业术语(Producer,Producer Group,Consumer Group,Topic,Message,Tag,Broker,Name Server)等
  6. 数据库面试题【一、事务四大特性】
  7. 系统测试:单元测试相关知识笔记
  8. java默认数组值_数组元素默认的初始值都是什么
  9. new hashmap 初始大小_你们要的HashMap工作原理!它来了!!!
  10. Keras深度学习实战(2)——使用Keras构建神经网络
  11. 关与 @EnableConfigurationProperties 注解
  12. vlfeat python
  13. Web前端开发工具(编辑器)汇总
  14. CxImage 初识
  15. 系统发育基因组学(Phylogenomics)的介绍以及实操
  16. jbutton如何实现点击_Java Swing JButton按钮的实现示例
  17. 人生不怕晚,就看敢不敢|优锘科技 X《无尽攀登》专场见面会
  18. 服务器被攻击 显示503,打开网页后出现503 service unavailable等字样,什么意思
  19. Google Chrome插件开发-Context Menus
  20. 全国大学生“高教杯”成图大赛——图错了如何修改

热门文章

  1. Unity API学习笔记(2)-GameObject的3种Message消息方法
  2. C#复习笔记(2)--C#1所搭建的核心基础
  3. JqGrid常用示例
  4. [bzoj1031][JSOI2007]字符加密Cipher
  5. CRC源码生成工具,可生成Verilog和VHDL
  6. itsdangerous
  7. MySQL · BUG分析 · Rename table 死锁分析
  8. C#对称加密(3des)和非对称加密(rsa)算法
  9. js mouseover mouseout 多次触发
  10. 在浏览器上运行Qt应用 emscripten-qt