【题目】

7、 OTA 全称为 Online Travel Agency,中文译为“在线旅行社”,是旅游电子商务行业的专业词语。指“旅游消费者通过网络向旅游服务提供商预定旅游产品或服务,并通过网上支付或者线下付费,即各酒店通过网络进行产品营销或产品销售”。OTA 平台是酒店营销的主要途径之一,不仅降低销售成本,同时也提高了顾客体验满意度。当顾客通过 OTA 平台进行酒店预订时,酒店就拥有了用户的相关数据。通过这些数据,能够更好地收集用户需求,从而可以提供更有针对性和个性化的服务,最终能够产生更多的忠诚会员带来更多订单。但 OTA 平台销售也存在用户拒单等情况,拒单原因有很多:例如,平台信息不同步,信息更新不及时;分销层次过多,导致无法及时查证订单;酒店违反 OTA 规则擅自以低价让客户取消订单,这种情况又叫做“切单”。OTA 平台需要统计用户订单的分布情况,以此发现平台缺陷及用户、商家的行为模式,OTA 平台据此调整营销策略。根据现有数据及给定参数完成订单数据统计,并写入指定的数据库或数据文件,截图并保存结果。
详细描述:
1) 请以上述3(题目数字编号)任务的输出结果作为输入数据源,编写Spark程序统计各省直销拒单率,以直销拒单率升序排列并输出前 10 条统计结果,输出至 HDFS 文件系统中/hotelsparkhive2。要求输出字段包含:省份、直销拒单率。
具体任务要求:
1) 运行代码,将统计的直销拒单率升序排列并将前 10 条统计结果打印输出并写入/hotelsparkhive2 中,将打印输出结果截图并保存(截图需包含打印语句输出结果的上下各 5 行运行日志)。


【答案】

参考答案截图:每个红框区域结果一致得 0.5 分; (两个红框共 1 分 )

【2019全国职业技能大赛大数据技术】任务三:10-数据清洗与分析(25分_题目+答案<图片+分值>)相关推荐

  1. 【2019全国职业技能大赛大数据技术】任务四:14-数据可视化(20分_题目+答案<图片+分值>)

    [任务说明] 任务四 : 数据可视化 (20 分 ) 本任务中 所需要 的原始数据四 存放于任务四 MySQL 的 的 project_hotels 数据库 和 计算机 桌面/H3CU_hotel/d ...

  2. 2022年深圳技能大赛-大数据技术应用职业技能竞赛介绍

    01竞赛项目 大数据技术应用 02竞赛标准 参照广东省第二届职业技能大赛大数据技术应用赛项标准,结合新时代行业企业发展情况,适当增加新知识.新技术.新设备.新技能的相关内容,由执委会组织专家制定,具体 ...

  3. 2021年全国职业院校技能大赛 “大数据技术与应用”—模拟赛题(三)

    2021年全国职业院校技能大赛 "大数据技术与应用" --模拟赛题(三) 文章适合了解大数据技术与应用技能大赛 赛题.文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处: ...

  4. 2021年全国职业院校技能大赛 “大数据技术与应用”—模拟赛题(二)

    2021年全国职业院校技能大赛 "大数据技术与应用" --模拟赛题(二) 文章适合了解大数据技术与应用技能大赛 赛题.文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处: ...

  5. 2021年全国职业院校技能大赛 “大数据技术与应用”—模拟赛题(一)

    2021年全国职业院校技能大赛 "大数据技术与应用" --模拟赛题(一) 文章适合了解大数据技术与应用技能大赛 赛题.文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处: ...

  6. 网络技能大赛-2019年国赛真题[2019年全国职业技能大赛高职组计算机网络应用赛项真题-H卷]路由交换部分答案详解

    网络技能大赛-2019年国赛真题[2019年全国职业技能大赛高职组计算机网络应用赛项真题-H卷]路由交换部分答案详解 2022年全国职业技能大赛网络系统管理赛项相较2021年再次做出改动,Linux部 ...

  7. 2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析(1)

    2021年广东省专业技能大赛--大数据技术与应用 真题题目及解析 文章适合用户了解大数据技能大赛的考试提纲和解析步骤.文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处:更多内容请点进

  8. 2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析(2)

    2021年广东省专业技能大赛--大数据技术与应用 真题题目及解析(2) 文章适合用户了解大数据技能大赛的考试提纲和解析步骤.文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处:更多内容请点进

  9. lyuyou消费大数据_基于大数据技术的电力用户行为分析及应用现状

    &Automation 基于大数据技术的电力用户行为分析及应用现状 沈玉玲,吕燕,陈瑞峰 ( 上海电气集团股份有限公司中央研究院, 上海 200070 ) 摘 要: 电力行业是大数据技术应用的 ...

最新文章

  1. 支付宝何以支撑双十一4200万次/秒的数据库请求峰值?
  2. 【Python】35个经典案例:吃透Python中的if条件语句~
  3. Oracle开启关闭归档日志
  4. 共享白板程序源代码_[源码和文档分享]QT实现的基于TCP Socket的共享白板
  5. Maven学习总结(31)——Maven坐标详解
  6. 随笔:读书笔记--《九败一胜:美团创始人王兴创业十年》
  7. USB协议详解第17讲(USB事务总结)
  8. veeam备份oracle数据库,Veeam Explorer for Oracle v10:即时发布数据库!
  9. R数据框操作 fourth day
  10. 树莓派智能语音机器人
  11. java lambda表达式 list转string
  12. 数据库拆分的理解和案例(详细版)
  13. 蓝牙协议分析(2)_协议架构
  14. 互联网企业盈利模式全分析
  15. mysql中计算两个日期的时间差函数TIMESTAMPDIFF用法
  16. 如何做RAID5之图解
  17. 揭秘网络黑产链:为何普通黑客能月入 8 万美元?
  18. Bugku:杂项 小美的秘密part2
  19. 蓝桥杯 ADV168 算法提高 快乐司机(贪心 快排)(java)
  20. 如何区分一个FrameWork是动态链接库还是静态库

热门文章

  1. 学习常用SHEEL脚本1
  2. PyQt5-五十音图听写
  3. 天敏VC4000视频开发设计方案
  4. 2021CCF BDCI图书推荐系统竞赛baseline
  5. 管理后台服务通用化设计拙见
  6. ASP.NET 网页模板-基础
  7. MFC界面开发进入BCGControlBar v30.5时代,Gauge控件全新升级
  8. 一个人尽然可以管理呢么多网站,强悍
  9. 为什么非全站升级HTTPS不可? 1
  10. QT中常用的输入控件