第三部分:大数据分析

1、 创建一个数据库,以你的用户名命名,创建成功后使用use命令切换为该库,并执行set hive.cli.print.current.db=true;截图(2分)

1)命令截图:

2)执行命令结果截图

2、在HIVE中创建需要的表,并写出建表语句,表结构如下:(3分)

订单表 data_order

data_address 地址表 通过orderMainId字段与 data_order表中的order_id 字段关联

data_area 地区表 通过street_code字段与data_address表中的street_id字段关联

1) 创建hive表 语句截图:

2)创建成功,执行show tables;截图

3、将数据加载到表中,写出加载数据的语句(3分)

数据文件名称分别与表名称对应,(字段分隔符为$$),注意,linux系统和hive默认不支持中文,要自己设置成utf-8编码才可以支持中文。
1) 导入第2步 创建表中的语句截图;

2)执行 select * from table_name 并截图(其中table_name 为前面创建的表名)

4、使用所建的表,按照省市分组,统计 有效订单(subOrder=1)中的 订单总金额(sum),已支付的订单总金额(订单状态state =5、6、7 这三类的paymoney汇总),订单个数(count)(6分)。 输出的字段 包含


1)sql语句截图:

2)sql语句结果截图:

5、使用所建的表统计每个省订单数最多的3个市(6分)。 输出的字段 包含 省份名称,城市名称,订单个数

1)sql语句截图:

2)sql语句结果截图:

2021年安徽省大数据与人工智能应用竞赛本科组(省赛)相关推荐

  1. 2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-高职组赛题第三部分可视化

    第三部分:可视化(30分) 这是一份用户消费行为数据,用来分析用户消费情况及品牌情况,可视化消费变化趋势. 数据中中文字符为UTF-8编码,字段分隔符为 @@ 列名 说明 montha 购买月份 us ...

  2. 2021年安徽省大数据与人工智能应用竞赛人工智能(网络赛)-本科组赛题

    第一部分:人工智能基础环境搭建部署(15分) 注:任务1与任务2任选一题完成即可. o 任务1:Anaconda 3.scikit-learn.OpenCV 3.X.PyTorch 1.8.X.tor ...

  3. 2021年安徽省大数据与人工智能应用竞赛 大数据-本科组赛题(省赛)

    第四部分:可视化(15分) 这是一份App用户消费行为数据,用来分析用户消费情况及品牌情况,可视化消费变化趋势. 1. 进行客户消费行为分析(按年龄段)(5分) 按照客户年龄段(age_group)分 ...

  4. 2021年安徽省大数据与人工智能竞赛人工智能网络赛赛2和3题

    第二题:(与现场赛一样) 按照要求对给定csv格式数据进行处理. task2.csv文件为本题的数据文件.利用Python编写代码完成以下任务: (1)分别求取Max TemperatureF和Min ...

  5. 2021年安徽省大数据与人工智能竞赛人工智能现场赛2和3题

    第二题: 按照要求对给定txt格式数据进行处理. task2.txt文件为本题的数据文件,第一行为特征的名称,从第二行开始为对应的特征数值(特征之间以空格隔开).利用Python编写代码完成以下任务: ...

  6. 安徽省大数据与人工智能竞赛经验分享-3【从赛题中分析比赛需要的技能】

    写在前面 本模块内容为我们团队一位优秀的童鞋总结的,分享给各位参加比赛的同学们,如果有感兴趣的同学或者友友,可以微信搜索BI and BME理解更多内容. 比赛中需要哪些技能,"大数据&qu ...

  7. 2019年安徽省大数据与人工智能应用赛总结---本科组

    前言 2019年安徽省大数据与人工智能决赛于10月13日在安徽省职业经济管理学院举办.现场赛共计90支队伍,经过4个小时的激烈追逐,我们组获得了22名的不错成绩,荣获省级二等奖 .严格意义上说,这是我 ...

  8. 2019 年全国职业院校技能大赛GZ-2019032 大数据技术与应用(高职组)赛题库

    2019 年全国职业院校技能大赛GZ-2019032 大数据技术与应用(高职组)赛题库 目录 任务一:Hadoop 平台及组件的部署管理 一. Hadoop 全分布部署 二. Hadoop 伪分布部署 ...

  9. 安徽省大数据与人工智能竞赛经验分享-1【以2020竞赛规程为例】

    写在前面 本模块内容为我们团队一位优秀的童鞋总结的,分享给各位参加比赛的同学们,如果有感兴趣的同学或者友友,可以微信搜索BI and BME理解更多内容. 一.竞赛内容         1.竞赛分组 ...

最新文章

  1. Xpath语法-爬虫(一)
  2. 基于RYU应用开发之负载均衡(源码开放)
  3. IDEA打包成可执行的JAR包
  4. 新项目新工作空间新仓库新setting文件
  5. oracle java写目录权限_oracle分配权限 学习笔记--转载
  6. 32 FI配置-财务会计-应收账款和应付账款-定义客户预付款的统驭科目
  7. 基于Node.js + WebSocket 的简易聊天室
  8. 解决IDEA报Unmapped Spring configuration files found.Please configure Spring facet
  9. 英语四级备考~自我总结
  10. “三门问题”的理解和Python验证
  11. java植物大战僵尸_JAVA课程设计——植物大战僵尸(团队)
  12. 最大流 edmonds carp
  13. 知乎APP 产品分析
  14. Linux CentOS7.0 使用root登录桌面
  15. Cocos2d-JS中ctor和Cocos2d-x中init的作用
  16. 三极管类型及工作状态判断
  17. c语言如何比较字符串的大小
  18. 二、Qt定时器与文本编辑器制作《QT 入门到实战》
  19. 手动刷入recovery的方法
  20. 华为模拟器ensp安装

热门文章

  1. 旷视2020图像算法工程师机考题(15道选择题)
  2. 计算机主机声音怎么办,电脑机箱声音大怎么办?电脑机箱声音大解决方法
  3. win7计算机不能设置双屏怎么回事,win7怎么设置双屏显示?Win7双屏显示设置的方法...
  4. android课程设计健身,健身软件课程设计_毕业论文设计.doc
  5. -webkit-border-radius和-moz-border-radius分析
  6. 模拟电路仿真LTspice(3):三极管共发射极放大电路
  7. kafka connector使用(Docker一键启动版)
  8. 微信小程序被投诉怎么办?小妙招教给你
  9. springboot+Rabit实战三:(springboot+rabbit 项目搭建)
  10. c 执行oracle 函数,Oracle 下医嘱执行函数