淘宝双11数据分析与预测

一、 案例简介
Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

二、 案例目的

  1. 熟悉Linux系统、MySQL、Hadoop、Hive、Sqoop、Spark等系统和软件的安装和使用;
  2. 了解大数据处理的基本流程;
  3. 熟悉数据预处理方法;
  4. 熟悉在不同类型数据库之间进行数据相互导入导出;
  5. 熟悉使用JSP语言搭建动态Web工程;
  6. 熟悉使用Spark MLlib进行简单的分类操作。

三、 实验环境准备

所需知识储备 Windows操作系统、Linux操作系统、大数据处理架构Hadoop的关键技术及其基本原理、列族数据库HBase概念及其原理、数据仓库概念与原理、关系型数据库概念与原理
训练技能 双操作系统安装、虚拟机安装、Linux基本操作、Hadoop安装、HBase安装、Sqoop安装、Eclipse安装
任务清单 1. 安装Linux系统;2.

淘宝双11数据分析与预测相关推荐

  1. 淘宝双11数据分析与预测课程案例—步骤四:利用Spark预测回头客行为代码报错

    在练习林子雨老师的"淘宝双11数据分析与预测课程案例-步骤四:利用Spark预测回头客行为"章节时出现了代码报错. 具体在执行"val model = SVMWithSG ...

  2. Spark大数据-基于Hive和Spark的淘宝双11数据分析与预测

    基于Hive和Spark的淘宝双11数据分析与预测 1.系统和环境要求(版本仅供参考): Linux: centos7 MySQL: 5.7.16 Hadoop: 2.7.1 Hive: 1.2.1 ...

  3. 大数据-11-案例演习-淘宝双11数据分析与预测

    主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数 ...

  4. 淘宝双11数据分析与预测汇总

    国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助. 淘宝双11数据分析与预测实验链接:http:/ ...

  5. Cloud Computing(8)_实例实现_淘宝双11数据分析与预测

    在本文中,主要实现了一个云计算相关实例:淘宝双11数据分析与预测 数据来源为: http://dblab.xmu.edu.cn/ 由于本文内容为课上本人和同学所做的一次presentation,故将仅 ...

  6. 淘宝双11数据分析与预测--“坑点”汇总

    国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助. 淘宝双11数据分析与预测实验连接:点击这里 问 ...

  7. 【大数据基础】淘宝双11数据分析与预测

    https://dblab.xmu.edu.cn/post/8116/ 问题 问题1 mysql登录需要密码 https://cloud.tencent.com/developer/beta/arti ...

  8. 淘宝双11数据分析与预测课程案例:实验环境搭配

    1 软件安装清单 安装Hadoop 安装MySQL 安装Hive 安装Sqoop 安装Eclipse 安装ECharts 2 hadoop安装 hadoop在centos的伪分布式安装 3 MySql ...

  9. 淘宝双11大数据分析(数据准备篇)

    文章目录 前言 数据内容分析 `user_log.csv`文件内容含义 `train.csv` 和 `test.csv` 文件内容含义 数据上传到Linux系统并解压 数据集的预处理 文件信息截取 导 ...

最新文章

  1. qq音乐 android pad版,QQ音乐HD(com.tencent.qqmusicpad) - 4.12.1.4 - 应用 - 酷安
  2. 【Codeforces Round #507 (Div. 2, based on Olympiad of Metropolises) A】Palindrome Dance
  3. 7系统启动到一半停止_太突然!国际饮料巨头计划狂砍一半品牌,这些饮料就快喝不到了…...
  4. 使用结构体的形式使一个函数返回多个数据
  5. 【网址收藏】IDEA社区版(Community)和付费版(UItimate)的区别
  6. php中if的效率,PHP中if和or运行效率对比
  7. codevs 5966 [SDOI2017]硬币游戏
  8. (26)VHDL实现或(数据流描述)
  9. Linux内核网络协议栈4-创建socket(2)
  10. php zip 不能创建文件,PHP无法访问新创建的zip文件
  11. global.asax、global.asax.compiled、PrecompiledApp.config三者关系
  12. 《Java编程思想》读后感
  13. syswow64删除文件_什么是SysWow64文件夹 SysWow64文件夹可以删除吗
  14. 偏最小二乘回归(PLSR)和主成分回归(PCR)
  15. 哈希(Hash)算法
  16. VB里的 dim是什么意思?
  17. c++工作宝贵经验呀,我去。。。。
  18. [Vue warn]: Property or method “throttle“ is not defined on the instance but referenced during rende
  19. 原来都是crontab惹的祸,服务器系统差点重置了/呜呜呜
  20. 抖音自定义卡片链接(图文链接)

热门文章

  1. 数据分析——matplotlib
  2. 用python给老师排课表_怎样排出每位老师都满意的课表?附答案!
  3. net::ERR_NAME_NOT_RESOLVED
  4. pdf怎么合并在一起?轻松合并pdf的几个方法
  5. 青岛各饭店餐馆订餐电话大全
  6. 《UML用户指南(第2版.修订版)》—第1章1.1节建模的重要性
  7. 人工智能能否超过人类智能
  8. API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
  9. 2021-10-07每日刷题打卡
  10. 计算机网络b站里谁讲得好,除了罗翔,B站还有多少神仙老师?