淘宝双11数据分析与预测
淘宝双11数据分析与预测
一、 案例简介
Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。
二、 案例目的
- 熟悉Linux系统、MySQL、Hadoop、Hive、Sqoop、Spark等系统和软件的安装和使用;
- 了解大数据处理的基本流程;
- 熟悉数据预处理方法;
- 熟悉在不同类型数据库之间进行数据相互导入导出;
- 熟悉使用JSP语言搭建动态Web工程;
- 熟悉使用Spark MLlib进行简单的分类操作。
三、 实验环境准备
所需知识储备 | Windows操作系统、Linux操作系统、大数据处理架构Hadoop的关键技术及其基本原理、列族数据库HBase概念及其原理、数据仓库概念与原理、关系型数据库概念与原理 |
---|---|
训练技能 | 双操作系统安装、虚拟机安装、Linux基本操作、Hadoop安装、HBase安装、Sqoop安装、Eclipse安装 |
任务清单 | 1. 安装Linux系统;2. |
淘宝双11数据分析与预测相关推荐
- 淘宝双11数据分析与预测课程案例—步骤四:利用Spark预测回头客行为代码报错
在练习林子雨老师的"淘宝双11数据分析与预测课程案例-步骤四:利用Spark预测回头客行为"章节时出现了代码报错. 具体在执行"val model = SVMWithSG ...
- Spark大数据-基于Hive和Spark的淘宝双11数据分析与预测
基于Hive和Spark的淘宝双11数据分析与预测 1.系统和环境要求(版本仅供参考): Linux: centos7 MySQL: 5.7.16 Hadoop: 2.7.1 Hive: 1.2.1 ...
- 大数据-11-案例演习-淘宝双11数据分析与预测
主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数 ...
- 淘宝双11数据分析与预测汇总
国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助. 淘宝双11数据分析与预测实验链接:http:/ ...
- Cloud Computing(8)_实例实现_淘宝双11数据分析与预测
在本文中,主要实现了一个云计算相关实例:淘宝双11数据分析与预测 数据来源为: http://dblab.xmu.edu.cn/ 由于本文内容为课上本人和同学所做的一次presentation,故将仅 ...
- 淘宝双11数据分析与预测--“坑点”汇总
国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助. 淘宝双11数据分析与预测实验连接:点击这里 问 ...
- 【大数据基础】淘宝双11数据分析与预测
https://dblab.xmu.edu.cn/post/8116/ 问题 问题1 mysql登录需要密码 https://cloud.tencent.com/developer/beta/arti ...
- 淘宝双11数据分析与预测课程案例:实验环境搭配
1 软件安装清单 安装Hadoop 安装MySQL 安装Hive 安装Sqoop 安装Eclipse 安装ECharts 2 hadoop安装 hadoop在centos的伪分布式安装 3 MySql ...
- 淘宝双11大数据分析(数据准备篇)
文章目录 前言 数据内容分析 `user_log.csv`文件内容含义 `train.csv` 和 `test.csv` 文件内容含义 数据上传到Linux系统并解压 数据集的预处理 文件信息截取 导 ...
最新文章
- qq音乐 android pad版,QQ音乐HD(com.tencent.qqmusicpad) - 4.12.1.4 - 应用 - 酷安
- 【Codeforces Round #507 (Div. 2, based on Olympiad of Metropolises) A】Palindrome Dance
- 7系统启动到一半停止_太突然!国际饮料巨头计划狂砍一半品牌,这些饮料就快喝不到了…...
- 使用结构体的形式使一个函数返回多个数据
- 【网址收藏】IDEA社区版(Community)和付费版(UItimate)的区别
- php中if的效率,PHP中if和or运行效率对比
- codevs 5966 [SDOI2017]硬币游戏
- (26)VHDL实现或(数据流描述)
- Linux内核网络协议栈4-创建socket(2)
- php zip 不能创建文件,PHP无法访问新创建的zip文件
- global.asax、global.asax.compiled、PrecompiledApp.config三者关系
- 《Java编程思想》读后感
- syswow64删除文件_什么是SysWow64文件夹 SysWow64文件夹可以删除吗
- 偏最小二乘回归(PLSR)和主成分回归(PCR)
- 哈希(Hash)算法
- VB里的 dim是什么意思?
- c++工作宝贵经验呀,我去。。。。
- [Vue warn]: Property or method “throttle“ is not defined on the instance but referenced during rende
- 原来都是crontab惹的祸,服务器系统差点重置了/呜呜呜
- 抖音自定义卡片链接(图文链接)
热门文章
- 数据分析——matplotlib
- 用python给老师排课表_怎样排出每位老师都满意的课表?附答案!
- net::ERR_NAME_NOT_RESOLVED
- pdf怎么合并在一起?轻松合并pdf的几个方法
- 青岛各饭店餐馆订餐电话大全
- 《UML用户指南(第2版.修订版)》—第1章1.1节建模的重要性
- 人工智能能否超过人类智能
- API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
- 2021-10-07每日刷题打卡
- 计算机网络b站里谁讲得好,除了罗翔,B站还有多少神仙老师?