随着时代的发展,小说已经成为了许许多多的人减压放松的目的,一部小说能够被人看到需要经过许许多多的代码和程序的编辑,从小说的存储、热度、排行、分类再到搜索,基于用户以往看过的小说进行的推荐,以及作者更新章节后的实时更新,小说后台对于每本书的热度、喜好程度进行权重的更新,这些都是在小说背后实实在在需要解决的问题。

本次课程就是针对百万小说数据的推荐、热度、内容等进行搜索、推荐、分析的项目.让大家在真实数据的实战中真真正正的掌握大数据存储、搜索及推荐等内容。

1.课程研发环境

项目源代码以JAVA为基准,结合各个大数据框架,结合真实数据,展现一个完整的小说网站。

开发工具:IDEA

框架:Spark2.4.0、Elasticsearch6.7.0、Hbase1.2.0-cdh5.7.0、Hadoop1.2.0-cdh5.7.0,Zookeeper1.2.0-cdh5.7.0、Kibana6.7.0

其他工具:Mysql、Spring boot

2.内容简介

现在的网站小说越来越多,数据也越来越大,超大数据量的存储和精确且复杂的搜索、推荐等对网站提出了更高的需求,本次项目就是基于百万真实的小说数据,来为大家展示在大数据的背景下,小说的存储、搜索及推荐该如何进行的内容。

JOJO老师:

多年任职一线互联网企业大数据开发,丰富的生产项目经验,专注于离线和实时数据处理,精通spark、kafka、flink、elasticsearch等大数据处理框架

单品课程:http://www.ibeifeng.com/goods-922.html

一、小说网站架构讲解

1.本项目的背景及目标

2.项目的架构设计

3.项目的架构选型

4.组件的安装

二、千万小说数据索引及存储

1.网站数据详解

2.mysql数据迁移到es

3.logstash配置编写

4.logstash数据迁移

5.小说存储及rowkey设计

6.小说导入javaBean类编写

7.小说数据迁移mr编写

8.数据导入rowkey代码编写

9.mr driver部分编写

10.数据迁移至hbase

三、网站复杂搜索功能实现

1.网站原始代码简介

2.网站搜索功能实现

3.网站添加搜索功能

4.搜索页面结果查看

5.小说搜索分词讲解

6.mapping分词器的添加分词功能

7.代码添加IK分词器

8.小说网站高亮搜索实现

9.拼音搜索功能实现

10.拼音搜索代码修改

11.从es获取小说详情页

12.收藏自增功能实现

13.es的乐观锁

14.小说章节数据迁移

15.小说章节查询功能实现

16.章节详情页搜索

17.网站最近更新小说功能实现

18.网站作品分类聚合展示功能

19.小说月周日热度榜

20.连载、完结top榜单

21.top10作家榜

22.新增作品功能实现

四、小说网站推荐引擎

1.推荐系统概述

2.推荐算法介绍

3.基于内容的推荐

4.基于协同过滤的推荐

5.基于关联规则的推荐

五、网站分析相关

1.小说网站用户数据分析

2.es集群规划讲解

3.es集群监控

4.Hbase监控

5.项目总结

目标一. 了解小说后台数据处理框架

目标二. 了解Elasticsearch在网站搜索中的作用

目标三. 了解数据在各个框架间的迁移

目标四. 了解网站推荐系统的基本设计

目标五. 对spark推荐系统有基本的认识

目标六. 通过网站的代码详细的了解构建一个网站后台的过程

1.课程针对人群

本课程针对具有一定的JAVA和大数据基础,想通过本项目的学习,了解使用Elasticsearch进行搜索实战、Logstash进行数据迁移、spark机器学习、spring boot进行网站后端开发的大数据开发工程师岗位的学员。

2.我该怎么学,如何才能学好这门课程,给些建议。

2.1、时间上的安排建议

本课程共31课时,如果您时间上充分,建议以每天4-5讲的进度往前学习。

2.2、学习要求

如果您没有基础,建议还是中规中矩的按照课程进度一点一点仔细观看学习,并一定要把看完的视频中的代码自己手敲一遍,以加深理解和记忆

如果您有基础,可不必按步就搬进行,可以拿你感兴趣的部分去学习,但一定要注意实践,并学会举一反三

2.3、讲师建议

1. 最好看完视频之后,抛开视频,独立自己去把上课中的示例写一遍,看自己是否理解,如果不正确,可以回过头看再看下视频,如果反复,达到真正理解和熟练掌握的目的。

2. 对于项目实战部分,一定要自己亲自动手做一遍,不要满足听完就OK了

3. 建议一边听视频,一边拿个纸和笔,做一些记录和笔记,这是一种非常好的学习习惯。

4. 一定不要过于依赖视频,要学会看API和使用百度,学会思考,学会举一反三

5. 最后祝您学有所成

课程是属于某个特定的专业技术,掌握该技术后,你可以从事以下职位的相关工作

大数据开发工程师

Elasticsearch开发工程师

wcom少彐x片_大数据实战之千万量级小说网站项目开发(存储、复杂搜索、推荐、分析)...相关推荐

  1. 大数据实战之用户画像概念、项目概述及环境搭建

    下面跟着我一起来学习大数据获取用户画像: 项目Profile课程安排 : 用户画像概念 1.用户画像概述 1.1.产生背景 早期的用户画像起源于交互设计之父Alan Cooper提出的"Pe ...

  2. 云计算和python学哪个_大数据、云计算该如何学习?

    大数据之Linux+大数据开发篇 阶段一.大数据.云计算 - Hadoop大数据开发技术 课程一.大数据运维之Linux基础 本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习H ...

  3. url采集工具_大数据关键技术浅谈之大数据采集

    在前几篇文章中,企通查为大家介绍了大数据处理的基本流程.从大数据的一系列处理过程中(抽取.集成.分析.解释),我们可以发现这一整套流程中涵盖了数据存储.处理.应用等多方面的技术. 大数据价值的完美体现 ...

  4. Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户

    深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:14:39 作者:陈飚 "昔我十年前,与君始相识." 一瞬间Hadoop也到了要 ...

  5. 数据的四大特征_大数据

    数据的四大特征_大数据 我们总是在谈数据分析,数据分析什么的,那我们现在先不谈数据分析,我们先来谈谈数据分析的基础--数据.那么到底什么是数据,数据有什么特征呢?这个问题虽基础却重要. 这里我们所说的 ...

  6. 大数据分析师高级证书_数据分析师资格证书好考吗_大数据分析师认证

    数据分析师资格证书好考吗_大数据分析师认证 为了适应大数据时代的要求,数据分析这一工作需要更加正规化.专业化以及职业化,因此,数据分析师应运而生,成了较多人争相报考的科目.那么 一方面,据小编了解,数 ...

  7. 大数据介绍项目流程_大数据介绍

    大数据介绍项目流程 About Big Data 关于大数据 什么是大数据?(What is Big Data?) In modern world, there are many big proble ...

  8. 诸葛io的技术架构图_大数据平台的技术演化之路 诸葛io平台设计实例

    作者简介:本文来自诸葛io创始人孔淼的技术分享.诸葛io是业内领先的智能数据决策平台,也是国内早期的数据分析践行者.本文将从诸葛io平台设计实例,分享大数据平台的技术演化之路. 如今,数据分析能力正逐 ...

  9. 大数据可视化陈为智慧树_智慧树知到_大数据可视化_答案章节单元测试答案

    智慧树知到_大数据可视化_答案章节单元测试答案 更多相关问题 (1)33+(-23)2-48-12×6:(2)当a=2时,计算21-a-a1+a的值. 计算(1-11-a)(1a2-1)的结果正确的是 ...

最新文章

  1. 华人小哥开发“黑话”数据集,AI:你连dbq都不知道,xswl!| NAACL 2021
  2. spring注解@Component、@Repository、@Service、@Controller
  3. vbs劫持快捷键并执行程序
  4. mysql8.0.15远程登陆权限,MySQL8.0给root用户赋予远程连接权限
  5. python画图表的库_「Python」python绘制图表
  6. AndroidStudio取消撤销、AS取消撤销;Ctrl+Shift+Z;
  7. [存档]CxServer的项目周期管理
  8. 22岁大学生获谷歌天价offer,击败6000人年薪百万
  9. 15个问题告诉你如何使用Java泛型
  10. struts2+hibernate3.3+spring3.0 实现零配置
  11. python struct pack string_python struct pack fmt格式
  12. 离散数学视频、书籍推荐及学习体会
  13. H3CIE(WLAN)学习笔记(1)——电磁场基础
  14. python爬取b站_python3 爬取B站视频弹幕
  15. 用ssms建sql server数据库和python连接到数据库
  16. [37期]二三事。老师说标题长才霸气。长长长…
  17. 条码打印机无法正常打印该如何解决
  18. Re:从零开始的鸿蒙开发教程
  19. 如何快速搭建一个像“天猫精灵”的智能语音助手?
  20. 07【需求评审】 UED

热门文章

  1. 一个netdisk storage backend app webos和增强的全功能网站云设想
  2. “IND-”安全概念的简单解释(IND-CPA,IND-CCA等)
  3. db2 v11安装
  4. 操作系统面试——虚拟内存
  5. iOS-TZImagePickerController获取相册照片、视频 (Swift代码)
  6. iOS15使用带Header的tableview 顶部出现空白问题
  7. 365赚钱宝养猫小程序程序源码下载
  8. 词向量之TF-IDF模型详解
  9. 河南城建学院matlab报告,河南城建学院MATLAB上机实验答案
  10. Linux的tty架构及UART驱动详解