关于举办大数据建模、分析、挖掘技术应用直播课程研修班

各企事业单位:

随着2015年9月国务院发布了《关于印发促进大数据发展行动纲要的通知》,各类型数据呈现出了指数级增长,数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级,企业有了能够轻松访问和分析数据以提高性能的新机会,如何从数据中获取价值显得尤为重要,也是大数据相关技术急需要解决的问题。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助确保正确的数据正确使用正确的方法获得正确的结果。

为响应科研及工作人员需求,根据国务院《国家中长期人才发展规划纲要(2010-2020年)》和人社部《专业技术人才知识更新工程实施方案(2010-2020年)》中国管理科学研究院职业资格认证培训中心(http://www.cnzgrz.org.cn)特举办“大数据建模、分析、挖掘技术应用高级研修班”。本次培训采用实战培训模式。

本次培训由北京龙腾亚太教育咨询有限公司承办,北京新鼎聚成文化传媒有限公司协办。具体通知如下:

一、时间安排: 2020年07月31日 — 2020年08月04日

(31日发直播平台登录须知、课件、代码、虚拟机,1日-4日上课)

二、培训目标

1.掌握大数据建模分析与使用方法。

2.掌握大数据平台技术架构。

3.掌握国内外主流的大数据分析与BI商业智能分析解决方案。

4.掌握大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用。

5.掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用。

6.掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布式系统平台应用,以及商业和开源的数据分析产品加上Hadoop平台形成大数据分析平台的应用剖析。

7.掌握常见的机器学习算法

三、授课专家

来自中国科学院计算技术研究所、清华大学、北京理工大学等科研机构和大学的高级专家,拥有丰富的科研及工程技术经验,长期从事机器学习、数据挖掘、大数据分析等领域的教学与研究工作。

四、参会对象:

各省市、自治区从事大数据分析、数据挖掘、数据处理、数据建模等领域相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关人员,以及大数据研究广大爱好者。

五、费用标准:

每人5680元(含报名费、培训费、资料费、32机时GPU训练费、证书费)

六、颁发证书:

参加相关培训并通过考核的学员,由中国管理科学研究院职业资格认证培训中心颁发《大数据开发与应用工程师》(高级)专业能力认证证书,可通过官方网站查询,该证书可作为有关单位专业技术人员能力评价、考核和任职的重要依据。

注:请学员将两寸彩照大于100K、身份证扫描件和学历证明扫描件,随报名回执表一起发送至报名邮箱,办理证书使用。

七、注意事项

1.参加培训学员需填写报名回执表发送到2044115758@qq.com;

2.收到报名回执表后会务组会第一时间去电话核实报名信息;

3.学员需自备电脑WIN10电脑64位系统,16G及以上内存,硬盘空间预留100G。

八、具体课程安排

第一天、上午9:00-12:00,课间休息20分钟
下午13:30-17:00,课间休息20分钟

一、大数据概述

1.大数据及特点分析

2.大数据关健技术

3.大数据计算模式

4.大数据应用实例

二、大数据处理架构Hadoop

1.Hadoop项目结构

2.Hadoop安装与使用

3.Hadoop集群的部署与使用

4.Hadoop 代表性组件

1.Hadoop Single Node Cluster

  1. Hadoop Multi Node Cluster

三、分布式文件系统HDFS

1.HDFS体系结构

2.HDFS存储

3.HDFS数据读写过程

1.创建与查看HDFS目录

2.从本地计算复制文件到HDFS

3.将HDFS文件复制到本地计算机

4.复制与删除HDFS文件

5.Hadoop HDFS Web浏览HDFS

四、分布式数据库HBase

1.HBase访问接口

2.HBase数据类型

3.HBase实现原理

4.HBase运行机制

5.HBase应用

第二天、上午9:00-12:00,课间休息20分钟
下午13:30-17:00,课间休息20分钟

五、MapReduce

1.MapReduce体系结构

2.MapReduce工作流程

3.资源管理调度框架YARN

4.MapReduce应用

六、Spark

1.Spark生态与运行架构

2.Spark SQL

3.Spark部署与应用方式

1.Python Spark 安装

2.本地运行pyspark程序

3.在Hadoop YARN 运行pyspark

4.Spark Web UI

七、IPython Notebook运行Python Spark程序

1.Anaconda

2.IPython Notebook使用Spark

3.使用IPython Notebook在Hadoop YARN模式运行

1.在不同模式运行IPython Notebook运行Python Spark命令

2.Python 程序开发

八、Python Spark集成开发环境

1.Python Spark集成开发环境部署配置

2.Spark数据分析库MLlib的开发部署

Spark MLlib应用程序示例

第三天、上午9:00-12:00,课间休息20分钟
下午13:30-17:00,课间休息20分钟

九、Python Spark决策树二分类与多分类

1.决策树原理

2.大数据问题

3.决策树二分类

4.决策树多分类

1.搜集数据

2.数据准备:导入并转换数据、提取特征字段、提取标签

  1. Python Spark建模,训练模型

4.预测数据

5.评估数据,给出评价指标并得到评估结果

十、Python Spark支持向量机

1.支持向量机SVM 原理与算法

2.Python Spark SVM程序设计

1.数据准备

2.建立SVM模型,训练模型

3.评估参数并找出最优参数

4.根据模型进行预测

十一、Python Spark 贝叶斯模型

1.朴素贝叶斯模型原理

2.Python Spark贝叶斯模型程序设计

1.建模贝叶斯模型,并进行对参数估计

2.训练模型,得到最优参数

3.根据模型进行预测

十二、Python Spark逻辑回归

1.逻辑回归原理

2.Python Spark逻辑回归程序设计

1.Python Spark逻辑回归建模

2.根据模型进行分类

第四天、上午9:00-12:00,课间休息20分钟
下午13:30-17:00,课间休息20分钟

十三、Python Spark回归分析

1.大数据分析

2.数据集介绍

3.Python Spark回归程序设计

1.数据准备

2.训练回归模型

3.建立评估指标

4.训练回归模型,并找到最优参数

5.根据模型进行预测

十四、Spark ML Pipeline 机器学习流程分类

1.机器学习流程组件:StringIndexer、OneHotEncoder、VectorAssembler等

2.使用Spark ML Pipeline 机器学习流程分类程序设计

1.数据准备

2.建立机器学习Pipeline流程

3.使用Pipeline流程训练

4.使用PipelineModel预测

5.评估模型准备率

十五、Python Spark 创建推荐引擎

1.推荐算法

2.推荐引擎大数据分析使用场景

3.推荐引擎设计

1.搜索数据

2.准备数据

3.训练模型

4.使用模型进行推荐

十六、项目实践

1.日志分析系统与日志挖掘项目实践

a、Hadoop,Spark,ELK技术构建日志数据仓库

b、互联网微博日志分析系统项目

1.推荐系统项目实践

a、电影数据分析与个性化推荐关联分析项目

希望通过培训解决的问题

问题一:
问题二:

关注微信公众号,了解更多资讯!

联系人:张 杰 手 机:13401149170 微 信:13401149170

电 话:010-81311930 报名邮箱:2044115758@qq.com

关于举办大数据建模、分析、挖掘技术应用直播课程研修班相关推荐

  1. 浅谈大数据建模的主要技术:维度建模

    文章目录 前言 维度建模关键概念 度量和环境 事实和维度 事实表 维度表 星形架构和雪花架构 维度建模一般过程 1. 选取业务过程 2. 定义粒度 3. 确定维度 4. 确定事实 前言 我们不管是基于 ...

  2. 大数据建模、分析、挖掘技术应用研修班的通知

    --- 关于举办 2021年数字信息化培训项目系列 --- 大数据建模.分析.挖掘技术应用研修班的通知 各企事业单位: 随着2015年9月国务院发布了<关于印发促进大数据发展行动纲要的通知> ...

  3. 【无标题】大数据建模、分析、挖掘技术应用

                              2022年数字信息化培训项目系列 各企事业单位: 随着2015年9月国务院发布了<关于印发促进大数据发展行动纲要的通知>,各类型数据呈现 ...

  4. 《大数据建模、分析、挖掘技术》

    2022 年 8 月 5 日 - 2022 年 8 月 9 日 北京(同时转线上直播) (5 日报到,6 日-9 日上课) 掌握大数据建模分析与使用方法. 掌握大数据平台技术架构. 掌握国内外主流的大 ...

  5. 大数据建模、分析、挖掘技术应用的进阶之路

    随着 2015 年 9 月gwy发布了<关于印发促进大数据发展行动纲要的tongzh>,各类型数据呈 现出了指数级增长,数据成了每个组织的命脉.今天所产生的数据比过去几年所产生的数据大好几 ...

  6. 大数据建模、分析、挖掘技术应用

    大数据建模.分析.挖掘技术: 具体安排 时间安排 课程大纲 详细内容 实践训练 第一天 9:00-12:00 14:00-17:00 一.大数据概述 1.大数据及特点分析 2.大数据关健技术 3.大数 ...

  7. 巨龙信息大数据建模与分析技术浅析

    巨龙大数据建模与分析系统是厦门市巨龙信息科技有限公司研发的一款跨数据平台的数据挖掘.分析.建模的工具.面向各行各业在大数据建设过程的应用诉求,致力于构建智能数据体系,打造更便捷.更易用的大数据生产力平 ...

  8. 华为云“企业快成长大数据与微服务技术创新论坛”成功举办

    6月16日,由华为云.msup.厦门火炬大学堂.厦门市行业软件协会联合主办的"企业快成长大数据与微服务技术创新论坛"在厦门成功举办.本次活动汇聚了华为云.珍爱网等知名企业的CTO和 ...

  9. 《大数据》专题征文:大数据可视分析技术与应用

    点击上方蓝字关注我们 <大数据>专题征文:大数据可视分析技术与应用 (截稿时间:2020年12月31日) 随着信息技术的飞速发展,特别是网络的普及,人类产生的数据量呈现爆炸式增长.而可视化 ...

最新文章

  1. 【 MATLAB 】信号处理工具箱之fft简介及案例分析
  2. asp.net 获取 当前日期时间 及 前后N天日期时间(DropDownList数据绑定)
  3. 回溯算法的题目,这样做,秒杀!!
  4. JPA中实现单向一对多的关联关系
  5. rxjs里concatMap operators的用法
  6. Actor模型(分布式编程)
  7. 移动端ios中click点击失效
  8. 以太坊虚拟机 EVM(1)EVMC interpreter
  9. 开发服务器 安装 centos 8 无法进入图形安装界面 X startup failed falling back to text mode
  10. 生成word_用Word生成员工信息表,单独生成独立文件,还能自动命名
  11. 多智能体强化学习(一) IQL、VDN、QMIX、QTRAN算法详解
  12. 笔记本触摸板没有反应了
  13. 2021年职业病防治法宣传周宣传资料
  14. 电脑出现“选择一个选项” 只有关闭和疑难解答
  15. 携手绿凯智能,趣开门人脸识别门禁落地武汉光谷生物城
  16. 【解决方法】ld: warning: directory not found for option
  17. 遍历同辈节点的方法_jquery如何遍历节点
  18. 大数据分析案例-基于决策树算法构建银行客户流失预测模型
  19. 异常记录 之 nested exception is java.lang.NoClassDefFoundError: com/lowagie/text/pdf/PdfContentByte
  20. 艾棣维欣联合INOVIO开展新冠DNA疫苗全球III期临床试验;陆道培医疗与辉瑞达成合作 | 医药健闻...

热门文章

  1. 运算放大器工作原理(杨老师模拟电子学习)
  2. PS 技术篇-使用ps修改图片、照片背景为透明背景实例演示
  3. 公交线路图查询系统c语言,公交路线查询系统(基于数据结构和C语言)完整
  4. python 设置全局代理_Python中使用socks5设置全局代理的方法示例
  5. Permission Denial: starting Intent 解决办法
  6. 浅谈虚拟交换机(vswitch)技术演进
  7. aspnet+C#房屋按揭贷款管理系统
  8. 文件描述符与inode的关系
  9. bonding(绑定与删除)
  10. Android自定义圆角圆形图片