大数据技术与应用展现出锐不可当的强大生命力,科学界与企业界寄予无比的厚望。大数据成为继20世纪末21世纪初互联网蓬勃发展以来的又一轮IT工业革命

编辑 | abby

官网 | www.datayuan.cn

微信公众号ID | datayuancn

大数据技术与应用展现出锐不可当的强大生命力,科学界与企业界寄予无比的厚望。大数据成为继20世纪末21世纪初互联网蓬勃发展以来的又一轮IT工业革命。

大数据技术是指从数据采集、清洗、集成、挖掘、分析与结果解释,进而从各种类型的巨量数据中快速获得有价值信息的全部技术。从数据挖掘和分析中,人们可以获取具有重要价值的信息。大数据技术的精髓是从大数据中产生新见解的能力、识别复杂关系和做出越来越精准的预测、从大数据中产生动力、获取知识和采取行动的能力。

大数据技术是现代科学与技术发展,尤其是计算机科学技术发展的重要成果和结晶,是科学发展史的又一新的里程碑。大数据的出现对计算机科学技术的许多领域提出了挑战与冲击,推动了IT技术的发展。

而今天,小编就要为大家推荐一本关于大数据技术的入门读物——《大数据核心技术与实用算法》。



从内容方面,该书共分为12个章节:

第一章:大数据技术概述,主要包括大数据技术框架、特征、大数据的冲击、大数据研究方法论、常用的大数据计算框架。

第二章:大数据获取与存储,主要包括数据获取的定义与数据获取领域、NewSQL和NoSQL、分布式文件系统、虚拟存储技术、云存储技术、分布式存储核心算法、数据仓库与数据集市、区块链技术等。

第三章:大数据抽取技术,主要包括数据抽取技术概述、增量数据抽取技术、非结构化数据抽取、Web数据抽取。

第四章:大数据清洗技术,主要包括数据质量与数据清洗、不完整数据清洗方法、异常数据清洗方法、重复数据清洗方法、文本清洗和数据清洗技术的实现。

第五章:大数据转换与约简,主要包括数据平滑、数据规范化、数据泛化、数据约简、数据压缩、数值约简、数值数据离散化与概念分层。

第六章:大数据集成技术,主要包括数据集成技术概述,数据迁移、数据集成模式、数据集成系统、数据集成系统的构建、数据聚类集成、实时数据集成、企业信息集成。

第七章:大数据分析技术,主要包括大数据分析定义与方法、数据分析的基本方法、高级数据分析、预测分析、大数据预测分析的应用趋势。

第八章:数据挖掘,主要包括数据挖掘理论基础、关联规则挖掘、分类、聚类方法、序列模式挖掘、Web挖掘技术、空间数据挖掘、非结构化文本数据挖掘。

第九章:大数据分析结果解释,主要包括数据分析结果的解释、数据的基本展现形式、大数据可视化、大数据可视分析。

第十章:大数据离线计算技术,主要包括数据离线计算概述、MapReduce的体系结构、Hadoop分布式计算平台、MapReduce程序设计实例。

第十一章:大数据流式计算技术。

第十二章:大数据交互式处理技术,主要包括交互式处理系统的问题、数据切分、数据钻取、Scala编程语言简介、交互式大数据处理框架Spark、交互式查询。

推荐阅读:


【每周一本书】之《人之彼岸》:郝景芳带你提前踏入人机交互的未知世界

【每周一本书】之《数据素养:数据使用指南》:如何将数据信息转变为迷人的故事?

【每周一本书】之《图解机器学习》:187张图解轻松入门

【每周一本书】之《大数据智能——互联网时代的机器学习和自然语言处理技术》

每周一本书之《大数据日知录:架构与算法》

本书由 数据猿联合北京师范大学出版社 共同推荐

【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社、中国人民大学出版社、中信出版社、上海交通大学出版社。

欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:wmh4178,备注“书”


【每周一本书】之《大数据核心技术与实用算法》相关推荐

  1. 关于大数据技术的演讲_大数据核心技术介绍:大数据处理技术

    大数据之所以能够从概念走向落地,说到底还是因为大数据处理技术的成熟,面对海量的数据,在有限的硬件条件下,以低成本满足大数据处理的各种实际需求.那么具体处理大数据需要哪些技术,今天我们来简单介绍一下大数 ...

  2. 大数据核心技术与应用实战峰会(上):大数据在多行业内大放异彩

    5月13日-15日,由全球最大中文IT社区CSDN主办的"2016中国云计算技术大会"(Cloud Computing Technology Conference 2016,简称C ...

  3. MySQL优化:批量插入大数据4种实用、讲究方案的测试

         简明:本文记录个人使用MySQL插入大数据总结较实用的方案,通过对常用插入大数据的4种方式进行测试,即for循环单条.拼接SQL.批量插入saveBatch().循环 + 开启批处理模式,得 ...

  4. 大数据核心技术与应用论坛落幕 各路大伽云集畅谈产业

    5月18日-20日,第八届云计算大会在万众期待下拉开序幕,本次会议以"技术融合 应用创新"为主题,来自全球的政府领导.行业专家.企业代表及行业主流媒体齐聚一堂,为现场听众呈上一场全 ...

  5. 大数据核心技术与应用实战峰会(下):六专家带你探秘各企业内的大数据实践...

    5月13日-15日,由全球最大中文IT社区CSDN主办的"2016中国云计算技术大会"(Cloud Computing Technology Conference 2016,简称C ...

  6. 字王:大数据与黑天鹅算法2.0

    字王:大数据与黑天鹅算法2.0 wiki百科:"黑天鹅"隐喻那些意外事件:它们极为罕见,在通常的预期之外. 如果一种理论.模型和算法,能够在一年内,捕获一只黑天鹅,无疑是成功的.科 ...

  7. 大数据相关技术和算法

    大数据的关键技术: 大数据的关键技术分为分析技术和处理技术,可用于大数据分析的关键技术主要包括A/B测试,关联规则挖掘,数据挖掘,集成学习,遗传算法,机器学习,自然语言处理,模式识别,预测模型,信号处 ...

  8. 大数据的几大经典算法

    大数据的几大经典算法 一. CART: 分类与回归树 CART, Classification and Regression Trees.在分类树下面有两个关键的思想:第一个 是关于递归地划分自变量空 ...

  9. 大数据算法_大数据时代,机器学习算法该如何升级?

    文 /杨晓宁 随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量.复杂多样.变化快的特性,对于大数据环境下的应用问题,传统的小数据上的机器学习算法很多已不再适用.因此,研究大 ...

  10. 大数据核心技术是什么

    大数据的核心层:数据采集层.数据存储与分析层.数据共享层.数据应用层,可能叫法有所不同本质上的角色都大同小异. 大数据的核心技术都包括什么? 1.数据采集 数据采集的任务就是把数据从各种数据源中采集和 ...

最新文章

  1. java中的@Override是否需要
  2. 以python入门教程新世界-Python打开新世界的大门-入门篇1
  3. [转载]AIX 上 Lotus Domino 的内存使用
  4. 1123 Is It a Complete AVL Tree (30 分)【难度: 难 / 平衡树 未完成】
  5. 计算机的组成_计算机网络的组成和分类
  6. Transformer新内核Synthesizer:低复杂度的attention代替点乘式的注意力机制
  7. Hiberbate中的一对多关联查询
  8. 语音识别开放化开发平台有哪些?
  9. java调用自身_Java有趣的自己调用自己
  10. 修改Docker镜像的默认存储位置
  11. System.Diagnostics.Process的常见用法
  12. 技巧|在 Mac 上拷贝(复制)、粘贴的方法
  13. 计算机c语言报告册,计算机c语言实验报告.docx
  14. 免费从网盘下载的卫星影像和高程DEM如何使用?
  15. c语言定义函数return,在C语言的函数定义中,如果不需要返回结果,就可以省略return语句。...
  16. 蓝桥杯练习1:等差素数列
  17. 【luogu CF633H】Fibonacci-ish II(莫队)(线段树)(矩阵乘法)
  18. Uptime-Kuma 一个花哨的开源监控工具
  19. f文件服务器,f文件服务器
  20. 嘉曼服饰上市破发,大跌16%:公司市值37亿 刘溦家族色彩浓厚

热门文章

  1. dp-cf-F-风王之瞳
  2. 重装系统win7 win7系统怎么重装 win7系统重装教程
  3. 大数据分析常用的工具有哪些(一)
  4. stm32寄存器版学习笔记06 输入捕获(ETR脉冲计数)
  5. edge浏览器使用IE模式进行调试
  6. 深交所股票交易接口的概述
  7. 在某网课学习前端笔记整理js篇24-js正则表达式
  8. 风行python_Python曾是程序员的“瑞士军刀”,而如今正被慢慢取代
  9. Pegasus Serial Port Tool @ Simplicity Version 串口测试工具简化版发布
  10. lua的坑(持续更新,每日更新两篇,9/15),更新到17个