“数据是新时代的石油。”

——Clive Humby

在当今的人工智能时代,数据分析和挖掘似乎已经是一个很古老的话题。这也难怪,对数据的分析甚至可以追溯到中国第一经—《易经》这部远古文明的产物,至少17世纪就开始的数理统计学为数据分析准备了齐全的数学工具,而领域公认的第一个数据挖掘算法也早在27年前就发表了。

事实上,目前的人工智能的发展是由数据驱动的。从数据中挖掘得到的知识在很大程度上成就了人工智能的奇妙,比如机器翻译、人脸识别、对话机器人等。目前人工智能所面临的问题是推广,也就是需要在各行各业将人工智能的能力发挥出来。这个能力的发挥在很大程度上依赖于数据的使用能力。而数据使用的难度源于数据的复杂性和多样性,我们需要一系列处理数据的工具,也就是数据挖掘工具,它是人工智能、机器学习任务的一个重要部分。

在过去二十多年中,数据挖掘领域取得了很大的进步,从计算机科学的角度来看尤其明显。尽管传统的概率与统计领域对数据分析已经有了广泛和深入的研究,但数据挖掘这个术语是由计算机科学相关的社区所创立的。对计算机科学家来说,计算的可扩展性、可用性和计算的执行都是极为重要的。

本期华章妹为大家推荐几本经典的数据挖掘图书。

《数据挖掘:原理与实践(基础篇)》

点击购买

作者:[美] 查鲁·C. 阿加沃尔

译者:王晓阳、王建勇、禹晓辉、陈世敏

推荐理由:大数据和人工智能时代的数据挖掘教材和工具书。从四个“超级问题”出发,不仅详解数据挖掘的基础知识,而且还介绍高级数据类型,结合复杂多样的实际数据环境,探讨数据挖掘的应用场景和使用方法。

本书中文版分为基础篇和进阶篇。基础篇(包括原书的第1-13章)详细介绍了针对数据挖掘的四个主要问题(聚类、分类、关联模式挖掘和异常分析)的各种解决方法、用于文本数据领域的特定挖掘方法,以及对于数据流的挖掘应用。

《数据挖掘:原理与实践(进阶篇)》

点击购买

作者:[美] 查鲁·C. 阿加沃尔

译者:王晓阳、王建勇、禹晓辉、陈世敏

推荐理由:大数据和人工智能时代的数据挖掘教材和工具书。从四个“超级问题”出发,不仅详解数据挖掘的基础知识,而且还介绍高级数据类型,结合复杂多样的实际数据环境,探讨数据挖掘的应用场景和使用方法。

进阶篇(包括原书的第14-20章)主要讨论了用于不同数据领域(例如时序数据、序列数据、空间数据、图数据)的特定挖掘方法,以及重要的数据挖掘应用(例如Web数据挖掘、排名、推荐、社交网络分析和隐私保护)。

《数据挖掘导论(原书第2版)》

点击购买

作者:[美]陈封能

迈克尔·斯坦巴赫

阿努吉·卡帕坦

维平·库玛尔

译者:段磊 张天庆 等

推荐理由:陈封能领衔编写的数据挖掘经典畅销教材新版,斯坦福大学、密歇根州立大学、明尼苏达大学、得克萨斯大学等知名高校的数据挖掘课程教材。从基础概念和算法的角度介绍数据挖掘所使用的主要原理与技术。

《数据挖掘:概念与技术(原书第3版)》

点击购买

作者:(美)Jiawei Han

Micheline Kamber

Jian Pei

译者:范明、孟小峰

推荐理由:数据挖掘领域最具里程碑意义的经典著作,完整全面阐述该领域的重要知识和技术创新。引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。

第039期赠书活动中奖名单公布

赠书规则

送书规则:感谢大家对华章图书的信任与支持。在留言区围绕数据挖掘谈谈你的看法。小编会在留言池随机捞2条锦鲤,分别包邮送出1本正版书籍。以上4本书可任选一本。

截止日期:1月29日下午17:00

特别注意:请按规则留言。阅读最多、分享最多者优先。

更多精彩回顾

书讯 | 1月书讯:Hello 2021! (上)

书讯 | 1月书讯:Hello 2021! (下)

资讯 | TIOBE 1 月编程语言:Python 摘得 2020 年度编程语言!

书单 | “绿宝书”好在哪?前端大佬们都在推荐

干货 | 使用 SQL 语句实现一个年会抽奖程序

收藏 | 2020年云原生技术关键趋势总结

上新 | 手把手教你如何制作可视化大屏!

【第40期】不可错过的数据挖掘好书相关推荐

  1. 《40期》 我们要把世纪末日变成重生日

    2012年.传说中一个会是世纪末日的一年.(ps:电影看多了--- _-!!!),但是寒假过后的北京.天气却是十分的晴朗.出奇的好.而就在今天也就是2012年2月9日40期的开班典礼就选了这一天.地点 ...

  2. 《强化学习周刊》第40期:PMIC多智能体强化学习、Lazy-MDPs、CTDS

    No.40 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...

  3. https防止注入_【缺陷周话】第40期:JSON 注入

     聚焦源代码安全,网罗国内外最新资讯! *声明:<缺陷周话>栏目系列文章由奇安信代码卫士团队原创出品.未经许可,禁止转载.转载请注明"转自奇安信代码卫士 www.codesafe ...

  4. 一个数字几个字节_技术工坊40期-DAG技术特性以及在字节雪球Obyte项目的使用实践...

    1. 活动基本信息 1)题目: [区块链技术工坊40期]DAG技术特性以及在字节雪球Obyte项目的使用实践 2)议题: 字节雪球Obyte(原名Byteball):一个基本于DAG技术的去中心化分布 ...

  5. 3星|《三联生活周刊》2017年40期:中国迈入高收入国家门槛几乎是板上钉钉的事...

    三联生活周刊·世界上最好的教育:我们能从芬兰学到什么?(2017年40期) 本期主题是芬兰的教育制度.芬兰的教育强调资源公平分配.教的少学的多. 以下是本期一些内容的摘抄,#号后面是kindle电子书 ...

  6. DT科技评论第40期:“影子经纪人”发布漏洞订阅服务,下一次的全球安全事件会在近期接踵而至吗?...

    DT科技评论 Data Technology Review 第 40 期 阿里云研究中心,人民网研究院,DeepTech深科技 本期目录 斯坦福大学研发出易弯曲的有机半导体集成电路 苹果新专利:Sir ...

  7. 软件测试周刊(第40期):大部分的恐惧与懒惰有关

    编辑:国薇.一口锅.菜菜.静怡.小淑子.夏至 欢迎来到第 40 期!这里记录过去一周我们看到的软件测试及周边的行业动态,周五发布. 本期看点:测试人员如何高效参与技术设计评审?更加深入的性能数据分析应 ...

  8. 【第40期】游戏策划:给@真轶的应聘攻略

    我是酱油,这是第40期文章. 网友@真轶留言:目前在自媒体公司,从事影视后期工作,做过游戏剪辑,想进游戏圈,比如策划或运营岗位. 这位网友的情况如下: 1.自学各种软件,会adobe AE.PR.PS ...

  9. 今天写些有用的,关于学习的,和关于40期项目读后感的一些想法

    兄弟连这地方,我是越来越喜欢了,这是一个很安静的教育园区,它有点像古代高手休练闭关的地方,绝对能让你练出一身好功夫,同时,难能可贵的是,这个园区的男女比例很平衡,具我身边的小明上网所查,在我们隔壁的教 ...

最新文章

  1. 20120511学习笔记
  2. SPOJ_SUBLEX
  3. no java virtual machine was found after searching Failed to load the JNI shared library
  4. git上托管的代码如何部署在阿里云上_居然仅用浏览器搞定Spring Boot应用的开发与部署...
  5. 最长公共上升子序列(LCIS)
  6. vue i18n 国际化 使用方法
  7. 募捐名单_年度捐款,以及为什么现在应该捐款,而不是以后
  8. linux 中国-新手村,从新手村开始,手把手带你入门梳理内核代码
  9. 如何不显示地图就获取位置数据?
  10. “鬼才”论文致谢刷屏!感谢我导“似导非导”的指导……
  11. html为知笔记模板,新建笔记模板二次开发
  12. native mysql 分区_MySQL-表分区
  13. 写给立志进入网络行业的朋友的一些忠告
  14. Android Studio 4.2Previw版本编译错误提示Disable offline mode and rerun the build
  15. 计算机的好处和坏处的英语作文,电脑利与弊英语作文
  16. 2019-02-24 经济 金融 投资 理财相关书籍推荐
  17. php十进制转ascii字符,(5条消息)php ASCII字符和十六进制数之间的相互转化
  18. 华为无线-Portal认证异常-无线强制切换为手机流量
  19. 人物素描如何把握尺寸大小_素描fu复制粘贴位置大小
  20. 抖音无水印解析网站精美源码-无需数据库 安装

热门文章

  1. 电压放大器原理(电压放大器适用于什么场合使用)
  2. 信用卡客户风险评估-聚类分析实验报告(python)
  3. ansys workbench收敛判断
  4. ICC Scenario Difinition(什么是Scenario?)
  5. 海康威视web插件【浏览器部分兼容 全兼容】
  6. Python-玩转数据-python ftp下载文件
  7. 设计一款CPU到底有多难?
  8. Linux下*.tar.gz文件解压缩命令
  9. 推荐一个关于视觉和图像处理的博客聚合-PIXEL SHAKERS
  10. 64匹马8个跑道问题