我的第一本书出版了:《人工智能数学基础与Python机器学习实战》。

内容简介

通常来说,人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的研究领域包括机器人、语音识别、图像识别、自然语言处理和专家系统等。

机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。生活中很多机器学习的书籍只注重算法理论方法,并没有注重算法的落地。本书是初学者非常期待的入门书,书中有很多的示例可以帮助初学者快速上手。

本书包括3个部分:

  • 第1部分介绍基本的数学工具和机器学习的概念;

  • 第2部分系统深入地讲解现今已成熟的机器学习方法和技术;

  • 第3部分介绍了SparkSpark机器学习

本书适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。

本书特色

有些读者在学习时会有这样一种感觉:一门课学完了、考试过了,却不知道学了有什么用,尤其是数学类的课程。这是因为传统教材大多数是按照“定义—例题—计算”的步骤来大篇幅罗列数学概念,偏重理论定义和运算技巧,不注重梳理学科内在的逻辑脉络,更没能深刻挖掘出本学科与当下前沿技术的交汇点。因此,本书采用了很多的案例和代码,不局限于算法本身,更注重于实践方面。

本书具有以下特点:。

  • 脉络清晰:数学基础、算法详解和持续探索。

  • 系统全面:网罗监督学习回归、监督学习分类、无监督学习、半监督学习等机器学习算法。

  • 注重实战:使用Python进行机器学习的项目实战,使用sklearn实现算法模型的搭建。

  • 紧跟发展:不局限于Python中的sklearn的学习,还紧跟大数据时代的发展。

  • 知识范围广:本书的知识广度比较大,涉及了高等数学、线性代数、概率论、数据处理和机器学习算法等方面。

具体大纲

下面是本书的具体具体大纲

第一章:走进机器学习的世界

  • 1.1 机器学习概述

    • 1.1.1 什么是机器学习
    • 1.1.2 机器学习的分类
  • 1.2 Python编程语言
    • 1.2.1 Python环境搭建
    • 1.2.2 机器学习相关软件包介绍
  • 1.3 机器学习的数学知识
    • 1.3.1 导数
    • 1.3.2 基本函数的求导公式
    • 1.3.3 求导法则
    • 1.3.4 Python实现求导
    • 1.3.5 泰勒展开式
    • 1.3.6 微积分基本定理
    • 1.3.7 基本函数的积分公式
    • 1.3.8 Python实现积分

第二章:人工智能数学基础

  • 2.1 线性代数

    • 2.1.1 向量及其线性运算
    • 2.1.2 矩阵及其线性运算
  • 2.2 随机变量
    • 2.2.1 离散型随机变量
    • 2.2.2 连续型随机变量
  • 2.3 随机变量概率分布
    • 2.3.1 伯努利分布
    • 2.3.2 泊松分布
    • 2.3.3 指数分布
    • 2.3.4 二项分布
    • 2.3.5 正态分布
    • 2.3.6 伽马分布
    • 2.3.7 贝塔分布
    • 2.3.8 卡方分布
    • 2.3.9 t分布
    • 2.3.10 F分布

第三章:数据获取和预处理

  • 3.1 数据获取

    • 3.1.1 自带和下载数据集
    • 3.1.2 创建数据集
    • 3.1.3数据集
  • 3.2 标准化
    • 3.2.1 z-score标准化
    • 3.2.2 Min-max标准化
  • 3.3二值化
    • 3.3.1 特征二值化
    • 3.3.2 标签二值化
  • 3.4 特征处理
    • 3.4.1 独热编码
    • 3.4.2 多项式特征
    • 3.4.3 PCA降维
  • 3.5 数据消洗
    • 3.5.1 Pandas数据消洗
    • 3.5.2 sklearn处理缺失值
  • 3.6 文本特征提取
    • 3.6.1 字典提取器
    • 3.6.2 词袋模型
    • 3.6.3 权重向量
  • 3.7 图像特征提取
    • 3.7.1 提取像素矩阵
    • 3.7.2 提取角点
    • 3.7.3 提取轮廓
    • 3.7.4 提取局部特征点
  • 3.8 特征选择
    • 3.8.1 Filter过滤去
    • 3.8.2 Wrapper包装法
    • 3.8.3 Embedded嵌入法

第4章:线性回归和逻辑回归

  • 4.1 线性回归

    • 4.1.1 最小二乘法
    • 4.1.2 梯度下降法
    • 4.1.3 线性回归实现
    • 4.1.4 Lasso回归和岭回归
    • 4.1.5 回归模型评估
    • 4.1.6 多项式回归
  • 4.2 逻辑回归
    • 4.2.1 逻辑回归算法
    • 4.2.2 逻辑回归实现
    • 4.2.3 分类模型评估

第5章 KNN和贝叶斯分类算法

  • 5.1 KNN算法

    • 5.1.1 KNN算法的距离度量
    • 5.1.2 KNN算法的代码实现
    • 5.1.3 交叉验证
    • 5.1.4 KD树
  • 5.2 贝叶斯分类算法
    • 5.2.1 贝叶斯定理
    • 5.2.2 高斯朴素贝叶斯
    • 5.2.3 多项式朴素贝叶斯
    • 5.2.4 伯努利朴素贝叶斯

第6章 决策树和随机森林

  • 6.1 决策树

    • 6.1.1 熵
    • 6.1.2 决策树算法
    • 6.1.3 剪枝算法
  • 6.2 决策树代码实现
    • 6.2.1 可视化决策树
    • 6.2.2 分类树
    • 6.2.3 回归树
  • 6.3 随机森林
    • 6.3.1 集成学习算法
    • 6.3.2 随机森林分类
    • 6.3.3 随机森林回归

第7章 支持向量机

  • 7.1 SVM核心概念

    • 7.1.1 线性可分
    • 7.1.2 核函数
    • 7.1.3 剪枝算法
  • 7.2 SVM代码实现
    • 7.2.1 SVC
    • 7.2.2 SVM人脸识别
    • 7.2.3 SVR

第8章 聚类算法

  • 8.1 K-means聚类算法

    • 8.1.1 K- means聚类算法原理
    • 8.1.2 模型评估
    • 8.1.3 图像处理
    • 8.1.4 K-means聚类算法实例
  • 8.2 层次聚类算法
    • 8.2.1 层次聚类算法原理
    • 8.2.2 层次聚类算法实例
  • 8.3 密度聚类算法
    • 8.3.1 密度聚类算法原理
    • 8.3.2 密度聚类算法实例

第9章 EM和HMM聚类算法

  • 9.1 EM聚类算法

    • 9.1.1 最大似然估计
    • 9.1.2 詹森不等式
    • 9.1.3 EM算法原理
  • 9.2 EM算法代码实现
  • 9.3 HMM聚类算法
    • 9.3.1 马尔可夫过程
    • 9.3.2 隐马尔可夫模型

第10章 主题模型

  • 10.1 LDA主题模型

    • 10.1.1 Dirichlet分布
    • 10.1.2 LDA贝叶斯模型
  • 10.2 自然语言处理常用工具包
    • 10.2.1 NLTK
    • 10.2.2 spacy
    • 10.2.3 Gensim
    • 10.2.4 jieba
    • 10.2.5 Stanford nlp
    • 10.2.6 Fuzzywuzzy
    • 10.2.7 Hanlp
  • 10.3 LDA主题模型实例

第11章 推荐算法

  • 11.1关联规则

    • 11.1.1 置信度
    • 11.1.2 支持度
    • 11.1.3 提升度
    • 11.1.4 代码实现
  • 11.2 基于用户行为的推荐算法
    • 11.2.1 矩阵分解
    • 11.2.2 SVD代码实现
  • 11.3 基于评分的推荐算法
    • 11.3.1 Slope One算法
    • 11.3.2 Slopeonef代码实现
  • 11.4 协同过滤

第12章 数据建模

  • 12.1 监督学习

    • 12.1.1 监督学习回归
    • 12.1.2 监督学习分类
  • 12.2 半监督学习
    • 12.2.1 标签传播算法
    • 12.2.2 半监督学习分类
  • 11.3 保存模型
    • 12.3.1 pickle
    • 12.3.2 joblib
    • 12.3.3 sklearn2pmml
  • 第12章 数据建模
  • 12.1 监督学习
    • 12.1.1 监督学习回归
    • 12.1.2 监督学习分类
  • 12.2 半监督学习
    • 12.2.1 标签传播算法
    • 12.2.2 半监督学习分类
  • 12.3 保存模型
    • 12.3.1 pickle
    • 12.3.2 joblib
    • 12.3.3 sklearn2pmml

第13章 Spark机器学习

  • 13.1 Spak分布式集群搭建

    • 13.1.1 创建Centos7虚拟机
    • 13.1.2 设置静态ip
    • 13.1.3 配置SSH服务
    • 13.1.4 安装Java
    • 13.1.5 搭建三台Centos7主机
    • 13.1.6 修改hosts文件
    • 13.1.7 配置SSH免密码登录
    • 13.1.8 搭建Hadoop集群
    • 13.1.9 搭建Zookeeper集群
    • 13.1.10 启动Hadoop和Zookeeper集群
    • 13.1.11 搭建Spark集群
  • 13.2 Hadoop和Spark的基础知识
    • 13.2.1 HDFS
    • 13.2.2 Spark Shell
    • 13.2.3 RDD编程
    • 13.2.4 Spark SQL
  • 13.3 Spark mllib
    • 13.3.1 回归模型
    • 13.3.2 分类模型

笔者感触

笔者:刘润森,熟悉PyTorch、TensorFlow等深度学习框架,对计算机视觉、机器学习和深度学习有深入研究

笔者最早从大一下学期开始接续学习机器学习,也曾在 CSDN 中分享一些相关机器学习的教程和其他IT领域的学习笔记,因此有出版社的朋友找到笔者,希望可以将这些内容整理成书,于是就有
了这本书。

对笔者而言,本书也是对自己学习成果的总结。大家千万不要认为学习机器学习就是调包,而忽视了里面数学的美,也不要过于在意里面的复杂算法。就国内而言,除少数公司的少数机器学习部门是推公式、做理论优化外,大部分机器学习岗位都是在用成熟的工具做开发、搞特征、调模型、上线产品。

例如,阿里云机器学习PAI平台,封装了上百种算法,提供了完整的机器学习链路,重点是具有可视化操作界面,通过拖曳操作,进行少量配置,即可完成业务处理。这里提醒一句,数学对于机器学习来说也是非常重要的。同时,数据分析也很重要,这里包括对数据的理解、对统计学的认知等,可以说,一个好的机器学习算法工程师也一定是一个好的数据分析师。

购买链接

下面是这本书在京东上的购买链接,淘宝天猫等购物平台均有销售,喜欢就看看,不喜欢静静走开即可。

京东自营购买链接

京东自营购买链接

当当自营购买链接

当当自营购买链接

双十一、不如买一本书吧相关推荐

  1. 双十一了,送大家几本书吧!包邮!

    点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 哈喽,各位小伙伴 双十一,你剁手了? 双十一,你剁手了? 双十一,你剁手了? 平台给你推荐的商品你喜欢吗? 喜欢 喜欢就对了 今天送 ...

  2. 购买新款macbook pro,现在买还是等双十一?

    喜欢苹果生态,准备入手14的新mbp,是直接走学生优惠还是等双十一活动? 肯定是走教育优惠!这个才刚发布,就想着双十一降价,不可能~ MacBook Pro 14英寸 M1 Pro 8核,发售价:14 ...

  3. brew 一直等待_等待双“十一”,去买心仪已久的蓝色呢子大衣

    时间真的过得很快呀,刚刚国庆节马上就要到双十一了.最近几年自从有了淘宝大家,感觉双11好像就是一个购物的日子.人们都知道双11淘宝会降价促销很多东西,所以人们都是冲着这个去的,包括我也是在内也选了一下 ...

  4. 2020年双十一,你贡献了多少?

    文 / 王不留(微信公众号:程序员生存指南) 写篇与双十一有关的内容吧. 昨晚入手了ipad2020款,2899元.早晨四点起床后,随手浏览网店,竟然在拼多多上发现最低价2709元,提供正品发票,品牌 ...

  5. 今年双十一,区块链怎么玩?CSDN“免费+质量局”沙龙邀你参加

    今年双十一,你是否一如既往地准备买买买?被眼花缭乱的各种"优惠""折扣"冲昏了头,购物车早早地堆满了各种"宝贝",坐等11号凌晨00:00: ...

  6. 淘宝双十一用5个“潜规则”冲击1500亿

    PMCAFF(www.pmcaff.com):互联网产品社区,是百度,腾讯,阿里等互联网人的学习交流平台.定期出品深度产品观察,互联产品研究首选 外包大师(www.waibaodashi.com):要 ...

  7. 天猫不搞双十一“开玩笑”

    这两冷幽默的消息不少.有消息称"天猫明年将不再组织双十一大促,考虑到低价促销冲击价格体系,利润被压薄,对品牌商造成一定程度的伤害,生死疲劳却换来白干一场.天猫试图在未来树立"第五大 ...

  8. PowerBI 秒级实时大屏展示方案 全面助力双十一

    双十一来了,你准备好了吗?不管你是否准备完毕,我们带来了全网首发的 PowerBI 秒级实时大屏展示方案,你可以直接用来展示双十一的实时状况. 我们一步步来说明这个套件模板教程. 真实效果 功能如下: ...

  9. c++如何将int数组中的值取出*号运算符_如何用动态规划巧妙解决 “双十一” 购物时的凑单问题?羊毛薅起来!!!...

    点击上方"程序员大白",选择"星标"公众号 重磅干货,第一时间送达 今年过去的 "双十一" ,你有薅到羊毛吗? 每年的双十一,会有各种促销活 ...

  10. jquery怎么判断不同的字显示不同的颜色_这个双十一,摄影师的显示器该换了,优派VP2785-2K显示器评测_显示器...

    2020-11-03 23:07:380点赞0收藏0评论 想攒一台电竞主机.家用主机.酷炫主机无从下手?想省钱又怕性能不达标?值得买帮你打造定制化DIY装机工具,自助全网比价装机,提供最适合的搭配方案 ...

最新文章

  1. 网络文件系统(NFS)简介
  2. 蓝桥杯:入门训练 圆的面积
  3. 运动检测 背景减除(Background Segment)
  4. 利用Python3内置文档资源高效学习及官方中文文档
  5. VTK:PolyData之ColorDisconnectedRegionsDemo
  6. python之用循环实现五子棋小程序
  7. 草稿 修改数据 datagroupview
  8. 绝对定位的div的居中方法,下面的写法兼容IE系列浏览器和火狐浏览器。
  9. Android 应用开发----ViewPager---PagerTitleStrip添加标题栏
  10. Linux 设置交换分区
  11. 互联网30年,泡沫如梦
  12. 体育运动赛事小程序开发制作
  13. 斐讯n1安装armbian系统的方法
  14. android qq毛玻璃,如何快速做出毛玻璃背景?有了这个网格渐变神器,1分钟搞定...
  15. 三星c9000刷android7.0,三星C9 Pro C9000官方原厂rom线刷包刷机包C9000ZCU1CRI1
  16. WIN10/WIN11 优启动 GHOST
  17. 【python基础】python爬虫对网页壁纸图片批量抓取下载
  18. lpx寒假作业案例6
  19. 网络请求及各类错误代码含义总结(包含AFN错误码大全)
  20. MySQL必须知道的点

热门文章

  1. 作业四:结对编程项目--四则运算
  2. EfficientDeRainy:一种高效的图像去雨雾算法
  3. 锐捷交换机配置snmp版本_锐捷交换机如何配置接口IP地址
  4. 纹理(Textures)
  5. foxmail信纸设置html,教你如何设置Foxmail信纸花样?
  6. php5.4 eregi,帮助将PHP eregi转换为preg_match
  7. 整合ecshop与discuz论坛
  8. XPT2046电阻触摸屏芯片的使用
  9. c语言学习——设圆半径r = 1.5,圆柱高h = 3,求圆周长,圆面积,圆球表面积,圆球体积,圆柱体积
  10. PSM案例《价格敏感度分析》