Google Assistant,Amazon Alexa,Microsoft Cortana,Apple Siri或Facebook Messaging M之间的共同点是什么? 所有这些个人助手均由机器学习和人工智能(AI)推动。 根据Glassdoor和Upwork.com的说法 ,机器学习是2017年必不可少的技能,并且将持续多年

您将如何发展技能,成为下一位机器学习工程师?

机器学习入门

Udacity , Coursera , edX和其他资源提供了MOOC(大规模开放在线课程),并且Amazon.com列出了5,000多本有关机器学习的书籍。 这些标题中的许多标题都可以帮助您入门,并通过动手知识逐步将您带入更高的层次。 此外,前Google工程师,领导YouTube视频分类团队的AurélienGéron也写了一本很棒的书: 动手学习Scikit-Learn和TensorFlow 。 这是一本实用的指导书,用于动手机器学习和深度学习 (一类机器学习算法)。

这本书假定您对机器学习几乎一无所知。 但是,这本书还假设您具有一些Python编程经验,并且对大学水平的数学有一定的了解,包括线性代数,概率和统计量。 机器学习项目通常使用Python,R,Java / Scala和C / C ++作为编程语言。 Géron并没有让我们实现自己的机器学习算法的玩具版本,而是使用了可用于生产的Python框架scikit-learn和TensorFlow 。 两者都是积极开发的开源项目。

为什么要使用scikit-learn和TensorFlow?

scikit-learn项目是David Cournapeau于2007年发起的Google夏季代码项目。Scikit-learn致力于使用通用的高级语言(如Python)将机器学习带给非专业人员。 根据scikit-learn的推荐页面 ,Spotify将scikit-learn机器学习包用于音乐推荐,而Evernote则将其用于音符分类。 它提供了基本的机器学习算法的高质量,易于使用的实现,包括回归,分类,聚类等。 Scikit-learn是学习机器学习的很好的切入点,并且是GitHub上第二高星级的机器学习库。

TensorFlow是Géron评估的第二个项目。 从2011年开始,Google Brain构建了DistBelief ,这是一个基于深度学习神经网络的机器学习系统。 TensorFlow是Google Brain的第二代机器学习系统,于2015年作为开源软件发布。Google使用TensorFlow神经网络模型进行语音识别,而Snapchat使用它进行图像识别。 它提供了用于神经网络和深度学习的高级机器学习算法,并且是GitHub上使用最多的机器学习库。

端到端机器学习项目

该书的核心优势在于它专注于端到端机器学习项目。 一个典型的机器学习项目涉及八个步骤:

  1. 看大图
  2. 获取数据
  3. 可视化数据以获取见解
  4. 准备用于机器学习算法的数据
  5. 选择一个模型并训练
  6. 微调模型
  7. 提出解决方案
  8. 启动,监视和维护机器学习系统

样例项目:房价预测

该书使用加利福尼亚州的公共普查数据来预测整个地区的房价。 第一步,这本书有助于解决问题-这是带有多元回归的监督学习问题。 根据所需的精度,下一步是选择性能指标; 例如,系统价格预测的68%落在实际价值的50,000美元以内,而系统价格预测的95%落在实际价值的100,000美元以内。

Scikit-learn提供了一些工具来获取数据,浏览数据,清理数据以及为机器学习算法准备数据。 一旦完成,下一步就是选择和训练模型。 机器学习项目的一大挑战是选择正确的模型,这将提供更好的预测准确性。 经验丰富的机器学习专家会选择三到四个模型,然后根据结果的准确性选择其中一个模型。

对于房价预测,Géron选择线性回归 , 决策树和随机森林模型。 他发现随机森林在此问题上的表现优于其他两个模型。

本书涵盖了更多的机器学习算法及其相关性和用法,并且包括涵盖了监督学习,非监督学习,半监督学习和强化学习的代码示例。 您的机器学习问题可能是细分客户并为每个组找到最佳的营销策略,检测哪些交易可能是欺诈性的,并预测明年的收入。

阅读: 使用Scikit-Learn和TensorFlow进行动手机器学习

翻译自: https://opensource.com/article/17/4/book-review-hands-machine-learning-scikit-learn-tensorflow

书评:使用Scikit-Learn和TensorFlow进行动手机器学习相关推荐

  1. Hands On Machine Learning with Scikit Learn and TensorFlow(第三章)

    MNIST 从sklearn自带函数中导入NMIST 第一次导入可能会出错,从这里下载https://github.com/amplab/datascience-sp14/blob/master/la ...

  2. scikit learn、tensorflow、keras区别

    参考:简书-刘敬:https://www.jianshu.com/p/0837b7c6ce10,感谢 一. 功能不同 Scikit-learn(sklearn)的定位是通用机器学习库 TensorFl ...

  3. Hands On Machine Learning with Scikit Learn and TensorFlow(第十章)

    Oscar帮助你寻找好的超参数组合. 每个隐藏层神经元的数量应该是逐渐减少的,因为第一层学到的低阶特征,可以在第二层组合成高阶特征 .

  4. TF学习——TF之API:TensorFlow的高级机器学习API—tf.contrib.learn的简介、使用方法、案例应用之详细攻略

    TF学习--TF之API:TensorFlow的高级机器学习API-tf.contrib.learn的简介.使用方法.案例应用之详细攻略 目录 tf.contrib.learn的简介 tf.contr ...

  5. 【scikit-learn】如何用Python和SciKit Learn 0.18实现神经网络

    本教程的代码和数据来自于 Springboard 的博客教程.本文的作者为 Jose Portilla,他是网络教育平台 Udemy 一门数据科学类课程的讲师. GitHub 链接:https://g ...

  6. Scikit Learn: 在python中机器学习

    Warning 警告:有些没能理解的句子,我以自己的理解意译. 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Ga ...

  7. TensorFlow高层次机器学习API (tf.contrib.learn)

    TensorFlow高层次机器学习API (tf.contrib.learn) 1.tf.contrib.learn.datasets.base.load_csv_with_header 加载csv格 ...

  8. [转载]Scikit Learn: 在python中机器学习

    原址:http://my.oschina.net/u/175377/blog/84420 目录[-] Scikit Learn: 在python中机器学习 载入示例数据 一个改变数据集大小的示例:数码 ...

  9. 机器学习与Scikit Learn学习库

    摘要: 本文介绍机器学习相关的学习库Scikit Learn,包含其安装及具体识别手写体数字案例,适合机器学习初学者入门Scikit Learn. 在我科研的时候,机器学习(ML)是计算机科学领域中最 ...

最新文章

  1. 跟我学Springboot开发后端管理系统3:Mybatis-Plus实战2
  2. RASPBERRY PI PICO 树莓派PICO开发板双核高性能低功耗RP2040芯片
  3. MongoDB开发学习开天辟地,经典入门
  4. 个人博客作业week1
  5. TensorRT安装教程
  6. silverlight中如何方便在多个场景即Xaml文件之间随意切换?
  7. 程序员达到高效率的一种境界
  8. 在同一台服务器上安装两个数据库
  9. poj 1459 Power Network 多源多汇网络流
  10. 说下我常用的几个精简版系统的感受
  11. 2021年度考核登记表
  12. 将数组分成两部分使得两部分的和的差最小
  13. 2019最新补单安全小技巧
  14. Android程序反破解技术
  15. 乐固、360加固在android 11 上报错,无法安装
  16. oracle12c 删除磁盘组,12C RAC重装无法识别磁盘组(AFD新特性)
  17. 请用python3编写一个计算器的控制台程序_二、软件工程慕课第一章作业题——编写一个计算器...
  18. 辉太郎看前端(for...in和for...of)
  19. RabbitMQ宕机后,消息100%不会丢失吗
  20. java图片压缩工具类

热门文章

  1. 2019年创业融资去哪个平台好?创成汇
  2. 利用OpenSmtp.Net发送需要smtp验证的邮件
  3. 烂泥:ubuntu中使用virt-manager图形化新建虚拟机
  4. 高级service之ipc ADIL用法
  5. PetShop4.0的安装、设置、调试与体验(草稿)
  6. JDK源码(9)-Double、Float
  7. 【elasticsearch系列】windows安装kibana
  8. oracle命中率sql,Oracle 检查命中率的SQL
  9. IT兄弟连 JavaWeb教程 使用Servlet实现在页面中显示随机数
  10. JS跨页面调用变量的方法