本书分8个章节

第1 章,Python 机器学习的生态系统,深入Python,它有一个深度活跃的开发者社区,而且许多开发者来自科学社区。这为Python 提供了丰富的科学计算库。在本章中,我们将讨论这些关键库的特性以及如何准备你的环境,以最好地利用它们。

第 2 章,构建应用程序,发现低价的公寓,指导我们构建第一个机器学习应用程序,我们从一个最小但实际的例子开始:建设应用程序来识别低价的公寓。到本章结束,我们将创建一个应用程序,使得寻找合适的公寓变得更容易点。

第 3 章,构建应用程序,发现低价的机票,演示了如何构建应用程序来不断地监测票价。一旦出现异常价格,应用程序将提醒我们,可以快速采取行动。
第 4 章,使用逻辑回归预测IPO 市场,展示了我们如何使用机器学习决定哪些IPO 值得仔细研究,而哪些可以直接跳过。

第 5 章,创建自定义的新闻源,介绍如何构建一个系统,它会了解你对于新闻的品味,而且每天都可以为你提供个性化的新闻资讯。
第 6 章,预测你的内容是否会广为流传,检查一些被大家广泛分享的内容,并试图找到这种内容相对于其他人们不愿分享的内容有哪些特点。
第 7 章,使用机器学习预测股票市场,讨论如何构建和测试交易策略。当你试图设计属于自己的系统时,有无数的陷阱要避免,这是一个几乎不可能完成的任务。但是,这个过程有很多的乐趣,而且有的时候,它甚至可以帮你盈利。

第 8 章,建立图像相似度的引擎,帮助你构建高级的、基于图像的深度学习应用。我们还将涵盖深度学习的算法来了解为什么它们是如此的重要,以及为什么它们成为了最近研究的热点。

第 9 章,打造聊天机器人,演示如何从头构建一个聊天机器人。读完之后,你将了解更多关于该领域的历史及其未来前景。

第 10 章,构建推荐引擎,探讨不同类型的推荐系统。我们将看到它们在商业中是如何实现和运作的。我们还将实现自己的推荐引擎来查找GitHub 资料库。

第一章节主要是了解了:机器学习的几个步骤 :  获取  -----  检查和探索方法  ----  准备 清理  ---  建模 ---- 评估-----部署 。

按照机器学习的6个步骤 在pycharm上实现data数据的处理。 花类型下的 花瓣长宽 花萼的长宽 的参数关系研究并使用可视化的工具做出关系图。使用到的库及代码见下图。


"""NO.1"""
# import requests
# r = requests.get(r"https://api.github.com/users/acombs/starred")
# r2 = r.json()
# # f = open('requests_txt.txt', mode='w+', encoding='utf-8')
# # f.write(str(r2))
# # f.close()
#
# print( r2 )"""NO.2使用pandas 分析数据data """# import os
# import pandas as pd
# import requests
# # PATH = r'E:/Users/iris/'
# PATH = r'E:\python_data\iris'
# r = requests.get('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data')
# with open(PATH + 'iris.data', 'w') as f:
#     f.write(r.text)
#
# os.chdir(PATH)
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
# df.head()
# print(df.head())
# print()
# print(df['sepal length'])
# print()
# print(df[(df['class']=='Iris-virginica')&(df['petal width']>2.2)])
# print()
# print(df.corr())"""NO.3 显示直方图 只显示 petal width 数据列"""
# import os
# import pandas as pd
#
# import matplotlib.pyplot as plt
# plt.style.use('ggplot')
# # matplotlib inline
# import numpy as np
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
#
# fig, ax = plt.subplots(figsize=(6,4))
# ax.hist(df['petal width'], color='black');
# ax.set_ylabel('Count', fontsize=12)
# ax.set_xlabel('Width', fontsize=12)
# plt.title('Iris Petal Width', fontsize=14, y=1.01)
# plt.show()"""NO.4 显示直方图 只显示4列数据列"""
# import os
# import pandas as pd
#
# import matplotlib.pyplot as plt
# plt.style.use('ggplot')
# # matplotlib inline
# import numpy as np
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
#
# fig, ax = plt.subplots(2,2, figsize=(6, 4))
#
# ax[0][0].hist(df['petal width'], color='black')
# ax[0][0].set_ylabel('Count', fontsize=12)
# ax[0][0].set_xlabel('Width', fontsize=12)
# ax[0][0].set_title('Iris Petal Width', fontsize=14, y=1.01)
#
# ax[0][1].hist(df['petal length'], color='black')
# ax[0][1].set_ylabel('Count', fontsize=12)
# ax[0][1].set_xlabel('Lenth', fontsize=12)
# ax[0][1].set_title('Iris Petal Lenth', fontsize=14, y=1.01)
#
# ax[1][0].hist(df['sepal width'], color='black')
# ax[1][0].set_ylabel('Count', fontsize=12)
# ax[1][0].set_xlabel('Width', fontsize=12)
# ax[1][0].set_title('Iris Sepal Width', fontsize=14, y=1.01)
#
# ax[1][1].hist(df['sepal length'], color='black')
# ax[1][1].set_ylabel('Count', fontsize=12)
# ax[1][1].set_xlabel('Length', fontsize=12)
# ax[1][1].set_title('Iris Sepal Length', fontsize=14, y=1.01)
#
# plt.tight_layout()
# """自动调整布局避免拥挤 """
# plt.show()""""NO.5 散点图  """
# import os
# import pandas as pd
#
# import matplotlib.pyplot as plt
# plt.style.use('ggplot')
# # matplotlib inline
# import numpy as np
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
# fig, ax = plt.subplots(figsize=(6,6))
# ax.scatter(df['petal width'], df['petal length'], color='green')
# ax.set_xlabel('Petal Width')
# ax.set_ylabel('Petal Length')
# ax.set_title('Petal Scatterplot')
# plt.show()# """"NO.6 线图  """
# import os
# import pandas as pd
#
# import matplotlib.pyplot as plt
# plt.style.use('ggplot')
# # matplotlib inline
# import numpy as np
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
#
# fig, ax = plt.subplots(figsize=(6, 6))
# ax.plot(df['petal length'], color='blue')
# ax.set_xlabel('Specimen Number')
# ax.set_ylabel('Petal Length')
# ax.set_title('Petal Length Plot')
#
# plt.show()""""使用 seaborn 库绘图1  """
# import seaborn as sns
# import pandas as pd
# import matplotlib.pyplot as plt
#
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
#
# sns.pairplot(df, hue='class')
#
# plt.show()
""""使用 seaborn 库绘图2  """
# import seaborn as sns
# import pandas as pd
# import matplotlib.pyplot as plt
#
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
#
# fig, ax = plt.subplots(2, 2, figsize=(7, 7))
# sns.set(style='white', palette='muted')
# sns.violinplot(x=df['class'], y=df['sepal length'], ax=ax[0,0])
# sns.violinplot(x=df['class'], y=df['sepal width'], ax=ax[0,1])
# sns.violinplot(x=df['class'], y=df['petal length'], ax=ax[1,0])
# sns.violinplot(x=df['class'], y=df['petal width'], ax=ax[1,1])
# fig.suptitle('Violin Plots', fontsize=16, y=1.03)
#
# for i in ax.flat:
#     plt.setp(i.get_xticklabels(), rotation=-90)
# fig.tight_layout()
#
# plt.show()"""使用Statsmodels 绘制散点图以及寻找散点图的关系公式并绘制回归曲线 """# import pandas as pd
# import matplotlib.pyplot as plt
# import statsmodels.api as sm
#
# PATH = r'E:\python_data\iris'
# df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])
#
# fig, ax = plt.subplots(figsize=(7, 7))
# ax.scatter(df['sepal width'][:50], df['sepal length'][:50])
# ax.set_ylabel('Sepal Length')
# ax.set_xlabel('Sepal Width')
# ax.set_title('Setosa Sepal Width vs. Sepal Length', fontsize=14, y=1.02)
#
# # plt.show()
#
# y = df['sepal length'][:50]
# x = df['sepal width'][:50]
# X = sm.add_constant(x)
#
# results = sm.OLS(y, X).fit()
#
# print(results.summary())
#
# fig, ax = plt.subplots(figsize=(7,7))
# ax.plot(x, results.fittedvalues, label='regression line')
# ax.scatter(x, y, label='data point', color='r')
# ax.set_ylabel('Sepal Length')
# ax.set_xlabel('Sepal Width')
# ax.set_title('Setosa Sepal Width vs. Sepal Length', fontsize=14, y=1.02)
# ax.legend(loc=2)
#
# plt.show()"""使用 scikit-learn 库实现识别  """import pandas as pd
import matplotlib.pyplot as pltfrom sklearn.ensemble import RandomForestClassifier
# from sklearn.cross_validation import train_test_split
from sklearn.model_selection import train_test_splitPATH = r'E:\python_data\iris'
df = pd.read_csv(PATH + 'iris.data', names=['sepal length', 'sepal width','petal length', 'petal width', 'class'])clf = RandomForestClassifier(max_depth=5, n_estimators=10)
X = df.iloc[:, :4]
y = df.iloc[:, 4]print(X)
print()
print(y)X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
rf = pd.DataFrame(list(zip(y_pred, y_test)), columns=['predicted', 'actual'])
rf['correct'] = rf.apply(lambda r: 1 if r['predicted'] == r['actual'] else 0, axis=1)# print(rf)
print(rf['correct'].sum()/rf['correct'].count())

第二章: import.io  抓取房源数据失败,尝试使用 八爪鱼 来抓取房源数据,但是免费版本的软件抓数据的能力实在太差 因此本章节没有完成代码实现功能。

读 python 机器学习实践指南相关推荐

  1. Python机器学习实践指南pdf (中文版带书签)、原书代码、数据集

    Python机器学习实践指南 目 录  第1章Python机器学习的生态系统 1  1.1 数据科学/机器学习的工作  流程 2  1.1.1 获取 2  1.1.2 检查和探索 2  1.1.3 清 ...

  2. 免费教材丨第55期:Python机器学习实践指南、Tensorflow 实战Google深度学习框架

    小编说  时间过的好快啊,小伙伴们是不是都快进入寒假啦?但是学习可不要落下哦!  本期教材  本期为大家发放的教材为:<Python机器学习实践指南>.<Tensorflow 实战G ...

  3. python实践pdf在线阅读_Python机器学习实践指南 PDF高清完整版

    Python机器学习实践指南 PDF高清完整版 作者: 库姆斯 (Alexander T.Combs) 出品方: 异步社区 原作名: Python Machine Learning Blueprint ...

  4. python tableau_Tableau集成Python机器学习实践(下)

    原标题:Tableau集成Python机器学习实践(下) 本系列分上.中.下三部分,本文为第三部分,关注微信公众号可获取完整内容. Tableau报表创建 数据准备 我们还是引用iris数据集的csv ...

  5. 机器学习实践指南:案例应用解析(第二版)

    试读及购买链接 机器学习实践指南2版代码及资源(原书中的360网盘链接因为360关闭网盘的原因已经失效) 1.https://pan.baidu.com/s/1nw37A5N   2.http://w ...

  6. 【Python机器学习时间指南】一、Python机器学习的生态系统

    本文主要记录<Python机器学习时间指南>第一章中1.2Python库和功能中的内容.学习机器学习的工作流程. 一.数据的获取和检查 requests获取数据 pandans处理数据 1 ...

  7. python最佳实践指南试题_8.1. 关于这份指南

    与 Tcl.Perl.Ruby.Scheme 以及 Java 类似,Python 是一门用途广泛的高级编程语言.它的一些关键特性有: 语法清晰.可读性极佳 Python 的设计哲学着眼于可读性,它以缩 ...

  8. 硅谷python_来自硅谷的Python最佳实践指南 | 极客时间

    这几年,学 Python 的程序员的确越来越多了,甚至不少人把 Python 当作第一语言来学习.也难怪,Python 的优点太多了,它语言简洁.开发效率高.可移植性强,并且可以和其他编程语言(比如 ...

  9. python机器学习实践和kaggle实践

    https://mlnote.wordpress.com/2015/12/16/python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%AE%9E%E8%B7%B5 ...

最新文章

  1. poj2724(二分图匹配)
  2. 5G前夜 运营商如何实现网络创新?
  3. C++ 并行与分布式编程 chapter5 任务间并发的同步(2)
  4. PHP 笔记——操作MySQL数据库
  5. Quartus II13.1安装教程
  6. arduino 嗡鸣器 音乐_[求助]怎样实现红外遥控蜂鸣器播放音乐,求大神指正
  7. Asp.net 视频摘要
  8. linux 别名,Linux中的别名就这么简单,如何使用和创建永久别名?
  9. 你单身,其实是个科学问题……
  10. 算法笔记_056:蓝桥杯练习 未名湖边的烦恼(Java)
  11. 【NOI2016】网格,离散化+求割点
  12. mysql 排序后在查询
  13. python os模块下载_python os模块
  14. 封装Js事件代理方法
  15. mysql分组取每组前几条记录_[转] mysql分组取每组前几条记要(排名)
  16. 拓端tecdat|R语言中回归模型预测的不同类型置信区间应用比较分析
  17. 酷酷跑真有java游戏吗_JAVA版光影分享【仅此一次】下
  18. Gradle下载的地址
  19. webrtc中GCC拥塞控制模块之码率控制器AimdRateControl
  20. matlab高斯正反算程序6,基于matlab的高斯投影正反算与相邻带坐标换算程序设计...

热门文章

  1. 植物神经紊乱、焦虑症和抑郁症之间有哪些区别呢?
  2. 即刻App产品分析报告
  3. 你有多久没有收到圣诞节的祝福了,你收到那个女孩(男孩)的祝福了吗?
  4. 泰坦尼克号数据的分析研究
  5. 【网易有数】BI数据分析工具一
  6. 房屋安全鉴定的建筑结构检测技术
  7. 真正的朋友与普通的朋友的区别 (转)
  8. 直播带货这么火,如何在小程序中实现视频通话及直播互动功能?
  9. 如何开启全新旅途,实现旅游市场活力复苏
  10. 【中途相遇法】【STL】BAPC2014 K Key to Knowledge (Codeforces GYM 100526)