2019/12/23

  • 对于机器学习,我们选择了Python

原因就是巴拉巴拉的一大堆。Python 已经成为许多数据科学应用的通用语言。它既有通用编程语言的强大功能,也有特 定领域脚本语言(比如 MATLAB 或 R)的易用性。Python 有用于数据加载、可视化、统 计、自然语言处理、图像处理等各种功能的库。


  • 然后我们要了解一个东西——scikit-learn。

scikit-learn 是一个开源项目,包含许多目前最先进的机器学习算法,每个算法都有详细的文档。建议浏览 scikit-learn 用户指南。

了解 scikit-learn 及其用法是很重要的,scikit-learn 是基于NumPy 和 SciPy 科学计算库的。如果不熟悉 NumPy 和 SciPy 科学计算库,推荐阅读SciPy 讲稿。

什么是NumPy?——创建和处理数值数据

什么是Matplotlib?——绘图 ( 参考博客1 、参考博客2、参考博文3都是一些参数什么含义,在官方文档中没搞懂)

####下面是一些简单的绘图设置import numpy as np
import matplotlib.pyplot as plt# Create a figure of size 8x6 inches, 80 dots per inch
#创建一个大小8*6英寸,每英寸80个点的图形
plt.figure(figsize=(8, 6), dpi=80)# Create a new subplot from a grid of 1x1
#创建一个1*1网格的新图形窗口
plt.subplot(1, 1, 1)X = np.linspace(-np.pi, np.pi, 256, endpoint=True)
C, S = np.cos(X), np.sin(X)# Plot cosine with a blue continuous line of width 1 (pixels)
#绘制余弦,其连续线宽为1(像素),颜色为蓝色。
plt.plot(X, C, color="blue", linewidth=1.0, linestyle="-")# Plot sine with a green continuous line of width 1 (pixels)
#绘制正弦,其连续线宽为1(像素),颜色为绿色。
plt.plot(X, S, color="green", linewidth=1.0, linestyle="-")# Set x limits
#设置x轴范围
plt.xlim(-4.0, 4.0)# Set x ticks
#设置x轴刻度
plt.xticks(np.linspace(-4, 4, 9, endpoint=True))# Set y limits
#设置y轴范围
plt.ylim(-1.0, 1.0)# Set y ticks
#设置y轴刻度
plt.yticks(np.linspace(-1, 1, 5, endpoint=True))# Save figure using 72 dots per inch
#保存一个每英寸72个像素点的图像
plt.savefig("exercise_2.png", dpi=72)# Show result on screen
#在屏幕上显示结果图
plt.show()

关于scipy?——高级科学计算

File input/output: scipy.io

Special functions: scipy.special

Linear algebra operations: scipy.linalg

Interpolation: scipy.interpolate

Optimization and fit: scipy.optimize

Statistics and random numbers: scipy.stats

Numerical integration: scipy.integrate

Fast Fourier transforms: scipy.fftpack

Signal processing: scipy.signal

Image manipulation: scipy.ndimage


  • 简要了解一下Jupyter Notebook

使用过pycharm,也用过VS,后来换电脑懒的下载一堆软件,下载Anaconda之后就直接用它自带的Spyder。因为总感觉在网页中打开Jupyter Notebook,单纯的不太习惯不是客户端的感觉。但是本书推荐使用Jupyter Notebook。便于测试用例。

接下来学习本书中第一个应用。


2019/12/25

  • 第一个应用:鸢尾花分类

看了两天上面提到的python库,简单的了解了一下,接着通过k近邻算法实现鸢尾花分类。

from sklearn.datasets import load_iris
iris_dataset = load_iris()
# print("Keys of iris_dataset:\n{}".format(iris_dataset.keys()))from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(
iris_dataset['data'],iris_dataset['target'],random_state=0)
#print("X_train shape: {}".format(X_train.shape))
#print("y_train shape: {}".format(y_train.shape))import numpy as np
import pandas as pd
# 利用X_train中的数据创建DataFrame
# 利用iris_dataset.feature_names中的字符串对数据列进行标记
#iris_dataframe = pd.DataFrame(X_train, columns=iris_dataset.feature_names)
# 利用DataFrame创建散点图矩阵,按y_train着色
#grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15, 15), marker='o', # hist_kwds={'bins': 20}, s=60, alpha=.8)from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=1)
knn.fit(X_train,y_train)###做出预测###X_new = np.array([[5,2.9,1,0.2]])
#print(X_new.shape)
#print("X_new.shape:{}".format(X_new.shape))prediction = knn.predict(X_new)
#print("Prediction:{}".format(prediction))
#print("Predicted target name:{}".format(#iris_dataset['target_names'][prediction]))###评估模型####estimate#y_pred = knn.predict(X_test)
#print("Test set predictions:\n{}".format(y_pred))#print("Test set score:{:.2f}".format(np.mean(y_pred == y_test)))
print("Test set score:{:.2f}".format(knn.score(X_test,y_test)))

Note : python机器学习笔记(一)相关推荐

  1. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

  2. Python机器学习笔记:异常点检测算法——Isolation Forest

    Python机器学习笔记:异常点检测算法--Isolation Forest 参考文章: (1)Python机器学习笔记:异常点检测算法--Isolation Forest (2)https://ww ...

  3. Python机器学习笔记 使用scikit-learn工具进行PCA降维...

    Python机器学习笔记 使用scikit-learn工具进行PCA降维 之前总结过关于PCA的知识:深入学习主成分分析(PCA)算法原理.这里打算再写一篇笔记,总结一下如何使用scikit-lear ...

  4. Python机器学习笔记 使用scikit-learn工具进行PCA降维

    Python机器学习笔记 使用scikit-learn工具进行PCA降维 之前总结过关于PCA的知识:深入学习主成分分析(PCA)算法原理.这里打算再写一篇笔记,总结一下如何使用scikit-lear ...

  5. Python机器学习笔记:使用Keras进行回归预测

    Keras是一个深度学习库,包含高效的数字库Theano和TensorFlow.是一个高度模块化的神经网络库,支持CPU和GPU. 本文学习的目的是学习如何加载CSV文件并使其可供Keras使用,如何 ...

  6. 基于sklearn进行蝴蝶花分类案例(Python机器学习笔记)

    本文背景   原有在网易云课堂学习课程Python机器学习简介,只不过好久没看.现想回顾一下,巩固所学内容. 数据集简介   Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理. ...

  7. Python机器学习笔记:深入理解Keras中序贯模型和函数模型

     先从sklearn说起吧,如果学习了sklearn的话,那么学习Keras相对来说比较容易.为什么这样说呢? 我们首先比较一下sklearn的机器学习大致使用流程和Keras的大致使用流程: skl ...

  8. python网格搜索核函数_(转载)Python机器学习笔记GridSearchCV(网格搜索)

    转载声明 介绍 在机器学习模型中,需要人工选择的参数称为超参数.比如随机森林中决策树的个数,人工神经网络模型中隐藏层层数和每层的节点个数,正则项中常数大小等等,他们都需要事先指定.超参数选择不恰当,就 ...

  9. FlyAI小课堂:python机器学习笔记:深入学习决策树算法原理

    分类技术(或分类法)是一种根据输入数据建立分类模型的系统方法,分类法的例子包括决策分类法,基于规则的分类法,神经网络,支持向量机和朴素贝叶斯分类法.这些技术都使用一种学习算法(learning alg ...

最新文章

  1. SSD: Signle Shot Detector 用于自然场景文字检测
  2. 我终将失去了你,我的MSN君
  3. JavaSE基础笔记十二
  4. 【elasticsearch】ES启动报错 uncaught exception in thread [main]org.elasticsearch.bootstrap.Startup
  5. 12个写论文必备的神经网络可视化工具
  6. 【实践】多场景下的搜索词推荐算法及在腾讯的应用实践.pdf(附下载链接)
  7. github博客安装jekyll的RUBY更换源
  8. java过滤html相关标签
  9. 最全面计算机英语单词列表(一)
  10. C语言在当代人工智能背景下的作用,人工智能c语言新手入门
  11. JUCE框架教程(8)——DSP Module基础
  12. Mac中微信文件的存储路径
  13. HTML5期末考核大作业:华为官网 ( 2页带轮播图)
  14. 100%概率与任意好友获取QQ幸运字符的方法
  15. Java中的日期与时间
  16. 内网渗透测试:内网横向移动基础总结
  17. mysql金额分隔符_mysql分隔符
  18. windows7、windows10 桌面快捷方式左下角有一个白色方块
  19. Day10_07目标:对象序列化技术
  20. 裁员潮未完,网传甲骨文将关闭中国研发中心,裁员1000+人,赔偿方案N+6?

热门文章

  1. 草图大师2023(SketchUp Pro 2023)win/mac中文特别版
  2. 鸿蒙珠融入体内,斗罗大陆同人小说排行榜。第一名:《斗罗大陆之超级无敌》:主角...
  3. 惠普HP LaserJet Pro M329dw 打印机驱动
  4. SuperMap云许可模块介绍
  5. HX=JE,HX-JE芯片无感升压ic
  6. 尖端科学技术视频片头LOGO动画PR模板MOGRT
  7. amd处理器更新zen4服务器芯片,5nm Zen4在手 AMD夺回25%的服务器CPU市场
  8. Redis 设计与实现重点回顾
  9. PHP 安全:过滤、验证和转义
  10. 执行还原操作_【操作技巧】SQL2014数据库存储路径的修改方法