《scikit-learn》数据标准化与SVM之SVC

这一章节我们能学到SVC作为分类器的简单使用。

先来看看对数据进行标准化的方式
标准化的目的与归一化一样，都是为了避免某个特征的重要程度过大或过小。
标准化的优点：受异常点的影响较小。适用于繁杂大数据。

from sklearn.preprocessing import StandardScaler# 标准化处理
std = StandardScaler()
# （fit_transform()等同于fit()填充数据 + tansform()转换数据）(tansform转换器转换数据时所依赖的均值、标准差等取决于fit()填充的数据)
data = std.fit_transform([[2., -2., 6.], [4., 8., 3.], [7., 8., -2.]])
print(std.mean_)print(data)

下面我们看看使用SVC来对鸢尾花数据集进行分类训练。

import numpy as np
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import GridSearchCV, train_test_split
from sklearn.datasets import load_irisdef load_data(filename):iris = load_iris()print(iris.data[0:5])scaler = StandardScaler()  # 标准化的目的与归一化一样，都是为了避免某个特征的重要程度过大或过小。x_std = scaler.fit_transform(iris.data)  # 标准化print(scaler.mean_)  # 每列的平均值print(x_std[0:5])# 将数据划分为训练集和测试集，test_size=.3表示30%的测试集x_train, x_test, y_train, y_test = train_test_split(x_std, iris.target, test_size=0.3)return x_train, x_test, y_train, y_testdef svm_test(x_train, x_test, y_train, y_test):# rbf核函数，设置数据权重svc = SVC(kernel='rbf', class_weight='balanced', )  # 核函数是高斯核c_range = np.logspace(-5, 15, 11, base=2)gamma_range = np.logspace(-9, 3, 13, base=2)# 网格搜索交叉验证的参数范围，cv=3,3折交叉，C是在正则化参数的常量，param_grid = [{'kernel': ['rbf', 'linear'], 'C': c_range, 'gamma': gamma_range}]grid = GridSearchCV(svc, param_grid, cv=3, n_jobs=-1)# 训练模型print('开始训练...')grid.fit(x_train, y_train)# 计算测试集精度score = grid.score(x_test, y_test)print('精度为%s' % score)if __name__ == '__main__':svm_test(*load_data('example.csv'))

《scikit-learn》数据标准化与SVM之SVC相关推荐

python笔迹识别_python_基于Scikit learn库中KNN,SVM算法的笔迹识别
之前我们用自己写KNN算法[网址]识别了MNIST手写识别数据 [数据下载地址] 这里介绍,如何运用Scikit learn库中的KNN,SVM算法进行笔迹识别. 数据说明: 数据共有785列,第一列 ...
python数据标准化1002无标题,Scikit标准化互信息学习给我错误的值
我是Python新手,我试图看到两个不同信号之间的标准化互信息,不管我使用什么信号,我得到的结果总是1,我认为这是不可能的,因为信号是不同的,不是完全相关的. 我使用的是Normalized Mutu ...
Scikit Learn: 在python中机器学习
Warning 警告:有些没能理解的句子,我以自己的理解意译. 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Ga ...
[转载]Scikit Learn: 在python中机器学习
原址:http://my.oschina.net/u/175377/blog/84420 目录[-] Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码 ...
scikit - learn 做文本分类
文章来源: https://my.oschina.net/u/175377/blog/84420 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的句子,我以自 ...
python scikit learn 封装_python的scikit-learn的主要模块和基本使用
在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法. 加载数据(Data L ...
Sklearn——对数据标准化(Normalization)
文章目录 1.前言 2.数据标准化 3.对比标准化前后 3.1.数据标准化前 3.2.数据标准化后 1.前言由于数据的偏差与跨度会影响机器学习的成效,因此正规化(标准化)数据可以提升机器学习的成效 ...
【scikit-learn】如何用Python和SciKit Learn 0.18实现神经网络
本教程的代码和数据来自于 Springboard 的博客教程.本文的作者为 Jose Portilla,他是网络教育平台 Udemy 一门数据科学类课程的讲师. GitHub 链接:https://g ...
SVR，时间序列分析的评价指标，python数据标准化
知识点 SVR 参考支持向量机(SVM)是一种分类算法,但是也可以做回归,根据输入的数据不同可做不同的模型(若输入标签为连续值则做回归,若输入标签为分类值则用SVC做分类) 对于SVM算法,我们首先 ...

《scikit-learn》数据标准化与SVM之SVC

《scikit-learn》数据标准化与SVM之SVC相关推荐

最新文章

热门文章