kaggle地址

数据预览

首先载入数据集

import pandas as pd
import numpy as nptrain = pd.read_csv('/Users/frank/Documents/workspace/kaggle/dataset/digit_recognizer/train.csv')
test = pd.read_csv('/Users/frank/Documents/workspace/kaggle/dataset/digit_recognizer/test.csv')
print train.head()
print test.head()
   label  pixel0  pixel1  pixel2  pixel3  pixel4  pixel5  pixel6  pixel7  \
0      1       0       0       0       0       0       0       0       0
1      0       0       0       0       0       0       0       0       0
2      1       0       0       0       0       0       0       0       0
3      4       0       0       0       0       0       0       0       0
4      0       0       0       0       0       0       0       0       0   pixel8    ...     pixel774  pixel775  pixel776  pixel777  pixel778  \
0       0    ...            0         0         0         0         0
1       0    ...            0         0         0         0         0
2       0    ...            0         0         0         0         0
3       0    ...            0         0         0         0         0
4       0    ...            0         0         0         0         0   pixel779  pixel780  pixel781  pixel782  pixel783
0         0         0         0         0         0
1         0         0         0         0         0
2         0         0         0         0         0
3         0         0         0         0         0
4         0         0         0         0         0  [5 rows x 785 columns]pixel0  pixel1  pixel2  pixel3  pixel4  pixel5  pixel6  pixel7  pixel8  \
0       0       0       0       0       0       0       0       0       0
1       0       0       0       0       0       0       0       0       0
2       0       0       0       0       0       0       0       0       0
3       0       0       0       0       0       0       0       0       0
4       0       0       0       0       0       0       0       0       0   pixel9    ...     pixel774  pixel775  pixel776  pixel777  pixel778  \
0       0    ...            0         0         0         0         0
1       0    ...            0         0         0         0         0
2       0    ...            0         0         0         0         0
3       0    ...            0         0         0         0         0
4       0    ...            0         0         0         0         0   pixel779  pixel780  pixel781  pixel782  pixel783
0         0         0         0         0         0
1         0         0         0         0         0
2         0         0         0         0         0
3         0         0         0         0         0
4         0         0         0         0         0  [5 rows x 784 columns]

分离训练数据和标签:

train_data = train.values[:,1:]
label = train.ix[:,0]
test_data = test.values

使用PCA来降维:PCA文档
使用SVM来训练:SVM文档

降维

from sklearn.decomposition import PCA
from sklearn.svm import SVC
pca = PCA(n_components=0.8, whiten=True)
# pca.fit(train_data)
train_data = pca.fit_transform(train_data)
# pca.fit(test_data)
test_data = pca.transform(test_data)

SVM训练

print('使用SVM进行训练...')
svc = SVC(kernel='rbf',C=2)
svc.fit(train_data, label)
print('训练结束.')
使用SVM进行训练...
训练结束.
print('对测试集进行预测...')
predict = svc.predict(test_data)
print('预测结束.')
对测试集进行预测...
预测结束.

保存结果:

pd.DataFrame({"ImageId": range(1, len(predict) + 1), "Label": predict}
).to_csv('output.csv', index=False, header=True)print 'done.'
done.

转载于:https://www.cnblogs.com/lijingpeng/p/5787569.html

kaggle之手写体识别相关推荐

  1. MNIST | 基于k-means和KNN的0-9数字手写体识别

    MNIST | 基于k-means和KNN的0-9数字手写体识别 1 背景说明 2 算法原理 3 代码实现 3.1 文件目录 3.2 核心代码 4 实验与结果分析 5 后记 概要: 本实验是在实验&q ...

  2. MNIST | 基于朴素贝叶斯分类器的0-9数字手写体识别

    MNIST | 基于朴素贝叶斯分类器的0-9数字手写体识别 1 背景说明 2 关于数据集 2.1 什么是MNIST 2.2 数据集处理 3 代码实现 3.1 文件目录 3.2 核心代码 3.3 注意点 ...

  3. pytorch实现kaggle猫狗识别(超详细)

    kaggle是一个为开发商和数据科学家提供举办机器学习竞赛.托管数据库.编写和分享代码的平台,在这上面有非常多的好项目.好资源可供机器学习.深度学习爱好者学习之用.碰巧最近入门了一门非常的深度学习框架 ...

  4. libsvm Minist Hog 手写体识别

    统计手写数字集的HOG特征 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ 这篇文章是模式识别的小作业,利用sv ...

  5. python模拟手写笔迹_pytorch实现MNIST手写体识别

    本文实例为大家分享了pytorch实现MNIST手写体识别的具体代码,供大家参考,具体内容如下 实验环境 pytorch 1.4 Windows 10 python 3.7 cuda 10.1(我笔记 ...

  6. TensorRT(3)-C++ API使用:mnist手写体识别

    本节将介绍如何使用tensorRT C++ API 进行网络模型创建. 1 使用C++ API 进行 tensorRT 模型创建 还是通过 tensorRT官方给的一个例程来学习. 还是mnist手写 ...

  7. TensorRT(2)-基本使用:mnist手写体识别

    结合 tensorRT官方给出的一个例程,介绍tensorRT的使用. 这个例程是mnist手写体识别.例程位于目录: /usr/src/tensorrt/samples/sampleMNIST 文件 ...

  8. 基于感知机的手写体识别

    对于手写体的识别,我采用的是keras来实现的,首先搭建一个单层感知机的模型来训练,来观察其模型的预测效果. 学习步骤如下: 源码: from keras.datasets import mnist ...

  9. Python3实现简单可学习的手写体识别

    0.目录 1.前言 2.通过pymssql与数据库的交互 3.通过pyqt与界面的交互 4.UI与数据库的交互 5.最后的main主函数 1.前言 版本:Python3.6.1 + PyQt5 + S ...

  10. [深度学习-实践]BP神经网络的Helloworld(手写体识别和Fashion_mnist)

    前言 原理部分请看这里 [深度学习-原理]BP神经网络 Tensorflow2 实现一个简单的识别衣服的例子 数据集Fashion_mnist, 此数据集包含10类型的衣服 ('T-shirt/top ...

最新文章

  1. 重磅丨2018年人工智能标准化白皮书
  2. 用 PS 调整服务器时间
  3. Spring.net学习记录
  4. css媒体查询(手机、平板、PC)
  5. s3c2410多通道adc驱动及测试程序
  6. JAVA并发编程的挑战
  7. 被马云、周鸿祎、李书福等人拉黑的微信,究竟犯了哪些众怒?
  8. mysql创建有参数的函数,7-3:MySQL 创建不带参数的自定义函数
  9. opencv c++讲解jzg mxy tyd_python看代码就行
  10. QTTabBar——Windows多功能标签软件
  11. Bus Hound 软件实现长时间数据自动保存
  12. power BI电商案例分析
  13. 高德AR驾车导航解决方案
  14. select函数用法
  15. 【ipad 作为 mac 分屏分辨率调整 | sidercar 分辨率调整】
  16. 总结今年一些公司的待遇
  17. matlab 符号表达式正负,如何在Matlab上为符号表达式编写`lhs()`或`rhs()`函数
  18. python编程剪刀石头布思路_Python制作简单的剪刀石头布游戏
  19. 判断当前终端是移动端还是PC端
  20. 服务器Apache配置以及改变工作目录

热门文章

  1. 腾讯云分布式高可靠消息队列CMQ架构最佳实践
  2. 坑系列 --- 重构过程中的过度设计
  3. 解读龙哥的书:用户是什么?
  4. 从甲骨文中国裁员说起
  5. 带大家一起感受美国两日游
  6. linux usb摄像头 监控软件,Linux下的motion detection(最简单的办公室监控系统)
  7. 串口与定时器的重要关系_单片机串口必备基础知识
  8. 代码平台Github半年发布125项更新,私库无限免费开启(附步骤)
  9. centos操作---搭建环境 安装python
  10. 2.泡妞与设计模式(三) 外观模式