scikit-learn——快速入门

sklearn 快速入门

环境:

  • ubuntu 12.04, 64 bits
  • python 2.7
  • sklearn 0.14

好几个月没有发博客了,平时的笔记都随意记在印象笔记中。现在闲着有空,把 sklearn 的基本模型学一学。实际上 scikit-learn 的学习材料非常非常齐全,建议英文好的同学直接看官方文档。

准备

sklearn 快速入门的官方文档在这里。这个文档主要描述机器学习的概念,以及如何加载数据训练模型保存模型

这里提供另外一个更加详细的材料,这份材料基于ipython notebook,可以在浏览器里运行代码,功能强大,演示效果非常好,github下载地址。如果电脑上没有安装git,请参考这篇博客进行设置。

  • 将材料下载到本地:

    git clone git@github.com:jakevdp/sklearn_pycon2013.git
    
  • 安装 ipython-notebook
    sudo easy_install "ipython>=0.13" jinja2 "tornado>=3.1.0" pyzmq
    sudo apt-get install ipython-notebook
    
  • 打开材料
    cd PATH/TO/sklearn_pycon2013/notebook
    ipython notebook --pylab inline
    

    --pylab inline 参数可以使 notebook 在浏览器里面直接画图效果

数据

sklearn 中的数据一般存放为二维数组,形状为 [n_samples, n_feartures]。比如著名的 iris 数据集(鸢尾花)包含了三种类别的花(target),共 150 组数据(samples),每组数据由 4 个特征组成,具体来说就是:萼片的长度、萼片的宽度、花瓣的长度、花瓣的宽度。那么,iris 数据集的 data 就由 150*4 的二维数组组成。

sklearn 提供了很多数据集,一类比较小,直接打包在库中,可以通过 datasets.load_ + Tab 来查看,另一类比较大,需要下载,可以通过 datasets.fetch_ + Tab 查看,下载的目录可以通过sklearn.datasets.get_data_home()查看。

更详细的信息请参考 notebook 中的 02_sklearn_data.ipynb 文件。

接口

创建一个机器学习的模型很简单:

from sklearn.linear_model import LinearRegression
model = LinearRegression()
print model

所有模型提供的接口有:

  • model.fit(): 实际上就是训练,对于监督模型来说是 fit(X, y),对于非监督模型是 fit(X)。

监督模型提供:

  • model.predict(X_new): 判别新样本
  • model.predict_proba(X_new): 某些模型可以输出概率,比如 LR,上一个输出的就是概率最大的 target
  • model.score(): 得分越高,fit 越好

非监督模型提供:

  • model.transform(): 从数据中学到新的“基空间”。
  • model.fit_transform(): 从数据中学到新的基并将这个数据按照这组“基”进行转换。

下面这个图展示了这些接口在机器学习模型中的位置:

更多信息请查看 ipython notebook 文档中的内容。

转载于:https://www.cnblogs.com/daniel-D/p/3700830.html

scikit-learn——快速入门相关推荐

  1. TensorFlow-4: tf.contrib.learn 快速入门

    学习资料: https://www.tensorflow.org/get_started/tflearn 相应的中文翻译: http://studyai.site/2017/03/05/%E3%80% ...

  2. 【tools】Latex菜鸟快速入门教程(基于overleaf平台:Learn LaTeX in 30 minutes)

    [tools]Latex菜鸟快速入门教程(基于overleaf平台) 注册登录overleaf LaTeX入门教程 1.First start 2.序言Preamble 3.添加标题.作者和日期 4. ...

  3. BERT模型超酷炫,上手又太难?请查收这份BERT快速入门指南!

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自 | GitHub    作者 | Jay Alammar 转自 | 机器之心 如 ...

  4. BERT模型超酷炫,上手又太难?请查收这份BERT快速入门指南

    2019-12-31 10:50:59 选自GitHub 作者:Jay Alammar 参与:王子嘉.Geek AI 如果你是一名自然语言处理从业者,那你一定听说过最近大火的 BERT 模型.本文是一 ...

  5. 图文并茂!60页PPT《快速入门python数据分析路线》(附链接)

    一个月不走弯路快速入门学python和python数据分析路线,呕心沥血加班加点做了2天,一共63页,该课件讲的都是路线中的核心知识,今天把该PPT分享给大家,能根据该课件提到的知识有针对性的学,做到 ...

  6. git 上传项目到linux仓库_「成都校区」Git使用快速入门

    Git使用快速入门 1.在Linux上安装Git 输入git命令,查询是否安装了git (1)如果是Debian或Ubuntu Linux系统,使用如下命令进行安装: apt-get install ...

  7. python快速编程入门教程-半小时带你快速入门Python编程,Python快速入门教程

    1,Introduction to Python (Python入门) 2,Python是什么? Python 官方网站的描述 Python is a programming language tha ...

  8. python怎么样才算入门编程-新手如何快速入门Python编程?听过来人说经验!

    新手如何快速入门Python编程?站在别人的肩膀上总是要快些的,如果你不借鉴前人的经验,那么前人踩过的坑你也会踩,所以来看看吧: Python是一种编程语言,可以用来做网站.写自动化测试脚本.做数据分 ...

  9. ADO.NET Entity Framework Beta2(五)/快速入门(实体框架)

    This quickstart illustrates a series of tasks that support the topics in Getting Started with the En ...

  10. 带你少走弯路:强烈推荐的Keras快速入门资料和翻译(可下载)

    上次写了TensorFlow和PyTorch的快速入门资料,受到很多好评,读者强烈建议我再出一个keras的快速入门路线,经过翻译和搜索网上资源,我推荐4份入门资料,希望对大家有所帮助. 备注:另外两 ...

最新文章

  1. 怒肝两个月MySQL源码,我总结出这篇2W字的MySQL协议详解(超硬核干货)!!
  2. 【每周CV论文推荐】 初学高效率CNN模型设计应该读的文章
  3. 磁盘显示RAW要如何办啊
  4. 裴蜀定理(note)
  5. 程序2:word count
  6. Spring Cloud构建微服务架构:分布式配置中心【Dalston版】
  7. 提交文件至服务器的设置——表单属性中的 enctype
  8. 8月20日全球六大国际域名解析量变化情况统计报告
  9. 苹果手机其他占内存很大去哪删除_Iphone内存总是不够用?原来这才是正确清理垃圾的方法,长见识了...
  10. Win 2008 r2 安装SSH服务器
  11. 用三方做的豆瓣电影页面
  12. 算法导论第三版 17.1-2习题答案
  13. 易语言卷帘菜单与json_易语言卷帘式菜单组件使用教程
  14. Office 针式打印机如何插入色带
  15. flash模拟器调全屏_模拟全屏或调暗背景
  16. 厦门理工学院OJ题解(1223:Rite与跳舞毯)
  17. 以太坊geth节点同步亲测经历
  18. canvas练习笔记之手绘熊本熊
  19. 记一次小白调参baseline——NLP中文预训练模型泛化能力比赛
  20. 前端页面 原生php+H5 视频播放一 专辑列表页(专辑页list)

热门文章

  1. Android:adb进程问题
  2. 安卓mqtt调试工具_MOTT工具调试阿里云物联网平台
  3. qt程序部署在linux,Qt应用打包发布,部署真正的Qt程序LinuxWindows-Go语言中文社区...
  4. Zookeeper常用命令详解(Zookeeper3.6)
  5. 当下,所有工程师都要具备技术变现思考和能力【赢在CSDN】
  6. 随输入动态改变ui_深入详解 Jetpack Compose | 优化 UI 构建
  7. linux找数组规矩,linux shell 数组建立及使用技巧(示例代码)
  8. python下俄罗斯方块的游戏设计_[源码和文档分享]基于Python的PyGame的俄罗斯方块游戏设计与实现...
  9. jedis mysql 数据结构_Redis的数据结构和内部编码
  10. mysql varchar json_谈谈 MySQL 的 JSON 数据类型