整理 | Jane

出品 | AI科技大本营

之前一直预告 Scikit-learn 的新版本会在 9 月发布,在马上就要结束的 9 月,我们终于迎来了 Scikit-learn  0.20。

此版本修复了大量的错误和功能,增强了 Scikit-learn 库,改善了文档和示例。在此对 Scikit-learn 的贡献者表示感谢!

新版本已经上线,小伙伴们是不是已经迫不及待想去试试了,在此之前,营长要特别提醒大家:Scikit-learn 0.20 是支持 Python 2.7 和 Python 3.4 的最后一个版本,从 Scikit-learn 0.21 开始,就只支持 Python 3.5 及更高版本的 Python。

Scikit-learn 作为基于 Python 语言的机器学习工具,一直备受关注。它是简单高效的数据挖掘与分析工具,建立在 Numpy、SciPy 和 Matplotlib 上,亦可在多种环境中重复使用,更重要的是 Scikit-learn 是开源的。

下面我们就来一起看一下新版本有哪些值得大家关注的亮点:

1.增加对数据科学用例的支持;如缺失值、类别变量、异类数据及分布异常的特征/目标。之前由 NaNs 表示的特征缺失值,现在被按列预处理(如scalers)接受。每个特征都无需考虑缺失值,包含缺失值的数据也可以被转换。尽管缺少数据,新模块 impute 为学习提供了估算器。

2.ColumnTransformer 处理 Pandas 中不同特征或不同列的情况。DataFrame 需要不同的预处理。字符串或 Pandas 的 类别数据列都可以用 OneHotEncoder 或 OrdinalEncoder 进行编码。

3.TransformedTargetRegressor 可以帮助把回归目标转换为模型。PowerTransformer 和 KBinsDiscretizer 将加入 quantileTransformer 作为 非线性变换。

4.除此之外,还为几个估计器(KMeans、Bayesian ridge 和 KernelDensity)增加了支持样本权重的功能,并且改进了估计器( MLPRegressor, GradientBoostingRegressor 和 SGDRegressor)的停止标准。

5.伴随此版本还首次公开发布了由 Joel Nothman 开发的通用术语和 API 列表( Glossary of Common Terms and API Elements),旨在帮助用户和贡献者更熟悉 Scikit-learn 中的术语和资源。

除了这些亮点外,还修复了很多 models 和 bug,大家可以自行查看 Scikit-learn 0.20 更新说明。

Scikit-learn 0.20 新版本说明:

http://scikit-learn.org/dev/whats_new.html#version-0-20

核心术语表:

http://scikit-learn.org/dev/glossary.html#glossary

Scikit-learn 中文版本(还未更新至 0.20)

http://sklearn.apachecn.org/cn/0.19.0/

好啦~到这里大家就准备去更新你的 Scikit-learn 吧!在发布新版本之前我们就给大家预告过一个教程(Scikit-learn 中 合并 Pandas 后的新教程),这次大家可以在新版本中直接试验一下,有问题我们下面评论区再聊~

2018 AI开发者大会

拒绝空谈,技术争鸣

2018 AI开发者大会(AI NEXTCon)由中国IT社区CSDN与硅谷AI社区AICamp联合出品的AI技术与产业年度盛会。多年经验淬炼,如今蓄势待发:将有近百位中美顶尖AI专家、知名企业代表以及千余名AI开发者齐聚北京,进行技术解读和产业论证。我们只讲技术,拒绝空谈,诚挚邀请AI业内人士一起共铸人工智能新篇章!

2018 AI开发者大会首轮重磅嘉宾及深度议题现已火热出炉,扫码抢“鲜”看。国庆特惠,购票立享 折优惠!


Scikit-learn 发布 0.20版本!新增处理缺失值、合并Pandas等亮点功能相关推荐

  1. vos2009 校验版本超时_开源多云应用平台 Choerodon猪齿鱼发布0.14版本

    Choerodon猪齿鱼是一个开源多云应用平台,基于Kubernetes的容器编排和管理能力,整合DevOps工具链.微服务和移动应用框架,来帮助企业实现敏捷化的应用交付和自动化的运营管理的开源平台, ...

  2. 开源多云应用平台 Choerodon猪齿鱼发布0.14版本

    Choerodon猪齿鱼鱼是一个开源多云应用平台,基于Kubernetes的容器编排和管理能力,整合DevOps工具链.微服务和移动应用框架,来帮助企业实现敏捷化的应用交付和自动化的运营管理的开源平台 ...

  3. 开源多云技术平台——Choerodon猪齿鱼发布0.16版本

    Choerodon猪齿鱼开源多云技术平台,是基于开源技术Kubernetes,Istio,knative,Gitlab,Spring Cloud来实现本地和云端环境的集成,实现企业多云/混合云应用环境 ...

  4. 简易影视小程序v1.0.1版本新增过审功能源码

    v1.0.1版本更新日志 1.增加激励广告 2.增加插屏广告 3.增加视频贴片广告 4.增加原生广告 5.独立tk框架后台,简易操作 6.增加小程序过审核功能,后台自定义审核页面 7.增加自定义多接口 ...

  5. 开源企业级数字化服务平台——Choerodon猪齿鱼发布0.11版本

    Choerodon猪齿鱼是一个开源企业服务平台,基于Kubernetes的容器编排和管理能力,整合DevOps工具链.微服务和移动应用框架,来帮助企业实现敏捷化的应用交付和自动化的运营管理的开源平台, ...

  6. ML.NET 发布0.11版本:.NET中的机器学习,为TensorFlow和ONNX添加了新功能

    微软发布了其最新版本的机器学习框架:ML.NET 0.11带来了新功能和突破性变化. 新版本的机器学习开源框架为TensorFlow和ONNX添加了新功能,但也包括一些重大变化, 这也是发布RC版本之 ...

  7. ML.NET 发布0.11版本:.NET中的机器学习,具有TensorFlow和ONNX的新功能

    微软发布了其最新版本的机器学习框架:ML.NET 0.11带来了新功能和突破性变化. ML.NET 0.11发布:.NET中的机器学习,具有TensorFlow和ONNX的新功能 ML.NET 0.1 ...

  8. 开源多云技术平台——Choerodon猪齿鱼发布0.19版本

    Choerodon猪齿鱼开源多云技术平台,是基于开源技术Kubernetes,Istio,knative,Gitlab,Spring Cloud来实现本地和云端环境的集成,实现企业多云/混合云应用环境 ...

  9. 简易影视小程序v1.0.1版本新增过审功能

    简易影视小程序v1.0.1版本新增过审功能 v1.0.1版本更新日志 1.增加激励广告 2.增加插屏广告 3.增加视频贴片广告 4.增加原生广告 5.独立tk框架后台,简易操作 6.增加小程序过审核功 ...

最新文章

  1. 大数据处理的关键架构
  2. Qt Dock Widgets 官方示例的翻译
  3. SQL Server 获取所有表和数据的批量操作
  4. P2911 [USACO08OCT]Bovine Bones G (python3实现)
  5. 3.3 超参数训练的实践:Pandas VS Caviar
  6. 接口测试(apipost、jmeter和python脚本)
  7. [转]为什么python标准库没有实现链表
  8. 维修小记:电脑更换不同型号主板时可能碰到的问题以及其解决方案
  9. 机械设计基础复习重点
  10. 二叉树的中序遍历算法
  11. 解决steamcommunity报错443/80端口被占用
  12. 云计算时代的技术架构与开发模式
  13. Rasa自定义NLU组件
  14. 2012年科技行业那些事:IT巨头加紧冲刺步伐
  15. linux系统下alsa设备,linux alsa配置
  16. YUV420视频上面添加字幕
  17. uva10005(Packing polygons)
  18. MySQL5.7 固态盘性能设置_MySQL 5.7 安装完成后,立即要调整的性能选项
  19. java 生产者消费者模式_聊聊并发(十)生产者消费者模式
  20. 神操作 之 Mac OS prompt_status:5:command not found:wc

热门文章

  1. windows mobile做一个摄象头预览程序
  2. ASP.NET 中的正则表达式
  3. 面向用户计算机,一款面向普通用户的防火墙软件,让你了解计算机到底产生了哪些网络流量?...
  4. linux socket完成端口,“完成端口”模型(IOCP)
  5. VSCode使用笔记
  6. 2018-3-22论文一种新型的智能算法--狼群算法(笔记三)算法的步骤+收敛性分析
  7. javascript实例
  8. Linq 等式运算符:SequenceEqual
  9. php 基于socket的基本通信
  10. python统计列表内元素个数