搞机器学习的应该没有人不知道scikit-learn吧,这个在ML中使用非常频繁的库在昨天已经发布了它最新版本0.22了。

scikit-learn 0.22的发布,其中包含许多错误修复和新功能!我们在下面详细介绍此版本的一些主要功能。

要安装最新版本(使用pip):

pip install -U scikit-learn

使用conda

conda install scikit-learn

新增的绘图API

新的绘图API可用于创建可视化。这个新的API可以快速调整绘图的视觉效果,而无需进行任何重新计算。也可以在同一图形上添加不同的图。下面的例子说明plot_roc_curve,但其他地块事业的支持一样 plot_partial_dependenceplot_precision_recall_curveplot_confusion_matrix

堆叠分类和回归

StackingClassifierStackingRegressor 允许您使用一堆带有最终分类器或回归器的估算器。堆叠概括包括堆叠各个估算器的输出,并使用分类器来计算最终预测。堆叠允许通过将每个单独的估算器的输出用作最终估算器的输入来利用其强度。基本估计量完全拟合,X而最终估计量则使用进行交叉验证的基本估计量预测进行训练cross_val_predict。

输出:0.9473684210526315

基于排列(permutation)的特征重要性

inspection.permutation_importance可用于获取的每个特征的重要性,对于任何拟合估计的估计:

原生支持缺失值以进行梯度增强

ensemble.HistGradientBoostingClassifierensemble.HistGradientBoostingRegressor现在有遗漏值(NaN的)的原生支持。这意味着在训练或预测时无需插补数据。

输出:[0 0 1 1]

预先计算的稀疏最近邻居图

大多数基于最近邻图的估计量都接受预先计算的稀疏图作为输入,以将同一图重用于多个估计量拟合。要在管道中使用此功能,可以使用memory参数以及两个新转换器之一 neighbors.KNeighborsTransformerneighbors.RadiusNeighborsTransformer。预计算也可以由自定义估算器执行,以使用替代实现,例如近似最近邻方法。

基于KNN的插补

支持使用k最近邻来完成缺失值的估算。

每个样本的缺失值都是使用n_neighbors训练集中找到的最近邻的平均值估算的 。如果两个都不丢失的特征都关闭,则两个样本关闭。默认情况下,支持缺失值的欧几里得距离度量标准 nan_euclidean_distances用于查找最近的邻居。

输出:

树的剪枝

树建成后,现在可以修剪大多数基于树的估计量。修剪基于最小的成本复杂性。

输出:

Average number of nodes without pruning 22.3

Average number of nodes with pruning 6.4

从OpenML检索数据帧

datasets.fetch_openml 现在可以返回pd.DataFrame,从而正确处理具有异构数据的数据集:

输出:

检查估计器的scikit-learn兼容性

开发人员可以使用来检查其scikit-learn兼容估计器的兼容性check_estimator。例如,check_estimator(LinearSVC)通行证。

现在,我们提供了一个pytest特定的装饰器,该装饰器允许pytest 独立运行所有检查并报告失败的检查。

ROC AUC支持多类别分类

该roc_auc_score功能也可以用于多类分类。

当前支持两种平均策略:

“一对多”算法计算成对的ROC AUC分数的平均值,

“一对多休息”算法计算每个类别相对于所有其他类别的ROC AUC分数的平均值。

在这两种情况下,都根据模型根据样本属于特定类别的概率估计来计算多类ROC AUC分数。OvO和OvR算法支持统一加权(average='macro')和按流行度(average='weighted')进行加权。

输出:0.9957333333333332

喜欢使用scikit-learn的朋友赶快去试试它的新功能吧!

失败 安装scikit_scikit-learn0.22版本最新发布相关推荐

  1. Linux工作笔记037---Centos8.2下安装mysql_测试通过_注意这里安装8.0.22版本的_8.0以后的版本有需要注意的地方_跟7.0之前的版本不一样

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 注意如果有错误: 可以通过查看: /usr/local/mysql/data 中有个.err文件, ...

  2. uniapp如何实现最新发布apk版本检查和更新

    前言: 我们要实现的用户进入apk首页之后,将安卓本机的apk版本和最新的apk版本对比,如果有更高级别的版本(版本号迭代的时候要逐渐增加,比如:本地100版本号(v1.0.0),最新的是102版本号 ...

  3. Mac电脑下安装Vue-cli高版本失败(intel,系统版本Monterey12.6)

    分析原因是系统版本过高 解决方案 先在终端输入下面代码执行 sudo chown -R $(whoami) /usr/local/* 再输入下面代码执行即可 npm install -g @vue/c ...

  4. OpenStack 最新版本Queens发布 中国公司贡献率排名出炉

    文章来源:OpenStack中国 2月28日,OpenStack Queens版本正式发布,这也是OpenStack自诞生以来公布的第17个版本.根据OpenStack基金会披露,为满足边缘计算,HA ...

  5. 【优麒麟】22.04 LTS版本即将发布,终极预告来袭,你准备好了吗?

    优麒麟社区自 2012 年创立到现在,已走过 10 个年头,在这 10 年里,优麒麟社区一直在不断打磨自己的技术,希望给大家带来更好的使用体验.在这期间我们的技术成果也得到了国内外社区的认可. 终于在 ...

  6. 需要安装Directx9.0c以上版本和最新显卡驱动

    在进入虚拟机,并启动shaiya时,提示"需要安装Directx9.0c以上版本和最新显卡驱动". 网上搜索后,得知,需要执行   菜谱->虚拟机->安装vmware ...

  7. 野火串口调试助手Linux,野火串口调试助手 支持在线安装方式,永远保持最新版本 持常用的110-1152 联合开发网 - pudn.com...

    野火串口调试助手 所属分类:人工智能/神经网络/深度学习 开发工具:Java 文件大小:1036KB 下载次数:0 上传日期:2020-11-07 19:58:05 上 传 者:潮吧刘京 说明:  支 ...

  8. 苹果最新发布的系统12.4版本在XR机型有严重bug,升级后无法支持电信卡,移动正常信号弱,本人升级后又刷回到12.3.1了。

    苹果最新发布的系统12.4版本在XR机型有严重bug,升级后无法支持电信卡,移动正常信号弱,本人升级后又刷回到12.3.1了.

  9. 在此计算机上有其他用户正在运行corel,处理CorelDRAW安装失败提示“由于您已安装了另外一个版本...”的方法...

    Coreldraw是一款平面设计软件,大家在使用这款软件的时候经常会由于各种原因将其进行卸载,有的用户是为了进行更新版本,有的用户则是由于该软件出现无法修复的故障.但是在安装的时候经常会遇到下图所示的 ...

最新文章

  1. SAP_SD常用增强
  2. MySQL升级教程(CentOS)
  3. 用python画月亮的代码-用 Python 画一个超级月亮
  4. 【数据挖掘知识点四】参数估计
  5. Ubuntu 14.04安装JDK1.8.0_25与配置环境变量
  6. CodeForces - 1422D Returning Home(最短路+思维建图)
  7. 华科考研834计算机网络,2018年华中科技大学834计算机专业基础综合 (模)...
  8. 实现IButtonControl接口时, PerformClick()方法的代码怎么写,请高手指导!
  9. mysql数据库参数
  10. “四不像”病毒冒充多款知名软件 窃取电脑隐私
  11. java11 scala_JDK1.10+scala环境的搭建之windows环境
  12. android学习笔记1-布局的初步了解以及 控件的常见属性
  13. php preview,preview.php
  14. 应用实战:从Redis到Aerospike,我们踩了这些坑
  15. 删除VS工程下的临时文件
  16. 香港流行乐黄金二十年——经典歌手(音乐人)全面回顾(四)
  17. TCP/IP协议栈扫盲班
  18. 如何在 arm 官网上找到合适的手册
  19. Spring注解开发
  20. 个人搭建ASP网站,从头开始完全教程(一)

热门文章

  1. pandas使用normalize函数将dataframe中的时间(time)数据列转化为日期(date)数据列(例如,从2019-12-25 11:30:00到2019-12-25)
  2. R语言可视化分别使用lattice包和ggplot2包可视化热图(heatmap)并绘制热力图对应的系统树图(dendrogram)实战
  3. R语言scale函数标准化缩放dataframe数据列实战
  4. NLP任务语义相似数据准备及实战
  5. 损失函数(损失函数、代价函数、目标函数)、​​​​​​​MSE、0-1损失函数、绝对误差损失函数、分位数损失函数、Huber损失函数、感知损失函数、Hinge损失函数、指数损失函数、对数损失函数
  6. 期望最大EM(Expectation Maximum)算法是什么?为什么有时候不用梯度下降而是用EM算法
  7. linux 别名管理,Linux 的 15 个命令行别名, 帮系统管理员提升工作效率!
  8. tf.keras.layers.Dense() 示例
  9. 搭建Hadoop的Eclipse开发环境
  10. Intent和PendingIntent的区别