AI之AutoML:autosklearn/Auto-Sklearn(基于scikit-learn库的自动化的机器学习工具)的简介、安装、使用方法之详细攻略

目录

autosklearn/Auto-Sklearn的简介

autosklearn/Auto-Sklearn(基于scikit-learn库的自动化的机器学习工具)的概述

autosklearn/Auto-Sklearn的安装

系统安装要求¶

autosklearn/Auto-Sklearn的使用方法

1、基础案例


autosklearn/Auto-Sklearn的简介

autosklearn/Auto-Sklearn(基于scikit-learn库的自动化的机器学习工具)的概述

简介

Auto-Sklearn,在2015年由德国图宾根大学的研究人员提出的,最初的版本于2016年发布。auto-sklearn基于scikit-learn库进行开发,支持多种机器学习任务,包括分类、回归、时间序列等。

核心技术点

Auto-Sklearn使用了贝叶斯优化的方法进行超参数优化,可以在较短的时间内找到最优的超参数组合,从而得到更好的模型性能。

功能

Auto-Sklearn是一款基于Python的自动机器学习工具,可以自动进行机器学习的各个步骤,包括特征选择、特征预处理、算法选择和超参数优化等。

自动特征选择与工程:可以自动选择最优特征子集,并进行归一化、缺失值处理等特征工程。

自动模型选择:可以自动选择最优的机器学习算法来解决问题,支持的算法包括SVM、KNN、随机森林等。

自动超参数优化:可以自动搜索机器学习模型的最优超参数,获得最高性能的模型配置。

特点

auto-sklearn的优势在于它的易用性和灵活性。用户只需要提供数据集和一些基本的配置,就可以自动进行模型构建和优化。

auto-sklearn可以自动选择和配置算法和超参数,从而让用户省去了手动调参的过程。

auto-sklearn还支持并行化处理,可以在多个CPU或GPU上运行,进一步加速模型训练和优化。

优缺点

自动化:auto-sklearn能够自动化地完成机器学习的各个环节,从而让用户省去手动调参和特征工程等繁琐的工作。

灵活性:auto-sklearn提供了多种配置选项,用户可以根据自己的需求进行自定义配置。

性能好:auto-sklearn使用贝叶斯优化技术进行超参数优化,能够在短时间内找到最优的超参数组合,从而得到更好的模型性能。

处理大数据集时较慢:auto-sklearn的处理速度受限于计算资源,处理大数据集时需要较长时间。

可解释性较差:由于auto-sklearn是自动化的,生成的模型可解释性较差。

应用案例

Kaggle竞赛:auto-sklearn在多个Kaggle竞赛中表现出色,包括房价预测、分类、回归等多个任务。

自动化机器学习平台:auto-sklearn可以作为自动化机器学习平台的核心组件,帮助用户快速构建和部署机器学习模型。

数据科学教育:auto-sklearn可以作为教学工具,帮助学生快速入门机器学习,并加深对机器学习原理的理解。

autosklearn/Auto-Sklearn安装

pip install auto-sklearnpip install -i https://pypi.tuna.tsinghua.edu.cn/simple auto-sklearnconda install -c conda-forge auto-sklearn

系统安装要求¶

auto-sklearn 具有以下系统要求:

  • Linux 操作系统(例如 Ubuntu)(在此处获取 Linux)

  • Python (>=3.7)(在此处获取 Python),

  • C++ 编译器(支持 C++11)(在此处获取 GCC)。

如果您尝试在没有提供 pyrfr 包的 wheel 文件的系统上安装 Auto-sklearn(请参阅此处了解可用的 wheels),您还需要:

  • SWIG(在此处获取 SWIG)。

有关缺少 Microsoft Windows 和 macOS 支持的说明,请查看Windows/macOS 兼容性部分。

注意:auto-sklearn 当前不支持 Windows系统,因为auto-sklearn严重依赖 Python 模块resource。是 Python 的Unix 特定服务resource 的一部分 ,在 Windows 机器上不可用。因此,无法 在 Windows 机器上运行auto-sklearn 。

autosklearn/Auto-Sklearn使用方法

1、基础案例


import sklearn.datasets
import autosklearn.classification# 加载Titanic数据集
X, y = sklearn.datasets.load_breast_cancer(return_X_y=True)# 使用Auto-Sklearn训练模型
model = autosklearn.classification.AutoSklearnClassifier()
model.fit(X, y)# 输出模型评估结果
print(model.sprint_statistics())

AI之AutoML:autosklearn/Auto-Sklearn(基于scikit-learn库的自动化的机器学习工具)的简介、安装、使用方法之详细攻略相关推荐

  1. ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介、使用方法之详细攻略

    ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介.使用方法之详细攻略 目录 sklearn.linear_mode中的LogisticRe ...

  2. sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略

    sklearn之XGBModel:XGBModel之feature_importances_.plot_importance的简介.使用方法之详细攻略 目录 feature_importances_ ...

  3. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  4. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  5. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  6. sklearn:sklearn.preprocessing的MinMaxScaler简介、使用方法之详细攻略

    sklearn:sklearn.preprocessing的MinMaxScaler简介.使用方法之详细攻略 目录 MinMaxScaler简介 MinMaxScaler函数解释 MinMaxScal ...

  7. sklearn:sklearn.GridSearchCV函数的简介、使用方法之详细攻略

    sklearn:sklearn.GridSearchCVl函数的简介.使用方法之详细攻略 目录 sklearn.GridSearchCV函数的简介 1.参数说明 2.功能代码 sklearn.Grid ...

  8. sklearn:sklearn.feature_selection的SelectFromModel函数的简介、使用方法之详细攻略

    sklearn:sklearn.feature_selection的SelectFromModel函数的简介.使用方法之详细攻略 目录 SelectFromModel函数的简介 1.使用SelectF ...

  9. sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略

    sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform.transform.inverse_transform简介.使用方法之详细攻略 ...

最新文章

  1. svn增量打包部署_利用svn的补丁文件打包生成增量文件
  2. 【响应式Web前端设计】HTML DOM padding 属性
  3. 我才知道wordpress还有com和org的区别呢
  4. 聊聊我对开发项目选技术的看法
  5. 四种launchMode启动方式
  6. 谈判如何在谈判中_如何避免通过工资谈判把钱留在桌上
  7. 训练代码_无需一行代码,完成模型训练和部署,这个AI工具开始公测
  8. 学习Android之SharedPreferences使用
  9. 高中计算机编辑程序,高中信息技术信息的编程加工教案
  10. 运动目标跟踪(六)--压缩跟踪之CS原理介绍
  11. 《剑指offer》面试题42——翻转单词顺序列
  12. 计算机联机玩游戏的操作方法,3种建立局域网的方式,不用网也可以联机玩游戏-局域网设置...
  13. SECS/GEM实现(一)半导体通讯协议软件,C、C++使用介绍
  14. 【整理】1、C网和G网双模手机是否可同时支持C网和G网上网?2、上网的同时是否可以打电话?3、呼叫等待和呼叫保持的概念与“双通”手机
  15. 宿骆氏亭寄怀崔雍崔衮
  16. 【C++课程设计——自助点餐系统】主页及登录界面
  17. ANSYS经典界面出图技巧总结
  18. ES(ElasticSearch) 如何建立索引
  19. SVLAN,CVLAN,PVLAN区别
  20. osi七层语言html,OSI分为哪七层 OSI七层功能介绍【详解】

热门文章

  1. 利用Nginx正向代理加速代码编译外网依赖下载速度
  2. JSF——JSF 标签
  3. 项目管理(PMP)项目沟通管理
  4. OpenJudge百炼-2745-显示器-C语言-模拟
  5. 多旋翼无人机组成(小白上路)
  6. 数据流图DFD --详细介绍
  7. OAuth 2.0 基础(2)
  8. SAP ABAP——SAP简介(一)【SAP发展历程】
  9. 我用过的几款电路设计EDA软件
  10. Matlab中库函数imadjust()的使用细节