构建模型的个基本过程:

PCA 与 SVD关系

PCA : 降维度。过程:首先计算样本本协方差矩阵,然后·暴力特征分解·(非常消耗资源)。

SVD : 降维度,它的标准推导过程类似特征分解(耗资源),据说,sk-learn中它有其他实现过程。

scikit-learn的PCA算法的背后真正的实现就是用的SVD,而不是我们我们认为的暴力特征分解。

# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #

# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #

# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #

1. 收集足够数据量: 收集大于50的样本量,否则非常用于过拟合。

2. 问题划分:是否是一个回归问题、无监督的分类问题(关联规则)、有监督的分类问题

分类问题: 样本量很大 SGD(随机梯度下降), 样本量不是很大时,LR svm  GBDT

转载于:https://www.cnblogs.com/andylhc/p/10298001.html

1,机器学习应用概述相关推荐

  1. 让AI学习AI:自动化机器学习的概述、发展和研究意义

    导读:我们在之前的文章<>中概述了人工智能,并引出了AutoML--自动化机器学习.本文将介绍AutoML的概述.发展和研究意义等概念性知识. 作者:王健宗 瞿晓阳 来源:大数据(ID:h ...

  2. 各个大厂的机器学习平台概述

    机器学习的核心是"使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测".这意味着,与其显式地编写程序来执行某些任务,不如教计算机如何开发一个算法来完成任务.有三种主要 ...

  3. 机器学习算法概述:随机森林逻辑回归

    摘要: 机器学习算法入门介绍:随机森林与逻辑回归! 随机森林是用于分类和回归的监督式集成学习模型.为了使整体性能更好,集成学习模型聚合了多个机器学习模型.因为每个模型单独使用时性能表现的不是很好,但如 ...

  4. 数据挖掘与机器学习——数据挖掘概述

    挖掘是从大量的.不完全的.有噪声的.模糊的.随机的应用数据中,提取潜在且有用的信息的过程. 分析分析处理(On-Line Analytical Processing ,OLAP) 数据分析过程 确定知 ...

  5. 《机器学习》--概述

    机器学习应用的领域: Database mining(数据挖掘) Applications can't program by hand(无法手动编写的程序) Self-customizi progra ...

  6. 机器学习(概述一)——定义

    何谓机器学习 不同人的认知 与人类认知过程的对比 基本定义 基本概念 机器学习能用来干吗 机器学习的常见应用框架 机器学习的分类 基于学习形式分类 基于目的分类 机器学习中的十大经典算法 补充 术语 ...

  7. 机器学习-决策树概述及对鸢尾花数据分类python实现利用graphviz模块画出决策树

    文章目录 1. 决策树概述 2. 理论分析 2.1 特征选择 2.1 1 熵&条件熵 2.1.2 信息增益 2.1.3 信息增益比 2.2 决策树的生成 2.2.1 ID3算法 2.2.2 C ...

  8. SQL Server 机器学习服务-概述与实战

    (本文2020年1月4日首发于D-BI) 前述 新年第一篇,去旧迎新.本文内容,既旧也新.旧之处在于,SQL Server 机器学习服务是微软在SQL Server 2016 中就引入的新功能,但当时 ...

  9. python数据挖掘课程设计,利用Python进行机器学习和数据挖掘概述

    利用Python数据挖掘和机器学习的概述 前言: 本文主要描述了使用Python进行数据挖掘业务的优势并介绍了相关的数据处理工具包pandas和机器学习算法库scikit-learn. 为什么使用py ...

最新文章

  1. compileReleaseJavaWithJavac
  2. C++ 32位和64位
  3. 新海诚没有参与制作的作品_继《你的名字》之后,新海诚又出新作啦!!
  4. 如何自行分析定位SAP BSP错误
  5. excel中怎样用公式获取表单控件_老会计不愿教的工资表汇总公式,真是太好用了...
  6. javascript初学者_针对JavaScript初学者的调试技巧和窍门
  7. xxljob 配置具体定时任务_分布式任务调度: XXL-Job
  8. php动态网页技术难点及分析,动态网页技术PHP关于cookie和session的分析
  9. Java并发之Condition接口
  10. linux 命令行下载bt,linux命令行下载BT种子和磁力链接
  11. 计算机程序设计语言发展经历了,简述计算机程序设计语言的发展历程
  12. 计算机网络蠕虫病毒及防范,蠕虫病毒检测与防范本科毕业论文.doc
  13. face_recognition 人脸识别
  14. windows cmd打开新窗口关闭窗口
  15. 六方面的学习,帮你走上业务架构师之路
  16. 中外消防传感器差距浅析
  17. 计算机视觉笔记11.26
  18. 一级建造师考试备考顺序
  19. 滚动条自动显示和隐藏
  20. 微软开源的浏览器自动化工具-Playwright

热门文章

  1. python set_Python Set联合
  2. python 并发_Python bin()
  3. java.sql.Date – Java SQL日期
  4. struts2 拦截器_Struts2 execAndWait拦截器示例,用于长时间运行的动作
  5. Linux服务器的显卡驱动丢失又装上的过程
  6. 深入了解什么是服务网格
  7. 深入了解VPP关键技术有哪些?
  8. Java基础:什么是返回对象
  9. SylixOS网络协议栈---Lwip协议栈之ARP表
  10. ActiveMQ RabbitMQ RokcetMQ Kafka实战 消息队列中间件视频教程