机器学习常见的挑战有哪些?

从大的类别上来讲,机器学习遇到的两个比较大的挑战是:

1,收集的数据不具有代表性;

2,选择了和数据集合不匹配的学习算法;

从细分的类别上来讲具体是:

1,数据集太小,训练样本有限;

大部分的机器学习算法需要大量或者足够多的数据才能进行有效的学习,即使是很多非常简单的问题也需要成百上千甚至上万级别的数据来进行支撑;在复杂问题,例如,智能语音、问答系统等系统中,如果你无法找到有效的迁移学习模型,那么可能甚至得千万级别的数据去进行模型的训练学习;

2,收集到的数据不具有代表性;

训练数据一定要具有代表性,无论你使用的是基于实例的学习还是基于模型的学习模型。使用不具代表性的数据集训练出来的模型都不可能做出可靠的预测和推理。针对你的当前问题,选择具有泛化特性最强的训练数据集是至关重要的。不过数据具有代表性这个事情知易行难,如果数据集的样本量太少,将会出现采样噪声(代表性不强的数据被选中),

机器学习常见的挑战有哪些?相关推荐

  1. (英国剑桥大学)部署机器学习中的挑战:案例研究综述(上)中文译文 Challenges in Deploying Machine Learnings: a Survey of Case Studies

    论文原文:https://arxiv.org/pdf/2011.09926.pdf 翻译:闪闪·Style 摘要 近年来,作为一个学术研究领域,同时也是实际商业问题的一种解决方案,机器学习越来越受到人 ...

  2. 干货 | 22道机器学习常见面试题目

    来源:机器学习算法与自然语言处理 本文共6600字,建议阅读13分钟. 本文为你带来22道机器学习常见的面试问题和回答. 1.无监督和有监督算法的区别? 有监督学习:对具有概念标记(分类)的训练样本进 ...

  3. AI理论知识基础(26)-机器学习常见损失函数, 共轭梯度法(2)

    机器学习常见损失函数, 共轭梯度法(2)

  4. 机器学习常见知识点自查50问与答

    机器学习常见知识点自查50问与答 1.什么是机器学习 2.机器学习与数据挖掘的区别 3.什么是机器学习的过度拟合现象 4.过度拟合产生的原因 5.如何避免过拟合 6.什么是感应式的机器学习 7.机器学 ...

  5. 文献学习(part49)--机器学习面临的挑战

    学习笔记,仅供参考,有错必纠 关键词:机器学习:深度学习:概率图模型:大数据:优化问题 机器学习面临的挑战 该文讨论了机器学习目前面临的几个挑战 , 包括 : 高维特征空间和数据量问题 ; 大数据量的 ...

  6. AI(3)--- 机器学习常见的七个步骤

    机器学习常见的七个步骤 小编注:这是 AIA (Ai Adventures) 系列的第二期,讲述实现机器学习常见的七个步骤,本篇视频时长约 10 分钟左右,文末有互动"彩蛋",欢迎 ...

  7. 机器学习九大挑战(转载)

    人工智能(AI)的未来令人充满期待,但目前却存在着一些问题,而且往往和道德伦理相关.机器学习在哪些方面让我们感到震惊?你能骗过一台机器吗?如果能,难度有多大?<终结者>里的Skynet(天 ...

  8. 【机器学习】机器学习常见符号

    机器学习常见符号 符号 名称 符号 名称 R 实数集 Rn n维实数向量空间 H 希尔伯特空间 X 输入空间 Y 输出空间 x∈X 输入,实例 y∈Y 输出,标记 X 输入随机变量 Y 输出随机变量 ...

  9. python绘制三维曲线图_机器学习的绘图库有哪些?如何运用python绘制机器学习常见曲线?...

    专栏引荐 绘图的变量 单变量 查看单变量最方便的无疑是displot()函数,默许绘制一个直方图,并你核密度估计(KDE) sns.set(color_codes=True) np.random.se ...

最新文章

  1. mysql innodb引擎丢失_【MySQL】InnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据...
  2. Python数据框结合lambda函数的使用
  3. c++面试题之内存分配
  4. iPhone开源系列:iDev Recipes
  5. 解决SQL Server里sp_helptext输出格式错行问题
  6. C运行时库和标准C++库
  7. 搭建一个Struts2工程
  8. 【Java从0到架构师】JDBC、Spring JDBC、JUnit
  9. 用lstm模型做预测_使用LSTM深度学习模型进行温度的时间序列单步和多步预测
  10. MIME类型“ image / jpg”是否与“ image / jpeg”相同?
  11. 项目管理十大知识领域之项目沟通管理
  12. 怎样使用思维导图做计划?分享5个思维导图做计划的模板
  13. 明尼苏达计算机科学与工程,2019上海软科世界一流学科排名计算机科学与工程专业排名明尼苏达大学双城分校排名第101-150...
  14. VB操作EXCEL表的常用方法
  15. 【Protues仿真】PNP三极管驱动蜂鸣器和实际电路相同却不响问题探讨
  16. 中国牛市还会来吗,中国牛市啥时候到?
  17. 莫队算法小介绍——看似暴力的莫队算法
  18. SpringBoot2——web开发(组件使用)
  19. mkv视频怎么转成mp4?
  20. linux系统提升硬盘写速度的方法

热门文章

  1. 嵌入式系统学习笔记之五-uboot常用命令之补充
  2. 数学建模中的matlab实例,matlab数学建模实例
  3. C++中的new和malloc的区别
  4. 官宣!清华大学要搬迁!
  5. 计算机视觉在生物力学和运动康复中的应用和研究
  6. 一文详解三维重建之定位定姿算法
  7. 基于图像的三维物体重建:在深度学习时代的最新技术和趋势综述之性能比较和未来研究方向...
  8. 计算机会计课程试题及答案,计算机会计第2次作业_报表_附答案
  9. Drug Target Review | 筛选用于抗COVID-19的抗病毒化合物
  10. 24 式加速你的 Python