最近小数在学习无监督学习的一些基础知识和应用场景,今天就跟大家分享一下。

无监督学习的概念术语是:推断描述“未标记”数据的分布与关系的机器学习任务,即给予学习算法的事例是未被标记的,因此没有直接的方法来评估算法产生的准确性。无监督学习即没有标注的训练数据集,需要根据样本间的统计规律对样本集进行分析。因此,无监督学习常常被用于数据挖掘,用于在大量无标签数据中发现些什么。

以上的解释很难理解,小数建议用一些具体案例来告诉大家无监督学习的一些实际应用场景,通过这些实际场景,大家就能了解无监督学习的价值。在大量实际场景中,跟金融相关的有:发现异常用户,反“洗钱”。有很多违法行为都需要"洗钱",这些洗钱行为跟普通用户的行为是不一样的,到底哪里不一样?如果通过人为去分析是一件成本很高很复杂的事情,我们可以通过这些行为的特征对用户进行分类,就更容易找到那些行为异常的用户,然后再深入分析他们的行为到底哪里不一样,是否属于违法洗钱的范畴。通过无监督学习,我们可以快速把行为进行分类,虽然我们不知道这些分类意味着什么,但是通过这种分类,可以快速排出正常的用户,更有针对性的对异常行为进行深入分析。

无监督学习根据应用任务的不同的算法也不尽相同,最常应用的是聚类和降维。今天小数重点介绍一下聚类分析

聚类分析的概念术语是:基于相似性概念将数据集再划分,形成较小的组,追求组别间异尽量大而组内的差异尽量小。小数用更好理解的话来表达以上的概念:聚类就是将观察值聚成一个一个的组,每一个组都含有一个或者几个特征。

由此可见,恰当地提取特征是无监督最为关键的环节。以下举例说明如何识别一只狗,在相关识别中,我们来尝试提取狗的特征,如:皮毛、四肢、耳朵、眼睛、胡须、牙齿、舌头等等。通过对特征相同的动物的聚类,可以将狗或者犬科动物聚成一类。在学习之前,机器不知道这群毛茸茸的东西是什么,只知道,这团东西属于一类,大象不在这个类(鼻子不符合),飞机也不在这个类(有翅膀)。特征有效性直接决定着算法有效性。如果我们拿体重来聚类,而忽略体态特征,恐怕就很难区分出兔子和狗了。聚类的目的在于把相似的东西聚在一起,而我们并不关心这一类是什么。因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。

最后,小数建议通过监督学习和无监督学习的对比来更好地理解和总结无监督学习:

1、监督学习是一种目的明确的训练方式,你知道得到的是什么;而无监督学习则是没有明确目的的训练方式,你无法提前知道结果是什么。

2、监督学习需要给数据打标签;而无监督学习不需要给数据打标签。

3、监督学习由于目标明确,所以可以衡量效果;而无监督学习几乎无法量化效果如何。

数字化把用户标签化为成百上千个标签进行用户画像的标识,区块链把数字化的关系进行记录,通过对场景的深度分析学习,相信在数字化的世界,财务分析类体验报告通过无监督学习能快速分析潜在企业经营风险以及供应链风险的提示在不远的将来即将变为现实。

往期精选干货|不想做股市里的韭菜?我们来帮你排雷!--辅仁药业篇干货|不想做股市里的韭菜?我们来帮你排雷!--海澜之家篇干货|不想做股市里的韭菜?我们来帮你排雷!--汤臣倍健篇

无监督学习与有监督学习的本质区别是什么_干货关于无监督学习你了解多少?...相关推荐

  1. 无监督学习与有监督学习的本质区别是什么_人工智能中的无监督学习

    这些误解中的许多原因都归因于这些形式的统计AI的名称 例如,有些人认为仅将机器学习用作反馈循环就是强化学习.其他人则认为,无人监督的全自动机器学习应用程序就是无监督学习的例子,但是这些类别的真正区别在 ...

  2. 无监督学习与有监督学习的本质区别是什么_吴恩达老师课程笔记系列第三节-无监督学习定义...

    第三节-无监督学习定义 我们将介绍第二种主要的机器学习问题.叫做无监督学习. 上个课程中,已经介绍了监督学习.回想当时的数据集,如图表所示,这个数据集中每条数据都已经标明是阴性或阳性,即是良性或恶性肿 ...

  3. 【ML复习】什么是 监督学习,什么是 非监督学习?二者的区别是什么?列举常见的 监督学习算法 和 非监督学习算法。

    纯手打默写. 目录 一 (1)什么是监督学习?什么是非监督学习? (2)二者的区别? 一 (1)什么是监督学习?什么是非监督学习? 答:监督学习 就是训练集的数据已经分好了类别,通过对 带有标签的数据 ...

  4. 业界干货 | 图解自监督学习,从入门到专家必读的九篇论文

    本文约3500字,建议阅读15分钟 一文搞懂AI未来最火的技术:自监督学习. 如果人工智能比作一块蛋糕,那么蛋糕的大部分是自监督学习,蛋糕上的糖衣是监督学习,蛋糕上的樱桃是强化学习. Yann Lec ...

  5. 【机器学习】业界干货 | 图解自监督学习,从入门到专家必读的九篇论文

    作者 | 对白 整理 | 对白的算法屋 编者寄语: 一文搞懂AI未来最火的技术:自监督学习. 大家好,我是对白. 如果人工智能比作一块蛋糕,那么蛋糕的大部分是自监督学习,蛋糕上的糖衣是监督学习,蛋糕上 ...

  6. 人工智能和人类智能的本质区别是什么(一)

    我们都知道,人工智能是根据人类智能进行模仿而来的,而人类智能能够工作,能够思考,我们为了让机器拥有这两种能力才开始进行人工智能开发的.但是大家是否知道人工智能和人类智能的本质区别是什么呢?我们在这几篇 ...

  7. 无意识和潜意识,两者的区别是什么?在考试中一般如何考查?|小白心理-312/347考研答疑

    无意识和潜意识,两者的区别是什么?在考试中一般如何考查?|小白心理-312/347考研答疑 一.从名词概念的角度来说 1.无意识 无意识是指人们对其内在身心活动以及周围环境变化没有知觉.在无意识状况下 ...

  8. 通信网与计算机网络的区别,计算机网络和计算机通信网络之间的本质区别是什么?...

    原标题:计算机网络和计算机通信网络之间的本质区别是什么? 1.用途不同 计算机网络在网络操作系统,网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递.计算机通信在计算机与计算机之间或计算 ...

  9. CT和X光的本质区别是什么?CT能否代替X光?

    已提交,查看回答. 黑洞宇宙 养生 健康饮食 中医养生 养生健康 CT和X光的本质区别是什么?CT能否代替X光? 2017-12-02 写回答 关注问题 (0) 分隔线 我来写精彩回答... 总字数: ...

最新文章

  1. with admin option /with grant option
  2. 13个风格独特的关于页面(About Pages)设计
  3. js——页面回到顶部
  4. 主板19针接口_【新品上市】D4双通道还能组RAID!华南B365D4主板6/7/8/9代全兼容!...
  5. 《那些年啊,那些事——一个程序员的奋斗史》——60
  6. 余承东:华为腕上穿戴设备市场份额已达全球第一
  7. 三菱触摸屏u盘上传和下载_威纶通触摸屏U盘下载方法
  8. php统计图移动端,移动端可视化视图、统计图表集合(持续更新综合案例)原型...
  9. 9、一篇文章带你看懂5G网络(接入网+承载网+核心网)
  10. SQL Server 数据库中的临时表
  11. H.265/HEVC视频编码标准总结
  12. RGB和HSV颜色空间
  13. Linux 远程连接
  14. rstudio 导出结果_R语言数据导入与导出
  15. Qt保留小数点后一位、两位……
  16. 网络拓扑测绘之海底光缆拓扑
  17. npm的插件如何直接在html中使用,webpack中html-webpack-plugin插件的使用(生成多个html页面,引入不一样的js文件)...
  18. PDF文件怎么免费解密?
  19. H5 canvas pc 端米字格 写字板
  20. 爬虫入门(五)抓取网页数据

热门文章

  1. Windows学习总结(18)——Windows运行命令与Win键+快捷键再总结
  2. java面试关于ssh的_[Java教程]ssh面试题
  3. 比特币技术公司创始人:ICO是一场被骗子玩弄的网络泡沫
  4. 基本排序(C语言版)
  5. CentOS7.2 network.service NetworkManager.service 冲突
  6. Java并发性和多线程介绍
  7. 好酷啊,真是图片吗?
  8. 有木有使用tomcat 7.0 报Out of Memory的同志
  9. 对VLAN间路由实验的总结
  10. PDFlib使用实例