监督学习无监督学习

To begin with, we should know that machine primarily consists of four major domain.

首先,我们应该知道机器主要由四个主要领域组成。

  1. Supervised learning: An agent or algorithm learns from the labeled data.
    有监督的学习:代理或算法从标记的数据中学习。
  2. Unsupervised learning: An agent or algorithm learns from the unlabeled data i.e. it finds similar patterns in the dataset and groups them accordingly.
    无监督学习:代理或算法从未标记的数据中学习,即,它在数据集中找到相似的模式并将其相应地分组。
  3. Semi-supervised learning: A combination of both Supervised and Unsupervised learning.
    半监督学习:监督学习和无监督学习的组合。
  4. Reinforcement learning: An agent or algorithm learns patterns or behaviors by correcting itself over and over again until evolves into a better agent.
    强化学习:代理或算法通过反复校正自身直到发展成为更好的代理来学习模式或行为。

Now let us see the methods which come under the unsupervised learning domain.

现在让我们看看无监督学习领域下的方法。

聚类 (Clustering)

Photo by Nareeta Martin on Unsplash
Nareeta Martin在Unsplash上拍摄的照片

The goal of clustering is to create groups of data points such that points in different clusters are dissimilar while points within a cluster are similar.

聚类的目的是创建数据点组,以使不同聚类中的点不相似,而聚类中的点相似。

Clustering also has its own subcategories.

群集也有其自己的子类别。

1. K-均值聚类 (1. K-means clustering)

With k-means clustering, we want to cluster our data points into k groups. A larger k creates smaller groups with more granularity, a lower k means larger groups and less granularity. It can be compared to the separate crowds of people surrounding different famous people at a party. The density of the crowd depends on the fame of that person.

通过k均值聚类,我们希望将数据点聚类为k组。 k越大,组越细,粒度越大; k越小,组越大,粒度越小。 可以将它与聚会上围绕着不同名人的独立人群进行比较。 人群的密度取决于那个人的名声。

2.层次聚类 (2. Hierarchical clustering)

Hierarchical clustering is similar to regular clustering, but it focuses on building a hierarchy of clusters. This type of clustering is used in the online shopping websites, where there are broad categories for simple navigation displayed on the homepage and as you click on it, further specific categories related to that would be displayed. This explains the more distinct cluster of items.

分层群集类似于常规群集,但是它专注于构建群集的层次结构。 这种类型的群集用于在线购物网站中,在主页上会显示大范围的简单导航,并且当您单击它时,将显示与之相关的其他特定类别。 这解释了更独特的项目集群。

降维 (Dimensionality-reduction)

1.主成分分析: (1. Principal Component Analysis:)

PCA is a dimensionality-reduction method in unsupervised learning which is used to reduce the dimensionality of large data sets into smaller ones by choosing the basis vectors on our own which are known as principal components. PCA remaps the space in which our data exists to make it more compressible. The transformed dimension is smaller than the original dimension.

PCA是一种无监督学习中的降维方法,用于通过自行选择被称为主要成分的基础向量,将大数据集的维数减少为较小的数据集。 PCA重新映射了我们数据存在的空间,以使其更具可压缩性。 变换后的尺寸小于原始尺寸。

2. K近邻 (2. K-nearest neighbor)

How do you determine the housing price of a house in a particular locality? We would take the average of the price of the houses in the nearby locality and determine the approximate price of the house we are about to buy. We label the test data point based on the average of the sample data in its neighborhood. We take the mean of the values if the variables are continuous and mode if they are categorical.

您如何确定特定地区房屋的房价? 我们将取附近地区房屋平ASP格,并确定我们将要购买的房屋的近似价格。 我们根据附近的样本数据的平均值来标记测试数据点。 如果变量是连续的,则取值的平均值;如果变量是分类的,则取值的平均值。

Applications of k-NN:

k-NN的应用:

  • Helps in the update of new methods of fraud detection.
    帮助更新欺诈检测的新方法。
  • Determining the housing price and detection of the temperature in the locality.
    确定房屋价格并检测当地温度。
  • Imputing missing training data.
    估算缺少的训练数据。

3. T分布随机邻居嵌入 (3. T-distributed Stochastic Neighbor Embedding)

t-SNE Embedding is an algorithm used to reduce a high dimensional dataset into a low dimensional graph that retains most of the original information. It is based on the principle of determining the similarity of all points in the scatter plot.

t-SNE嵌入是一种用于将高维数据集还原为保留大部分原始信息的低维图形的算法。 它基于确定散点图中所有点的相似性的原理

The process done here is measuring the distance from the point we are interested in all the other points and plotting that distance on a normal distribution curve, which is centered on the point that we are interested in.

此处完成的过程是测量到我们在所有其他点上都感兴趣的点的距离,并将该距离绘制在正态分布曲线上,该分布曲线以我们感兴趣的点为中心。

Note: We use a normal distribution curve because distant points have low similarity values and close points have high similarity values.

注意:我们使用正态分布曲线,因为远点的相似度值低而闭合点的相似度值高。

Now it puts the data points on a number line in a random order, and t-SNE moves these points little by little based on their similarity values, until it has clustered them properly on a lower dimension.

现在,它将数据点以随机顺序放置在数字线上,然后t-SNE根据它们的相似性值一点一点地移动这些点,直到将它们正确地聚集在较低维度上为止。

生成建模 (Generative modeling)

1.生成对抗网络 (1. Generative adversarial network)

A generative adversarial network is deep learning-based generative model. Generative models are models that use unsupervised learning. GAN is a system where two neural networks compete to create or generate variations within a dataset.

生成对抗网络是基于深度学习的生成模型。 生成模型是使用无监督学习的模型。 GAN是一个系统,其中两个神经网络竞争在数据集中创建或生成变体。

It has a generator model and a discriminator model. The generator network takes a sample and generates a sample of data by learning the distribution of classes. The discriminator network learns the boundaries between those classes by estimating the probability of whether the sample is taken from the real sample.

它具有生成器模型和鉴别器模型。 生成器网络通过学习类的分布来获取样本并生成数据样本。 鉴别器网络通过估计是否从真实样本中提取样本的概率来学习这些类别之间的界限。

GAN的应用: (Applications of GAN :)

  • They are used for image manipulation and generation.
    它们用于图像处理和生成。
  • They can be deployed for tasks in understanding risk and recovery in healthcare.
    可以将它们部署用于了解医疗保健的风险和恢复的任务。
  • Used in drug research to produce new chemical structures from the existing ones.
    用于药物研究以从现有化学结构产生新的化学结构。
  • Google brain project is an interesting application of GAN.
    Google的大脑项目是GAN的有趣应用。

The main advantage of GAN is to generate data when there is not much data available, without any human supervision.

GAN的主要优点是在没有可用数据的情况下在没有任何人工监督的情况下生成数据。

2.深度卷积生成对抗网络 (2. Deep Convolutional Generative adversarial Network)

DCGAN has convolutional layers between the input and the output image in the generator. And in the discriminator, it uses regular convolutional networks to classify the generated and the real images. The architecture of the DCGAN is:

DCGAN在生成器的输入和输出图像之间具有卷积层。 在鉴别器中,它使用常规的卷积网络对生成的图像和真实图像进行分类。 DCGAN的体系结构为:

  • The pooling layers are replaced with generators and discriminators.
    合并层被生成器和鉴别器代替。
  • Batch normalization is used in both generators and discriminators.
    批处理规范化在生成器和鉴别器中都使用。
  • The fully connected layers are removed.
    完全连接的层将被删除。
  • ReLU is used as the activation function in the generator for all layers except the output layer.
    ReLU用作生成器中除输出层以外的所有层的激活函数。
  • Leaky ReLU activation function is used in the discriminator for all layers.
    鉴别器对所有层使用泄漏的ReLU激活功能。

3.样式转移 (3. Style Transfer)

Style transfer is the method used to generate a new image by combining the content image with a style image. By using this we can make the environment image that we have looked a lot greater because it is being combined with the style of iconic paintings.

样式转移是用于通过将内容图像与样式图像组合来生成新图像的方法。 通过使用它,我们可以使我们看起来更大的环境图像,因为它已与标志性绘画的风格相结合。

The activations in the neural network of the content and the style image should match the activations in the generated image. So style transfer can make any image that you took on your trek look modified like the famous Hokusai Japanese painting.

内容和样式图像在神经网络中的激活应与生成的图像中的激活匹配。 因此,样式转移可以使您在跋涉中拍摄的任何图像看起来都像著名的北斋日本画一样被修改。

翻译自: https://medium.com/perceptronai/a-brief-introduction-to-unsupervised-learning-a18c6f1e32b0

监督学习无监督学习

http://www.taodudu.cc/news/show-863653.html

相关文章:

  • kusto使用_Python查找具有数据重复问题的Kusto表
  • 使用GridSearchCV和RandomizedSearchCV进行超参数调整
  • rust面向对象_面向初学者的Rust操作员综合教程
  • 深度学习术语_您应该意识到这些(通用)深度学习术语和术语
  • 问题解决方案_问题
  • airflow使用_使用AirFlow,SAS Viya和Docker像Pro一样自动化ML模型
  • 迁移学习 nlp_NLP的发展-第3部分-使用ULMFit进行迁移学习
  • 情感分析朴素贝叶斯_朴素贝叶斯推文的情感分析
  • 梯度下降优化方法'原理_优化梯度下降的新方法
  • DengAI —数据预处理
  • k 最近邻_k最近邻与维数的诅咒
  • 使用Pytorch进行密集视频字幕
  • 5g与edge ai_使用OpenVINO部署AI Edge应用
  • 法庭上认可零和博弈的理论吗_从零开始的本征理论
  • 极限学习机和支持向量机_极限学习机I
  • 如何在不亏本的情况下构建道德数据科学系统?
  • ann人工神经网络_深度学习-人工神经网络(ANN)
  • 唐宇迪机器学习课程数据集_最受欢迎的数据科学和机器学习课程-2020年8月
  • r中如何求变量的对数转换_对数转换以求阳性。
  • 美团脱颖而出的经验_使数据科学项目脱颖而出的6种方法
  • aws rds同步_将数据从Python同步到AWS RDS
  • 扫描二维码读取文档_使用深度学习读取和分类扫描的文档
  • 电路分析导论_生存分析导论
  • 强化学习-第3部分
  • 范数在机器学习中的作用_设计在机器学习中的作用
  • 贝叶斯深度神经网络_深度学习为何胜过贝叶斯神经网络
  • 模型监控psi_PSI和CSI:前2个模型监控指标
  • flask渲染图像_用于图像推荐的Flask应用
  • pytorch贝叶斯网络_贝叶斯神经网络:2个在TensorFlow和Pytorch中完全连接
  • 稀疏组套索_Python中的稀疏组套索

监督学习无监督学习_无监督学习简介相关推荐

  1. gui的design 无界面_无蓝光不刺眼 海信阅读手机超长续航双11嗨不停_

    2020年11月03日 14:40作者:黄页编辑:黄页 用手机阅读新闻.书籍几乎已经成了呼吸一样很自然的事情了.但同时,双眼也会因为如此便利的操作而让蓝光伤害眼睛.如果想要一直体验如此高效地阅读方式, ...

  2. andriod studio 运行 无结果_无负压静音供水设备下篇一

    1.无负压静音供水设备的安全接地保护 a )控制柜的金属柜体上应有可靠的接地保护,与接地点相连的保护导线的截面应符合GB/T3797-2005中4.10.6的规定.与接地点连接的导线必须是黄.绿双色或 ...

  3. 迅雷下载器无限制版_无敏感_无限速

    迅雷下载器5.8 下载链接:链接: https://pan.baidu.com/s/1ZYf1aRwZvW4PUT7qO0lKIg 提取码: if5x 速度如图 转载于:https://www.cnb ...

  4. homebrew1002无标题_无标题文档

    News: 2015-01-26 我们已经更新了如何玩高版本的游戏.用户可通过这种方法畅玩所有高版本的游戏 we had update how to play high version game in ...

  5. AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法)、分类/回归/聚类/降维算法模型选择思路、11类机器学习算法详细分类之详细攻略

    AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法).分类/回归/聚类/降维算法模型选择思路.11类机器学习算法详细分类(决策树/贝叶 ...

  6. 监督学习与无监督学习的区别_机器学习

    最近发现很多人还是不能真正分清机器学习的学习方法,我以个人的愚见结合书本简单说一下这个 机器学习中,可以根据学习任务的不同,分为监督学习(Supervised Learning),无监督学习(Unsu ...

  7. AI学习_无监督学习(编解码器)_图像分割_Unet/U2net

    无监督学习 让模型对输入的数据进行特征提取,从而实现无标签(无监督学习) 本质是编码,解码的过程.让模型在卷积编码(下采样).卷积解码(上采样)的过程中.自我总结特征 目前常用于图像分割 (ps:图像 ...

  8. 结构化数据与非结构数据、监督学习与非监督学习、标记与无标记

    结构化数据与非结构化数据: 结构化:可以用二维表表示的数据,存储在数据库里面的 非结构化数据:包括所有格式的办公文档.文本.图片.XML.HTML.各类报表.图像和音频/视频信息等等 办结构化:介于其 ...

  9. 有监督、无监督和半监督学习

    目录 概念描述 监督学习(Supervised Learning,SL) 无监督学习(Unsupervised Learning,UL) 半监督学习(Semi-supervised Learning, ...

  10. dbscan算法中 参数的意义_无监督机器学习中,最常见的聚类算法有哪些?

    在机器学习过程中,很多数据都具有特定值的目标变量,我们可以用它们来训练模型. 但是,大多数情况下,在处理实际问题时,数据不会带有预定义标签,因此我们需要开发能够对这些数据进行正确分类的机器学习模型,通 ...

最新文章

  1. Fedora 15 16 17 18 20无线网卡驱动安装
  2. Java21-day12【网络编程(网络编程入门(ip地址、端口、协议、InetAddress)、UDP通信程序、TCP通信程序)】
  3. 在ABAP debugger里手动trigger DB commit
  4. ffmpeg 新老接口问题及对照集锦
  5. MyEclipse生成常用方法
  6. 修理牧场(哈夫曼树 )
  7. 改变照片分辨率的软件_设计图像,想调整大小而又不降低质量,用这3个软件,那就对了...
  8. 写一个NSString类的实现
  9. db9串口(db9串口定义及颜色)
  10. 四两拨千斤的工作小工具分享
  11. php源码怎样打包APP_HBuilder打包App方法
  12. TestFlight Beta 相关问答
  13. 查询linux服务器有哪些IP在连接
  14. R语言学习笔记(1~3)
  15. Nature:基于宏基因组测序构建人类肠道微生物组参考基因集
  16. 三元前驱体废水除镍钴锰
  17. 高质量C++/C编程指南(重要)
  18. 免安装Oracleclient和PL/SQL
  19. DreamSpark for Students
  20. Picasa的使用想法及对其他几个看图软件的粗略考察

热门文章

  1. Eclipse+ADT+Android SDK 搭建安卓开发环境
  2. c#泛型作为返回类型的写法
  3. django from组件 实现增加 删除 编辑(推荐用法)
  4. unity3d常用组件及分析
  5. 【转】Dubbo_与Zookeeper、SpringMVC整合和使用(负载均衡、容错)
  6. Ext JS 5初探(二) ——Bootstrap.js
  7. Lync server 2010 发布拓扑错误0x80070005
  8. Search Engine XSS Worm
  9. 不需要人际交往的计算机系,计算机对大学生人际交往影响.doc
  10. php model db 赋值,PHP 框架 Model 层是否应该统一 DB 和 Cache