文章目录

  • 一. K均值聚类:物以类聚、人以群分
    • 1.1 距离的概念
    • 1.2 闵可夫斯基距离
    • 1.3 VDM距离
    • 1.4 聚类模型中的基本概念
    • 1.5 K-均值聚类(K-means)
    • 1.6 K-均值算法的求解步骤
    • 1.7 K-均值算法的参数选择
  • 二. K邻近分类:近朱者赤、近墨者黑
    • 2.1 K-邻近算法(K-Nearest Neighbors, K-NN)
    • 2.2 问题
    • 2.3 K-邻近算法的改进
  • 三. 案例:信贷客群的聚类分析
  • 参考:

一. K均值聚类:物以类聚、人以群分

聚类算法是数据挖掘中的一项重要技术,其目的是使聚类后同一类的数据尽可能聚集在一起,不同的数据尽可能分离。聚类模型既有有监督的场景又有无监督的场景。经过一定的改造,还可以适用于半监督的场景。

常见的非监督式的聚类模型有:

  1. 原型聚类:原型聚类是指聚类结构能通过一组原型刻画。原型是指样本空间中具有代表性的点。通常情况下,算法先对原型进行初始化,然后对原型进行迭代更新求解。常见的算法有k-均值聚类、学习向量量化、高斯混合聚类
  2. 密度聚类:从样本的分布密度出发考虑样本间的可连接性,并基于可连接性样本不断扩展聚类簇以获得最终的聚类结果。常见的算法有DBSCAN
  3. 层次聚类:在不同层次对数据集进行划分,从而形成树型的聚类结构。常见的算法有AGNES

1.1 距离的概念

在聚类模型中,刻画样本间的“距离”是非常重要、也是最本质的内容。距离

金融业信贷风控算法9-聚类场景之K均值聚类与K邻近聚类相关推荐

  1. 金融业信贷风控算法1-初等概率论

    文章目录 一. 前言 1.1 一个小故事 1.2 为什么要学习概率论 二. 初等概率论 2.1 离散随机变量 2.1.1 伯努利分布 2.1.2 二项分布 2.1.3 泊松分布 2.1.4 几何分布 ...

  2. 金融业信贷风控算法2-初等统计理论

    文章目录 一. 假设检验 1.1 什么是假设检验 1.2 定义 1.3 原假设与备择假设 1.4 统计量与显著性水平 1.5 单侧检验和双侧检验 1.6 常用的假设检验 二.参数估计 2.1 参数估计 ...

  3. 金融业信贷风控算法4-python的入门和介绍

    文章目录 一. Python语言的基本概念 1.1 python介绍 1.2 python基础语法 1.2.1 python3的基本数据结构 1.2.2 python3基本语句 1.2.3 自定义函数 ...

  4. 金融业信贷风控算法5-时间序列模型概述

    文章目录 一. 时间序列的定义 二. 时间序列在金融上的应用 2.1 资产收益率 三. 平稳性 四. 白噪声 五. 线性时间序列 六. AR模型 七. MA模型 八. ARMA模型 九. 实战 9.1 ...

  5. 算法-聚类-K均值与模糊K均值:原理+python代码

    这篇文章是根据作业修改后得到的,个人感觉写的比较详细了.但还有许多不足,希望大家评论指出. K均值聚类与模糊K均值 1. 算法原理及流程 相关名词解释如表1. 表1-相关名词解释 1.1 K均值算法原 ...

  6. 概述:机器学习和大数据技术在信贷风控场景中的应用

    来源:知乎 本文约5400字,建议阅读10分钟 本文简要概述在当前大数据和机器学习技术如何在信贷风控场景下的常见应用. 似乎一夜之间,所有的互联网公司在对外的宣传稿中都会提及自己使用机器学习和大数据技 ...

  7. 机器学习-聚类之K均值(K-means)算法原理及实战

    K-means算法 前言 机器学习方法主要分为监督学习和非监督学习两种.监督学习方法是在样本标签类别已知的情况下进行的,可以统计出各类样本的概率分布.特征空间分布区域等描述量,然后利用这些参数进行分类 ...

  8. 聚类算法及python实现——模糊C均值(FCM)

    聚类算法及python实现--模糊C均值(FCM) 模糊C和K均值的区别 K均值:硬聚类,隶属度只有0和1,基于"类内误差平方和最小化"原则 模糊C:模糊聚类,隶属度取值为[0,1 ...

  9. 聚类算法中的K均值聚类算法(K-Means clustering)

    =======================================================================               Machine Learni ...

最新文章

  1. 使用Ultra Librarian转换芯片的Altium Designer封装格式
  2. AspxCallBack控件的CallBack事件
  3. Helm 3 发布 | 云原生生态周报 Vol. 27
  4. oracle 父latch:library cache,library cache latch等待事件
  5. Python中常见的语法糖
  6. SQL技巧(多行合并一列)
  7. python改变turtle画笔方向的函数_哪个选项不能改变turtle画笔的运行方向?
  8. oracle下定时删除归档脚本
  9. 被占满_关晓彤在家做饭暴露豪宅内景,冰箱占满一整面墙,酒柜比人还要高
  10. 如何开发一个网页版的SQL查询工具
  11. 二维码上可以用精密光纤激光打标机打吗?
  12. 基于java小区物业管理系统
  13. 江民“网页收割者”病毒技术分析报告
  14. Linux命令行设置行数,Linux设置history命令显示行数以及时间
  15. riot账号服务器互通吗,云顶之弈手游和PC数据互通吗账号数据同步分析
  16. Xcode 10.1 安装模拟器无反应:点击create 无反应
  17. 2021 年第一次做核酸检测是什么体验
  18. 质量与规范,敬我们那些年欠下的技术债
  19. 浅谈中国2050年人均受教育年限问题
  20. php 微信小程序签到打卡,微信小程序实现打卡日历功能

热门文章

  1. Python之每日一练生成激活码
  2. 复盘,你做到位了吗?
  3. 关于企业建立薪酬体系的几点建议
  4. CSS Sprite——雪碧图
  5. 关于Wwise Audio的层级简介
  6. php+微信小程序大学跳蚤市场的微信小程序设计与实现毕业设计源码261620
  7. PDF合并后怎么调整顺序?
  8. 车载以太网3 时分多址TDMA和车载总线LIN
  9. [2022]Facial Geometric Detail Recovery via Implicit Representation
  10. 通过向量乘积推导地球两点之间的球面距离