机器学习基本概念

机器学习

机器学习是一门致力于研究如何通过计算的手段,根据经验改善系统自身的性能的学科。

算法

算法是指一系列规则和运算公式。将这些规则和运算公式作用到数据集上,能够得到一个分析结果,通常就是一 个模型。

模型构建

模型构建是指选择数据和算法,执行算法生成模型的过程。

数据集

数据集即我们机器学习使用的数据,往往具有很多维度,数据集常被划分为训练集和测试集。

机器学习分类

K-means算法

基本概念

K-means算法是很典型的基于距离的聚类算法,一般采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。

内部迭代原理

为避免运行时间过长,通常设置一个最大运行轮数或最小调整幅度作为阈值。

算法特点

  1. 使用速度快,原理简单易掌握。
  2. k均值算法中k值是需要预先给定的,因为得到的结果会服务于后续目的,所以k值的确定不能脱离实际。
  3. k均值的聚类算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,当数据量大的时候,算法开销很大。
  4. k均值是求得局部最优解的算法,所以对于初始化时选取的k个聚类的中心比较敏感,不同点的中心选取策略可能带来不同的聚类结果。

算法流程

基于K-means算法的客户分群知识相关推荐

  1. [Python] 用K-means聚类算法进行客户分群

    目录 一.背景 1.项目描述 2.数据描述 二.相关模块 三.数据可视化 1.数据读取 2.数据可视化 2.1 平行坐标图 2.2 年龄/年收入/消费分数的分布 2.3 年龄/年收入/消费分数的柱状图 ...

  2. kmeans改进 matlab,基于距离函数的改进k―means 算法

    摘要:聚类算法在自然科学和和社会科学中都有很普遍的应用,而K-means算法是聚类算法中经典的划分方法之一.但如果数据集内相邻的簇之间离散度相差较大,或者是属性分布区间相差较大,则算法的聚类效果十分有 ...

  3. 客户分群基于聚类方法:KMeans以及GMM(Gaussian Mixture Model )

    客户分群基于聚类方法:KMeans以及GMM(Gaussian Mixture Model ) 多维度客户分群简介 1.1 聚类算法简介 企业在进行客户分析时,往往希望通过了解不同的客户具有什么不同的 ...

  4. 精细化营销和客户分群

    昨天听的一场报告,感觉不错,整理一下. (电脑死机,本来都快整理好了,哭) 1.什么是精细化营销 精细化营销就是恰当地.贴切根据客户的差异将客户分群,采取不同的营销策略.比较有名的有天猫的千人千面,亚 ...

  5. 风控必学|肘部法与客户分群——客户画像中的聚类与特征画像分析

    客户聚类分析,在信贷圈子里,是一种很常见的数据挖掘场景,对于从事金融数据分析岗位的我们,也是需要必备掌握能力之一.无论是策略分析岗,还是数据建模岗,或者是数据分析岗,客户样本的分群画像,在某些程度上来 ...

  6. 破局存量客群营销,试一下客户分群管理(含聚类模型等实操效果评估)

    信贷场景下的客户分群,在实际业务中有着非常重要的意义,例如存量客群营销.客户价值管理.产品精准营销.风控层次部署等,都会依据不同类别客户的合理划分.客户群体的分类,我们经常通过机器学习中的聚类算法来实 ...

  7. 基于K-means聚类算法进行客户人群分析

    摘要:在本案例中,我们使用人工智能技术的聚类算法去分析超市购物中心客户的一些基本数据,把客户分成不同的群体,供营销团队参考并相应地制定营销策略. 本文分享自华为云社区<基于K-means聚类算法 ...

  8. 数据挖掘中客户分群的应用

    通过前期对系统内部的数据挖掘进行客户分群,并打上了相关的客户标签,这些客户标签对后期有什么应用呢?目前在做一个电信数据挖掘项目过程中,发现了电信客户觉得客户标签对他们的电信产品有很大的作用,希望能够找 ...

  9. 基于RFM和K-Means的用户分群

    在本项目中,我们基于用户购买数据(Transaction Data)做用户的分群,使用的方法一次是RFM模型和K-means算法. 原始数据是:http://archive.ics.uci.edu/m ...

最新文章

  1. OpenGL Texture Wrap Modes纹理包裹模式的实例
  2. Hard Disk Drive HDU - 4788——24行代码AC,解题报告
  3. 文献学习(part28)--Biclustering of gene expression data based on related genes and conditions extraction
  4. 快速上手Linux核心命令(四):文件内容相关命令
  5. ADO.NET常用对象详解之:Command对象
  6. 任何性能指标越界或造成 APP 崩溃,优酷通用性能测试一招搞定
  7. 我是如何获取新知识的?
  8. Spring Cloud入门五 hystrix
  9. 苹果id可以同时用两个手机吗_苹果手机Apple ID账号的重要性你知道多少?
  10. 今日头条如何赚钱,今日头条赚钱规则,今日头条快速赚钱技巧
  11. elementUI的tree组件搜索过滤,可识别拼音,且不区分大小写
  12. Python做一个“盯盘机器人”,实时监控股票价格并通知你!
  13. matlab 从字符串里面提取出数字
  14. 豆瓣电影Top250信息爬取并保存到excel文件中!
  15. VIM插件管理:管理插件的插件pathogen
  16. 在Win10中安装Openfoam
  17. 纪念日+小游戏+工具小软件
  18. osg导入模型时,模型全黑的原因及解决方法分析
  19. c语言用库函数求正弦数,用C语言求正弦值?
  20. java构造方法时对象初始化,实例化,参数赋值

热门文章

  1. 关于学校正方教务管理系统登录的分析
  2. mysql强化练习_MySQL数据库 - 50道SQL强化练习题
  3. 理解strtok函数返回值
  4. 如何使用 SketchUp 最大限度地提高室内设计的效率和创造力?
  5. 比起银隆大股东,这才是董明珠多年来最大的敌人
  6. CSS如何使得img图片设置无色透明
  7. 从IP V4 向IP V6 过渡(计算机网络-网络层)
  8. 夺命雷公狗---node.js---13之Buffer的转换
  9. Value of type “string“ is not suitable for value type “Numeric (float)“. Value “Traceback (most rece
  10. otrs安装mysql_安装OTRS | 学步园