Python数据挖掘与机器学习,快速掌握聚类算法和关联分析
摘要:前文数据挖掘与机器学习技术入门实战与大家分享了分类算法,在本文中将为大家介绍聚类算法和关联分析问题。分类算法与聚类到底有何区别?聚类方法应在怎样的场景下使用?如何使用关联分析算法解决个性化推荐问题?本文就为大家揭晓答案。
from sklearn.cluster import KMeans
kms=KMeans(n_clusters=3)
y=kms.fit_predict(x)
#通过聚类分析客户价值
import pandas as pda
import numpy as npy
import matplotlib.pylab as pyl
fname="D:\\我的教学\\Python\\阿里云系列直播\\第4次直播代码\\company.csv"
dataf=pda.read_csv(fname,encoding="gbk")
x=dataf.as_matrix()
from sklearn.cluster import KMeans
kms=KMeans(n_clusters=3)
y=kms.fit_predict(x)
print(y)
#年龄-消费金额图,消费时间-消费金额图,年龄-消费时间图
for i in range(0,len(y)):if(y[i]==0):print(str(i)+"大众客户")pyl.subplot(2,3,1)#年龄-消费金额图pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"*r")pyl.subplot(2,3,2)#消费时间-消费金额图pyl.plot(dataf.iloc[i:i+1,2:3].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"*r")pyl.subplot(2,3,3)#年龄-消费时间图pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,2:3].as_matrix(),"*r")elif(y[i]==1):print(str(i)+"超级VIP客户")pyl.subplot(2,3,1)#年龄-消费金额图pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"sy")pyl.subplot(2,3,2)#消费时间-消费金额图pyl.plot(dataf.iloc[i:i+1,2:3].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"sy")pyl.subplot(2,3,3)#年龄-消费时间图pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,2:3].as_matrix(),"sy")elif(y[i]==2):print(str(i)+"VIP客户")pyl.subplot(2,3,1)#年龄-消费金额图pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"pb")pyl.subplot(2,3,2)#消费时间-消费金额图pyl.plot(dataf.iloc[i:i+1,2:3].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"pb")pyl.subplot(2,3,3)#年龄-消费时间图pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,2:3].as_matrix(),"pb")
pyl.show()
from apriori import *
import pandas as pda
filename="D:/Python35/data/lesson_buy.xls"
dframe=pda.read_excel(filename,header=None)
change=lambda x:pda.Series(1,index=x[pda.notnull(x)])
mapok=map(change,dframe.as_matrix())
data=pda.DataFrame(list(mapok)).fillna(0)
#设置置信度阈值和支持度阈值
surpport=0.2
cfd=0.3
print(find_rule(data,surpport,cfd))
import FP_Grow_tree
sample=[['milk','eggs','bread','chips'],['eggs','popcorn','chips','beer'],['eggs','bread','chips'],['milk','eggs','bread','popcorn','chips','beer'],['milk','bread','beer'],['eggs','bread','beer'],['milk','bread','chips'],['milk','eggs','bread','butter','chips'],['milk','eggs','butter','chips']
]
sample1=[[u'牛奶',u'鸡蛋',u'面包',u'薯片'],[u'鸡蛋',u'爆米花',u'薯片',u'啤酒'],[u'鸡蛋',u'面包',u'薯片'],[u'牛奶',u'鸡蛋',u'面包',u'爆米花',u'薯片',u'啤酒'],[u'牛奶',u'面包',u'啤酒'],[u'鸡蛋',u'面包',u'啤酒'],[u'牛奶',u'面包',u'薯片'],[u'牛奶',u'鸡蛋',u'面包',u'黄油',u'薯片'],[u'牛奶',u'鸡蛋',u'黄油',u'薯片']
]
#print(sample1)
##参数说明 sample为事务数据集 []为递归过程中的基,support为最小支持度
support=3
ff=FP_Grow_tree.FP_Grow_tree(sample1,[],support)
##打印频繁集
ff.printfrequent()
本文作者:聒小小噪
Python数据挖掘与机器学习,快速掌握聚类算法和关联分析相关推荐
- Python数据挖掘项目:构建随机森林算法模型预测分析泰坦尼克号幸存者数据
作者CSDN:进击的西西弗斯 本文链接:https://blog.csdn.net/qq_42216093/article/details/120196972 版权声明:本文为作者原创文章,未经作者同 ...
- 【Python】sklearn机器学习之层次聚类算法AgglomerativeClustering
文章目录 基本原理 绘图层次 定义距离 基本原理 和Birch聚类相似,层次聚类也是一种依赖树结构实现的聚类方法,其核心概念是相似度.根据相似度,可以将所有样本组织起来,从而构建一棵层次聚类树. 其中 ...
- 【Python】sklearn机器学习之Birch聚类算法
文章目录 基本原理 sklearn调用 基本原理 BIRCH,即Balanced Iterative Reducing and Clustering Using Hierarchies,利用分层的平衡 ...
- 带你入门Python数据挖掘与机器学习(附代码、实例)
作者:韦玮 来源:Python爱好者社区 本文共7800字,建议阅读10+分钟. 本文结合代码实例待你上手python数据挖掘和机器学习技术. 本文包含了五个知识点: 1. 数据挖掘与机器学习技术简介 ...
- 基于Spark的机器学习实践 (九) - 聚类算法
0 相关源码 1 k-平均算法(k-means clustering)概述 1.1 回顾无监督学习 ◆ 分类.回归都属于监督学习 ◆ 无监督学习是不需要用户去指定标签的 ◆ 而我们看到的分类.回归算法 ...
- Python 数据挖掘与机器学习进阶实训-3-韦玮-专题视频课程
Python 数据挖掘与机器学习进阶实训-3-106人已学习 课程介绍 Python 数据挖掘与机器学习进阶实训-3 课程收益 培养Python全栈工程师 讲师介绍 韦 ...
- python数据挖掘与机器学习实践技术
分析机器学习在应用时需要掌握的经验及编程技巧.通过实际案例的形式,介绍如何提炼创新点,以及如何发表高水平论文等相关经验.旨在掌握Python编程的基础知识与技巧.特征工程(数据清洗.变量降维.特征选择 ...
- Python 数据挖掘与机器学习进阶实训-2-韦玮-专题视频课程
Python 数据挖掘与机器学习进阶实训-2-39人已学习 课程介绍 Python 数据挖掘与机器学习进阶实训-2 课程收益 培养Python全栈工程师 讲师介绍 韦玮 ...
- Python 数据挖掘与机器学习进阶实训-1-韦玮-专题视频课程
Python 数据挖掘与机器学习进阶实训-1-262人已学习 课程介绍 Python 数据挖掘与机器学习进阶实训-1 课程收益 培养Python全栈工程师 讲师介绍 韦 ...
最新文章
- c语言 sysinfo_操作系统:内存分配(C语言 winapi)
- 麦子学院彭亮python基础_麦子学院python
- 前端学习之——h5适配
- C# 将程序添加开机启动的三种方式
- win7 找不到 计算机策略组,win7打开组策略报错:找不到资源string.Advanced_EnableSSL3Fallback...
- python新线程打开cmd_Python – 函数无法在新线程中运行
- python中的shallow copy 和 deep copy
- 刚安装了极域电子教室,默认密码是什么?(教师端)
- 100行代码搞定Python做OCR识别身份证,文字各种字体!
- 抖音书单号怎么取名,抖音书单号大概多久能起来
- 【解决】package ‘xxxx‘ is not in GOROOT
- 20种硬件工程师必知必会基础元器件|最新更新至8.13
- 仅仅有人物没背景的图片怎么弄_纯干货//只会画人物不会画背景?这3种方法教你快速画背景!...
- matlab中dos命令的应用
- 经典面试题扔鸡蛋(Google面试题附带LeetCode例题)
- 【学习教程】全系统各类型工程水土保持方案编制实践技术系列
- 在职研究生报考条件2020年
- TAQ服务器npc多久自动交物资,怀旧服GZS故意拖延TAQ开门,手段无下限?玩家:杀NPC举报也没用!...
- phpcms数据库备份与恢复_数据库备份与恢复方案
- 【Python游戏开发】史上最有趣的一款象棋代码,真是太好玩了,这些人都说它比国际象棋更好玩,不服你往下看?(敲赞啊~)
热门文章
- tensorflow python3.6_[教程]Tensorflow + win10 + CPU + Python3.6+ 安装教程
- python考试搜题-大学mooc用Python玩转数据章节考试答案
- 【LeetCode笔记】139. 单词拆分(Java、动态规划、字符串、哈希表)
- linux设置历史命令保留数目限制,linux下修改history命令保存条数
- 多层协议解析 c语言,基于DPI的应用层协议书解析.doc
- python寻找屏幕上的特定字符_库Turtle:用Python指挥小海龟在屏幕上绘图,流行的儿童编程...
- mysql游标的概述_MySQL游标简介
- python扫描字符串文本时下线_python:SyntaxError:扫描字符串li时的EOL
- 中科院发布规范学术论著署名问题负面行为清单
- 85岁院士的新年浪漫:这大概是最美好的爱情