数据挖掘-亲和性分析函数(通用)

#库导入
import numpy as np
from collections import defaultdict
from operator import itemgetterdef Affinity_Analysis(dataset,features,nums_feature);
if __name__ == "__main__":#数据导入(0、1矩阵，一行表示单一消费者的消费情况，一列表示单一商品售卖情况)dataset_filename="数据包路径"X=np.loadtxt(dataset_filename)#特征名称features=['bread','milk','cheese','apple','banana']#特征数量nums_feature=5#函数调用Affinity_Analysis(X,features,nums_feature)def Affinity_Analysis(dataset,features,nums_feature):#遍历数据valid_rules=defaultdict(int)invalid_rules=defaultdict(int)nums_occurances=defaultdict(int)for sample in dataset:for primise in range(nums_feature):if sample[primise]==0: continuenums_occurances[primise]+=1for conclusion in range(nums_feature):if conclusion==primise: continueif sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1else: invalid_rules[(primise,conclusion)]+=1#支持度support=valid_rules#置信度confidence=defaultdict(float)for primise,conclusion in valid_rules.keys():confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]#根据支持度和置信度进行降序排列sorted_support=sorted(support.items(),key=itemgetter(1),reverse=True)sorted_confidence=sorted(confidence.items(),key=itemgetter(1),reverse=True)#结果展示print('\n支持度由高到低：')for i in sorted_support:print("[{0} {1}]\t- Support: {2}".format(features[i[0][0]],features[i[0][1]],i[1]))#print("- Support: {0}".format(confidence[(primise,conclusion)]))#print("- Confidence: {0}".format(support[(primise,conclusion)]))print('\n置信度由高到低：')for i in sorted_confidence:print("[{0} {1}]\t- Support: {2:.3f}".format(features[i[0][0]],features[i[0][1]],i[1]))#print("- Support: {0}".format(confidence[(primise,conclusion)]))#print("- Confidence: {0}".format(support[(primise,conclusion)]))

数据挖掘-亲和性分析函数(通用)相关推荐

python亲和度_数据挖掘——亲和性分析
亲和性分析根据样本个体之间的相似度,确定它们关系的亲疏.应用场景: 1.向网站用户提供多样化的服务或投放定向广告. 2.为了向用户推荐电影或商品 3.根据基因寻找有亲缘关系的人比如:统计顾客购买了商 ...
30个学习大数据挖掘的重要知识点！
https://www.jianshu.com/p/2441b69794b0 下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下. 1. 数据.信息和知识是广义数据表现的不同形式. 2. 主要 ...
可达100K/月，美团招聘各类安全工程师（地点：北京/上海，内含大量岗位）
想找钱多事少离家近的工作, 关注我们吧! 美团信息安全部招聘安全工程师(目标职级:腾讯T2.2-T4.2,阿里P6-P9,月薪 15-100K,地点:北京/上海) gogo姐说:美团疯狂招人,童鞋们骨 ...
调查数据分析的基本问题
(转载)调查数据分析的基本问题 基本内容概述 (一)预测分析的概述  经济预测是把预测的理论和方法应用于经济领域,对经济现象的未来进行判断和预测.经济预测既是科学又是艺术.   ...
每周大数据论文（二）Data Mining with Big Data
日常声明:论文均来自于谷歌学术或者其他国外付费论文站,博主只是读论文,译论文,分享知识,如有侵权联系我删除,谢谢.同时希望和大家一起学习,有好的论文可以推荐给我,我翻译了放上来,也欢迎大家关注我的读论 ...
谷哥学术2022年2月资源分享列表 07/20
资源名称下载地址关键词电网短路容量测试仪开发.pdf https://download.csdn.net/download/tysonchiu/80448310 技术文档电容和电阻环形阵列探头 ...
挖掘对象、空间、多媒体、文本和Web数据
1.复杂数据对象的挖掘处理答:这里的对象是指复杂但相对结构化的数据对象,这些数据对象不能简单的用数据关系来表示,大多数拥有这些数据的应用基本上是面向对象的.这个时候,对数据对象的挖掘就是对复杂结构化 ...
最新CCF会议|2022-2023顶会会议时间+投稿时间+官网链接（视觉+多媒体+数据挖掘+数据库+通用人工智能）
图形学与多媒体序号刊物简称链接出版社截至日期类别会议地点会议举办日期 1 ACM MM ACM Multimedia Systems Conference 2023 ACM Inter ...
python亲和性分析_数据挖掘入门系列教程（一）之亲和性分析
数据挖掘入门系列教程(一)之亲和性分析教程系列简介该教程为入门教程,为博主学习数据挖掘的学习路径步骤.教程为入门教程,从最简单的开始.使用的编程语言为Python3.8.1,使用JupyterNo ...

数据挖掘-亲和性分析函数(通用)

数据挖掘-亲和性分析函数(通用)相关推荐

最新文章

热门文章