数据挖掘-亲和性分析函数(通用)
#库导入
import numpy as np
from collections import defaultdict
from operator import itemgetterdef Affinity_Analysis(dataset,features,nums_feature);
if __name__ == "__main__":#数据导入(0、1矩阵,一行表示单一消费者的消费情况,一列表示单一商品售卖情况)dataset_filename="数据包路径"X=np.loadtxt(dataset_filename)#特征名称features=['bread','milk','cheese','apple','banana']#特征数量nums_feature=5#函数调用Affinity_Analysis(X,features,nums_feature)def Affinity_Analysis(dataset,features,nums_feature):#遍历数据valid_rules=defaultdict(int)invalid_rules=defaultdict(int)nums_occurances=defaultdict(int)for sample in dataset:for primise in range(nums_feature):if sample[primise]==0: continuenums_occurances[primise]+=1for conclusion in range(nums_feature):if conclusion==primise: continueif sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1else: invalid_rules[(primise,conclusion)]+=1#支持度support=valid_rules#置信度confidence=defaultdict(float)for primise,conclusion in valid_rules.keys():confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]#根据支持度和置信度进行降序排列sorted_support=sorted(support.items(),key=itemgetter(1),reverse=True)sorted_confidence=sorted(confidence.items(),key=itemgetter(1),reverse=True)#结果展示print('\n支持度由高到低:')for i in sorted_support:print("[{0} {1}]\t- Support: {2}".format(features[i[0][0]],features[i[0][1]],i[1]))#print("- Support: {0}".format(confidence[(primise,conclusion)]))#print("- Confidence: {0}".format(support[(primise,conclusion)]))print('\n置信度由高到低:')for i in sorted_confidence:print("[{0} {1}]\t- Support: {2:.3f}".format(features[i[0][0]],features[i[0][1]],i[1]))#print("- Support: {0}".format(confidence[(primise,conclusion)]))#print("- Confidence: {0}".format(support[(primise,conclusion)]))
数据挖掘-亲和性分析函数(通用)相关推荐
- python亲和度_数据挖掘——亲和性分析
亲和性分析根据样本个体之间的相似度,确定它们关系的亲疏.应用场景: 1.向网站用户提供多样化的服务或投放定向广告. 2.为了向用户推荐电影或商品 3.根据基因寻找有亲缘关系的人 比如:统计顾客购买了商 ...
- 30个学习大数据挖掘的重要知识点!
https://www.jianshu.com/p/2441b69794b0 下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下. 1. 数据.信息和知识是广义数据表现的不同形式. 2. 主要 ...
- 可达100K/月,美团招聘各类安全工程师(地点:北京/上海,内含大量岗位)
想找钱多事少离家近的工作, 关注我们吧! 美团信息安全部招聘安全工程师(目标职级:腾讯T2.2-T4.2,阿里P6-P9,月薪 15-100K,地点:北京/上海) gogo姐说:美团疯狂招人,童鞋们骨 ...
- 调查数据分析的基本问题
(转载)调查数据分析的基本问题 基本内容概述 (一)预测分析的概述 经济预测是把预测的理论和方法应用于经济领域,对经济现象的未来进行判断和预测.经济预测既是科学又是艺术. ...
- 每周大数据论文(二)Data Mining with Big Data
日常声明:论文均来自于谷歌学术或者其他国外付费论文站,博主只是读论文,译论文,分享知识,如有侵权联系我删除,谢谢.同时希望和大家一起学习,有好的论文可以推荐给我,我翻译了放上来,也欢迎大家关注我的读论 ...
- 谷哥学术2022年2月资源分享列表 07/20
资源名称 下载地址 关键词 电网短路容量测试仪开发.pdf https://download.csdn.net/download/tysonchiu/80448310 技术文档 电容和电阻环形阵列探头 ...
- 挖掘对象、空间、多媒体、文本和Web数据
1.复杂数据对象的挖掘处理 答:这里的对象是指复杂但相对结构化的数据对象,这些数据对象不能简单的用数据关系来表示,大多数拥有这些数据的应用基本上是面向对象的.这个时候,对数据对象的挖掘就是对复杂结构化 ...
- 最新CCF会议|2022-2023顶会会议时间+投稿时间+官网链接(视觉+多媒体+数据挖掘+数据库+通用人工智能)
图形学与多媒体 序号 刊物简称 链接 出版社 截至日期 类别 会议地点 会议举办日期 1 ACM MM ACM Multimedia Systems Conference 2023 ACM Inter ...
- python亲和性分析_数据挖掘入门系列教程(一)之亲和性分析
数据挖掘入门系列教程(一)之亲和性分析 教程系列简介 该教程为入门教程,为博主学习数据挖掘的学习路径步骤.教程为入门教程,从最简单的开始.使用的编程语言为Python3.8.1,使用JupyterNo ...
最新文章
- mybatis中传集合时 报异常 invalid comparison: java.util.Arrays$ArrayList and java.lang.String
- Laravel——消息通知
- Remove Linked List Elements
- 记录运行gpu错误及解决方案
- 【译】Java中的对象序列化
- 【英语学习】【Level 07】U03 Amazing wonders L2 A global city
- CentOS6.5和RedHat6.5下以rpm方式安装mysql-5.6.20
- numpy 高阶函数 —— np.histogram
- 飞信php接口 web service
- 从面试题中看Java的Reference(引用)
- 通王CMS采集-TWCMS文章采集-通王CMS关键词采集伪原创发布详解
- 刀塔霸业怎么在电脑上玩 刀塔霸业电脑版玩法教程
- uniapp app真机测试
- 《诺曼底大风暴》观后感
- RenderScript 让你的Android计算速度快的飞上天!
- 一个正在开发中的 Python3 贪吃蛇游戏
- 硬件经典面试 100 题
- 使用VB 6.0使用XML和文本文件进行数据管理:第一部分
- 天秤座的骑友,量身定制的骑游运动,爱上骑行的好处和特点
- 多颜色显示北京各县区-ArcGis操作
热门文章
- python 正则表达式应用——缩写词扩充
- C#一列数的规则如下: 1、1、2、3、5、8、13、21、34...... 求第100位数是多少, 用递归算法实现。...
- drupal6 笔记
- Chrome OS 0.4.220 Beta下载已发布
- Swaks-smtp瑞士军刀(smtp邮件)
- App设计灵感之十二组精美的天气预报App设计案例
- Python之深入解析一行代码计算每个省面积的神器Geopandas
- 110. Balanced Binary Tree 平衡二叉树
- 编写你的第一个 Django 应用,第 7 部分
- 【机器视觉】 import算子