#库导入
import numpy as np
from collections import defaultdict
from operator import itemgetterdef Affinity_Analysis(dataset,features,nums_feature);
if __name__ == "__main__":#数据导入(0、1矩阵,一行表示单一消费者的消费情况,一列表示单一商品售卖情况)dataset_filename="数据包路径"X=np.loadtxt(dataset_filename)#特征名称features=['bread','milk','cheese','apple','banana']#特征数量nums_feature=5#函数调用Affinity_Analysis(X,features,nums_feature)def Affinity_Analysis(dataset,features,nums_feature):#遍历数据valid_rules=defaultdict(int)invalid_rules=defaultdict(int)nums_occurances=defaultdict(int)for sample in dataset:for primise in range(nums_feature):if sample[primise]==0: continuenums_occurances[primise]+=1for conclusion in range(nums_feature):if conclusion==primise: continueif sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1else: invalid_rules[(primise,conclusion)]+=1#支持度support=valid_rules#置信度confidence=defaultdict(float)for primise,conclusion in valid_rules.keys():confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]#根据支持度和置信度进行降序排列sorted_support=sorted(support.items(),key=itemgetter(1),reverse=True)sorted_confidence=sorted(confidence.items(),key=itemgetter(1),reverse=True)#结果展示print('\n支持度由高到低:')for i in sorted_support:print("[{0} {1}]\t- Support: {2}".format(features[i[0][0]],features[i[0][1]],i[1]))#print("- Support: {0}".format(confidence[(primise,conclusion)]))#print("- Confidence: {0}".format(support[(primise,conclusion)]))print('\n置信度由高到低:')for i in sorted_confidence:print("[{0} {1}]\t- Support: {2:.3f}".format(features[i[0][0]],features[i[0][1]],i[1]))#print("- Support: {0}".format(confidence[(primise,conclusion)]))#print("- Confidence: {0}".format(support[(primise,conclusion)]))

数据挖掘-亲和性分析函数(通用)相关推荐

  1. python亲和度_数据挖掘——亲和性分析

    亲和性分析根据样本个体之间的相似度,确定它们关系的亲疏.应用场景: 1.向网站用户提供多样化的服务或投放定向广告. 2.为了向用户推荐电影或商品 3.根据基因寻找有亲缘关系的人 比如:统计顾客购买了商 ...

  2. 30个学习大数据挖掘的重要知识点!

    https://www.jianshu.com/p/2441b69794b0 下面是一些关于大数据挖掘的知识点,今天和大家一起来学习一下. 1. 数据.信息和知识是广义数据表现的不同形式. 2. 主要 ...

  3. 可达100K/月,美团招聘各类安全工程师(地点:北京/上海,内含大量岗位)

    想找钱多事少离家近的工作, 关注我们吧! 美团信息安全部招聘安全工程师(目标职级:腾讯T2.2-T4.2,阿里P6-P9,月薪 15-100K,地点:北京/上海) gogo姐说:美团疯狂招人,童鞋们骨 ...

  4. 调查数据分析的基本问题

    (转载)调查数据分析的基本问题 基本内容概述 (一)预测分析的概述  经济预测是把预测的理论和方法应用于经济领域,对经济现象的未来进行判断和预测.经济预测既是科学又是艺术.   ...

  5. 每周大数据论文(二)Data Mining with Big Data

    日常声明:论文均来自于谷歌学术或者其他国外付费论文站,博主只是读论文,译论文,分享知识,如有侵权联系我删除,谢谢.同时希望和大家一起学习,有好的论文可以推荐给我,我翻译了放上来,也欢迎大家关注我的读论 ...

  6. 谷哥学术2022年2月资源分享列表 07/20

    资源名称 下载地址 关键词 电网短路容量测试仪开发.pdf https://download.csdn.net/download/tysonchiu/80448310 技术文档 电容和电阻环形阵列探头 ...

  7. 挖掘对象、空间、多媒体、文本和Web数据

    1.复杂数据对象的挖掘处理 答:这里的对象是指复杂但相对结构化的数据对象,这些数据对象不能简单的用数据关系来表示,大多数拥有这些数据的应用基本上是面向对象的.这个时候,对数据对象的挖掘就是对复杂结构化 ...

  8. 最新CCF会议|2022-2023顶会会议时间+投稿时间+官网链接(视觉+多媒体+数据挖掘+数据库+通用人工智能)

    图形学与多媒体 序号 刊物简称 链接 出版社 截至日期 类别 会议地点 会议举办日期 1 ACM MM ACM Multimedia Systems Conference 2023 ACM Inter ...

  9. python亲和性分析_数据挖掘入门系列教程(一)之亲和性分析

    数据挖掘入门系列教程(一)之亲和性分析 教程系列简介 该教程为入门教程,为博主学习数据挖掘的学习路径步骤.教程为入门教程,从最简单的开始.使用的编程语言为Python3.8.1,使用JupyterNo ...

最新文章

  1. mybatis中传集合时 报异常 invalid comparison: java.util.Arrays$ArrayList and java.lang.String
  2. Laravel——消息通知
  3. Remove Linked List Elements
  4. 记录运行gpu错误及解决方案
  5. 【译】Java中的对象序列化
  6. 【英语学习】【Level 07】U03 Amazing wonders L2 A global city
  7. CentOS6.5和RedHat6.5下以rpm方式安装mysql-5.6.20
  8. numpy 高阶函数 —— np.histogram
  9. 飞信php接口 web service
  10. 从面试题中看Java的Reference(引用)
  11. 通王CMS采集-TWCMS文章采集-通王CMS关键词采集伪原创发布详解
  12. 刀塔霸业怎么在电脑上玩 刀塔霸业电脑版玩法教程
  13. uniapp app真机测试
  14. 《诺曼底大风暴》观后感
  15. RenderScript 让你的Android计算速度快的飞上天!
  16. 一个正在开发中的 Python3 贪吃蛇游戏
  17. 硬件经典面试 100 题
  18. 使用VB 6.0使用XML和文本文件进行数据管理:第一部分
  19. 天秤座的骑友,量身定制的骑游运动,爱上骑行的好处和特点
  20. 多颜色显示北京各县区-ArcGis操作

热门文章

  1. python 正则表达式应用——缩写词扩充
  2. C#一列数的规则如下: 1、1、2、3、5、8、13、21、34...... 求第100位数是多少, 用递归算法实现。...
  3. drupal6 笔记
  4. Chrome OS 0.4.220 Beta下载已发布
  5. Swaks-smtp瑞士军刀(smtp邮件)
  6. App设计灵感之十二组精美的天气预报App设计案例
  7. Python之深入解析一行代码计算每个省面积的神器Geopandas
  8. 110. Balanced Binary Tree 平衡二叉树
  9. 编写你的第一个 Django 应用,第 7 部分
  10. 【机器视觉】 import算子