在做商品关联度分析的时候,我们可能会遇到各种各样格式的数据,而对数据的格式往往会影响关联度分析,一般来说,数据源大多有三种格式:

  • 第一种是事务型交易数据,典型的数据格式是每个数据行以订单ID或以客户ID作为关联分析的参照维度,如果同一个订单中有多少类商品,将会有多个数据行记录。如图下所示:
  • 第二种是合并后的交易数据,数据格式是每个数据行以订有单ID或以客户ID作为关联分析的参照维度,如果不同商品在同一个订单中,那么将会有多个数据行记录。
  • 第三种是真值表格数据,每个数据行以订有单ID或以客户ID,列是每个要关联物品是否购买值,通常T或F表示,不过3.第三种是真值表格数据,每个数据行以订有单ID或以客户ID,列是每个要关联商品是否购值,通常用T或F表示。不过我们这里的列表示每个要关联商品要购买的个数,这种数据格式暂时称为假真值表格数据

    在关联性分析时,对第一、第二种数据格式的操作比较复杂,而第三种几乎不再对数据格式进行任何操作就可以进行关联性分析。因此,为了方便起见,如何将第一第二种数据格式转化为第三种格式将会很大影响关联性的方便程度,而Excel给我们提供了一个很简单的转化方式,透视表,以下是它的操作步骤。

- 第一步,选择所要转化的数据,点击插入,后点击推荐的数据透明表格。

- 第二步,点击红色箭头指向的选项。

- 第三步,按照箭头所示,分别将订单号拉向“行”下面的方框,商品拉向“列”下面的方框,以及将个数拉向‘值’下面的方框便可得到第三种数据中的假真值表格数据。

如果要得到真值表格数据,只要在第一步的时候点击“数据透视表”,然后直接按照第三步的操作方式便可以得到真值表格数据。

Excel如何把事务型数据转化为可以直接关联性分析数据相关推荐

  1. 篮球数据API接口 - 【篮球赛事分析数据】API调用示例代码

    分享使用接口调用的示例代码,篮球数据[篮球赛事分析数据]接口 package com.huaying.demo.basketball;import java.nio.charset.StandardC ...

  2. 足球数据API接口 - 【足球赛事分析数据】API调用示例代码

    分享使用接口调用的示例代码,足球数据[足球赛事分析数据]接口 package com.huaying.demo.football;import java.nio.charset.StandardCha ...

  3. 数据总量 40 亿+,报表分析数据 10 亿+,TiDB 在中通的落地与进化

    作者:luzizhuo 原文来源: https://tidb.net/blog/3da1aed9 本文根据中通快递数据智能部基础架构负责人朱友志在[PingCAP DevCon 2021]上的演讲整理 ...

  4. 将EXCEL表格的数据转化为数组对象形式的数据

    使用xlsx.full.min.js读取excel表格数据 excel 数据是这样的 处理后数据是这样的 代码如下,需要引入xlsx.full.min.js 下载地址 <!doctype htm ...

  5. 如何将多个文本数据转化为指定数据格式[以电影数据为例](数据预处理)

    数据格式 目标数据格式 程序 局限性 本文为原创博客,仅供技术学习使用.未经允许,禁止将其复制下来上传到百度文库等平台.如有转载请注明本文博客的地址(链接) 数据格式 首先,我来介绍一下数据格式.存在 ...

  6. 如何对一个变量数据进行正则判定_生存分析数据中的BuckleyJamesMultipleRegression Model...

    一.模型简介 目前,生存分析领域,最常用的是Cox比例风险回归模型,该模型具有良好的特性,不仅可以分析各种自变量对生存时间的影响,而且对基准风险分布不作任何要求(半参数模型).Cox模型使用时要满足一 ...

  7. 数据分区与放置策略解析_数据策略好数据与坏数据

    数据分区与放置策略解析 In 1990 the Virginia based bank "Signet Bank" decided to trust two smart peopl ...

  8. 大数据学习路线,如何学习大数据?

    声明:本文转至http://blog.csdn.net/yuexianchang/article/details/52468291 1.Linux基础和分布式集群技术 学完此阶段可掌握的核心能力: 熟 ...

  9. 提取数据_基于众包的可视化图表数据提取

    Crowdsourcing-based Data Extraction from Visualization Charts 作者 Chengliang Chai† Guoliang Li† Ju Fa ...

最新文章

  1. ImageNet识别率一次提高1%:谷歌AI新突破引Jeff Dean点赞
  2. 【计算机网络】网络安全 : 计算机网络安全威胁 ( 四种网络攻击类型 | 主动攻击与被动攻击 | 分布式拒绝服务攻击 DDos | 恶意程序 | 计算机网络安全目标)
  3. spark之5:配置文件
  4. C#语法——await与async的正确打开方式
  5. 学习笔记1-Linux1
  6. 亿级Web系统负载均衡几种实现方式
  7. 量化交易入门读物列表
  8. Fixed the bug:while running alert/confirm in javascript the chrome freezes
  9. jQuery-1.9.1源码分析系列(十) 事件系统——事件包装
  10. axios发送网络请求
  11. VMware Workstation 6.0 正式版公布
  12. 浅谈Android事件分发
  13. Wi-Fi当前的趋势及对IT和物联网的影响
  14. java 实现写出倒立三角形的几种方法
  15. python表白玫瑰花绘制——情人节表白
  16. CSMA/CD协议 详解
  17. python开发ps插件_python +ps 三方面库整理
  18. c#圆的周长和面积面向对象_初遇C#:一个简单的小程序(圆形周长,面积计算器)...
  19. DPlayer视频播放器使用方法介绍
  20. 天梯赛习题:直捣黄龙(Dijsk算法 + dfs + 路径状态存储)

热门文章

  1. 松下PLC控制松下伺服电机(上位机发送控制命令)
  2. 密码安全:密码设置要求,密码爆破办法,密码归类使用,密码处置方案
  3. Java中通过JNI技术开发一款PC端微信数据库解密备份工具
  4. 【软件质量】软件健壮性
  5. 在微软从测试开发工程师到主管
  6. python manage.py startapp app 执行成功但未生成 app文件夹 解决办法
  7. 单机版坦克大战游戏总结
  8. 针对在线游戏玩家的 DDoS 攻击和破坏性的涟漪效应
  9. java面试(二)--(1)EJB的几种类型(2)Hibernate的悲观锁和乐观锁(3) 二叉搜索树与双向链表
  10. C++设计模式 - 代理模式详解一