序贯模型=关联规则+时间因素。

了解这个模型可以参考李明老师的《R语言与网站分析 [李明著][机械工业出版社][2014.04][446页]》,第九章,第二节的“序列模型关联分析”。

以下贴一个网络中关于序贯模型,R语言的arulesSequences包:转载于网易博客:Tony Woo

__________________________________________________________________________________________

今天下午基本上把通过arulesSequences来进行序列模式挖掘搞明白了,晚上又把arulesSequences中最重要的函数cspade查看了一下。Mark一下。

还是先简单写一个模式挖掘的例子。

1、数据准备

假设数据存放在E盘下的test.txt,而且E盘中的数据为:
1 10 2 C D A F H E
1 15 3 A B C E A F
1 20 3 A B F D C F
1 25 4 A C D F D D
2 15 3 A B F 
2 20 1 E
3 10 3 B F
4 10 3 D G H
4 20 2 B F
4 25 3 A G H F
4 30 12 A H H H A F F F A G G G
数据比zaki稍微复杂一些,不过只是多添加了一些个别内容。

2、建模

>x=read_baskets(con="E:/zaki.txt",info=c("sequenceID","eventID","SIZE"))
>s1 <- cspade(x, parameter = list(support = 0.6,maxlen=3), control = list(verbose = TRUE))
>as(s1,"data.frame")
主要就这么三步,就完成了序列模式挖掘。现在需要看一下核心的函数cspade()。

3、cspade函数解释

根据文档,cspade函数结构如下:
cspade(data, parameter = NULL, control = NULL, tmpdir = tempdir())
其实,参数data没啥可说的,就导入transactions类型的数据就可以了。
parameter是设定各种参数,这个还需要认真了解一下。
parameter中,可选的参数有如下几个:
support:0-1之间的一个数值,代表得到的高频序列的最小支持度。
        支持度其实是这样计算的:看上面的data中有4个序列,比如我们要计算{A}的支持度,则直接看{A}在4个序列中出现过几次,用次数再除以4就得到了支持度。至于一次订单中出现多少次A,则对序列挖掘是没啥影响的。
maxsize:一个整数值,代表在寻找高频序列的过程中,任意一个序列里面的每一个元素的最多能有几个项。
        举个例子, <{D,H},{B,F},{A}> 是我们通过序列挖掘得到的一个序列s,那么序列s包含3个元素element,其中第一个元素又包含2个项item。通过设定maxsize,可以在序列挖掘中设定1对1或多对1的不同挖掘方式。
maxlen:一个整数值,代表挖掘的序列最大可以是多长,也即一个序列最多可以有几个元素。
        比如,如果s1 <- cspade(x, parameter = list(support = 0.6,maxlen=2), control = list(verbose = TRUE))  ,那么最终得到的序列可能为: <{D,H},{B}><{A,F,H},{A,F}>

因此,通过maxlen参数可以去挖掘较短的序列。

mingap:一个整数值,确定两个连续的订单之间的最小时间差值,默认为none。
maxgap:一个整数值,确定两个连续的订单之间的最大时间差值,默认为none。
maxwin:一个整数值,确定一个序列中任意两个订单之间的最大时间差值,默认为none。
control其实是对内存了什么的控制,一般用不到,第四个也是用不到。因此,cspade函数主要就parameter的设定。

R语言︱关联规则+时间因素=序贯关联规则相关推荐

  1. R语言使用apriori算法进行关联规则挖掘实战:关联规则概念、频繁项集、支持度(support)、置信度(confidence)、提升度(lift)、apriori算法

    R语言使用apriori算法进行关联规则挖掘实战:关联规则概念.频繁项集.支持度(support).置信度(confidence).提升度(lift).apriori算法 目录

  2. r语言rank降序_R语言学习笔记:sort、rank、order、arrange排序函数

    R语言中排序有几个基本函数:sort().rank().order().arrange() 一.总结 sort()函数是对向量进行从小到大的排序 rank()函数返回的是对向量中每个数值对应的秩 or ...

  3. (转载)R语言ARIMA时间序利

    原链接: https://www.cnblogs.com/silverangel/p/10132361.html 基于R语言的时间序列分析预测 数据来源: R语言自带 Nile 数据集(尼罗河流量) ...

  4. r语言rank降序_R语言速成之第一章 向量(编辑,排序,10个基本函数)

    1.4向量的编辑 1.4.1扩展向量c() vc vc vc vc vc 注意:单独append(vc,num)不会改变vc的值 1.4.2改变元素的值直接引用后赋值 vc vc[1] vc[1:3] ...

  5. r语言rank降序_R语言rank函数详细解析

    1.rank函数是什么 rank相关文档[1]可以译为"返回原数组(?)中各个元素排序(?)后的秩次(?)",表面上看确实可以得到次序,但对数组.排序.秩次交待不清. 2.rank ...

  6. r语言rank降序_常见排序分析方法及R语言实现

    常用排序分析方法 相信大家在做微生物多样性研究时经常听到PCA分析.PCoA分析,NMDS分析,CCA分析,RDA分析.它们对物种(或基因.功能)的分析具有重要作用,因而频频出现在16S测序及宏基因组 ...

  7. 基于R语言的关联规则分析项目

    转自http://blog.163.com/dm_team/blog/static/2379750132014891084989/ 摘要 抱着成为一名优秀的数据分析师/数据挖掘师的理想,我们组成了一个 ...

  8. R语言学习(六)——关联规则分析

    什么是关联规则 引例:啤酒与尿布 发现了买尿布的顾客经常也会买啤酒后,超市把两者摆在一起,从而提高了两者的销量.具体原因是:年轻的父亲下班回家的路上需要给孩子买尿布,但他们又没空去酒吧,所以就通常也给 ...

  9. python晋江文学城数据分析——标签关联规则分析(Apriori算法+R语言)

    在学R语言购物篮分析,突然联想到虽然标签算不得商品,但和商品很相似,可以看看作者设置标签时喜欢把什么标签放一块.由于前文一直用的是python,所以准备接着用python,但是整体弄下来后,发现在可视 ...

最新文章

  1. Oracle技术之Data Pump介绍
  2. Android开发指南(42) —— Adding Custom Suggestions
  3. python查看dataframe数据类型_python pandas中DataFrame类型数据操作函数的方法
  4. QDoc文件结构documentstructure
  5. Activiti工作流6.0表结构介绍
  6. java时间往后一天_如何在Java中将日期增加一天?
  7. 如何取消wlan自动登录 更换wlan帐号
  8. Spring: Spring 从xml获取bean
  9. 轮子来袭 vJine.Core Orm 之 01_快速体验
  10. 使用NPO依赖的一些类库文件介绍
  11. android短信模板,短信服务 · Android – Bmob后端云
  12. Ubuntu16.04装机2:安装CUDA10.2+cuDNN7.6.5
  13. 未处理System.BadImageFormatException,试图加载格式不正确的程序。 (异常来自 HRESULT:0x8007000B)
  14. 使用PdgCntEditor软件对PDF目录进行快速编辑
  15. 乐视第4代超级电视引领行业风向标
  16. Modeling Personalized Item Frequency Information for Next-basket Recommendation
  17. 游戏开发团队及工作流程
  18. 今天有个同事L发了一个“称象”的帖子,不过更搞笑的是另一个同事Z回了一个经典的解答。...
  19. 常用的js代码以及自动在线生成JavaScript工具地址
  20. 第七章:OCP工具简介

热门文章

  1. uoj #111. 【APIO2015】Jakarta Skyscrapers
  2. tomcat+路由器+oray
  3. 搭建rocketMq环境
  4. 2018-05-17-OAA-一种mermaid脚本驱动的软件项目模块图形化表述思路
  5. 第100篇博文纪念 | C# 根据数据库表结构生成DOC数据库文档
  6. ajax请求数据之后在已经有的数据前面打对勾的方法
  7. git_day03_01——git远程仓库的使用
  8. Android 异步处理AsyncTask
  9. Android开发实践:线程与异步任务
  10. opencv绘制基本形状的二值图像