AC自动机最初作用  一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章,让你找出有多少个单词在文章里出现过。

当然这不是AC自动机的全部作用。

本文就是一例,给出几个单词,查询在text里出现最多次数的单词,如果不唯一,按输入次序输出

AC自动机是刚刚学的,修改其实自己没能力,参考了别人的代码,修改了自己的模板

先看题目http://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=505&page=show_problem&problem=4195

再看我自己的AC模板(修改前的)

/*************************************************/
//AC 自动机  by Pilgrim
//
//MAXLEN 模式串的长度
//str 模式串(待匹配的)
//keyword 待输入的单词
//cnt是否为该单词的最后一个节点,Insert的时候,
//当单词插入完成,其最后一个节点的cnt=1
//root的fail为NULL
//
// 初始化
//root=cur=Trie;    //cur指向存储单元的末地址
//head = tail = 0;
//root->clr();
//另外在Insert的时候  创建节点的时候也是要clr()的
/*************************************************/#define MAXLEN 1000010
#define MAXTRIE 500010
#define WORDLEN 51
#define KIND 26char str[MAXLEN],keyword[WORDLEN];struct Node{Node *fail;Node *next[KIND];   /*next数组里存的是当前节点的孩子*/int cnt;void clr(){fail = NULL;cnt = 0;memset(next,0,sizeof(next)*KIND);}
}Trie[MAXTRIE],*q[MAXTRIE],*root,*cur;  /*看最开头的注释*/
int head,tail;/*队列首尾 初始化head = tail = 0*/void Insert(char s[])   /*向Tries 插入单词*/
{int idx,i,n=strlen(s);Node *p=root;for(int i=0;i<n;i++){idx = s[i]-'a';if(p->next[idx]==NULL){/*NULL的时候才分配空间,是为了处理这种情况:he  her 两个单词,字典树上他们在同一个分支,r和e的cnt都是1*/p->next[idx]=++cur;p->next[idx]->clr();}p=p->next[idx];}p->cnt++;   /*插入完成,此处是p->cnt++而非p->cnt=1;是为了排除这种情况:her er 这两个单词,如果是p->cnt=1只会被按一种单词计数,但是也造成的问题是,模板串即keyword重复的时候会出现问题*/
}void Build_AC()
{Node *p,*tmp;root->fail=NULL;q[tail++]=root;while(head!=tail){p=q[head++];for(int i=0;i<KIND;i++){if(p->next[i]){q[tail++]=p->next[i];if(p == root){p->next[i]->fail = root;}else{tmp=p->fail;while(tmp!=NULL){if(tmp->next[i])    /*tmp->next[i] p->next[i]  i都表示'a'+i故如果tmp->next[i]!=NULL,说明以前出现过'a'+i*/{p->next[i]->fail=tmp->next[i];break;}tmp=tmp->fail;}if(tmp == NULL)p->next[i]->fail = root;}}}}
}int Query()
{int ans=0,n=strlen(str),idx;Node *tmp,*p=root;for(int i=0;i<n;i++){idx=str[i]-'a';while(p->next[idx]==NULL && p!=root) //跳转失败指针,比如已经到达最底层p=p->fail;p=p->next[idx];if(p==NULL) /*如果Trie中不存在该字母,就让该字母的指针指向root*/p=root;tmp = p;  //p不动,tmp计算后缀串while(tmp!=root && tmp->cnt!=-1)//模拟下就可以知道,tmp->cnt!=-1{                               //是为了防止对同一个串重复计数ans+=tmp->cnt;              //比如单词是her  str是herher 此时答案只是1tmp->cnt=-1;tmp=tmp->fail;//指针移向下个字符继续匹配}}return ans;
}void Init_AC()
{cur = root = Trie;root->clr();head = tail = 0;
}

首先分析题目需要处理的几个问题:

1、计数。

AC自动机为了不重复计数,有这么一句tmp->cnt=-1;

这一句肯定要改掉

另外,注意即使不是单词结尾,也可以进入这个循环,而每次进入这个循环,如果/*(2)*/这里处理不当,肯定会多计数

    while(tmp!=root && tmp->cnt!=-1)/*(1)*/{                               ans+=tmp->cnt;              tmp->cnt=-1;/*(2)*/tmp=tmp->fail;//指针移向下个字符继续匹配}

需要做两处修改,/*(1)*/处,tmp->cnt>=1才进入循环; /*(2)*/处,数组记录出现次数

2、当有些word出现次数相同的时候,怎么输出所有的。

答案是,记录最大的出现次数mmax,然后扫记录所有单词出现次数的数组,只要跟mmax相同,就输出。

最后上代码

#include <cstdio>
#include <cstdlib>
#include <iostream>
#include <cstring>
#include <map>using namespace std;#define MAXLEN 1000010
#define MAXTRIE 500010
#define WORDLEN 71
#define KIND 26
#define N 201char str[MAXLEN],keyword[WORDLEN];
char all[N][WORDLEN];
int num[N];/*存储字符串个数*/struct Node{Node *fail;Node *next[KIND];   /*next数组里存的是当前节点的孩子*/int cnt,id;void clr(){fail = NULL;cnt = 0;id=-1;memset(next,0,sizeof(next)*KIND);}
}Trie[MAXTRIE],*q[MAXTRIE],*root,*cur;  /*看最开头的注释*/
int head,tail;/*队列首尾 初始化head = tail = 0*/void Insert(char s[],int id)   /*向Tries 插入单词*/
{int idx,i,n=strlen(s);Node *p=root;for(int i=0;i<n;i++){idx = s[i]-'a';if(p->next[idx]==NULL){/*NULL的时候才分配空间,是为了处理这种情况:he  her 两个单词,字典树上他们在同一个分支,r和e的cnt都是1*/p->next[idx]=++cur;p->next[idx]->clr();}p=p->next[idx];}p->cnt++;   /*插入完成,此处是p->cnt++而非p->cnt=1;是为了排除这种情况:her er 这两个单词,如果是p->cnt=1只会被按一种单词计数,但是也造成的问题是,模板串即keyword重复的时候会出现问题*/p->id=id;
}void Build_AC()
{Node *p,*tmp;root->fail=NULL;q[tail++]=root;while(head!=tail){p=q[head++];for(int i=0;i<KIND;i++){if(p->next[i]){q[tail++]=p->next[i];if(p == root){p->next[i]->fail = root;}else{tmp=p->fail;while(tmp!=NULL){if(tmp->next[i])    /*tmp->next[i] p->next[i]  i都表示'a'+i故如果tmp->next[i]!=NULL,说明以前出现过'a'+i*/{p->next[i]->fail=tmp->next[i];break;}tmp=tmp->fail;}if(tmp == NULL)p->next[i]->fail = root;}}}}
}int Query()
{int ans=0,n=strlen(str),idx;Node *tmp,*p=root;for(int i=0;i<n;i++){idx=str[i]-'a';while(p->next[idx]==NULL && p!=root) //跳转失败指针,比如已经到达最底层p=p->fail;p=p->next[idx];if(p==NULL) /*如果Trie中不存在该字母,就让该字母的指针指向root*/p=root;tmp = p;  //p不动,tmp计算后缀串while(tmp!=root && tmp->cnt>=1)//模拟下就可以知道,tmp->cnt!=-1{                               //是为了防止对同一个串重复计数ans+=tmp->cnt;if(tmp->id!=-1)             //比如单词是her  str是herher 此时答案只是1num[tmp->id]++;//tmp->cnt=-1;tmp=tmp->fail;//指针移向下个字符继续匹配}}return ans;
}void Init_AC()
{cur = root = Trie;root->clr();head = tail = 0;memset(num,0,sizeof(num));
}int main()
{int n;while(scanf("%d",&n)!=EOF && n){Init_AC();for(int i=0;i<n;i++){scanf("%s",keyword);strcpy(all[i],keyword);Insert(keyword,i);}scanf("%s",str);Build_AC();int mmax = -1;Query();for(int i=0;i<n;i++)mmax = max(mmax,num[i]);printf("%d\n",mmax);for(int i=0;i<n;i++)if(num[i]==mmax)puts(all[i]);}return 0;
}

上面的略慢,再快一点的,Query循环里稍改下

#include <cstdio>
#include <cstdlib>
#include <iostream>
#include <cstring>
#include <map>using namespace std;#define MAXLEN 1000010
#define MAXTRIE 500010
#define WORDLEN 71
#define KIND 26
#define N 201char str[MAXLEN],keyword[WORDLEN];
char all[N][WORDLEN];
int num[N];/*存储字符串个数*/struct Node{Node *fail;Node *next[KIND];   /*next数组里存的是当前节点的孩子*/int cnt,id;void clr(){fail = NULL;cnt = 0;id=-1;memset(next,0,sizeof(next)*KIND);}
}Trie[MAXTRIE],*q[MAXTRIE],*root,*cur;  /*看最开头的注释*/
int head,tail;/*队列首尾 初始化head = tail = 0*/void Insert(char s[],int id)   /*向Tries 插入单词*/
{int idx,i,n=strlen(s);Node *p=root;for(int i=0;i<n;i++){idx = s[i]-'a';if(p->next[idx]==NULL){/*NULL的时候才分配空间,是为了处理这种情况:he  her 两个单词,字典树上他们在同一个分支,r和e的cnt都是1*/p->next[idx]=++cur;p->next[idx]->clr();}p=p->next[idx];}p->cnt++;   /*插入完成,此处是p->cnt++而非p->cnt=1;是为了排除这种情况:her er 这两个单词,如果是p->cnt=1只会被按一种单词计数,但是也造成的问题是,模板串即keyword重复的时候会出现问题*/p->id=id;
}void Build_AC()
{Node *p,*tmp;root->fail=NULL;q[tail++]=root;while(head!=tail){p=q[head++];for(int i=0;i<KIND;i++){if(p->next[i]){q[tail++]=p->next[i];if(p == root){p->next[i]->fail = root;}else{tmp=p->fail;while(tmp!=NULL){if(tmp->next[i])    /*tmp->next[i] p->next[i]  i都表示'a'+i故如果tmp->next[i]!=NULL,说明以前出现过'a'+i*/{p->next[i]->fail=tmp->next[i];break;}tmp=tmp->fail;}if(tmp == NULL)p->next[i]->fail = root;}}}}
}int Query()
{int ans=0,n=strlen(str),idx;Node *tmp,*p=root;for(int i=0;i<n;i++){idx=str[i]-'a';while(p->next[idx]==NULL && p!=root) //跳转失败指针,比如已经到达最底层p=p->fail;p=p->next[idx];if(p==NULL) /*如果Trie中不存在该字母,就让该字母的指针指向root*/p=root;tmp = p;  //p不动,tmp计算后缀串while(tmp!=root)//模拟下就可以知道,tmp->cnt!=-1{if(tmp->cnt>=1)                   //是为了防止对同一个串重复计数if(tmp->id!=-1)             //比如单词是her  str是herher 此时答案只是1num[tmp->id]++;tmp=tmp->fail;//指针移向下个字符继续匹配}}return ans;
}void Init_AC()
{cur = root = Trie;root->clr();head = tail = 0;memset(num,0,sizeof(num));
}int main()
{int n;while(scanf("%d",&n)!=EOF && n){Init_AC();for(int i=0;i<n;i++){scanf("%s",keyword);strcpy(all[i],keyword);Insert(keyword,i);}scanf("%s",str);Build_AC();int mmax = -1;Query();for(int i=0;i<n;i++)mmax = max(mmax,num[i]);printf("%d\n",mmax);for(int i=0;i<n;i++)if(num[i]==mmax)puts(all[i]);}return 0;
}

AC自动机加强版 uva 1449 - Dominating Patterns相关推荐

  1. AC自动机讲解超详细

    begin:2019/5/2 update 2020/6/12 更新了LaTeX(咕了好久 感谢大家支持! AC自动机详细讲解 AC自动机真是个好东西!之前学KMPKMPKMP被NextNextNex ...

  2. LA4670 Dominating Patterns[AC自动机]

    The archaeologists are going to decipher a very mysterious "language". Now, they know many ...

  3. P5357 【模板】AC自动机(二次加强版)(AC自动机建fail树dfs求模式串出现次数)

    P5357 [模板]AC自动机(二次加强版)(AC自动机建fail树dfs求模式串出现次数) 传送门 形式上,AC 自动机基于由若干模式串构成的 Trie 树,并在此之上增加了一些 fail 边:本质 ...

  4. P3796 【模板】AC自动机(加强版)

    P3796 [模板]AC自动机(加强版) https://www.luogu.org/problemnew/show/P3796 题目描述 有NN个由小写字母组成的模式串以及一个文本串TT.每个模式串 ...

  5. P5357 【模板】AC自动机(二次加强版) fail树

    传送门 文章目录 题意: 思路: 题意: 思路: 这个只能搞failfailfail树了,让后跑一遍即可. 重复的字符串记一个,让后其他的都跟他一个答案即可. // Problem: P3796 [模 ...

  6. luogu P3796【模板】AC自动机(加强版)

    嘟嘟嘟 这个和某谷的AC自动机模板简单版差不多. 但还是要注意几点的: 1.这个是统计出现次数,而不是是否出现,所以在查询的时候加上这个节点的val后,不能把val标记为-1.那么也就可以说查询的时间 ...

  7. 洛谷P5357 - 【模板】AC自动机(二次加强版)(AC自动机+fail树)

    题目链接:点击查看 题目大意:给出n个模式串,问在主串中分别出现了多少次 题目分析:如果像以往那样,在匹配的时候fail指针乱跳的话,那么是错误的AC自动机使用方法,时间复杂度也大大上升,接近于暴力的 ...

  8. 【AC自动机】AC自动机(二次加强版)(luogu 5357)

    正题 luogu 5357 题目大意 给你若干单词和一个字符串,让你查询每个单词在字符串中出现的次数 解题思路 AC自动机模板 先把单词丢进去,然后拿字符串去跑,每到一个点累计答案 因为数据较大,所以 ...

  9. UVa 11468 (AC自动机 概率DP) Substring

    将K个模板串构成一个AC自动机,那些能匹配到的单词节点都称之为禁止节点. 然后问题就变成了在Tire树上走L步且不经过禁止节点的概率. 根据全概率公式用记忆化搜索求解. 1 #include < ...

最新文章

  1. NSLog打印自定义对象
  2. WinAPI: PolyBezier - 绘制贝塞尔线
  3. Matlab中基本统计量的函数
  4. Git笔记(一)——[commit, checkout]
  5. 【译】BINDER - ANALYSIS AND EXPLOITATION OF CVE-2020-0041
  6. go flag包获取命令行参数使用示例
  7. javaweb学习总结(十八):JSP属性范围
  8. 遮掩java_css之图片下方定位遮掩层
  9. Google首席决策师告诉你,AI和数据科学团队需要哪10种角色
  10. 华为或正与联发科、紫光展锐就采购更多芯片事宜展开磋商
  11. 女生可以学计算机应用吗,我是女生 学计算机应用技术还是软体技术
  12. 博图中fb与多重背景数据块_STEP7中如何生成和更新多重背景?
  13. JSPstudy恢复80端口
  14. 多模块java项目代码混淆
  15. BZOJ4198: [Noi2015]荷马史诗(哈夫曼树)
  16. php工具下载 脚本之家,php脚本编辑工具题目
  17. Excel数据计数(count)
  18. 正点原子 任天堂_任天堂20年前,任天堂用纸Mario改变了RPG风格
  19. http-equiv
  20. 现在还可以做公众号吗?我是如何在细分领域公众号粉丝一年不到从0到5000+增长?

热门文章

  1. java stdin 和stdout_对stdin,stdout 和STDOUT_FILENO,STDIN_FILENO的学习
  2. 台式计算机硬件图文详解,[计算机硬件及网络]电脑硬件知识图文详解.pdf
  3. 下一代Windows系统,Win11要来了?
  4. 计算机毕业设计ssm公交电子站牌管理系统软件9430l系统+程序+源码+lw+远程部署
  5. 入耳式蓝牙耳机哪款音质好?入耳式降噪蓝牙耳音质排行榜
  6. vs2010旗舰版 安装失败原因
  7. 机器学习算法(2)—— 线性回归算法
  8. hs8545m超级管理员密码_企业邮箱密码被盗用的解决方案
  9. html中浏览不留痕迹,彻底删除记录,你需要这样操作不留痕迹
  10. 关于QTableWidget表头添加全选按钮