AC自动机 洛谷P3966 单词
题目链接:https://www.luogu.org/problem/P3966
题意:一篇论文是由许多个单词组成的,给出N个单词,查询每个单词在文章中出现的次数。
分析:其实还是裸的AC自动机。。。
构成文本串的时候直接在单词后面加一个特殊符号就行,查询函数遇到这个符号就重新从根开始,其他和上一篇一模一样。
insert,get_fail,topu函数都没有任何变化,因为我们插入的还是原本的单词,唯一有变化的只是文本串,所以只有用到文本串的查询函数变化了。
查询函数每次重头开始,就相当于所有模式串在按顺序来的一个个模式串里面匹配了。
#include<bits/stdc++.h> using namespace std; const int maxn=1e6+300;//单词间自行添加了符号,稍做扩大 const int inf=0x3f3f3f3f; typedef long long ll; #define meminf(a) memset(a,0x3f,sizeof(a)) #define mem0(a) memset(a,0,sizeof(a)); struct node{int fail;//失配指针failint vis[26];//子节点的位置,也就是字典树的那26个字母int end;//如果是尾节点就记录 int ans;//用来记录出现次数 }AC[200100]; char s[maxn];//用来输入模式串 char ss[maxn]; //用来输入文本串 int cnt=0;//Trie的指针 int in[maxn];//记录入度 int m[200100],Ans[200100]; void insert(char *s,int pos){int len=strlen(s);int now=0;//字典树的当前指针for(int i=0;i<len;i++){//Trie树没有这个子节点 if(AC[now].vis[s[i]-'a']==0) AC[now].vis[s[i]-'a']=++cnt;//多组输入,需要清除 一个个清除,之前++cnt说明需要用到这个节点了 now=AC[now].vis[s[i]-'a'];}if(AC[now].end==0) AC[now].end=pos;//标记该结点是一个单词的结尾 ,并标记这是第几个单词 m[pos]=AC[now].end;//记录当前的单词的位置,可能是它本身,也可能是它重复单词里第一个出现的 }void get_fail(){queue<int> que;for(int i=0;i<26;i++){//把第二层的fail指针都设为0 if(AC[0].vis[i]!=0){AC[AC[0].vis[i]].fail=0;que.push(AC[0].vis[i]);in[0]++;} }while(!que.empty()){int u=que.front();que.pop();for(int i=0;i<26;i++){if(AC[u].vis[i]!=0){//如果当前结点的子节点存在,就将子节点的fail指针指向当前结点fail指针指向的结点的对应子节点处 AC[AC[u].vis[i]].fail=AC[AC[u].fail].vis[i];in[AC[AC[u].fail].vis[i]]++;//被fail指针指向的结点的入度加1 que.push(AC[u].vis[i]);}else AC[u].vis[i]=AC[AC[u].fail].vis[i];//否则直接将这个不存在的子节点指向当前结点fail指针指向结点的对应子节点处 }} }void AC_query(char* s){int len=strlen(s);int now=0;for(int i=0;i<len;i++){if(s[i]=='T'){now=0;continue;} now=AC[now].vis[s[i]-'a'];AC[now].ans++;} }void topu(){queue<int> que;for(int i=1;i<=cnt;i++)if(in[i]==0) que.push(i);while(!que.empty()){int u=que.front();que.pop();if(AC[u].end!=0) Ans[AC[u].end]=AC[u].ans;int v=AC[u].fail;if(v!=0) in[v]--,AC[v].ans+=AC[u].ans;if(in[v]==0) que.push(v);} }int main(){int n;scanf("%d",&n);cnt=0;for(int i=1;i<=n;i++){scanf("%s",s);insert(s,i);strcat(ss,s);strcat(ss,"T");}AC[0].fail=0;//结束标志 get_fail(); //求出失配指针 AC_query(ss);topu(); for(int i=1;i<=n;i++){printf("%d\n",Ans[m[i]]);}return 0; }
转载于:https://www.cnblogs.com/qingjiuling/p/11377805.html
AC自动机 洛谷P3966 单词相关推荐
- AC自动机-洛谷3121 [USACO15FEB]审查(黄金)Censoring (Gold)
https://www.luogu.org/problem/show?pid=3121#sub 首先题目看清楚 FJ注意到列表中的单词不会出现一个单词是另一个单词子串的情况,这意味着每个列表中的单词在 ...
- 洛谷P3966 [TJOI2013]单词(后缀自动机)
传送门 统计单词出现次数--为啥大家都是写AC自动机的嘞--明明后缀自动机也能做的说-- 统计出现次数这个就直接按长度排序然后做个dp就好,这是SAM的板子的要求啊,不提了 然后考虑怎么让所有串之间隔 ...
- 洛谷 P1019 单词接龙 (DFS)
题目传送门 当时一看到这题,蒟蒻的我还以为是DP,结果发现标签是搜索-- 这道题的难点在于思路和预处理,真正的搜索实现起来并不难.我们可以用一个贪心的思路,开一个dic数组记录每个单词的最小重复部分, ...
- 洛谷P1019 单词接龙
题目描述 单词接龙是一个与我们经常玩的成语接龙相类似的游戏,现在我们已知一组单词,且给定一个开头的字母,要求出以这个字母开头的最长的"龙"(每个单词都最多在"龙" ...
- 【搜索】NOIP2000 or 洛谷1019单词接龙
题目链接:洛谷1019 题目描述 单词接龙是一个与我们经常玩的成语接龙相类似的游戏,现在我们已知一组单词,且给定一个开头的字母,要求出以这个字母开头的最长的"龙"(每个单词都最多在 ...
- 洛谷P1101 单词方阵 (C语言 + 详细注释 + 五妙)
//首先声明一下,我的代码大部分是参照洛谷的一位博客:Way_How_Fri3nd.看完后我就觉得写的非常好,由于我不知道怎么转载洛谷的博客,所以干脆自己写一篇CSDN博客,因为写的实在是太好了,我迫 ...
- 洛谷 P1101 单词方阵
给一n×n的字母方阵,内可能蕴含多个"yizhong"单词.单词在方阵中是沿着同一方向连续摆放的.摆放可沿着 8个方向的任一方向,同一单词摆放时不再改变方向,单词与单词之间可以交叉 ...
- 洛谷 P1019 单词接龙 Label:dfs
题目描述 单词接龙是一个与我们经常玩的成语接龙相类似的游戏,现在我们已知一组单词,且给定一个开头的字母,要求出以这个字母开头的最长的"龙"(每个单词都最多在"龙" ...
- 洛谷 - P1381 - 单词背诵 - 哈希 - 尺取
https://www.luogu.org/problemnew/show/P1381 字符串匹配,用哈希总没有错的. 然后就是尺取了,题目要求首先尽可能多覆盖,那么每次尾巴往后面长. 一开始先找到第 ...
- 洛谷——P1101 单词方阵
题目描述 给一n \times nn×n的字母方阵,内可能蕴含多个"yizhong"单词.单词在方阵中是沿着同一方向连续摆放的.摆放可沿着 88 个方向的任一方向,同一单词摆放时不 ...
最新文章
- Java项目:在线商城系统(前后端分离+java+vue+Springboot+ssm+mysql+maven+redis)
- 笔记-中项案例题-2019年下-整体管理
- 1732: 数花费(Kruscal)
- 永磁交流伺服电机的工作原理与更换新编码器后的常规零位校正方法
- Python zmq 讲解
- C#中常用的分页存储过程
- macbook只有windows下安装os系统、trackpad++下载
- Java调优案例分析与实战
- IP-MAC绑定到底有多重要?(白目的见解)
- 基于arm-linux-gcc版本,音乐视频播放器mplayer
- 胡歌官宣生女,胡椒粉们真为他高兴,人生最顶级的能力是【涅槃重生】的力量
- 【SQL面试】窗口函数如何实现【累加】?
- 成成你好呀笔记整理(知识点合集二)
- iar stm32_STM32强大的生态,在这里一起总结!
- 有关JSON和介绍和使用
- hexo部署到云服务器
- 图中连通块的个数:并查集
- win10系统下找不到hosts文件解决方案
- 今天写了篇中间件的论文
- bert-pytorch版源码详细解读