Common Substrings
Time Limit: 5000MS   Memory Limit: 65536K
Total Submissions: 5495   Accepted: 1822

Description

A substring of a string T is defined as:

T(ik)=TiTi+1...Ti+k-1, 1≤ii+k-1≤|T|.

Given two strings AB and one integer K, we define S, a set of triples (ijk):

S = {(ijk) | kKA(ik)=B(jk)}.

You are to give the value of |S| for specific AB and K.

Input

The input file contains several blocks of data. For each block, the first line contains one integer K, followed by two lines containing strings A and B, respectively. The input file is ended by K=0.

1 ≤ |A|, |B| ≤ 105
1 ≤ K ≤ min{|A|, |B|}
Characters of A and B are all Latin letters.

Output

For each case, output an integer |S|.

Sample Input

2
aababaa
abaabaa
1
xx
xx
0

Sample Output

22
5

先是把两个字符串连接起来,中间加一个没有出现过的字符。然后用后缀数组求得height数组。

之后的过程麻烦,我是看别人代码看了好久才看懂的。

大致意思是维护一个单调栈。

每遇到一个B的后缀就统计与前面的A的后缀
 能产生多少个长度不小于k的公共子串。最A也一样做一边

/** POJ 3415 Common Substrings* 给定两个字符串A和B,求长度不小于k的公共子串的个数* 基本思路是计算A的所有后缀和B的所有后缀之间的最长公共前缀的长度,* 把最长公共前缀长度不小于k的部分全部加起来。* 先把两个字符串连起来,中间用一个没有用过的字符隔开。* 按height分组后,接下来便是快速的统计每组中后缀之间的最长公共前缀之和* 用一个单调的栈来维护,每遇到一个B的后缀就统计与前面的A的后缀* 能产生多少个长度不小于k的公共子串。最A也一样做一边*/
#include <iostream>
#include <string.h>
#include <stdio.h>
#include <algorithm>
using namespace std;
const int MAXN=200010;int sa[MAXN];
int t1[MAXN],t2[MAXN],c[MAXN];
int rank[MAXN],height[MAXN];void build_sa(int s[],int n,int m)
{int i,j,p,*x=t1,*y=t2;for(i=0;i<m;i++)c[i]=0;for(i=0;i<n;i++)c[x[i]=s[i]]++;for(i=1;i<m;i++)c[i]+=c[i-1];for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;for(j=1;j<=n;j<<=1){p=0;for(i=n-j;i<n;i++)y[p++]=i;for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;for(i=0;i<m;i++)c[i]=0;for(i=0;i<n;i++)c[x[y[i]]]++;for(i=1;i<m;i++)c[i]+=c[i-1];for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];swap(x,y);p=1;x[sa[0]]=0;for(i=1;i<n;i++)x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;if(p>=n)break;m=p;}
}void getHeight(int s[],int n)
{int i,j,k=0;for(i=0;i<=n;i++)rank[sa[i]]=i;for(i=0;i<n;i++){if(k)k--;j=sa[rank[i]-1];while(s[i+k]==s[j+k])k++;height[rank[i]]=k;}
}
char str1[MAXN],str2[MAXN];
int r[MAXN];
int sta[MAXN],stb[MAXN];
int main()
{freopen("in.txt","r",stdin);freopen("out.txt","w",stdout);int k;int n;int len1,len2;while(scanf("%d",&k)==1 && k){scanf("%s%s",&str1,&str2);len1=strlen(str1);len2=strlen(str2);n=len1+len2+1;for(int i=0;i<len1;i++)r[i]=str1[i];r[len1]=1;for(int i=0;i<len2;i++)r[i+len1+1]=str2[i];r[len1+len2+1]=0;build_sa(r,n+1,128);getHeight(r,n);long long ans=0;long long ss=0;int top=0;for(int i=2;i<=n;i++){if(height[i]<k){ss=0;top=0;continue;}int cnt=0;if(sa[i-1]<len1){cnt++;ss+=height[i]-k+1;}while(top>0 && height[i]<=sta[top-1]){top--;ss-=stb[top]*(sta[top]-height[i]);cnt+=stb[top];}sta[top]=height[i];stb[top++]=cnt;if(sa[i]>len1)ans+=ss;}ss=0;top=0;for(int i=2;i<=n;i++){if(height[i]<k){ss=0;top=0;continue;}int cnt=0;if(sa[i-1]>len1){cnt++;ss+=height[i]-k+1;}while(top>0 && height[i]<=sta[top-1]){top--;ss-=stb[top]*(sta[top]-height[i]);cnt+=stb[top];}sta[top]=height[i];stb[top++]=cnt;if(sa[i]<len1)ans+=ss;}printf("%I64d\n",ans);}return 0;
}


POJ 3415 Common Substrings (后缀数组,长度不小于k的公共子串的个数)相关推荐

  1. POJ - 3415 Common Substrings(后缀数组+单调栈)

    题目链接:点击查看 题目大意:给出两个字符串,再给出一个k,问两个字符串中长度大于等于k的公共子串有多少个(种类可重复) 题目分析:因为涉及到了子串问题,先用后缀数组跑出height数组来,接下来如果 ...

  2. POJ - 3415 Common Substrings(长度不小于K的公共子串个数)

    Common Substrings 后缀数组+单调栈 题解1 题解2 题解3 #include<cstdio> #include<cstring> #include<io ...

  3. POJ 3415 Common Substrings

    Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given t ...

  4. poj 3261 后缀数组 找反复出现k次的子串(子串能够重叠)

    题目:http://poj.org/problem?id=3261 仍然是后缀数组的典型应用----后缀数组+lcp+二分 做的蛮顺的,1A 可是大部分时间是在调试代码.由于模板的全局变量用混了,而自 ...

  5. POJ - 1226 Substrings(后缀数组+二分)

    题目链接:点击查看 题目大意:给出n个字符串,求出n个字符串中或者在他们翻转过来的字符串中,出现的最长公共子串的长度 题目分析:说白了就是求n个字符串中的最长公共子串的变形,而这个变形也相当简单,只是 ...

  6. poj 3261 Milk Patterns 后缀数组 最长重复子串

    http://poj.org/problem?id=3261 给一串数组,数组最少含有k个相同子串,可重叠,求这样子串的最长长度. 后缀数组求出 height[],若连续k个height[]都大于mi ...

  7. POJ 3080 Blue Jeans (后缀数组)

    题目大意: 求出这些DNA序列中的最长且字典序最小的公共子串. 思路分析: 二分长度的答案,去height中扫描这个长度是否满足,一旦满足就立即输出.这样就能够保证字典序最小了. #include & ...

  8. cdoj915-方老师的分身 II (长度不小于k的最短路)【spfa】

    http://acm.uestc.edu.cn/#/problem/show/915 方老师的分身 II Time Limit: 10000/5000MS (Java/Others)     Memo ...

  9. SPOJ - DISUBSTR Distinct Substrings(后缀数组)

    题目链接:点击查看 题目大意:给出一个字符串,求出本质不同的字串的数量 题目分析:正难则反,我们可以先求出总的字串有 n*(n+1)/2 个,然后遍历一遍height数组减去所有重复的部分就是答案了 ...

  10. poj 1743 二分答案+后缀数组 求不重叠的最长重复子串

    题意:给出一串序列,求最长的theme长度 (theme:完全重叠的子序列,如1 2 3和1 2 3  or  子序列中每个元素对应的差相等,如1 2 3和7 8 9) 要是没有差相等这个条件那就好办 ...

最新文章

  1. linux可以远程装机吗,linux 远程装机
  2. 【机器学习】libsvm使用的数据格式
  3. 将JavaScript字符串全部转换为小写吗?
  4. Rhel7 Ldap为本地用户认证方式,设置域、服务器位置和下载key
  5. linux关机正确方法
  6. 浅析IPDCC的地理信息识别和服务
  7. AI公开课:19.03.06何晓冬博士《自然语言与多模态交互前沿技术》课堂笔记以及个人感悟
  8. Docker 在容器中部署静态网站
  9. 奇妙的数学动图,美到令人窒息!
  10. 在Ubuntu下设置笔记本外接显示器(双显示器)
  11. 杀毒软件可以查杀所有计算机病毒吗,好的杀毒软件可以查杀任何病毒,对还是错?...
  12. C++ STL算法系列4---unique , unique_copy函数
  13. 软件测试工程师简历模板(三年经验)
  14. 嵌入式系统课堂总结1
  15. 34%的人会出轨。。。
  16. 打开小米5开发者选项
  17. MyBatis自动生成实体类、DAO接口和Mapping映射文件的代码(逆向工程)
  18. 币圈炒币如何避免被额韭菜?
  19. 美印两国程序员真的平分秋色吗?
  20. 国际期货投机有什么风险?目前正大怎么样?

热门文章

  1. 利用图片指纹检测高相似度图片--相似图片搜索的原理
  2. 最新如何解决git 输入github时每次都要输入用户名和密码问题
  3. 【2019牛客暑期多校训练营(第七场)E】Find the median【权值线段树】
  4. mysql卸载注意问题_mysql卸载注意事项
  5. Raki的读paper小记:DEBERTA: DECODING-ENHANCED BERT WITH DISENTANGLED ATTENTION
  6. 68.x的平方根(力扣leetcode) 博主可答疑该问题
  7. 88.合并两个有序数组(力扣leetcode)博主可答疑该问题
  8. 《Web漏洞防护》读书笔记——第9章,XSS防护
  9. java web相对路径_java(Web)中相对路径,绝对路径问题总结
  10. mysql query profiler_Using the New MySQL Query Profiler