UVA 10526 - Intellectual Property

题目链接

题意:给定两个问题,要求找出第二个文本抄袭第一个文本的所有位置和长度,输出前k个,按长度从大到小先排,长度一样的按位置从小到大

思路:后缀数组,把两个文本拼接起来,记录下拼接位置为tdp,这样如果sa[i] < tdp就是前面的文本开头,如果sa[i] >= tdp就是后面的文本开头,拼接起来的求出height数组,利用该数组的性质,从前往后扫一遍,从后往前扫一遍,把所有位置的最大值保存下来,最后在扫描一遍位置,把答案记录下来

代码:

#include <cstdio>
#include <cstring>
#include <algorithm>using namespace std;const int MAXLEN = 200005;
const int INF = 0x3f3f3f3f;char str[55555];
int k, tdp, an, v[MAXLEN];struct Ans {int len, pos;Ans() {}Ans(int len, int pos) {this->len = len;this->pos = pos;}
} ans[MAXLEN];bool cmp(Ans a, Ans b) {if (a.len == b.len) return a.pos < b.pos;return a.len > b.len;
}struct Suffix {int s[MAXLEN];int sa[MAXLEN], t[MAXLEN], t2[MAXLEN], c[MAXLEN], n;int rank[MAXLEN], height[MAXLEN];void build_sa(int m) {n++;int i, *x = t, *y = t2;for (i = 0; i < m; i++) c[i] = 0;for (i = 0; i < n; i++) c[x[i] = s[i]]++;for (i = 1; i < m; i++) c[i] += c[i - 1];for (i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;for (int k = 1; k <= n; k <<= 1) {int p = 0;for (i = n - k; i < n; i++) y[p++] = i;for (i = 0; i < n; i++) if (sa[i] >= k) y[p++] = sa[i] - k;for (i = 0; i < m; i++) c[i] = 0;for (i = 0; i < n; i++) c[x[y[i]]]++;for (i = 0; i < m; i++) c[i] += c[i - 1];for (i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];swap(x, y);p = 1; x[sa[0]] = 0;for (i = 1; i < n; i++)x[sa[i]] = (y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k]) ? p - 1 : p++;if (p >= n) break;m = p;}n--;}void getHeight() {int i, j, k = 0;for (i = 1; i <= n; i++) rank[sa[i]] = i;for (i = 0; i < n; i++) {if (k) k--;int j = sa[rank[i] - 1];while (s[i + k] == s[j + k]) k++;height[rank[i]] = k;}}void init() {tdp = 0; n = 0; an = 0;gets(str);while (gets(str)) {if (strcmp(str, "END TDP CODEBASE") == 0) break;int len = strlen(str);str[len] = '\n';for (int i = 0; i <= len; i++)s[n++] = str[i];}tdp = n;s[n++] = 260;gets(str);while (gets(str)) {if (strcmp(str, "END JCN CODEBASE") == 0) break;int len = strlen(str);str[len] = '\n';for (int i = 0; i <= len; i++)s[n++] = str[i];}s[n] = 0;}void solve() {init();build_sa(261);getHeight();memset(v, 0, sizeof(v));int Min = -1;for (int i = 1; i <= n; i++) {if (sa[i] < tdp) Min = INF;else if (sa[i] > tdp) {if (Min == -1) continue;Min = min(height[i], Min);v[sa[i] - tdp - 1] = max(Min, v[sa[i] - tdp - 1]);}}Min = -1;for (int i = n; i >= 1; i--) {if (sa[i] < tdp) Min = INF;else if (sa[i] > tdp) {if (Min == -1) continue;Min = min(height[i + 1], Min);v[sa[i] - tdp - 1] = max(Min, v[sa[i] - tdp - 1]);}}int r = -1;for (int i = 0; i < n - tdp; i++) {if (i + v[i] <= r) continue;if (v[i] == 0) continue;ans[an++] = Ans(v[i], i);r = i + v[i];}sort(ans, ans + an, cmp);for (int i = 0; i < min(an, k); i++) {printf("INFRINGING SEGMENT %d LENGTH %d POSITION %d\n", i + 1, ans[i].len, ans[i].pos);for (int j = ans[i].pos + tdp + 1; j < ans[i].pos + tdp + 1 + ans[i].len; j++)printf("%c", s[j]);printf("\n");}}} gao;int main() {int bo = 0;int cas = 0;while (~scanf("%d%*c", &k) && k) {if (bo) printf("\n");else bo = 1;printf("CASE %d\n", ++cas);gao.solve();}return 0;
}

UVA 10526 - Intellectual Property (后缀数组)相关推荐

  1. UVa10526 - Intellectual Property(后缀数组的应用)

    题意:给出两个字符串s1,s2,求s2在s1中的出现的子串,输出其起始位置和长度,按长度从大到小,位置从小到大排序输出,忽略重叠的子串 代码如下: #include <iostream> ...

  2. UVA - 12338 Anti-Rhyme Pairs(后缀数组)

    题目链接:点击查看 题目大意:给出n个字符串和m个查询,每次查询给出两个字符串的下标,询问这两个字符串的最长公共前缀的长度 题目分析:因为需要询问最长公共前缀,而且查询的m给到了1e6,这也要求我们每 ...

  3. 【uva10829-求形如UVU的串的个数】后缀数组+rmq or 直接for水过

    题意:UVU形式的串的个数,V的长度规定,U要一样,位置不同即为不同字串 https://uva.onlinejudge.org/index.php?option=com_onlinejudge&am ...

  4. 寻找一个字符串的重复子串 后缀数组

    什么是后缀数组 令字符串 S=S[1]S[2]...S[n]S=S[1]S[2]...S[n]{\displaystyle S=S[1]S[2]...S[n]} , S[i,j]S[i,j]{\dis ...

  5. 【2012百度之星/资格赛】H:用户请求中的品牌 [后缀数组]

    时间限制: 1000ms 内存限制: 65536kB 描述 馅饼同学是一个在百度工作,做用户请求(query)分析的同学,他在用户请求中经常会遇到一些很奇葩的词汇.在比方说"johnsonj ...

  6. Boring counting HDU - 3518 (后缀数组)

    Boring counting \[ Time Limit: 1000 ms \quad Memory Limit: 32768 kB \] 题意 给出一个字符串,求出其中出现两次及以上的子串个数,要 ...

  7. HDU4080 Stammering Aliens(二分 + 后缀数组)

    题目 Source http://acm.hdu.edu.cn/showproblem.php?pid=4080 Description Dr. Ellie Arroway has establish ...

  8. 后缀数组 + Hash + 二分 or Hash + 二分 + 双指针 求 LCP ---- 2017icpc 青岛 J Suffix (假题!!)

    题目链接 题目大意: 就是给你n个串每个串取一个后缀,要求把串拼起来要求字典序最小!! sum_length_of_n≤5e5sum\_length\_of\_n\leq 5e5sum_length_ ...

  9. 后缀数组 ---- 2018~2019icpc焦作H题[后缀数组+st表+二分+单调栈]

    题目链接 题目大意: 给出nnn个数,定义f[l,r]f[l,r]f[l,r]表示 区间[l,r][l,r][l,r]的最大值,求所有 子区间的最大值的和,要求相同的子区间只能算一次 比如数列 5 6 ...

最新文章

  1. 分析mrp主要应用范围_华珀聚脲丨聚脲的主要应用范围
  2. 李开复评价马斯克:他真正的目的是把人变成半机械人
  3. wxpython开发教程_wxpython入门第十步(应用程序框架)
  4. Python使用数学形态学腐蚀运算删除验证码图片中的干扰噪点和线条
  5. Java基础学习总结(142)——以正确的姿势使用Java 8 Optional
  6. 找出有序数组中绝对值最小的数
  7. 这款机器人也想体验双十一!
  8. linux下apache安装ssl,linux下apache安装ssl步骤
  9. element input 自适应_input高度自适应。
  10. 联想 R9000 系列以及Realtek Semiconductor Co., Ltd. Device 88xx系列 Ubuntu WIFI 不能使用
  11. k2p华硕系统怎么设置_斐讯k2华硕固件,斐讯k2p华硕固件设置
  12. 【WPS】折线图数据点上添加标记(三角形、正方形、菱形等)
  13. 时间轴+html+源码,HTML5+CSS3+Jquery实现纯手工的垂直时光轴【附源码】
  14. 用opencv将左右眼视角图片转换为红蓝3D图片
  15. 如何使用Photoshop将图片变小?
  16. Dockerfile配置APM监控实现Java容器的性能监控
  17. 诺基亚java闪退_手机程序闪退怎么办?使用这三种办法,即可轻松搞定
  18. 数据分析找不到数据?200个源数据网站全给你!
  19. WebAssembly在白鹭引擎5.0中的实践
  20. 关于python 关于面向对象 关于magic method(魔方方法)

热门文章

  1. 几个国外域名解析网站
  2. K2 BPM客户案例 | 重庆延锋安道拓-BPM全流程-QAD集成
  3. dcloud 5+、uni-app下载到外层目录
  4. 【软件安装】SPSS22.0安装
  5. python矩阵的共轭转置_基础 | Python 下的矩阵操作
  6. 纠正pylint no member报错
  7. 汤森路透 Thomson Reuters --使用多模型数据库ArangoDB 打造快速安全的简单视图分析...
  8. 2016年全面前端面试题总结
  9. 康威定律【系统设计的影响因素】
  10. 第五章Table(3)