
给出n个串,m组询问。每组询问均为一个字符串,询问在初始n个串中是否存在一个串与该询问串恰好只有一个位置不相同。输出YES or NO。



hash: abccac
hash[1] = 0
hash[6] = 0*131^5+1*131^4+2*131^3+2*131^2+0*131+2

此处hash[6]即是这个字符串的hash值,131为seed,即hash种子,然后还要取一个模数,即mod。由此可以发现hash值即是字符串中每一个位置的贡献,所以本题要求恰好只有一个位置不相同,即可以枚举不相同位置,减去原有贡献,加上新贡献即可。然后本题就可以解决,但是由于此题的数据卡的很e xin,所以seed和mod取的不好的话,会被卡成zz。

这里补充一下常见的seed和mod,seed一般取质数,3、5、7、13、131、13131这些均可,mod一般也取质数,1e9+7,1e11+7,1e13+7,1e18+7均可,也可以直接将数据类型取为unsigned long long,即可对2^64-1直接取模。




#include <cstdio>
#include <iostream>
#include <cstring>
#include <map>
#include <algorithm>
#define rep(i,a,b) for(int i = a; i <= b; i++)
using namespace std;
typedef long long ull;
const int N = 6*1e5+1000;
const ull mod = 1e11+7;
const ull ttp1 = 3;
const ull ttp2 = 5;
int n,m;
ull base[5] = {0,1,2,131313,123};
ull seed1[N],seed2[N];
char s[N];
struct Node{ull a,b;
map<Node,int> mp;bool operator == (Node x, Node y)
{if(x.a == y.a && x.b == y.b) return true;else return false;
}bool operator < (Node x, Node y)
{return x.a < y.a;
}int solve(ull hash1, ull hash2)
{int len = strlen(s);// printf("s:%s,len:%d\n",s,len);rep(j,0,len-1){rep(k,0,2){if(s[j]-'a' == k) continue;ull tmp1 = hash1;tmp1 = (tmp1+(-base[s[j]-'a']+base[k])*seed1[len-1-j]%mod)%mod;if(tmp1 < 0) tmp1 += mod;ull tmp2 = hash2;tmp2 = (tmp2+(-base[s[j]-'a']+base[k])*seed2[len-1-j]%mod)%mod;if(tmp2 < 0) tmp2 += mod;gn.a = tmp1, gn.b = tmp2;// printf("k:%d,tmp:%llu\n",k,tmp);if(mp[gn] == 1) return 1;}}return 0;
}int main()
{// printf("mod:%lld\n",mod);mp.clear();seed1[0] = 1;seed1[1] = ttp1;seed2[0] = 1;seed2[1] = ttp2;int _ = 6*1e5+100;rep(i,2,_){seed1[i] = (seed1[i-1]*ttp1)%mod;if(seed1[i] < 0) seed1[i] += mod;seed2[i] = (seed2[i-1]*ttp2)%mod;if(seed2[i] < 0) seed2[i] += mod;}scanf("%d%d",&n,&m);rep(i,1,n){scanf("%s",s);int len = strlen(s);ull hash1 = 0;ull hash2 = 0;rep(j,0,len-1){hash1 = (hash1*ttp1%mod+base[s[j]-'a'])%mod;if(hash1 < 0) hash1+=mod;hash2 = (hash2*ttp2%mod+base[s[j]-'a'])%mod;if(hash2 < 0) hash2+=mod;}// printf("s:%s,hash:%llu\n",s,hash);gn.a = hash1, gn.b = hash2;mp[gn] = 1;}rep(i,1,m){scanf("%s",s);int len = strlen(s);ull hash1 = 0;ull hash2 = 0;rep(j,0,len-1){hash1 = (hash1*ttp1%mod+base[s[j]-'a'])%mod;if(hash1 < 0) hash1+=mod;hash2 = (hash2*ttp2%mod+base[s[j]-'a'])%mod;if(hash2 < 0) hash2+=mod;}if(solve(hash1,hash2))printf("YES\n");else printf("NO\n");}return 0;
}//mod: 1e9+7, seed: 257
//mod: 1e18+3, seed: 3、5
//mod: 1e11+7, seed: 3、5、1313、...


本题也可以对n个已知串建立Trie树, 然后对于m个查询串,允许在匹配过程中有一次失配的情况,然后进行dfs搜索即可。详见代码中的query函数。



#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#define rep(i,a,b) for(int i = a; i <= b; i++)
using namespace std;
const int N = 6*1e5+1000;
const int max_node = 6*1e5+1000;
const int charset = 30;int n,m;
char s[N];struct Trie
{int tot,root,child[max_node][charset];  //root:根节点  tot:节点编号//child[i][j]=k,表示编号为i的节点的第j个孩子是编号为k的节点int flag[max_node];   //是否以某一个字符为结束Trie(){ root = tot = 1;  //根节点编号为1 memset(flag,0,sizeof flag);}    void insert(const char *str){int cur = root;for(int i = 0;str[i];i++){int x = str[i]-'a';if(child[cur][x] == 0)child[cur][x] = ++tot;cur = child[cur][x];}flag[cur] = 1; //记录单词以该点结束 }int query(const char *str, int cur, int pos, int cnt){// printf("str:%s,cur:%d,pos:%d,cnt:%d\n",str,cur,pos,cnt);int x = str[pos]-'a';if(!str[pos]){if(cnt != 1) return 0;else return flag[cur];}else{// if(child[cur][x] == 0) cnt++;if(cnt == 2) return 0;int jud = 0;rep(i,0,2){if(child[cur][i] == 0) continue;if(i != x)jud = (query(str,child[cur][i],pos+1,cnt+1) | jud);elsejud = (query(str,child[cur][i],pos+1,cnt) | jud);// printf("jud:%d\n",jud);if(jud == 1) break;}return jud;}}
}tre;int main()
{scanf("%d %d",&n,&m);rep(i,1,n){scanf("%s",s);tre.insert(s);}rep(i,1,m){scanf("%s",s);if(tre.query(s,1,0,0)) printf("YES\n");else printf("NO\n");}return 0;

