题意:给定字符串S,然后M个字符串T。Q次询问,每次给出(L,R,l,r),问S[l,r]在L到R这些T字符串中,在哪个串出现最多,以及次数。
思路:把所有串建立SAM,然后可以通过倍增走到[l,r]在SAM上的位置p,然后在这个位置p上求,求的过程就是一个线段树求区间最值。 现在的关键是得到线段树,这个线段树记录了endpos,这个可以用启发式合并。
注意现在是广义后缀自动机,不能用拓扑排序合并线段树。 必须用fail树DFS来合并。 不然会出错。 具体我也不知道,不过我估计是因为广义自动机里面有空串导致的。 因为空串导致x和fax的长度相同,这样拓扑就会出错。 而普通的SAM没有这种情况。
#include<bits/stdc++.h>
#define rep2(i,a,b) for(int i=a;i>=b;i--)
#define rep(i,a,b) for(int i=a;i<=b;i++)
using namespace std;
const int maxn=1100010;
char c[maxn],t[maxn];
int rt[maxn],pos[maxn],fcy[maxn],N,M,Q,tot;
int f[maxn][20],ans,num;
struct in{
int L,R,Mx,id;
}s[maxn*20];
void update(int now)
{
if(s[s[now].L].Mx>=s[s[now].R].Mx) {
s[now].Mx=s[s[now].L].Mx;
s[now].id=s[s[now].L].id;
}
else {
s[now].Mx=s[s[now].R].Mx;
s[now].id=s[s[now].R].id;
}
}
void ins(int &now,int L,int R,int p)
{
if(!now) now=++tot;
if(L==R){ s[now].Mx++; s[now].id=L; return ;}
int Mid=(L+R)>>1;
if(p<=Mid) ins(s[now].L,L,Mid,p);
else ins(s[now].R,Mid+1,R,p);
update(now);
}
void merge(int &now,int x,int y,int L,int R)
{
if(!x||!y) { now= x|y; return ;}
now=++tot;int Mid=(L+R)>>1;
if(L==R) { s[now].Mx=s[x].Mx+s[y].Mx; s[now].id=L; return ;}
merge(s[now].L,s[x].L,s[y].L,L,Mid);
merge(s[now].R,s[x].R,s[y].R,Mid+1,R);
update(now);
}
void query(int Now,int L,int R,int l,int r)
{
if(!Now||l>r) return ;
if(s[Now].Mx<num) return ;
if(l<=L&&r>=R) {
if(s[Now].Mx>num) num=s[Now].Mx,ans=s[Now].id;
else if(s[Now].Mx==num&&num!=0) ans=min(ans,s[Now].id);
return ;
}
int Mid=(L+R)>>1;
if(l<=Mid) query(s[Now].L,L,Mid,l,r);
if(r>Mid) query(s[Now].R,Mid+1,R,l,r);
}
struct SAM{
int ch[maxn][26],fa[maxn],maxlen[maxn],cnt,last;
int a[maxn],b[maxn];
void init()
{
cnt=last=1;
memset(ch[1],0,sizeof(ch[1]));
}
void add(int x,int id)
{
int np=++cnt,p=last; last=np;
if(id>0) ins(rt[np],1,M,id);
maxlen[np]=maxlen[p]+1; memset(ch[np],0,sizeof(ch[np]));
while(p&&!ch[p][x]) ch[p][x]=np,p=fa[p];
if(!p) fa[np]=1;
else {
int q=ch[p][x];
if(maxlen[q]==maxlen[p]+1) fa[np]=q;
else {
int nq=++cnt; maxlen[nq]=maxlen[p]+1;
fa[nq]=fa[q]; fa[q]=fa[np]=nq;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
while(p&&ch[p][x]==q) ch[p][x]=nq,p=fa[p];
}
}
}
vector<int>G[maxn];
void dfs(int u)
{
for(int i=0;i<G[u].size();i++){
int v=G[u][i];
f[v][0]=u; dfs(v);
merge(rt[u],rt[u],rt[v],1,M);
}
}
void DFS()
{
rep(i,2,cnt) G[fa[i]].push_back(i);
dfs(1);
}
}T;
void solve()
{
int L,R,l,r,len;
scanf("%d%d%d%d",&L,&R,&l,&r);
len=r-l+1;
int now=pos[r];
if(T.maxlen[now]<len) {
printf("%d %d\n",L,0);
return ;
}
for(int i=19;i>=0;i--)
if(T.maxlen[f[now][i]]>=len) now=f[now][i];
ans=L; num=0;
query(rt[now],1,M,L,R);
printf("%d %d\n",ans,num);
}
int main()
{
T.init();
scanf("%s",t+1);
N=strlen(t+1); T.last=1;
rep(i,1,N) T.add(t[i]-'a',0),pos[i]=T.last;
scanf("%d",&M);
rep(i,1,M) {
T.last=1;
scanf("%s",c+1); N=strlen(c+1);
rep(j,1,N) T.add(c[j]-'a',i);
}
T.DFS();
rep(i,1,19) rep(j,2,T.cnt) f[j][i]=f[f[j][i-1]][i-1];
scanf("%d",&Q);
while(Q--) solve();
return 0;
}