传送门:后缀数组一·重复旋律

最长不可重叠重复子串问题
二分答案,转化成判定问题

bool check(int K)
{
    for(int i=1;i<=n;i++)
    if(height[i]< K)
    {
        minsa=sa[i];
        maxsa=sa[i];
    }
    else 
    {
        minsa=min(minsa,sa[i]);
        maxsa=max(maxsa,sa[i]);
        if(maxsa-minsa>=K)return true;
    }
    return false;
}

最长公共子串问题
求排名相邻,原来不在同一个字符串的 height 值的最大值

重复次数最多的连续字串
逃。。。

分析:

难~,求sa、rank、height数组跪了,好难理解啊。

suffix(i)表示从原字符串第i个字符开始到字符串结尾的后缀。我们把它所有的后缀拿出来按字典序排序
把排好序的数组记做sa。比如sa[1]=7,sa[4]=2
名次数组 Rank, Rank[i] 保存的是后缀 i 在所有后缀中从小到大排列的“名次”
height[i] 是 suffix(sa[i-1]) 和 suffix(sa[i]) 的最长公共前缀长度,即排名相邻的两个后缀的最长公共前缀长度。

有几个结论:

有了height,求最长可重叠重复K次子串就方便了。重复子串即两后缀的公共前缀,最长重复子串,等价于两后缀的最长公共前缀的最大值。问题就转化成了,求height 数组中最大的长度为 K的子序列的最小值。

后缀数组的求法有很多,最有名的是两种倍增算法DC算法。时间复杂度上DC算法更优,但是很复杂。我们这里只介绍相对容易的倍增算法。

有空再仔细研究这个算法,先溜了。

代码参看 《ACM-ICPC 算法与实现》

AC Code

#include<bits/stdc++.h>
#define rep(i,a,b) for(int i=a;i<=b;i++)
using namespace std;
const int maxn=1e6+5;

void  radis(int *str,int *a,int *b,int n,int m)
{
	static int count[200000];
	memset(count,0,sizeof(count));
	for(int i=0;i<n;++i) ++count[str[a[i]]];
	for(int i=1;i<=m;++i) count[i]+=count[i-1];
	for(int i=n-1;i>=0;--i) b[--count[str[a[i]]]]=a[i];
}

void suffix_array(int *str,int *sa,int n,int m)
{
	static int rank[200000],a[200000],b[200000];
	for(int i=0;i<n;++i)rank[i]=i;
	radis(str,rank,sa,n,m);
	
	rank[sa[0]]=0;
	for(int i=1;i<n;++i)
		rank[sa[i]]=rank[sa[i-1]]+(str[sa[i]]!=str[sa[i-1]]);
	for(int i=0;1<<i<n;++i)
	{
		for(int j=0;j<n;++j)
		{
			a[j]=rank[j]+1;
			b[j]=j+(1<<i) >=n?0:rank[j+(1<<i)]+1;
			sa[j]=j;
		}
		radis(b,sa,rank,n,n);
		radis(a,rank,sa,n,n);
		rank[sa[0]]=0;
		for(int j=1;j<n;++j)
		{
			rank[sa[j]]=rank[sa[j-1]]+(a[sa[j-1]]!=a[sa[j]] || b[sa[j-1]] != b[sa[j]]);
		}		
	}	
}

void calc_height(int *str,int *sa,int *h,int n)
{
	static int rank[200000];
	int k=0;
	h[0]=0;
	for(int i=0;i<n;++i)
		rank[sa[i]]=i;
	for(int i=0;i<n;++i)
	{
		k=k==0?0:k-1;
		if(rank[i]!=0)
			while(str[i+k] == str[sa[rank[i]-1]+k]) ++k;
		h[rank[i]]=k;
	}
}

int sa[20005 ];
int h[20005 ];
int  str[20005 ];
int main()
{
	int n,k;
	scanf("%d%d",&n,&k);
	//n=8,k=2;
	int max_num=0;
	for(int i=0;i<n;i++)
	{
		scanf("%d",&str[i]);	
		max_num=max(str[i],max_num);
	}
	suffix_array(str,sa,n,max_num);
	calc_height(str,sa,h,n);
	/*
	for(int i=0;i<n;i++)		
		cout<<sa[i]<<" ";
	cout<<endl;
	for(int i=0;i<n;i++)		
		cout<<h[i]<<" ";
	cout<<endl;		
	*/
	
	int left=0,right=n-1;
	int res=0;
	//cout<<666<<endl;
	while(left<=right)
	{
		int mid=(left+right)>>1;
		//cout<<mid<<endl;
		int cnt=1;
		for(int i=0;i<n;i++)
		{
			if(h[i]>=mid)
				cnt++;
			else cnt = 1;
			if(cnt >=k) break;
		}
		if(cnt>=k)
		{
			res=max(res,mid);
			left=mid+1;			
		}
		else
			right=mid-1;
	}
	cout << res << endl;
	
    return 0;
}

相关文章:

  • 2021-08-29
  • 2021-05-08
  • 2022-02-08
  • 2022-12-23
  • 2021-11-14
  • 2021-10-16
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-10-20
  • 2022-12-23
  • 2022-12-23
  • 2021-07-20
  • 2022-12-23
相关资源
相似解决方案