后缀数组貌似不是这个题正确的姿势
不过也可以做自己yy的做法 用set水过了
不过看起来并不是很慢
原题中的式子等价于
所有后缀的长度之和*[length(s)-1] 减去 任意两个后缀的lcp长度
任意两个后缀的lcp长度可以直接光看height数组
先想n^2暴力的做法
求出所有sa[i]和sa[j](i<j)的lcp长度然后乘2
然后sa[i]和sa[j]的lcp长度=min{heigh[i+1],heihgt[i+2].....height[j]}
想一下如何优化这个过程
有点抽象,为自己的表达拙计……具体看代码吧,代码还是比较和蔼的
可以用set优化到nlogn
-----------------------------------------------
2016.1.11
突然发现暴力比set快
而且复杂度都是nlogn
显然暴力查找常数小
然后就改了一发
set 5800ms
暴力查找 3800ms
set code:
#include<cstdio>
#include<cstdlib>
#include<cmath>
#include<cstring>
#include<queue>
#include<vector>
#include<set>
#include<map>
#include<iostream>
#include<algorithm>
#define T 511111
using namespace std;
struct W{int a,pos;}y[T];
char s[T];
int t1[T],t2[T],cc[T],sa[T],rank[T],height[T];
int len;
long long ans;
set<int>st;
bool cmp1(W a,W b){return a.a<b.a;}
bool cmp(int *y,int a,int b,int k)
{
int a1=y[a],b1=y[b];
int a2=a+k>=len?-1:y[a+k];
int b2=b+k>=len?-1:y[b+k];
return a1==b1&&a2==b2;
}
void make_sa()
{
int *x=t1,*y=t2,m=333;
for(int i=0;i<m;i++)cc[i]=0;
for(int i=0;i<len;i++)++cc[x[i]=s[i]];
for(int i=1;i<m;i++)cc[i]+=cc[i-1];
for(int i=len-1;~i;i--)sa[--cc[x[i]]]=i;
for(int k=1;k<=len;k<<=1)
{
int p=0;
for(int i=len-k;i<len;i++)y[p++]=i;
for(int i=0;i<len;i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(int i=0;i<m;i++)cc[i]=0;
for(int i=0;i<len;i++)++cc[x[y[i]]];
for(int i=1;i<m;i++)cc[i]+=cc[i-1];
for(int i=len-1;~i;i--)sa[--cc[x[y[i]]]]=y[i];
swap(x,y),m=1,x[sa[0]]=0;
for(int i=0;i<len;i++)x[sa[i]]=cmp(y,sa[i],sa[i-1],k)?m-1:m++;
if(m>=len)return;
}
}
void make_height()
{
int k=0;
for(int i=0;i<len;i++)rank[sa[i]]=i;
for(int i=0;i<len;i++)
{
if(!rank[i])continue;
int j=sa[rank[i]-1];
if(k)k--;
while(s[i+k]==s[j+k])k++;
height[rank[i]]=k;
}
}
int main()
{
scanf("%s",s);
len=strlen(s);
make_sa();
make_height();
for(int i=0;i<len;i++)
{
y[i].a=height[i];
y[i].pos=i;
}
//以上均为求sa,height过程,可以无视啦
sort(y+1,y+len,cmp1);
st.insert(0),st.insert(len);
for(int i=1;i<len;i++)
{
int l=*--st.lower_bound(y[i].pos);
int r=*st.upper_bound(y[i].pos);
int now=y[i].pos;
ans=ans-(long long)2*(now-l)*(r-now)*y[i].a;
ans=ans+(long long)i*(len-1);
st.insert(now);
}
ans+=(long long)len*(len-1);
cout << ans;
return 0;
}
暴力查找 code:
#include<cstdio>
#include<cstdlib>
#include<cmath>
#include<cstring>
#include<queue>
#include<vector>
#include<set>
#include<map>
#include<iostream>
#include<algorithm>
#define T 511111
using namespace std;
struct W{int a,pos;}y[T];
bool vis[T];
char s[T];
int t1[T],t2[T],cc[T],sa[T],rank[T],height[T];
int len;
long long ans;
set<int>st;
bool cmp1(W a,W b){return a.a<b.a;}
bool cmp(int *y,int a,int b,int k)
{
int a1=y[a],b1=y[b];
int a2=a+k>=len?-1:y[a+k];
int b2=b+k>=len?-1:y[b+k];
return a1==b1&&a2==b2;
}
void make_sa()
{
int *x=t1,*y=t2,m=333;
for(int i=0;i<m;i++)cc[i]=0;
for(int i=0;i<len;i++)++cc[x[i]=s[i]];
for(int i=1;i<m;i++)cc[i]+=cc[i-1];
for(int i=len-1;~i;i--)sa[--cc[x[i]]]=i;
for(int k=1;k<=len;k<<=1)
{
int p=0;
for(int i=len-k;i<len;i++)y[p++]=i;
for(int i=0;i<len;i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(int i=0;i<m;i++)cc[i]=0;
for(int i=0;i<len;i++)++cc[x[y[i]]];
for(int i=1;i<m;i++)cc[i]+=cc[i-1];
for(int i=len-1;~i;i--)sa[--cc[x[y[i]]]]=y[i];
swap(x,y),m=1,x[sa[0]]=0;
for(int i=0;i<len;i++)x[sa[i]]=cmp(y,sa[i],sa[i-1],k)?m-1:m++;
if(m>=len)return;
}
}
void make_height()
{
int k=0;
for(int i=0;i<len;i++)rank[sa[i]]=i;
for(int i=0;i<len;i++)
{
if(!rank[i])continue;
int j=sa[rank[i]-1];
if(k)k--;
while(s[i+k]==s[j+k])k++;
height[rank[i]]=k;
}
}
int ask_pre(int x)
{
while(!vis[x])x--;
return x;
}
int ask_nxt(int x)
{
while(!vis[x])x++;
return x;
}
int main()
{
scanf("%s",s);
len=strlen(s);
make_sa();
make_height();
for(int i=0;i<len;i++)
{
y[i].a=height[i];
y[i].pos=i;
}
sort(y+1,y+len,cmp1);
memset(vis,0,sizeof(vis));
vis[0]=1;vis[len]=1;
for(int i=1;i<len;i++)
{
int l=ask_pre(y[i].pos);
int r=ask_nxt(y[i].pos);
int now=y[i].pos;
ans=ans-(long long)2*(now-l)*(r-now)*y[i].a;
ans=ans+(long long)i*(len-1);
vis[now]=1;
}
ans+=(long long)len*(len-1);
cout << ans;
return 0;
}

本文介绍了一种使用后缀数组和LCP数组解决特定字符串问题的方法,并对比了使用set优化与暴力查找两种实现方式的性能差异。

283

被折叠的 条评论
为什么被折叠?



