bzoj 3670: [Noi2014]动物园 kmp与扩展kmp

这篇博客介绍了在NOI2014中的一道动物园问题,涉及KMP算法和扩展KMP算法的应用。园长通过设立算法班激发动物们学习算法,题目要求求出字符串中满足特定条件的子串数量。博客提供了两种解法,一种是基于KMP的思路,另一种是扩展KMP的方法,并附有相应的代码实现。

bzoj 3670: [Noi2014]动物园容

Description

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”
园长:“非常好!那你能举个例子吗?”
熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。
下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?
特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出对1,000,000,007取模的结果即可。

Input

第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

Output

包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

Sample Input

3
aaaaa
ab
abcababc

Sample Output

36
1
32

HINT

n≤5,L≤1,000,000

解法1:kmp

其实这道题用AC自动机的角度比较好理解。
nxt数组的计算是kmp基础了。
我们先不考虑 (2j<i) ( 2 j < i ) 的限制。
那么考虑nxt数组,其实就是失配函数,也就是满足题意的最长后缀。那么我们考虑一条从i开始的nxt链。也就是 v1,v2vn v 1 , v 2 ⋯ v n 其中 vn=nxt[vn1]v1=i v n = n x t [ v n − 1 ] , v 1 = i 那么所有的 vS[vxi] v , S [ v x ⋯ i ] S[0i] S [ 0 ⋯ i ] 的后缀也是前缀,又由于nxt[i]是最长的满足题意的子串,所以 v v 也就是所有满足题意的子串。
于是我们只要计算每个点i的nxt链的长度即可,直接递推。
对于条件(2j<i)我们只需要重新kmp一遍,在跳链的时候判断一下即可。

代码1

/**************************************************************
    Problem: 3670
    User: 2014lvzelong
    Language: C++
    Result: Accepted
    Time:772 ms
    Memory:10076 kb
****************************************************************/

#include<iostream>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#include<cmath>
using namespace std;
const int N = 1e6 + 10, mod = 1e9 + 7;
int n, num[N], nxt[N];
char a[N];
void readchar() {
    char ch = getchar(); n = 0;
    while(ch < 'a' || ch > 'z') ch = getchar();
    for(;ch >= 'a' && ch <= 'z'; ch = getchar()) a[++n] = ch;
}
int main() {
    int T;
    scanf("%d", &T);
    while(T--) {
        readchar(); num[1] = 1;
        for(int i = 2, k = 0; i <= n; ++i) {
            while(k && a[i] != a[k + 1]) k = nxt[k];
            if(a[i] == a[k + 1]) ++k;
            nxt[i] = k; num[i] = num[nxt[i]] + 1;
        }
        int ans = 1;
        for(int i = 2, k = 0; i <= n; ++i) {
            while(k && a[i] != a[k + 1]) k = nxt[k];
            if(a[i] == a[k + 1]) ++k;
            while((k << 1) > i) k = nxt[k];
            ans = 1LL * ans * (num[k] + 1) %mod;
        }
        printf("%d\n", ans);
    }
    return 0; 
}

解法2:扩展kmp

网上一堆题解都是如果是扩展kmp就是水题。
像我这种刚学的渣渣当然是蒙逼的。
扩展kmp的算法学习:拓展kmp算法总结
然后嘞,为啥这是一道裸题?
考虑一个串i对答案的贡献。
nxt[i]在exkmp里表示 S[in1]S[0n1] S [ i ⋯ n − 1 ] 和 S [ 0 ⋯ n − 1 ] 的最长公共前缀。
也就是说对于以 iji+nxt[i] i ≤ j ≤ i + n x t [ i ] 结尾的前缀, S[ij] S [ i ⋯ j ] 一定既是前缀j的后缀又是前缀j的前缀。
那么i就对所有的j的答案产生1的贡献。
考虑限制条件 (2j<i) ( 2 j < i ) 也就是要求i的贡献的前缀j不能超过2i。
所以i对所有的 ijmin(i+nxt[i],2i) i ≤ j ≤ m i n ( i + n x t [ i ] , 2 i ) 产生1的贡献。
别告诉我用线段树区修单查!
差分即可。

代码2

/**************************************************************
    Problem: 3670
    User: 2014lvzelong
    Language: C++
    Result: Accepted
    Time:1108 ms
    Memory:10076 kb
****************************************************************/

#include<iostream>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#include<cmath>
using namespace std;
const int N = 1e6 + 10, mod = 1e9 + 7;
int n, nxt[N], b[N];
char a[N];
void readchar() {
    char ch = getchar(); n = 0;
    while(ch < 'a' || ch > 'z') ch = getchar();
    for(;ch >= 'a' && ch <= 'z'; ch = getchar()) a[n++] = ch;
}
void Exkmp() {
    nxt[0] = n; int j, k = 2;
    for(j = 0; a[j] == a[j + 1] && j + 1 < n; ++j) ;
    nxt[1] = j;
    for(int i = 2;i < n; ++i) {
        if(i + nxt[i - k] < k + nxt[k]) nxt[i] = nxt[i - k];
        else {
            for(j = max(nxt[k] + k - i, 0); i + j <= n && a[j] == a[j + i]; ++j) ;
            nxt[i] = j; k = i;
        }
    }
}

int main() {
    int T; scanf("%d", &T);
    while(T--) {
        memset(b, 0, sizeof(b));
        memset(nxt, 0, sizeof(nxt));
        readchar(); Exkmp();
        for(int i = 0;i < n; ++i) ++b[i], --b[min(i << 1, i + nxt[i])];
        int ans = 1, cur = b[0];
        for(int i = 0;i < n; cur = (cur + b[++i]) % mod) ans = 1LL * ans * (cur + 1) % mod;
        printf("%d\n", ans);
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值