最长回文子串Manacher O(n)解法+ 区间dp O(n2)解法

最新推荐文章于 2025-06-06 23:29:28 发布

原创最新推荐文章于 2025-06-06 23:29:28 发布 · 942 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

dp 同时被 2 个专栏收录

51 篇文章

订阅专栏

字符串

7 篇文章

订阅专栏

本文介绍了两种高效的求解最长回文子串的算法：Manacher算法和动态规划方法。Manacher算法通过巧妙地处理回文串的奇偶性问题，达到线性时间复杂度O(n)。动态规划方法则通过构建DP状态数组，避免了重复判断，有效降低时间复杂度。

题解转自博客：www.cnblogs.com/mickole/articles/3578298.html

题目：（替代题目可去pat天梯赛练习题中寻找，当然那个题n3也能过）

长度为N(N很大)的字符串，求这个字符串里的最长回文子串？（百度2014校招笔试题目）

题目指出“N 很大”，就是提示我们不要想通过遍历的方法来找到这个字符串，我想到的就一种解法，时间复杂度应该不高，但是我算不出来这个算法的复杂度是多少，首先说一下什么是回文字符串：回文字符串是指从左到右和从右到左相同的字符串，比如"1221"或者“12321”都是回文字符串.

关于这个题目的解法很多。

解法一：Manacher算法（O(n))

大家都知道，求回文串时需要判断其奇偶性，也就是求aba和abba的算法略有差距。然而，这个算法做了一个简单的处理，很巧妙地把奇数长度回文串与偶数长度回文串统一考虑，也就是在每个相邻的字符之间插入一个分隔符，串的首尾也要加，当然这个分隔符不能再原串中出现，一般可以用‘#’或者‘$’等字符。例如：
原串：abaab
新串：#a#b#a#a#b#
这样一来，原来的奇数长度回文串还是奇数长度，偶数长度的也变成以‘#’为中心的奇数回文串了。
接下来就是算法的中心思想，用一个辅助数组P记录以每个字符为中心的最长回文半径，也就是P[i]记录以S[i]字符为中心的最长回文串半径。P[i]最小为1，此时回文串为Str[i]本身。

为了防止求P[i]向两边扩展时可能数组越界，我们需要在数组最前面和最后面加一个特殊字符，令P[0]=‘$’，最后位置默认为‘\0’不需要特殊处理
我们可以对上述例子写出其P数组，如下:
新串： # a # b # a # a # b #
P[] : 1 2 1 4 1 2 5 2 1 2 1
我们可以证明P[i]-1就是以S[i]为中心的回文串在原串当中的长度。
证明：
1、显然L=2*P[i]-1即为新串中以S[i]为中心最长回文串长度。
2、以S[i]为中心的回文串一定是以#开头和结尾的，例如“#b#b#”或“#b#a#b#”所以L减去最前或者最后的‘#’字符就是原串中长度的二倍，即原串长度为(L-1)/2，化简的P[i]-1。

那么怎么计算P[i]呢？该算法增加两个辅助变量（其实一个就够了，两个更清晰）id和mx，其中id表示最大回文子串中心的位置，mx则为id+P[id]，也就是最大回文子串的边界。依次从前往后求得P数组就可以了，这里用到了DP(动态规划)的思想，也就是求P[i]的时候，前面的P[]值已经得到了，我们利用回文串的特殊性质可以进行一个大大的优化。我先把核心代码贴上：

这个算法的关键点就在这里了：

if(mx > i)

P[i] >= MIN(P[2 * id - i], mx - i)

就是这个串卡了我非常久。实际上如果把它写得复杂一点，理解起来会简单很多：

//记j = 2 * id - i，也就是说 j 是 i 关于 id 的对称点。
if (mx - i > P[j]) 
    P[i] = P[j];
else /* P[j] >= mx - i */
    P[i] = mx - i; // P[i] >= mx - i，取最小值，之后再匹配更新。

当然光看代码还是不够清晰，还是借助图来理解比较容易。
当 mx - i > P[j] 的时候，以S[j]为中心的回文子串包含在以S[id]为中心的回文子串中，由于 i 和 j 对称，以S[i]为中心的回文子串必然包含在以S[id]为中心的回文子串中，所以必有 P[i] = P[j]，见下图。

当 P[j] >= mx - i 的时候，以S[j]为中心的回文子串不一定完全包含于以S[id]为中心的回文子串中，但是基于对称性可知，下图中两个绿框所包围的部分是相同的，也就是说以S[i]为中心的回文子串，其向右至少会扩张到mx的位置，也就是说 P[i] >= mx - i。至于mx之后的部分是否对称，就只能老老实实去匹配了。

对于 mx <= i 的情况，无法对 P[i]做更多的假设，只能P[i] = 1，然后再去匹配了。

核心代码：

void pk()
{
    int i;
    int mx = 0;
    int id;
    for(i=1; i<n; i++)
    {
        if( mx > i )
            p[i] = MIN( p[2*id-i], mx-i );        
        else
            p[i] = 1;
        for(; str[i+p[i]] == str[i-p[i]]; p[i]++)
            ;
        if( p[i] + i > mx )
        {
            mx = p[i] + i;
            id = i;
        }
    }
}

解法二：动态规划（DP),区间dp

思想：DP的考虑源于暴力方法，暴力方法是寻找一个字符串的所有子串，需要O(n^2)的开销，然后对于每一个子串需要O(n)的开销来判断是否是回文，故暴力方案为O(n^3)，但是这里有一个问题，就是在暴力的时候有重复判断；

例如，如果子串X为回文，那么sXs也是回文；如果X不是回文，那么sXs也不是回文；另外，ss也是回文。所以这里使用DP我们可以按照子串长度从小到大的顺序来构建DP状态数组，使用一个二维数组dp[i][j]记录子串[i-j]是否为回文子串，那么我们就有初始化和自底向上的方案了；

初始化：单字符串和相等的双字符串为回文

自底向上构造：X[i]==X[j] && dp[i+1][j-1]==1 则dp[i][j] = 1

2种解法的完整代码：

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <vector>
#include <queue>
#include <set>
#include <map>
#include <string>
#include <cmath>
#include <cstdlib>
#include <ctime>
#include <stack>
#include <sstream>
#include <string>

using namespace std;

const int maxn = 1100;


string bydp(string s){
    bool dp[maxn][maxn];
    memset(dp,0,sizeof(dp));
    int n = s.length();
    int maxlen = 1,lbegin = 0;
    ///长度为1的单独处理
    for(int i = 0;i<n;++i){
        dp[i][i] = 1;
    }
    ///长度为2的单独处理。
    for(int i = 0;i<n-1;++i){
        if(s[i]==s[i+1]){
            dp[i][i+1] = 1;
            maxlen = 2;
            lbegin = i;
        }
    }

    for(int len = 3;len <=n;++len){
        for(int i = 0;i+len-1<n;++i){
            int j = i+len-1;
            if(dp[i+1][j-1] && s[i]==s[j]){
                dp[i][j] = 1;
                maxlen = len;
                lbegin = i;
            }
        }
    }
    return s.substr(lbegin,maxlen);
}


string byManacher(string s){
    ///转换为新串
    int n = s.length();///原串长度
    string news;
    news+='@';news+='#';
    for(int i = 0;i<n;++i){
        news+=s[i];
        news+='#';
    }


    ///求解p
    int p[2*maxn];
    n = 2*n+2;
    memset(p,0,sizeof(p));
    int id=0,mx=0;///***id是最大回文子串中心的位置，并不是最长回文子串中心的位置
    int maxcent = 0, maxr = 0;;
    for(int i = 1;i<n;++i){
        int j = 2*id-i;///j是i关于id的对称点
        if(mx>i) p[i] = min(p[j],mx-i);
        else p[i] = 1;
        while(i+p[i]<n && i-p[i]>0 && news[i+p[i]] == news[i-p[i]]) p[i]++;

        if(p[i]+i>mx){///更新位置
            id = i;
            mx = p[i]+i;
        }
        if(p[i]>maxr){
            maxcent = i;
            maxr = p[i];
        }
    }
    string ans;
    int maxbegin = maxcent-maxr+1,maxend = maxcent+maxr-1;
    for(int i = maxbegin;i<=maxend;++i){
        if(news[i] != '#') ans += news[i];
    }
    return ans;
}

int main(){

    string s;
    getline(cin,s);
    s = bydp(s);
    ///s = byManacher(s);
    cout<<s.length();

    return 0;

}