HDU 2457 AC 自动机 + DP

本文介绍了一种使用AC自动机和动态规划处理基因序列的算法,通过构建Trie树和计算失配指针,实现了对目标基因的有效搜索和最小处理次数的计算。
题意

传送门 HDU 2457

题解

初始化 A C AC AC 自动机,将 T r i e Trie Trie 上节点看做字符串后缀的不同模式(或者状态)。若一个模式存在目标基因,那么这个节点或其失配节点(最长后缀)对应的字符串是目标基因。计算失配指针的时候,处理了各节点的所有状态转移(即在字符串结尾添加 A , C , G , T A,C,G,T A,C,G,T 其中一个字符),同时标记各状态是否存在目标基因即可。

d p [ i + 1 ] [ j ] dp[i+1][j] dp[i+1][j] 代表字符串在区间 [ 0 , i ] [0,i] [0,i] 且后缀模式为状态 j j j 的最少处理次数,设原始字符串为 s t r str str 则有

d p [ i + 1 ] [ t r i e [ j ] [ k ] ] = { d p [ i ] [ j ] s t r [ i ] 等 于 k 代 表 的 字 符 d p [ i ] [ j ] + 1 o t h e r w i s e dp[i+1][trie[j][k]]=\begin{cases} dp[i][j] & str[i]等于k代表的字符\\ dp[i][j]+1 & otherwise \\ \end{cases} dp[i+1][trie[j][k]]={dp[i][j]dp[i][j]+1str[i]kotherwise

状态转移时要保证各状态代表的后缀模式不存在目标基因,不合法状态设为 I N F INF INF,初始为空串,满足条件,则有 d p [ 0 ] [ 0 ] = 0 dp[0][0]=0 dp[0][0]=0

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <queue>
using namespace std;
#define maxn 1005
int ns, id['Z' + 1], trie[maxn][4], flag[maxn], fail[maxn], dp[maxn][maxn];
char str[maxn];

void insert(char *s)
{
    int len = strlen(s), p = 0;
    for (int i = 0; i < len; i++)
    {
        int c = id[s[i]];
        if (!trie[p][c])
        {
            memset(trie[ns], 0, sizeof(trie[ns]));
            trie[p][c] = ns++;
        }
        p = trie[p][c];
    }
    flag[p] = 1;
}

void getFail()
{
    queue<int> q;
    for (int i = 0; i < 4; i++)
    {
        if (trie[0][i])
        {
            fail[trie[0][i]] = 0;
            q.push(trie[0][i]);
        }
    }
    while (!q.empty())
    {
        int p = q.front();
        q.pop();
        if (flag[fail[p]])
        {
            flag[p] = 1;
        }
        for (int i = 0; i < 4; i++)
        {
            if (trie[p][i])
            {
                fail[trie[p][i]] = trie[fail[p]][i];
                q.push(trie[p][i]);
            }
            else
            {
                trie[p][i] = trie[fail[p]][i];
            }
        }
    }
}

int main()
{
    int n, t = 0;
    while (~scanf("%d", &n) && n)
    {
        ns = 1, id['A'] = 0, id['C'] = 1, id['G'] = 2, id['T'] = 3;
        memset(trie[0], 0, sizeof(trie[0]));
        memset(flag, 0, sizeof(flag));
        char s[25];
        for (int i = 0; i < n; i++)
        {
            scanf(" %s", s);
            insert(s);
        }
        getFail();
        scanf(" %s", str);
        int len = strlen(str);
        memset(dp, 0x3f, sizeof(dp));
        dp[0][0] = 0;
        for (int i = 0; i < len; i++)
        {
            for (int j = 0; j < ns; j++)
            {
                for (int k = 0; k < 4; k++)
                {
                    int nxt = trie[j][k];
                    if (!flag[j] && !flag[nxt])
                    {
                        dp[i + 1][nxt] = min(dp[i + 1][nxt], dp[i][j] + (k == id[str[i]] ? 0 : 1));
                    }
                }
            }
        }
        int res = len + 1;
        for (int i = 0; i < ns; i++)
        {
            if (!flag[i])
            {
                res = min(res, dp[len][i]);
            }
        }
        printf("Case %d: %d\n", ++t, res > len ? -1 : res);
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值