这个题目不是编程珠玑上看到的,但是解法用到的数据结构在编程珠玑上有讲到,先归类到这里。
求一个字符串中连续出现的次数最多的子串。例如字符串“abababc”,最多连续出现的为ab,连续出现三次。要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab。两个题目的解法有些类似,都用到了后缀数组这个数据结构。求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
abababc
bababc
ababc
babc
abc
bc
c
可以看出第一个后缀数组和第三个后缀数组的起始都为ab,第5个后缀数组也为ab。可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,下一次出现应该在第i+len(s)个后缀数组的前面。这个规律也不难看出。那么从头到尾按照这个规律搜索下不难得出结果。下面是代码:
#include <iostream>
using namespace std;
int con_sub(char *str, char **ret);
int main()
{
char str[] = "abcabcabcabcabcabbbb";
char *ret = NULL;
int time = con_sub(str, &ret);
printf("%s occuers %d times\n", ret, time);
return 0;
}
int con_sub(char *str, char **ret)
{
int max_time = 0;//连续出现的最多次数
int ret_len = 0;//连续出现的字符串的长度
char *addr = NULL;//连续出现字符串的起始地址
int len = strlen(str);
char **a = (char **)malloc(sizeof(char *)*len);
//生成后缀数组
for(int i=0; i<len; i++)
a[i] = &str[i];
//重复字符串的长度范围为1到(len+1)/2
for(int i=1; i<=(len+1)/2; i++)
{
//当重复的字符串长度为i的时候,如果是连续出现的,那么第j和第j+i个后缀数组前面为重复的字符串
for(int j=0; j+i<=len-1; j+=i)
{
int k = j;
int temp_time = 1;
while(k+i <= len-1 && strncmp(a[k], a[k+i], i) == 0)
{
temp_time++;
k += i;
}
if(temp_time > max_time)
{
max_time = temp_time;
ret_len = i;
addr = a[k];
}
}
}
*ret = new char[len+1];
strncpy(*ret, addr, ret_len);
return max_time;
}
本文介绍了一种使用后缀数组解决寻找字符串中连续出现次数最多的子串问题的方法。通过分析后缀数组,可以找出重复出现的模式,并确定最多连续出现的子串。例如在字符串'abababc'中,子串'ab'连续出现了三次。这种方法与寻找最长重复子串的问题解法相似,但两者有所区别。给出的代码实现了这一算法。
求一个字符串中连续出现的次数最多的子串&spm=1001.2101.3001.5002&articleId=7795479&d=1&t=3&u=ae90f54eaa14457d913ef0a2306c057a)
2319

被折叠的 条评论
为什么被折叠?



