1. 首页
  2. 后缀数组

POJ 3261 Milk Patterns (后缀数组+二分)

求可重叠的出现K次的最长重复子串~

二分枚举height数组即可。

//#pragma commmpnt(linkmpr, "/STACK:102400000,102400000")
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <cmath>
using namespace std;
typedef long long LL;
const int M = 10055;

/* *suffix array *倍增算法  O(n*logn)
*待排序数组长度为n,放在0~n-1中,在最后面补一个0
*da(str ,n+1,sa,Rank,height,  ,   );//注意是n+1;
*例如: *n   = 8;
*num[]   = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0
*Rank[]  = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };Rank[0~n-1]为有效值,Rank[n]必定为0无效 值
*sa[]    = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值
*height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值 * */

const int MAXN=20010;
int t1[MAXN],t2[MAXN],c[MAXN];
//求SA数组需要的中间变量,不需要赋值
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
//函数结束以后结果放在sa数组中

bool cmp(int *r,int a,int b,int l)
{
    return r[a] == r[b] && r[a+l] == r[b+l];
}

void da(int *str,int *sa,int *Rank,int *height,int n,int m)
{
    n++;
    int i, j, p, *x = t1, *y = t2;     //第一轮基数排序,如果s的最大值很大,可改为快速排序
    for(i = 0; i < m; i++)c[i] = 0;
    for(i = 0; i < n; i++)c[x[i] = str[i]]++;
    for(i = 1; i < m; i++)c[i] += c[i-1];
    for(i = n-1; i >= 0; i--)sa[--c[x[i]]] = i;
    for(j = 1; j <= n; j <<= 1)
    {
        p = 0;         //直接利用sa数组排序第二关键字
        for(i = n-j; i < n; i++)y[p++] = i;//后面的j个数第二关键字为空的最小
        for(i = 0; i < n; i++)if(sa[i] >= j)y[p++] = sa[i] - j;         //这样数组y保存的就是按照第二关键字排序的结果
        //基数排序第一关键字
        for(i = 0; i < m; i++)c[i] = 0;
        for(i = 0; i < n; i++)c[x[y[i]]]++;
        for(i = 1; i < m; i++)c[i] += c[i-1];
        for(i = n-1; i >= 0; i--)sa[--c[x[y[i]]]] = y[i];        //根据sa和x数组计算新的x数组
        swap(x,y);
        p = 1;
        x[sa[0]] = 0;
        for(i = 1; i < n; i++)
            x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p >= n)
            break;
        m = p;//下次基数排序的最大值
    }
    int k = 0;
    n--;
    for(i = 0; i <= n; i++)
        Rank[sa[i]] = i;
    for(i = 0; i < n; i++)
    {
        if(k)
            k--;
        j = sa[Rank[i]-1];
        while(str[i+k] == str[j+k])
            k++;
        height[Rank[i]] = k;
    }
}

int Rank[MAXN],height[MAXN];

int a[MAXN];
int r[MAXN];
int sa[MAXN];
int n,k,ans;

int is_ok(int len)    
{
    int cnt = 1;
    for(int i = 2; i <= n; i++)
    {
        if(height[i] < len) cnt = 1;
        else cnt++;
        if(cnt >= k) return 1;
    }
    return 0;

}

int find_ans()  //二分枚举长度
{
    int l=1,r=n,mid;
    ans=-1;
    while(l<=r)
    {
        mid=(l+r)>>1;
        if(is_ok(mid))
        {
            l=mid+1;
            ans=max(ans,mid);
        }
        else
            r=mid-1;
    }

    printf("%d\n",ans);

    return 0;
}

int main()
{
    scanf("%d%d",&n,&k);
    int m=0;
    for(int i=0; i<n; ++i)
    {
        scanf("%d",&a[i]);
        a[i]++;
        m=max(m,a[i]); //更加机智的方法来确定m
    }
    a[n]=0;
    //m=200001;
    da(a,sa,Rank,height,n,m);
    find_ans();
    return 0;
}

 

评分 0, 满分 5 星
0
0
看完收藏一下,下次也能找得到
  • 版权声明:本文基于《知识共享署名-相同方式共享 3.0 中国大陆许可协议》发布,转载请遵循本协议
  • 文章链接:http://www.carlstedt.cn/archives/1177 (转载时请注明本文出处及文章链接)
上一篇:
:下一篇

发表评论

gravatar

快来吐槽一下吧!

  1. .01 4:06
  2. .02 1:47
  3. .03 3:39
  4. .04 1:40