文章目录
- description
- solution
- code
#3483. SGU505 Prefixes and suffixes(询问在线版)
description
给定𝑛个字符串,有𝑚个询问。
每个询问给出两个字符串𝑠1, 𝑠2,问𝑛个字符串中有多少个字符串满足𝑠1是其前缀,且𝑠2是其后缀。
输入格式
从文件 fix.in 中读入数据。
输入文件的第一行包含一个整数𝑛,含义如上所述。
接下来𝑛行,每行一个字符串。
接下来一行包含一个整数𝑚,代表询问数。
接下来𝑚行,每行包含两个字符串𝑠1, 𝑠2,代表一次询问。询问内容请参见问题描述。
为了体现算法的在线性,我们令上次询问的答案是𝑥(如果这是第一个询问则𝑥 = 0)。询问的两个字符串的所有字符都要按字母表的顺序向后移动𝑥位(字母表是一个环)。例如 x=2,输入的 s1=qz 则查询的 s1=sb。
输出格式
输出到 fix.out 中。
对于每次询问,输出串满足既是𝑠1的前缀,又是𝑠2的后缀的字符串的数量。
样例输入
10
emikuqihgokuhsywlmqemihhpgijkxdukjfmlqlwrpzgwrwozkmlixyxniutssasrriafu
emikuqihgokuookbqaaoyiorpfdetaeduogebnolonaoehthfaypbeiutssasrriafu
emikuqihgokuorocifwwymkcyqevdtglszfzgycbgnpomvlzppwrigowekufjwiiaxniutssasrriafu
emikuqihgokuorociysgfkzpgnotajcfjctjqgjeeiheqrepbpakmlixyxniutssasrriafu
emikuqihgokuorociysgfrhulymdxsqirjrfbngwszuyibuixyxniutssasrriafu
emikuqihgokuorguowwiozcgjetmyokqdrqxzigohiutssasrriafu
emikuqihgokuorociysgsczejjmlbwhandxqwknutzgdmxtiutssasrriafu
emikuqihgokuorociysgvzfcdxdiwdztolopdnboxfvqzfzxtpecxcbrklvtyxniutssasrriafu
emikuqihgokuorocsbtlyuosppxuzkjafbhsayenxsdmkmlixyxniutssasrriafu
emikuqihgokuorociysgfjvaikktsixmhaasbvnsvmkntgmoygfxypktjxjdkliixyxniutssasrriafu
10
emikuqihgokuorociysg yxniutssasrriafu
aiegqmedckgqknky eqpoowonnewbq
xfbdnjbazhdnhkhvb qrqgbnmlltlkkbtyn
bjfhrnfedlhrlolzfv qppxpoofxcr
zhdfpldcbjf stsidponnvnmmdvap
zhdfpldcbjfpjmjxdt gdstsidponnvnmmdvap
dlhjtphgfnjtnqnbhxr wxwmhtsrrzrqqhzet
bjfhrnfedlhrlolzfv frqppxpoofxcr
zhdfpldcbjf dponnvnmmdvap
ucyakgyxweakehes nondykjiiqihhyqvk
样例输出
4
7
3
5
5
1
3
5
10
4
数据规模和约定
设𝐿1表示𝑛个字符串的长度之和,𝐿2表示𝑚次查询的字符串𝑠1, 𝑠2的长度之和。
数据点 | 𝑛的规模 | 𝑚的规模 | L1的规模 | L2的规模 |
---|---|---|---|---|
1 | = 10 | = 10 | ≤ 1000 | ≤ 500 |
2 | = 200 | = 1000 | ≤ 160000 | ≤ 160000 |
3 | = 500 | = 5000 | ≤ 400000 | ≤ 800000 |
4 | = 1000 | = 10000 | ≤ 800000 | ≤ 400000 |
5~7 | = 2000 | = 50000 | ≤ 1600000 | ≤ 1600000 |
8~10 | = 2000 | = 100000 | ≤ 1600000 | ≤ 3200000 |
对于所有数据,保证字符串的字符集为小写英文字母
solution
刚开始就想了前缀字典树和后缀字典树,但是又要求是同一个字符串,如果暴力存储每个字典树节点代表的子串被包含在哪些字符串里面,似乎就可以前缀后缀对比求出
但这显然会TLETLETLE,可能跟暴力差不多
害怕空间超限制,我又想到了可持久化字典树,但似乎不大有作用
考试过程中,游老师突然说了句
排完序,就是线性复杂度了
waitaminute!\rm wait\ a\ minute!wait a minute!
我好像没有排序诶——我陷入了沉思
排序??
排什么序?排序为我带来了什么好处吗??
排序会让序列变得有序~~(废话)~~
树的dfn序,使得树可以被划分成连续区间
…………......
真実はいつも一つ!
当我将字符串排序后,对于一段前缀,包含它的字符串一定是一段连续区间!!!
于是乎可以像树的dfn序求节点管辖的子树区间,我可以求出包含该前缀的字符串区间的左右端点
答案通过这一步就进行了字符串筛选,留下的这个区间恰好是所有满足s1s1s1是其前缀的字符串
接下来就是进一步筛选,这些字符串中后缀是s2s2s2的串
首先我怎么做到只要这一段区间里面的字符串信息呢??
暴力枚举——这又回到了起点,不可取
是的没错,就是一开始的——可持久化
这样就转化成了前缀和问题,rrr版本减去l−1l-1l−1版本即可
s2s2s2为后缀,似乎也是一开始的——后缀字典树
对,没错,倒着再来一个可持久化字典树
时间复杂度主要是在前缀字典树和后缀字典树上跑s1,s2s1,s2s1,s2长度的字符串求和
前面的一些预处理,复杂度没有超过查询的复杂度
两个部分无交集,复杂度是相加关系
所以取大复杂度而言,的确是线性的
只要想到了,就非常好写这个代码
正解其实就是把之前的乱想法,安排了一个顺序,前提是拍好了序而已
以上是正解做法
接下来再分享一种方法把
字符串一般都容易想到——哈希
尤其是想不出正解的时候,哈希总归是不会抛弃你的
这道题就是预处理对于每一个字符串的每一个前缀/后缀都哈希一下
一共是2∗L12*L12∗L1的
然后查询的时候,就直接枚举nnn个字符串,然后直接调第iii个字符串长度为s1,s2s1,s2s1,s2的前缀、后缀哈希,跟查询的两个串哈希比较即可
这种做法是O(nm)O(nm)O(nm)的
code
#include <cstdio>
#include <iostream>
#include <algorithm>
using namespace std;
#define maxn 2002
#define maxm 1600002
int n, m, len, cnt_pre, cnt_suf;
string s[maxn];
int L[maxm], R[maxm], sum[maxm], root[maxn];
int pre[maxm][26], suf[maxm][26];void insert_pre( int id ) {len = s[id].length();int now = 0;for( int i = 0;i < len;i ++ ) {int k = s[id][i] - 'a';if( ! pre[now][k] ) pre[now][k] = ++ cnt_pre;now = pre[now][k];if( ! L[now] ) L[now] = id;R[now] = id;}
}void insert_suf( int lst, int &now, int id, int d ) {if( ! ~d ) return;now = ++ cnt_suf;for( int i = 0;i < 26;i ++ ) suf[now][i] = suf[lst][i];sum[now] = sum[lst] + 1;int k = s[id][d] - 'a';insert_suf( suf[lst][k], suf[now][k], id, d - 1 );
}string a, b;int find() {int now = 0;for( int i = 0;i < len;i ++ ) {int k = a[i] - 'a';if( ! pre[now][k] ) return 0;else now = pre[now][k];}return now;
}int query( int l, int r, int d ) {int k = b[d] - 'a';if( sum[suf[r][k]] - sum[suf[l][k]] == 0 ) return 0;if( d == 0 ) return sum[suf[r][k]] - sum[suf[l][k]];return query( suf[l][k], suf[r][k], d - 1 );
}int main() {freopen( "fix.in", "r", stdin );freopen( "fix.out", "w", stdout );scanf( "%d", &n );for( int i = 1;i <= n;i ++ ) cin >> s[i];sort( s + 1, s + n + 1 );for( int i = 1;i <= n;i ++ ) insert_pre( i ), insert_suf( root[i - 1], root[i], i, len - 1 );scanf( "%d", &m );int ans = 0;while( m -- ) {cin >> a >> b;len = a.length();for( int i = 0;i < len;i ++ ) {int x = a[i] - 'a';x = ( x + ans ) % 26;a[i] = x + 'a';}int pos = find();if( ! pos ) {printf( "%d\n", ans = 0 );continue;}len = b.length();for( int i = 0;i < len;i ++ ) {int x = b[i] - 'a';x = ( x + ans ) % 26;b[i] = x + 'a';}int l = L[pos], r = R[pos];printf( "%d\n", ans = query( root[l - 1], root[r], len - 1 ) );}return 0;
}