📅  最后修改于: 2023-12-03 15:12:04.755000             🧑  作者: Mango
给定一个只包含小写字母 a、b、c 和 d 的字符串 str,请计算 str 中有多少个由相同数量的 a、b、c 和 d 组成的子串。
最朴素的思路是穷举所有可能组成子串的情况,然后遍历一遍检查是否满足条件。但是这个做法的时间复杂度是 O(n^3),对于较长的字符串会导致超时。
其实我们可以用类似滑动窗口的思路优化这个过程。
我们假设当扫描到某个字符时已经存在 x 个 a,y 个 b,z 个 c,w 个 d,此时如果其中任意三个数相等,那么当前位置就会贡献一段满足条件的子串。
具体来说,我们可以用一个四元组 (x, y, z, w) 来记录当前的状态,然后使用一个哈希表来记录之前所有出现过的状态。每当遇到一个新的状态时,就在哈希表中查找是否存在另外三个数相等的状态,如果存在,则当前位置和之前的状态之间的子串符合条件。
以下是 Python 代码实现,其中使用了 defaultdict 来简化哈希表的逻辑。
def countSubstrings(s: str) -> int:
from collections import defaultdict
d = defaultdict(int)
d[(0, 0, 0, 0)] = 1 # 初始状态为 (0, 0, 0, 0)
res, x, y, z, w = 0, 0, 0, 0, 0
for ch in s:
if ch == 'a':
x += 1
elif ch == 'b':
y += 1
elif ch == 'c':
z += 1
else:
w += 1
key = (x - z, y - w, z - x, w - y)
res += d[key]
d[key] += 1
return res
代码中用一个四元组来表示状态,四元组的每个元素表示 a 减去 c 的数目、b 减去 d 的数目、c 减去 a 的数目和 d 减去 b 的数目。具体用法可以参考代码中的注释。
本题是一道稍微有难度的字符串问题,但是通过使用哈希表等数据结构,我们可以将时间复杂度降到 O(n) 级别。
这也提示我们在解决字符串问题时,要善于使用一些常见的数据结构和算法,比如哈希表、双指针、滑动窗口等。