K周期字符串需要的最少操作次数

2024-08-17

题目:

给你一个长度为 n 的字符串 word 和一个整数 k ,其中 kn 的因数。

在一次操作中,你可以选择任意两个下标 ij,其中 0 <= i, j < n ,且这两个下标都可以被 k 整除,然后用从 j 开始的长度为 k 的子串替换从 i 开始的长度为 k 的子串。也就是说,将子串 word[i..i + k - 1] 替换为子串 word[j..j + k - 1]

返回使 word 成为 K 周期字符串 所需的 最少 操作次数。

如果存在某个长度为 k 的字符串 s,使得 word 可以表示为任意次数连接 s ,则称字符串 wordK 周期字符串 。例如,如果 word == "ababab",那么 word 就是 s = "ab" 时的 2 周期字符串 。

示例 1:

输入:word = “leetcodeleet”, k = 4

输出:1

解释:可以选择 i = 4 和 j = 0 获得一个 4 周期字符串。这次操作后,word 变为 “leetleetleet” 。

示例 2:

输入:word = “leetcoleet”, k = 2

输出:3

解释:可以执行以下操作获得一个 2 周期字符串。

i j word
0 2 etetcoleet
4 0 etetetleet
6 0 etetetetet

提示:

  • 1 <= n == word.length <= 105
  • 1 <= k <= word.length
  • k 能整除 word.length
  • word 仅由小写英文字母组成。

思路:

根据题意,我们只能选择首字母下标为 0, k, 2k, 3k, , n  k 的长为 k 的子串来操作(替换)。

并且,k 周期字符串意味着,所有首字母下标为 0, k, 2k, 3k, , n  k 的长为 k 的子串均相等。

为使操作次数尽量少,我们可以计算最多保留多少个子串不变。也就是统计 word 中的这些首字母下标为 0, k, 2k, 3k, , n  k 的长为 k 的子串中,出现次数最多的子串的出现次数 mx。用出现次数最多的子串,替换其余子串。

所以用子串的个数 n / k 减去 mx,就是最少操作次数。

代码:

class Solution {
public:
    int minimumOperationsToMakeKPeriodic(string word, int k) {
        int n = word.length(), mx = 0;
        unordered_map<string, int> cnt;
        for (int i = k; i <= n; i += k) {
            mx = max(mx, ++cnt[word.substr(i - k, k)]);
        }
        return n / k - mx;
    }
};