28.实现 strStr()

实现 strStr() 函数。

给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回 -1

说明:

needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。

对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与 C 语言的 strstr() 以及 Java 的 indexOf() 定义相符。

示例 1:

1
2
输入:haystack = "hello", needle = "ll"
输出:2

示例 2:

1
2
输入:haystack = "aaaaa", needle = "bba"
输出:-1

示例 3:

1
2
输入:haystack = "", needle = ""
输出:0

解题思路

这是一道经典的字符串匹配题目,有多种解法。

核心思想

  • 暴力匹配:双重循环比较
  • KMP算法:优化字符串匹配
  • 内置函数:使用语言内置的字符串查找函数

方法一:暴力匹配(推荐初学者)

时间复杂度 O(m×n)、空间复杂度 O(1)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
/**
* @param {string} haystack
* @param {string} needle
* @return {number}
*/
var strStr = function(haystack, needle) {
// 处理边界情况
if (needle === '') return 0;
if (haystack.length < needle.length) return -1;

const hLen = haystack.length;
const nLen = needle.length;

for (let i = 0; i <= hLen - nLen; i++) {
let match = true;

// 检查从位置i开始的子串是否匹配
for (let j = 0; j < nLen; j++) {
if (haystack[i + j] !== needle[j]) {
match = false;
break;
}
}

if (match) {
return i;
}
}

return -1;
};

方法二:优化版本

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
var strStr = function(haystack, needle) {
if (needle === '') return 0;

const hLen = haystack.length;
const nLen = needle.length;

for (let i = 0; i <= hLen - nLen; i++) {
// 使用substring进行比较
if (haystack.substring(i, i + nLen) === needle) {
return i;
}
}

return -1;
};

方法三:KMP算法(高级解法)

时间复杂度 O(m+n)、空间复杂度 O(n)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
var strStr = function(haystack, needle) {
if (needle === '') return 0;

// 构建next数组
const next = buildNext(needle);
const hLen = haystack.length;
const nLen = needle.length;

let i = 0, j = 0;

while (i < hLen && j < nLen) {
if (j === -1 || haystack[i] === needle[j]) {
i++;
j++;
} else {
j = next[j];
}
}

if (j === nLen) {
return i - j;
}

return -1;
};

// 构建next数组
function buildNext(pattern) {
const next = new Array(pattern.length);
next[0] = -1;

let i = 0, j = -1;

while (i < pattern.length - 1) {
if (j === -1 || pattern[i] === pattern[j]) {
i++;
j++;
next[i] = j;
} else {
j = next[j];
}
}

return next;
}

方法四:使用内置函数

1
2
3
var strStr = function(haystack, needle) {
return haystack.indexOf(needle);
};

解题要点

  1. 边界处理
    • needle为空字符串时返回0
    • haystack长度小于needle长度时返回-1
  2. 暴力匹配
    • 双重循环,外层遍历haystack的每个位置
    • 内层比较从该位置开始的子串是否匹配needle
  3. KMP算法
    • 构建next数组,避免重复比较
    • 时间复杂度优化到O(m+n)

面试要点

  • 高频考点:这道题是面试中的高频题目
  • 算法选择:能够分析不同算法的时间复杂度
  • 边界处理:注意各种边界情况的处理
  • KMP算法:了解KMP算法的原理和应用

相关题目

扩展思考

  1. 为什么KMP算法更快?

    • 利用已经匹配的信息,避免重复比较
    • next数组记录了模式串的自匹配信息
  2. 时间复杂度分析

    • 暴力匹配:O(m×n)
    • KMP算法:O(m+n)
    • 内置函数:通常也是O(m+n)
  3. 边界情况

    • needle为空:返回0
    • haystack为空,needle不为空:返回-1
    • 两个都为空:返回0
  4. 实际应用

    • 文本编辑器中的查找功能
    • 数据库中的字符串搜索
    • 网络协议中的模式匹配

最后更新: 2021-09-09