C语言：手把手教你实现子串查找算法（从strstr到自定义函数）-平芜编程栈

1. 为什么需要理解子串查找？

在日常编程中，字符串处理是最基础也最频繁的操作之一。想象一下你在编辑器中按下Ctrl+F查找关键词，或者在数据库中搜索特定记录，背后都离不开字符串匹配算法。C语言作为系统级编程语言，其标准库提供的strstr函数就是解决这类问题的经典工具。

但只会调用API远远不够。我在面试新人时发现，90%的应聘者能熟练使用strstr，但当被要求手写实现时，往往漏洞百出。这就像只会开自动挡的车，一旦需要手动换挡就手忙脚乱。理解底层实现不仅能帮助调试复杂问题，更是提升算法思维的重要训练。

2. 标准库strstr函数解析

2.1 函数原型与基本用法

strstr的函数声明简洁有力：

char *strstr(const char *haystack, const char *needle);

这个形象的名字来源于"干草堆里找针"的英文谚语。参数haystack是主字符串，needle是待查找的子串。返回值有两种可能：

找到时返回子串首次出现的地址
未找到时返回NULL指针

实际使用非常简单：

#include <stdio.h> #include <string.h> int main() { char text[] = "Hello, world!"; char *result = strstr(text, "world"); if (result) { printf("Found at position: %ld\n", result - text); } else { printf("Not found\n"); } return 0; }

2.2 边界条件与陷阱

虽然接口简单，但strstr有几个容易踩坑的细节：

空字符串处理：当needle为空字符串时，标准规定应返回haystack起始地址
内存安全：要确保haystack和needle都以'\0'结尾
大小写敏感：标准的strstr区分大小写，"Hello"中找不到"hello"

我曾见过一个线上bug，因为开发者没检查strstr返回值就直接使用，导致程序崩溃。正确的做法总是先判断返回值是否为NULL。

3. 从零实现自己的strstr

3.1 暴力匹配算法

最直观的实现方式是逐个字符比较：

char *my_strstr(const char *haystack, const char *needle) { if (!*needle) return (char *)haystack; for (; *haystack; haystack++) { const char *h = haystack; const char *n = needle; while (*h && *n && (*h == *n)) { h++; n++; } if (!*n) return (char *)haystack; } return NULL; }

这个版本虽然效率不高（最坏情况O(mn)），但清晰展示了核心逻辑：

外层循环遍历haystack每个字符作为起点
内层循环逐个比较子串字符
发现不匹配立即跳出内层循环
如果needle全部匹配完成，返回当前起始位置

3.2 优化思路与技巧

实际项目中我们可以做这些优化：

提前长度检查：如果needle比haystack长直接返回NULL
首字符过滤：先快速扫描首字符匹配的位置
使用memcmp：对剩余部分用块比较替代逐字符比较

优化后的版本：

char *my_strstr_opt(const char *haystack, const char *needle) { size_t needle_len = strlen(needle); if (!needle_len) return (char *)haystack; size_t haystack_len = strlen(haystack); if (haystack_len < needle_len) return NULL; char first = *needle; const char *end = haystack + haystack_len - needle_len + 1; for (; (haystack = memchr(haystack, first, end - haystack)); haystack++) { if (!memcmp(haystack, needle, needle_len)) return (char *)haystack; } return NULL; }

4. 进阶讨论与性能对比

4.1 算法复杂度分析

原始暴力算法在最坏情况下（如haystack="aaa...aaa", needle="aa...aab"）需要O(mn)次比较。而优化版本通过：

memchr快速定位首字符（平均O(n/m)）
memcmp批量比较（利用CPU的SIMD指令）

实际测试中，对于1MB的haystack和10字节的needle，优化版本能快3-5倍。但要注意，短字符串场景下优化可能反而更慢，因为函数调用开销可能超过收益。

4.2 更高效的算法

工业级实现通常会考虑这些算法：

KMP算法：通过预处理模式串达到O(n)复杂度
Boyer-Moore算法：从右向左比较，利用坏字符规则跳转
Sunday算法：Boyer-Moore的简化版，更容易实现

以Sunday算法为例的核心思想：

char *sunday_search(const char *haystack, const char *needle) { size_t needle_len = strlen(needle); if (!needle_len) return (char *)haystack; // 预处理跳转表 size_t skip[256]; for (int i = 0; i < 256; i++) skip[i] = needle_len + 1; for (int i = 0; i < needle_len; i++) skip[(unsigned char)needle[i]] = needle_len - i; // 搜索过程 size_t haystack_len = strlen(haystack); const char *end = haystack + haystack_len; const char *p = haystack; while (p + needle_len <= end) { if (!memcmp(p, needle, needle_len)) return (char *)p; if (p + needle_len >= end) break; p += skip[(unsigned char)p[needle_len]]; } return NULL; }

5. 实战测试与调试技巧

5.1 测试用例设计

好的测试应该覆盖这些场景：

空字符串作为输入
needle比haystack长
完全匹配的情况
部分匹配但最终失败
多次出现的情况
特殊字符（如\0出现在字符串中间）

示例测试框架：

void test_case(const char *haystack, const char *needle, int expect) { char *std_result = strstr(haystack, needle); char *my_result = my_strstr(haystack, needle); if ((std_result == NULL && my_result == NULL) || (std_result && my_result && (std_result - haystack) == (my_result - haystack))) { printf("PASS: '%s' in '%s'\n", needle, haystack); } else { printf("FAIL: '%s' in '%s'\n", needle, haystack); printf("Expected: %ld, Got: %ld\n", std_result ? std_result - haystack : -1, my_result ? my_result - haystack : -1); } } int main() { test_case("hello", "ll", 2); test_case("hello", "world", -1); test_case("", "", 0); test_case("hello", "", 0); test_case("mississippi", "issip", 4); return 0; }

5.2 调试常见问题

新手实现时常见的问题包括：

忘记处理空字符串的特殊情况
内层循环没有检查字符串结束符
返回值直接返回局部指针变量
没有考虑大小写敏感的需求差异

一个实用的调试技巧是打印每次比较的中间状态：

printf("Comparing '%c' vs '%c' at pos %ld\n", *h, *n, h - haystack);

6. 工程实践建议

在实际项目中，选择字符串搜索算法要考虑这些因素：

字符串长度：短字符串用暴力法足够，长文本才需要复杂算法
搜索频率：单次搜索不需要预处理，频繁搜索值得预处理
编码规范：团队可能要求使用标准库保证一致性
可读性优先：除非性能瓶颈明确，否则选择最易维护的实现

我参与过一个文本编辑器项目，最初使用KMP算法，后来发现对于平均20个字符的文档搜索，简单优化后的暴力法反而更快，最终选择了更简单的实现。

记住：最好的算法不一定是理论最优的，而是最适合当前场景的。理解原理才能做出明智选择。

C语言：手把手教你实现子串查找算法（从strstr到自定义函数）