简述Python里面search和match的区别！

在用 Python 写正则的时候，估计很多兄弟第一眼就看见了两个最常用的函数：match() 和 search()。看名字就知道一个是“匹配”，一个是“搜索”，但实际用起来，那坑多得是能绕你一整圈。我身边好几个实习生面试的时候，都是在这俩上翻车的。所以今天我就跟你们唠一唠这俩货到底有啥区别，以及我自己是怎么在项目中被它们坑过的。

先说 match()。这个函数的脾气特别“轴”，就像那种只认死理的程序员，它只能从字符串的起始位置开始匹配。什么意思？就是你给它一大串字符串，它只看开头那一段，开头不对，直接告诉你“匹配失败”，完全不给你机会翻盘。举个例子：

你看第二个例子，虽然字符串里面有 "abc"，但不是在最开头，match 直接就翻脸不认人了，连句解释都不给你。

再说 search()，这家伙就灵活多了，属于“讲道理”的那种。不管你这玩意儿在哪，它都愿意耐着性子从头到尾地搜一遍。只要有一个位置符合条件，它就高高兴兴地返回结果。还是用刚才的例子：

是不是很明显？所以啊，search() 更像是实际业务里我们经常要用的那种“模糊搜索”或者“关键词识别”，用起来更贴近人的直觉。

这俩函数的区别，很多教程都讲过，但我觉得真正的问题，是很多人不了解它们的“性格”，导致选错场景。就像我以前在一个风控系统里做手机号格式识别，本来是想看看用户输入的内容里有没有手机号，于是写了个 re.match(r'\d{11}', input)，结果搞得一大堆用户数据都被标记成非法。为啥？因为很多人习惯加空格、加前缀，比如 "手机号：13812345678"，结果 match 一看不是从头开始就放弃了。当时我们排查了半天以为是正则写错了，其实就是用错了函数。

后来我改成了 search()，一下子问题全没了。那次之后我才意识到，正则不是只写得对就行，用的 API 对不对，有时候影响更大。

当然，也不是说 match() 就完全没用，它还是有自己的用武之地的。比如说你做数据格式校验的时候，如果你要求数据必须从头开始匹配，那 match() 就很合适，比如：

这个时候你要是用 search()，可能会误伤，用户多加个空格也能匹配上，不太严谨。

还有一个特别容易混淆的点就是，很多人误以为 match() 是精确匹配，其实不是。match() 只是从头开始匹配，不等于整个字符串都得匹配上。比如下面这个：

你看，它根本不管后面的 "def"，只要开头是 "abc" 就算你赢了。如果你真想做到“整个字符串都得符合”，那你得自己加上 ^ 和 $，或者用 fullmatch() 这个 3.4 之后的新函数。

不过说实话，fullmatch() 这个函数我自己用得不多，因为绝大多数情况下业务需求并不要求这么严，有时候太严了反而会让用户体验变差。

还有一个我之前做日志分析时踩过的坑也挺有意思。那会儿要从一大堆日志里找出关键字开头的行，比如以 "ERROR" 开头的。同事用的是 search()，结果一堆中间带 "ERROR" 的也被揪了出来。我一看这不行，改成 match("ERROR", line)，一下子精准多了。那时候我才意识到，很多时候 match() 用在行开头匹配其实很有用，尤其是处理带换行的文本块时。

再往深一点讲，其实 match() 和 search() 都是调用了底层的 _compile()，最终执行的是 _sre.SRE_Pattern 对象的 match() 或 search() 方法。说白了就是它们底层是一样的，只是匹配起点不一样。理解这个机制很重要，尤其是在做性能优化的时候。

有一次我们系统处理正则的时候发现瓶颈严重，后来我看日志才发现，是用了一个大模式配合 search() 去搜整个 5 万字的 HTML，太浪费资源了。后来我让他们把 HTML 预处理一下，只提取可能包含关键词的段落，再用 search() 去扫，效率一下子翻了 3 倍。这就说明，不是 search() 不行，是你得用对位置。

对了，还有一点，match() 和 search() 返回的都是 Match 对象，它们的使用方式其实是一样的，比如 group()、start()、end() 这些方法都可以用。很多初学者以为它们返回的结果也不一样，其实不是，是你调用方式的问题。

比如：

你换成 match() 如果匹配不到，那 m 就是 None，调用 group() 就直接报错了。所以一定记得先判断返回值是不是 None，这不是语法问题，而是代码健壮性的问题。

我自己在用的时候也形成了一套习惯：**如果是处理结构化数据（比如字段提取），优先用 match()；如果是处理非结构化文本（比如日志、文章），优先用 search()**。这不是说谁更好，而是看场景。

当然，写文章讲这些还算轻松，真正搞项目的时候，这俩玩意儿踩坑是家常便饭。有时候你匹配的目标不规范，数据源有噪声，或者用户输入太灵活，这时候你就得反复试、反复调。有些哥们儿可能一开始就写了几十行正则，然后发现 match 一个都匹配不上，结果一怒之下开始疯狂地在正则里加 .*，最后搞成一团乱麻，这就得不偿失了。

我个人建议是，先想清楚你要的到底是“从头开始匹配”还是“字符串中有匹配即可”，然后再选函数。别搞错了方向再去优化正则，那就有点本末倒置了。

说到底，match() 和 search() 就像是两个性格迥异的同事，一个一板一眼、规矩严谨，一个灵活机动、啥活都敢接。你得学会根据场景用人，别用错了人还埋怨工具不给力。

你说这东西有啥深奥的吗？其实没啥深奥的，就是细节决定成败。正则不难，难的是别自己坑自己。你们在面试或者做题的时候，要真把这俩用明白了，不敢说碾压其他候选人，至少不至于被简单题绊倒。

以后再遇到这类问题，记住一句话：**match 是从头查户口，search 是全村走访。**你看你是要看户口本，还是挨家挨户排查线索，就知道该用哪个了。

以上就是“简述Python里面search和match的区别！”的详细内容，想要了解更多Python 教程欢迎持续关注编程学习网。

扫码二维码 获取免费视频学习资料

Python编程学习

查看2022高级编程视频教程免费获取