news 2026/3/27 3:39:51

Python字符串易踩的10个“坑”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python字符串易踩的10个“坑”

大家好,欢迎来到 Crossin 的编程教室。

字符串是Python中最常用的数据类型之一,看起来简单,用着顺手,但里面也藏着一些“坑”,很多新手(甚至有些老手)都会在这里不小心踩中。

今天我们就来盘点一下Python字符串的10个经典易错点,帮助你避开这些常见错误。相信看完这篇文章,你对字符串的理解又能更进一步。

1. 字符串是不可变的

Python的字符串是不可变(immutable)的,这意味着一旦创建,就不能修改其中的字符。

很多人写出这样的代码,以为自己改了字符串:

s = "hello"s[0] = "H" # 试图修改第一个字符

结果直接报错:'str' object does not support item assignment

还有人用replace,以为它能原地替换:

s = "hello"s.replace("h", "H")print(s) # 还是 "hello"

但其实 replace 是返回一个新字符串,原字符串没变。正确写法:

s = s.replace("h", "H")print(s) # "Hello"

记住:任何“修改”字符串的操作,都会返回新字符串,原字符串不变。

2. is 和 == 在字符串里的区别

== 判断值是否相等,is 判断是否是同一个对象。

对于小字符串,Python会做字符串驻留(interning),所以有时is也返回True:

a = "hello"b = "hello"print(a == b) # Trueprint(a is b) # 通常True(因为驻留)

但不要依赖 is,尤其是长字符串或动态生成的:

a = "hello world!"b = "hello " + "world!"print(a is b) # 可能False

所以,永远用 == 比较值相等。

3. 空字符串、None、False 的混淆

空字符串 ""、None、False 在布尔上下文中都为 False:

if "": print("不会执行")if None: print("也不会执行")if False: print("还是不执行")

但它们是完全不同的东西:

  • "":有值,字符串类型,只是内容为空

  • None:没有值 / 未赋值

  • False:有值,bool类型

检查字符串是否为空串用 if s == "",不要和 None 混用。

4. strip() 不是“删除字符”

有人以为:

s.strip("abc")

是删除字符串里的 "abc" 子串。

但其实它的含义是:

删除字符串两端所有属于字符集合 {a, b, c} 的字符。

print("abc123abc456bca".strip("abc"))# 结果是 "123abc456"

不是替换,不是删除子串,而是从两端往中间“剥字符”,直到不属于集合的字符为止。

5. split() 的默认行为

不传参数的split()很聪明:

s = "a b c d"print(s.split()) # ['a', 'b', 'c', 'd'] 自动把连续空白当一个分隔符print(s.split(" ")) # ['a', '', 'b', '', '', 'c', '', 'd']

它会自动丢弃首尾空白,并忽略空字段。

6. 字符串比较的“反直觉”顺序

字符串比较是按Unicode码点逐字符比较的:

print("10" < "2") # True 因为'1'的码点 < '2'print("Apple" < "apple") # True 因为大写A < 小写a

因此排序或比较版本号、数字字符串时可能会跟你想象的结果不一样。需要排序数字时,先转 int 或用 key 参数。

7. 字符长度 ≠ 显示长度

len() 计算的是字符数(Unicode码点数),不是视觉宽度:

s = "你好🏃🏻‍♀️" # emoji组合字符print(len(s)) # 7

8. 循环中用 + 拼接字符串的性能陷阱

在循环里这样拼接:

s = ""for i in range(100000): s += "a" # 每次都创建新字符串

大数据量时会超级慢(O(n²))。

正确方式:

parts = []for i in range(100000): parts.append("a")s = "".join(parts)# 或直接 s = "".join("a" for i in range(10000))

大量字符串拼接时务必用 join。

9. “中文乱码”

中文乱码通常发生在编码/解码不匹配的时候:

text = "中文"bytes_data = text.encode("gbk") # 用gbk编码print(bytes_data.decode("gbk")) # 用gbk解码正确print(bytes_data.decode("utf-8", errors='replace')) # 用utf-8解码 → 乱码 ����

读文件、网络数据时,指定正确的编码,否则编码不匹配就会乱码。

10. 结尾不能是单个反斜杠

字符串末尾不能直接写单个 \,因为它会转义后面的引号,即使是前面加上 r 的原始字符串(raw string)也不行:

r"C:\new\test\" # 语法错误

如果你想表示 Windows 的路径,直接用 / 替代 \ 吧。

以上就是Python字符串的10个易错点。希望这些例子能帮你少走弯路。

你还踩过什么坑?可以在留言区说一说。

如果本文对你有帮助,欢迎点赞、评论、转发。你们的支持是我更新的动力~


Crossin的新书《码上行动:用ChatGPT学会Python编程》已经上市了。本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。【点此查看详细介绍】

购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。

Crossin的其他书籍:


添加微信crossin123,加入编程教室共同学习~

感谢转发点赞的各位~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/25 14:04:22

MCP Azure量子服务配置紧急避坑指南:3天内必须掌握的6个核心要点

第一章&#xff1a;MCP Azure量子服务配置概述Azure量子服务是微软为开发者和研究人员提供的云端量子计算平台&#xff0c;支持从算法设计到硬件执行的端到端开发流程。通过该服务&#xff0c;用户可以访问多种量子硬件后端&#xff0c;包括来自Quantinuum、IonQ等合作伙伴的量…

作者头像 李华
网站建设 2026/3/26 3:11:56

系统性能优化实践指南:从基础配置到高级调优

本文针对嵌入式系统和网络设备环境&#xff0c;提供一套完整的系统性能优化方法论。通过分层优化策略&#xff0c;从内核参数调整到应用服务优化&#xff0c;全面提升系统运行效率和稳定性。 【免费下载链接】istoreos 提供一个人人会用的的路由、NAS系统 &#xff08;目前活跃…

作者头像 李华
网站建设 2026/3/25 15:29:37

【企业级成本控制实战】:MCP+Azure量子环境月省40%费用的秘密路径

第一章&#xff1a;MCP Azure 量子成本控制的核心理念在构建和管理基于 Microsoft Cloud Platform&#xff08;MCP&#xff09;与 Azure 量子计算服务的解决方案时&#xff0c;成本控制不再是后期优化手段&#xff0c;而是架构设计之初就必须嵌入的核心原则。Azure 量子计算资源…

作者头像 李华
网站建设 2026/3/23 7:54:23

Windows浏览器强制跳转终极解决方案:一键恢复你的选择权

Windows浏览器强制跳转终极解决方案&#xff1a;一键恢复你的选择权 【免费下载链接】EdgeDeflector A tiny helper application to force Windows 10 to use your preferred web browser instead of ignoring the setting to promote Microsoft Edge. Only runs for a microse…

作者头像 李华