news 2026/5/11 7:34:49

Python 读取 txt 文件的全攻略

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python 读取 txt 文件的全攻略

Python 读取 txt 文件是最基础的文件操作之一,核心通过内置的open()函数实现,配合不同的读取方法可适配小文件、大文件、按行读取、按字节读取等不同场景。本文从基础到进阶,结合实例讲解所有常用方法。

一、核心基础:open()函数与文件打开模式

1.open()函数的基本参数

python

open(file, mode='r', encoding=None)
参数说明
file文件路径(相对路径:相对于当前 Python 脚本的路径;绝对路径:完整路径)
mode打开模式(默认r,只读模式),常用模式见下表
encoding文件编码格式(推荐显式指定,如utf-8gbk,避免乱码)

2. 常用文件打开模式

模式作用
r只读模式(默认),文件不存在则报错
r+读写模式,文件不存在则报错
rb二进制只读模式(用于非文本文件,如图片、视频,无需指定 encoding)
a追加模式,文件不存在则创建
w写入模式,文件不存在则创建,存在则清空原有内容

3. 关键:使用with语句(推荐)

with语句会自动关闭文件,避免因忘记调用close()导致的资源泄漏,是 Python 读取文件的最佳实践。

python

# 基本结构 with open("test.txt", "r", encoding="utf-8") as f: # 读取文件的操作 content = f.read()

二、常用读取方法(按场景分类)

先准备一个测试文件test.txt,内容如下:

plaintext

Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 1:小文件 → 一次性读取整个文件(read()

适合文件体积小(几 KB~ 几十 KB),需要一次性获取所有内容的场景。

python

# 读取整个文件 with open("test.txt", "r", encoding="utf-8") as f: content = f.read() # 返回字符串,包含所有内容(包括换行符\n) print("文件全部内容:") print(content)

输出结果

plaintext

文件全部内容: Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 2:中等文件 → 读取所有行到列表(readlines()

将文件的每一行作为列表的一个元素,方便后续通过索引、切片处理行数据。

python

with open("test.txt", "r", encoding="utf-8") as f: lines = f.readlines() # 返回列表,每个元素是一行内容(包含换行符\n) print("文件的行列表:", lines) print("第2行内容:", lines[1].strip()) # strip()去掉换行符和首尾空格

输出结果

plaintext

文件的行列表: ['Python读取txt文件\n', '这是第2行内容\n', 'Hello World!\n', '这是最后一行'] 第2行内容: 这是第2行内容

场景 3:任意文件 → 逐行读取(for循环遍历文件对象,推荐)

这是最高效、最内存友好的方式,逐行读取,不一次性加载整个文件,适合所有场景(尤其是大文件)。

python

with open("test.txt", "r", encoding="utf-8") as f: print("逐行读取文件:") for line in f: # 直接遍历文件对象,每次返回一行 print(line.strip()) # strip()去除换行符和多余空格

输出结果

plaintext

逐行读取文件: Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 4:精准控制 → 按字节 / 字符读取(read(n)

read(n)可指定读取的字符数(文本模式)或字节数(二进制模式),适合需要分段读取的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: content1 = f.read(6) # 读取前6个字符 print("前6个字符:", content1) content2 = f.read(3) # 从当前位置继续读取3个字符 print("后续3个字符:", content2)

输出结果

plaintext

前6个字符:Python 后续3个字符:读取t

场景 5:逐行读取(readline()

每次调用readline()读取一行,直到返回空字符串(文件结束),适合需要手动控制读取进度的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: line1 = f.readline() # 读取第一行 line2 = f.readline() # 读取第二行 print("第一行:", line1.strip()) print("第二行:", line2.strip())

输出结果

plaintext

第一行:Python读取txt文件 第二行:这是第2行内容

三、进阶场景处理

1. 处理大文件(GB 级)

大文件的核心是逐行读取(避免一次性加载到内存),使用for循环遍历文件对象即可:

python

# 读取GB级大文件,逐行处理 with open("big_file.txt", "r", encoding="utf-8") as f: for line in f: # 处理每一行(如统计行数、提取关键信息) pass

2. 处理不同编码的 txt 文件

Windows 系统下的 txt 文件常使用gbk/gb2312编码,Linux/Mac 下多为utf-8,若编码不匹配会报UnicodeDecodeError,需显式指定编码:

python

# 读取GBK编码的文件 with open("gbk_file.txt", "r", encoding="gbk") as f: content = f.read() print(content) # 读取带BOM的UTF-8文件(Windows记事本保存的UTF-8文件常带BOM) with open("utf8_bom_file.txt", "r", encoding="utf-8-sig") as f: content = f.read() print(content)

3. 二进制模式读取(rb

用于读取非文本文件(如图片、视频),或需要处理字节数据的场景:

python

with open("test.txt", "rb") as f: content = f.read() # 返回字节串(bytes) print("二进制内容:", content) # 转换为字符串(需指定编码) print("转换为字符串:", content.decode("utf-8"))

四、常见问题与解决方法

问题 1:FileNotFoundError(文件不存在)

  • 解决:检查文件路径是否正确(相对路径是否相对于当前脚本,绝对路径是否完整)。

问题 2:UnicodeDecodeError(编码错误)

  • 解决:显式指定正确的编码(如utf-8gbkutf-8-sig)。

问题 3:读取的内容有多余的换行符 / 空格

  • 解决:使用strip()(去除首尾空格和换行符)、rstrip("\n")(仅去除换行符)。

问题 4:文件权限不足(PermissionError

  • 解决:检查文件的读写权限,确保当前用户有读取权限。

五、总结:方法选择建议

场景推荐方法优点
小文件(<100KB)read()一次性读取简单快捷
中等文件(100KB~1MB)readlines()读取到列表方便后续行处理
大文件(>1MB)for循环遍历文件对象(逐行读取)内存友好、效率高
精准分段读取read(n)灵活控制读取量

核心原则:优先使用with语句,避免资源泄漏;大文件必用逐行读取,避免内存溢出。掌握这些方法,就能处理所有 txt 文件的读取需求。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 20:02:51

Open-AutoGLM上手机,只需这4步!开发者必看的轻量化部署秘籍

第一章&#xff1a;Open-AutoGLM移动端部署概述Open-AutoGLM 是基于 AutoGLM 架构优化的轻量化大语言模型&#xff0c;专为在移动设备上实现高效推理而设计。该模型通过结构压缩、算子融合与硬件适配等技术&#xff0c;在保持较高自然语言理解能力的同时&#xff0c;显著降低计…

作者头像 李华
网站建设 2026/5/1 20:26:36

【大模型私有化部署新选择】:Open-AutoGLM本地化实施方案详解

第一章&#xff1a;Open-AutoGLM私有化部署的背景与意义随着企业对数据隐私和模型可控性的要求日益提升&#xff0c;大语言模型的私有化部署逐渐成为关键需求。Open-AutoGLM 作为一款开源的自动化生成语言模型&#xff0c;支持在本地环境或私有云中部署&#xff0c;确保敏感数据…

作者头像 李华
网站建设 2026/5/1 13:57:38

零代码+全场景!ChatWiki四步搭建企业AI知识库,效率提升必备收藏指南

传统知识管理因知识分散导致查找效率低、响应慢。ChatWiki作为零代码AI知识库解决方案&#xff0c;通过接入大模型、上传文档处理、关联知识库和智能响应四步&#xff0c;帮助企业构建智能记忆中枢。其全场景适配和精细化管理功能&#xff0c;使企业能高效利用AI技术提升知识管…

作者头像 李华
网站建设 2026/5/10 8:50:53

openEuler 系统想远程管理?不用公网 IP 也能轻松实现,方法在这!

文章目录前言1. 本地SSH连接测试2. openEuler安装Cpolar3. 配置 SSH公网地址4. 公网远程SSH连接5. 固定连接SSH公网地址6. SSH固定地址连接测试前言 openEuler 是一款聚焦多样性计算的操作系统&#xff0c;支持服务器、嵌入式设备和云计算环境&#xff0c;安全性和稳定性都不错…

作者头像 李华
网站建设 2026/5/10 0:21:04

Mac上运行Open-AutoGLM到底难不难?看完这篇你就知道该怎么做

第一章&#xff1a;Mac上运行Open-AutoGLM的现状与挑战在苹果芯片架构逐步普及的背景下&#xff0c;越来越多开发者尝试在Mac平台上部署和运行大型语言模型。Open-AutoGLM作为基于AutoGPT架构衍生的开源项目&#xff0c;具备自动化任务分解与执行能力&#xff0c;但其在Mac本地…

作者头像 李华