news 2026/5/16 12:54:36

【MongoDB实战】7.3 批量操作优化:BulkWrite

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【MongoDB实战】7.3 批量操作优化:BulkWrite

文章目录

  • 7.3 批量操作优化:BulkWrite
    • 前置准备
      • 1. 环境要求
      • 2. 基础连接代码
    • 7.3.1 循环单条操作vs批量操作:性能差异对比
      • 核心差异
      • 实战性能对比(测试10000条插入)
      • 典型输出结果(参考)
      • 差异原因分析
    • 7.3.2 BulkWrite实战:批量插入、更新、删除组合操作
      • 核心语法
      • 实战:组合操作完整示例
      • 输出结果(参考)
      • 关键注意事项
    • 7.3.3 场景实战:百万级日志数据批量导入优化
      • 业务场景
      • 优化思路
      • 完整优化代码
      • 典型输出结果(参考)
      • 进一步优化建议
    • 7.3.4 核心总结
      • 扩展:不同驱动的BulkWrite语法(参考)

7.3 批量操作优化:BulkWrite

BulkWrite(批量写入)是MongoDB提供的核心批量操作接口,能够将插入、更新、删除等多个操作打包成一批发送到服务端,大幅减少客户端与服务端的网络往返次数(Round-Trip),相比循环单条操作可提升数倍甚至数十倍的性能。

  • 本节从性能对比、核心实战、百万级数据导入优化三个维度,全面讲解BulkWrite的使用与优化思路。

前置准备

1. 环境要求

  • MongoDB版本:3.2+(BulkWrite基础支持),推荐4.4+(性能更优)
  • 驱动:以Pythonpymongo(3.12+)为例(Node.js/Java驱动语法逻辑一致)
  • 安装依赖:pip install pymongo python-dotenv

2. 基础连接代码

frompymongoimportMongoClient,InsertOne,UpdateOne,DeleteOnefrompymongo.errorsimportBulkWriteErrorimporttimeimportrandomimportstring# 1. 连接MongoDB(本地/远程)client=MongoClient("mongodb://localhost:27017/")# 2. 选择数据库和集合db=client["test_db"]collection=db["bulk_demo"]# 清空测试集合(仅测试用)collection.delete_many({})


7.3.1 循环单条操作vs批量操作:性能差异对比

核心差异

操作类型网络往返次数性能特点适用场景
循环单条操作N次(N=操作数)网络开销大、吞吐量低少量操作(<100)
BulkWrite批量1次(分块时少量)网络开销极小、吞吐量高大量操作(≥100)

实战性能对比(测试10000条插入)

frompymongoimportMongoClient,InsertOne,UpdateOne,DeleteOnefrompymongo.errorsimportBulkWriteErrorimporttimeimportrandomimportstring# 1. 连接MongoDB(本地/远程)client=MongoClient("mongodb://localhost:27017/")# 2. 选择数据库和集合db=client["test_db"]collection=db["bulk_demo"]# 清空测试集合(仅测试用)collection.delete_many({})# 生成测试数据(随机字符串)defgenerate_random_str(length=10):return''.join(random.choice(string.ascii_letters)for_inrange(length))# 测试数据量TEST_COUNT=10000test_data=[{"name":generate_random_str(),"age":random.randint(18,60)}for_inrange(TEST_COUNT)]# ========== 测试1:循环单条插入 ==========start_time=time.time()fordocintest_data:collection.insert_one(doc)single_cost=time.time()-start_timeprint(f"循环单条插入{TEST_COUNT}条耗时:{single_cost:.2f}秒")# 清空集合,准备批量测试collection.delete_many({})# ========== 测试2:BulkWrite批量插入 ==========start_time=time.time()# 构造批量插入操作列表bulk_operations=[InsertOne(doc)fordocintest_data]# 执行批量操作result=collection.bulk_write(bulk_operations)b
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 14:59:53

HTML如何设计JQuery支持大文件上传的拖拽功能?

2023年11月2日 星期四 阴有小雨 外包项目日志 - 企业级大文件传输系统Day3 项目背景与架构设计 客户是某地质勘探研究院&#xff0c;每日需上传**20GB**的勘探数据&#xff08;含激光扫描点云、地质剖面图等&#xff09;&#xff0c;要求&#xff1a; 文件夹结构保留&#xf…

作者头像 李华
网站建设 2026/5/16 6:56:04

yolo-ORBSLAM2复现

这个也是一个经典的问题了&#xff0c;我是想复现&#xff0c;再进行修改&#xff0c;因为我不使用yolo作为检测&#xff0c;但要先搞清楚检测框是怎么送入slam的&#xff0c;所以先复现各位大佬们的。主要参考&#xff1a; https://github.com/JinYoung6/orbslam_addsemantic…

作者头像 李华
网站建设 2026/5/16 1:31:21

python基于大数据技术的购房推荐系统的设计与实现

Python基于大数据技术的购房推荐系统的设计与实现是一个复杂但具有广泛应用前景的项目。以下是对该系统的详细介绍&#xff1a; 一、系统概述 购房推荐系统利用Python编程语言的强大功能和丰富的大数据技术&#xff0c;结合机器学习算法和推荐算法&#xff0c;对购房数据进行深…

作者头像 李华
网站建设 2026/5/14 16:53:23

介观交通流仿真软件:DynusT_(20).DynusT在实际项目中的应用

DynusT在实际项目中的应用 在上一节中&#xff0c;我们已经了解了DynusT的基本功能和使用方法。本节将详细介绍如何在实际项目中应用DynusT进行交通流仿真。我们将通过具体的案例来展示如何设置仿真参数、导入交通网络数据、模拟交通流量以及分析仿真结果。这些案例将涵盖城市交…

作者头像 李华
网站建设 2026/5/11 14:58:33

深入JVM(三):JVM执行引擎

JVM执行引擎 一、JVM前后端编译 前端编译&#xff1a;使用编译器将Java文件编译成class字节码文件后端编译&#xff1a;将class字节码文件编译成机器码指令java 跨平台直接理解&#xff1a;前端编译将java文件编译成class文件&#xff0c; 然后使用jvm&#xff08;后端编译&…

作者头像 李华
网站建设 2026/5/11 14:58:28

通信系统仿真:通信系统基础理论_(8).抗干扰技术

抗干扰技术 1. 引言 在通信系统中,信号的传输会受到各种干扰的影响,这些干扰可能来自自然环境(如电磁波、雷电等)或人为因素(如其他通信系统、电子设备等)。这些干扰会降低通信系统的性能,导致信号失真、误码率增加等问题。因此,研究和应用抗干扰技术是非常重要的。本…

作者头像 李华