news 2026/4/27 11:03:27

huggingface-cli download 断点续传

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
huggingface-cli download 断点续传

在使用huggingface-cli download时,断点续传的核心是--resume-download参数,该参数能检测本地未完成的下载文件,从断点处继续传输(而非重新下载)。以下是完整的使用方法、生效条件和问题排查:

一、核心原理

--resume-download会在下载时生成临时文件(后缀通常为.tmp),记录已下载的字节数;当下载中断(网络断开、进程终止等),重新执行带该参数的命令时,工具会读取临时文件,从断点处续传,避免重复下载已完成部分。

二、前提准备

确保huggingface-hub版本足够新(v0.10+ 支持该参数,v0.16+ 对大文件/LFS 文件支持更完善):

pipinstall--upgrade huggingface-hub

三、断点续传的具体用法

1. 基础用法(以下载 LiveCodeBench 为例)

在原有下载命令后直接添加--resume-download即可:

huggingface-cli download LiveCodeBench/LiveCodeBench\--local-dir LiveCodeBench\# 本地保存目录--local-dir-use-symlinks False\# 强制下载文件(非符号链接)--resume-download# 核心:断点续传参数
2. 结合筛选规则(include/exclude)

若仅下载指定文件/排除部分文件,续传参数仍兼容:

huggingface-cli download LiveCodeBench/LiveCodeBench\--include"data/**,evaluation/*.py"\# 只下载指定目录/文件--exclude"docs/**"\# 排除无需下载的内容--local-dir LiveCodeBench\--local-dir-use-symlinks False\--resume-download
3. 下载指定版本 + 断点续传

若需下载特定分支/commit/tag,续传参数同样生效:

huggingface-cli download LiveCodeBench/LiveCodeBench\--revision v1.0\# 指定版本(分支/标签/commit hash)--local-dir LiveCodeBench\--local-dir-use-symlinks False\--resume-download
4. 自动重试 + 断点续传(网络不稳定时)

搭配--retries N(N 为重试次数),实现中断后自动重试 + 续传:

huggingface-cli download LiveCodeBench/LiveCodeBench\--local-dir LiveCodeBench\--local-dir-use-symlinks False\--resume-download\--retries5# 最多自动重试5次

四、断点续传生效条件

  1. 本地保留了中断后的临时文件:--local-dir目录下会生成.tmp后缀的临时文件,不要删除/移动
  2. 重新执行的命令与中断前完全一致:包括--local-dir--include/--exclude--revision等所有参数,否则会视为新下载;
  3. 目标文件在 Hugging Face Hub 上未被修改:若文件更新,工具会判定为新文件,重新下载。

五、常见问题排查

1. 断点续传未生效(重新从头下载)
  • 原因1:huggingface-hub版本过旧 → 执行pip install --upgrade huggingface-hub升级;
  • 原因2:临时文件被删除 → 中断后不要清理--local-dir目录,保留.tmp文件;
  • 原因3:命令参数不一致 → 确保重新执行的命令和中断前的参数完全相同(比如--local-dir路径不能改);
  • 原因4:文件在 Hub 上已更新 → 可删除本地旧文件后重新下载。
2. 报错 “Resume download not supported for this file”
  • 原因:旧版本对 LFS 大文件的断点续传支持不足 → 升级到huggingface-hub>=0.16.0即可解决。
3. 续传时提示文件校验失败
  • 原因:中断导致临时文件损坏 → 删除该文件的.tmp临时文件,重新执行命令(会从头下载该文件,但其他文件仍可续传)。

六、补充说明

  • --resume-download幂等的:即使文件已完全下载,执行带该参数的命令也不会重复下载,只会校验文件完整性;
  • 若需强制重新下载(忽略断点):移除--resume-download参数,或删除--local-dir目录后重新执行。

参考

livecodebench/code_generation_lite

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 23:56:48

CUDA安装不再难:Miniconda-Python3.10镜像内置最佳实践配置

CUDA安装不再难:Miniconda-Python3.10镜像内置最佳实践配置 在深度学习和高性能计算的日常开发中,最让人头疼的往往不是模型设计或算法优化,而是环境搭建本身。你是否经历过这样的场景:刚拿到一台新的GPU服务器,满心期…

作者头像 李华
网站建设 2026/4/17 14:15:42

GitHub Actions持续集成:Miniconda-Python3.10自动测试AI脚本

GitHub Actions持续集成:Miniconda-Python3.10自动测试AI脚本 在人工智能项目开发中,你是否经历过这样的场景?本地训练好的模型脚本推送到GitHub后,CI却报错“ModuleNotFoundError”;或者同事拉下代码运行失败&#xf…

作者头像 李华
网站建设 2026/4/27 9:13:20

Markdown撰写技术博客:记录Miniconda配置PyTorch全过程

Miniconda 配置 PyTorch 全流程实战:打造高效可复现的 AI 开发环境 在深度学习项目中,最让人头疼的往往不是模型调参,而是“我这边跑得好好的,你那边怎么报错?”——依赖冲突、版本不一致、环境缺失……这些问题几乎每…

作者头像 李华
网站建设 2026/4/25 17:55:58

中华人民共和国网络安全法

(2016年11月7日第十二届全国人民代表大会常务委员会第二十四次会议通过 根据2025年10月28日第十四届全国人民代表大会常务委员会第十八次会议《关于修改〈中华人民共和国网络安全法〉的决定》修正)目  录第一章 总  则第二章 网络安全支持与促进第…

作者头像 李华
网站建设 2026/4/25 20:08:23

项目分享|Open-AutoGLM:让AI真正“上手”你的手机

引言 在智能设备普及的今天,如何让手机更“懂”用户需求,实现自动化任务处理,成为提升效率的重要方向。Open-AutoGLM 作为一款基于 AutoGLM 构建的手机端智能助理框架,通过多模态技术与自动化操作的结合,让用户只需用…

作者头像 李华
网站建设 2026/4/25 5:18:48

Linux系统下最简PyTorch环境搭建:Miniconda-Python3.10实战记录

Linux系统下最简PyTorch环境搭建:Miniconda-Python3.10实战记录 在现代AI开发中,一个常见的场景是:你刚拿到一台新的Linux服务器,准备复现一篇论文的实验结果。可当你运行pip install torch时,却卡在了CUDA版本不兼容的…

作者头像 李华