news 2026/5/5 12:39:39

taming-transformers代码使用过程中的报错“packaging.version.InvalidVersion: Invalid version: ‘0.10.1,<0.11‘pyt”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
taming-transformers代码使用过程中的报错“packaging.version.InvalidVersion: Invalid version: ‘0.10.1,<0.11‘pyt”

论文下载:https://arxiv.org/abs/2012.09841

代码下载:https://github.com/CompVis/taming-transformers(VQ-GAN)

论文Neural Discrete Representation Learning(VQ-VAE)详解(PyTorch)

论文VQ-VAE-2(Generating Diverse High-Fidelity Images with VQ-VAE-2)详解(PyTorch)

论文VQ-GAN(Taming Transformers for High-Resolution Image Synthesis)高分辨图像生成讲解(PyTorch)

我们在使用taming-transformers代码时,根据作者提供的environment.yaml来安装相关的库,当然下面这种安装方式最终的torch和torchvision都是cpu版本的,如果要安装GPU版本的,只需要去讲对应1.7.0的cuda版本的torch下载下来之后,pip install XXX就可以安装了,这种安装方式比较不容易失败。

但是我们发现安装完成之后运行“sample_fast.py”依然会报错“packaging.version.InvalidVersion: Invalid version: '0.10.1,<0.11'pyt”这个问题,是版本出现了问题。虽然我看了网上的直接使用“conda env create -f environment.yaml”安装之后就可以正常运行,我不是很清楚是怎么回事,反正通过报错的情况好像是和transformers依赖的库有关,但是作者提供的transformers==4.3.1版本的,最后尝试了很多方式都不行,然后将transformers==4.2.0即可。

conda env create -f environment.yaml

name: taming channels: - pytorch - defaults dependencies: - python=3.8.5 - pip=20.3 - cudatoolkit=10.2 - pytorch=1.7.0 - torchvision=0.8.1 - numpy=1.19.2 - pip: - albumentations==0.4.3 - opencv-python==4.1.2.30 - pudb==2019.2 - imageio==2.9.0 - imageio-ffmpeg==0.4.2 - pytorch-lightning==1.0.8 - omegaconf==2.0.0 - test-tube>=0.7.5 - streamlit>=0.73.1 - einops==0.3.0 - more-itertools>=8.0.0 - transformers==4.3.1 - -e .

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 16:11:18

GLM-TTS与DVWA安全测试平台对比:AI语音系统安全防护思考

GLM-TTS与DVWA安全测试平台对比&#xff1a;AI语音系统安全防护思考 在智能语音助手、虚拟主播和自动化客服日益普及的今天&#xff0c;用户对“像人一样说话”的AI系统期待越来越高。GLM-TTS这类支持零样本音色克隆的文本到语音&#xff08;TTS&#xff09;模型&#xff0c;正…

作者头像 李华
网站建设 2026/5/3 17:26:30

语音合成中的语义强调实现:通过音高变化突出关键词

语音合成中的语义强调实现&#xff1a;通过音高变化突出关键词 在教育讲解、有声书朗读或客服播报中&#xff0c;你是否曾遇到过这样的问题——机器生成的语音虽然清晰自然&#xff0c;但所有内容都“平铺直叙”&#xff0c;重点信息毫无起伏&#xff0c;听者难以抓住关键&…

作者头像 李华
网站建设 2026/5/3 13:55:31

如何用Scala语言构建类型安全的GLM-TTS客户端

如何用 Scala 构建类型安全的 GLM-TTS 客户端 在语音合成技术加速落地的今天&#xff0c;越来越多的应用场景——从虚拟主播到有声读物生成、从智能客服到方言保护——都对个性化、高保真语音输出提出了严苛要求。GLM-TTS 作为一款支持零样本语音克隆、情感迁移和音素级控制的大…

作者头像 李华
网站建设 2026/5/1 10:45:41

语音合成中的呼吸音模拟:增加拟人化自然感细节

语音合成中的呼吸音模拟&#xff1a;增加拟人化自然感细节 在虚拟主播深情讲述一个动人故事时&#xff0c;你是否曾被那句尾轻柔的喘息所打动&#xff1f;当游戏角色在激烈战斗后断续说出“我……还能继续”&#xff0c;那种真实的疲惫感从何而来&#xff1f;这些细节的背后&am…

作者头像 李华
网站建设 2026/5/4 20:16:34

全面讲解Keil5软件下载与注册激活流程

手把手带你搞定Keil5安装与激活&#xff1a;从零开始的嵌入式开发第一步 你是不是也曾在准备开启STM32开发之旅时&#xff0c;卡在了 Keil5怎么下载&#xff1f;怎么注册&#xff1f;为什么编译到一半报错“code size limited to 32KB”&#xff1f; 这些看似简单却让人抓狂…

作者头像 李华
网站建设 2026/5/2 17:07:18

语音克隆也能做SaaS?结合GPU资源售卖搭建TTS服务平台

语音克隆也能做SaaS&#xff1f;结合GPU资源售卖搭建TTS服务平台 在AIGC内容爆炸的今天&#xff0c;个性化语音正在从“可有可无”的附加功能&#xff0c;演变为数字内容的核心竞争力。无论是虚拟主播的一颦一笑&#xff0c;还是智能客服的语气起伏&#xff0c;用户对“像人一样…

作者头像 李华