taming-transformers代码使用过程中的报错“packaging.version.InvalidVersion: Invalid version: ‘0.10.1,＜0.11‘pyt”-平芜编程栈

论文下载：https://arxiv.org/abs/2012.09841

代码下载：https://github.com/CompVis/taming-transformers（VQ-GAN）

论文Neural Discrete Representation Learning（VQ-VAE）详解（PyTorch）

论文VQ-VAE-2（Generating Diverse High-Fidelity Images with VQ-VAE-2）详解（PyTorch）

论文VQ-GAN（Taming Transformers for High-Resolution Image Synthesis）高分辨图像生成讲解（PyTorch）

我们在使用taming-transformers代码时，根据作者提供的environment.yaml来安装相关的库，当然下面这种安装方式最终的torch和torchvision都是cpu版本的，如果要安装GPU版本的，只需要去讲对应1.7.0的cuda版本的torch下载下来之后，pip install XXX就可以安装了，这种安装方式比较不容易失败。

但是我们发现安装完成之后运行“sample_fast.py”依然会报错“packaging.version.InvalidVersion: Invalid version: '0.10.1,<0.11'pyt”这个问题，是版本出现了问题。虽然我看了网上的直接使用“conda env create -f environment.yaml”安装之后就可以正常运行，我不是很清楚是怎么回事，反正通过报错的情况好像是和transformers依赖的库有关，但是作者提供的transformers==4.3.1版本的，最后尝试了很多方式都不行，然后将transformers==4.2.0即可。

conda env create -f environment.yaml

name: taming channels: - pytorch - defaults dependencies: - python=3.8.5 - pip=20.3 - cudatoolkit=10.2 - pytorch=1.7.0 - torchvision=0.8.1 - numpy=1.19.2 - pip: - albumentations==0.4.3 - opencv-python==4.1.2.30 - pudb==2019.2 - imageio==2.9.0 - imageio-ffmpeg==0.4.2 - pytorch-lightning==1.0.8 - omegaconf==2.0.0 - test-tube>=0.7.5 - streamlit>=0.73.1 - einops==0.3.0 - more-itertools>=8.0.0 - transformers==4.3.1 - -e .

GLM-TTS与DVWA安全测试平台对比：AI语音系统安全防护思考

GLM-TTS与DVWA安全测试平台对比：AI语音系统安全防护思考在智能语音助手、虚拟主播和自动化客服日益普及的今天，用户对“像人一样说话”的AI系统期待越来越高。GLM-TTS这类支持零样本音色克隆的文本到语音（TTS）模型，正…

李华

语音合成中的语义强调实现：通过音高变化突出关键词

语音合成中的语义强调实现：通过音高变化突出关键词在教育讲解、有声书朗读或客服播报中，你是否曾遇到过这样的问题——机器生成的语音虽然清晰自然，但所有内容都“平铺直叙”，重点信息毫无起伏，听者难以抓住关键&…

李华

如何用Scala语言构建类型安全的GLM-TTS客户端

如何用 Scala 构建类型安全的 GLM-TTS 客户端在语音合成技术加速落地的今天，越来越多的应用场景——从虚拟主播到有声读物生成、从智能客服到方言保护——都对个性化、高保真语音输出提出了严苛要求。GLM-TTS 作为一款支持零样本语音克隆、情感迁移和音素级控制的大…

李华

语音合成中的呼吸音模拟：增加拟人化自然感细节

语音合成中的呼吸音模拟：增加拟人化自然感细节在虚拟主播深情讲述一个动人故事时，你是否曾被那句尾轻柔的喘息所打动？当游戏角色在激烈战斗后断续说出“我……还能继续”，那种真实的疲惫感从何而来？这些细节的背后&am…

李华

全面讲解Keil5软件下载与注册激活流程

手把手带你搞定Keil5安装与激活：从零开始的嵌入式开发第一步你是不是也曾在准备开启STM32开发之旅时，卡在了 Keil5怎么下载？怎么注册？为什么编译到一半报错“code size limited to 32KB”？ 这些看似简单却让人抓狂…

李华

语音克隆也能做SaaS？结合GPU资源售卖搭建TTS服务平台

语音克隆也能做SaaS？结合GPU资源售卖搭建TTS服务平台在AIGC内容爆炸的今天，个性化语音正在从“可有可无”的附加功能，演变为数字内容的核心竞争力。无论是虚拟主播的一颦一笑，还是智能客服的语气起伏，用户对“像人一样…

李华