【音频】记录潜在有用信息：Qwen3-TTS、Qwen3-ASR 与 Qwen3-ForcedAligner-平芜编程栈

Qwen3-TTS 正式发布！
我们已将完整模型家族——VoiceDesign（语音设计）、CustomVoice（定制语音）和 Base（基础克隆）——全部开源，为开源社区带来SOTA的顶尖语音合成质量。

✨ 核心亮点：

提供 5 个模型（0.6B 与 1.7B 参数规模）
支持自由风格的语音设计与声音克隆
覆盖 10 种主流语言（中、英、日、韩、德、法、俄、葡、西、意）
配备 SOTA 级别的 12Hz 语音分词器，实现高压缩率与高保真重建
完整支持微调（Fine-tuning）
在多项权威评测中达到当前最优（SOTA）性能

欢迎大家使用和反馈🚀

🔗 相关资源：

GitHub: https://github.com/QwenLM/Qwen3-TTS
Hugging Face 模型库: https://huggingface.co/collections/Qwen/qwen3-tts
ModelScope 模型库: https://modelscope.cn/collections/Qwen/Qwen3-TTS
技术博客: https://qwen.ai/blog?id=qwen3tts-0115
论文: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
Hugging Face 在线 Demo: https://huggingface.co/spaces/Qwen/Qwen3-TTS
ModelScope 在线 Demo: https://modelscope.cn/studios/Qwen/Qwen3-TTS
API 文档: https://www.alibabacloud.com/help/en/model-studio/qwen-tts-voice-design

🎉 Qwen3-ASR 与 Qwen3-ForcedAligner 正式发布，专为真实复杂场景打造的工业级语音模型来了！

🔊 核心亮点：
✅ 支持 52 种语言与方言（30 种语言 + 22 种方言/口音），自动识别语种
✅ 抗噪能力强：嘈杂环境、多人对话、甚至唱歌🎤都能稳稳识别
✅ 超长音频支持：单次推理最长 20 分钟，告别分段烦恼
✅ 高精度对齐：Qwen3-ForcedAligner 提供词/短语级时间戳（11 种语言），精度超越 MFA/CTC/CIF 等传统方案

🛠️ 全链路开源：
配套完整的推理与微调工具链，支持 vLLM 批处理、流式识别、异步服务，开箱即用，轻松部署！

🔗 一键直达：
• GitHub：https://github.com/QwenLM/Qwen3-ASR
• Hugging Face：https://huggingface.co/collections/Qwen/qwen3-asr
• 魔搭 ModelScope：https://modelscope.cn/collections/Qwen/Qwen3-ASR
• 体验 Demo：HF / 魔搭搜索 “Qwen3-ASR” 即可试玩
• 技术博客 & 论文详见项目主页

真实场景实测能打，开发者友好，欢迎 Star ⭐ 体验 & 反馈～

视频批量下载工具：5步实现无水印高效下载，让你节省80%时间

视频批量下载工具：5步实现无水印高效下载，让你节省80%时间【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 你是否还在为手动下载抖音视频而烦恼？面对成百上千个视频需要保…

李华

高效手机号查询QQ账号的实现方法与安全指南

高效手机号查询QQ账号的实现方法与安全指南【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 功能解析：核心技术模块与特性独立运行架构实现方法 phone2qq工具采用零依赖设计理念，完全基于Python3标准库构建…

李华

深度剖析：OpenCore-Legacy-Patcher版本管理技术如何解决老旧Mac设备升级难题

深度剖析：OpenCore-Legacy-Patcher版本管理技术如何解决老旧Mac设备升级难题【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher OpenCore-Legacy-Patcher&#xf…

李华

智能视频处理：重新定义自动化剪辑的效率革命

智能视频处理：重新定义自动化剪辑的效率革命【免费下载链接】autocut 用文本编辑器剪视频项目地址: https://gitcode.com/GitHub_Trending/au/autocut 你是否曾遇到这样的困境：花费数小时手动剪辑视频，却仍难以精准捕捉核心内容&…

李华

小白友好OCR方案：网页上传图片，自动检测文字并导出结果

小白友好OCR方案：网页上传图片，自动检测文字并导出结果 1. 为什么你需要这个OCR工具你有没有遇到过这些场景？ 手机拍了一张发票照片，想快速提取上面的金额和公司名称，却要手动一个字一个字敲进电脑教学资料是PDF扫…

李华

新一代Switch游戏高效部署工具全攻略：Awoo Installer技术解析与实战指南

新一代Switch游戏高效部署工具全攻略：Awoo Installer技术解析与实战指南【免费下载链接】Awoo-Installer A No-Bullshit NSP, NSZ, XCI, and XCZ Installer for Nintendo Switch 项目地址: https://gitcode.com/gh_mirrors/aw/Awoo-Installer 在Switch玩家的…

李华