news 2026/6/22 11:09:01

腾讯开源SongGeneration:AI一键生成中英双语高品质歌曲

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
腾讯开源SongGeneration:AI一键生成中英双语高品质歌曲

腾讯正式宣布开源旗下AI音乐生成项目SongGeneration,基于创新的LeVo架构实现文本到完整歌曲的端到端生成,支持中英文双语创作,为人声与伴奏的和谐统一提供了突破性解决方案。

【免费下载链接】SongGeneration腾讯开源SongGeneration项目,基于LeVo架构实现高品质AI歌曲生成。它采用混合音轨与双轨并行建模技术,既能融合人声与伴奏达到和谐统一,也可分别处理实现更高音质。模型在百万歌曲数据集上训练,支持中英文生成,效果媲美业界顶尖系统,为音乐创作带来突破性AI解决方案项目地址: https://ai.gitcode.com/tencent_hunyuan/SongGeneration

随着AIGC技术的快速迭代,音乐创作领域正经历深刻变革。从早期的旋律生成到如今的完整歌曲创作,AI模型已逐步实现从片段式辅助到全流程创作的跨越。据相关数据显示,2024年全球AI音乐市场规模已突破12亿美元,预计2025年将保持85%的同比增长率。然而当前主流解决方案普遍面临人声伴奏分离困难、多语言支持不足、生成质量参差不齐等问题,制约着AI在音乐创作领域的规模化应用。

作为腾讯AILab的旗舰音乐生成模型,SongGeneration创新性地采用"混合音轨+双轨并行"的双路径建模技术。这种架构设计允许模型同时处理混合音频流(人声与伴奏的融合信号)和独立双轨流(人声/伴奏分离信号),既保证了音乐整体的和谐度,又通过分离处理提升了各声部的音质表现。从技术实现上看,该模型由LeLM语言模型与音乐编解码器构成,前者负责理解文本指令并生成音乐序列,后者则将抽象的音乐 tokens 还原为高保真音频信号。

在性能表现上,SongGeneration在百万级歌曲数据集上完成训练,提供多个版本满足不同场景需求:基础版支持2分30秒时长的中英文歌曲生成,仅需10G显存即可运行;进阶的full版本将时长扩展至4分30秒;而large版本通过更深层的网络设计,在RFT(相对保真度测试)指标上达到1.51分,音质表现已接近专业录音水准。值得注意的是,即将推出的v1.5系列还将新增西班牙语、日语等多语言支持,进一步扩展创作边界。

该图片通过生动的视觉设计直观呈现了SongGeneration的核心功能定位。卡通企鹅形象呼应腾讯品牌标识,吉他与音乐符号元素则清晰指向音乐创作场景,整体设计传递出技术与艺术融合的产品理念。

从应用价值来看,SongGeneration的开源将显著降低音乐创作门槛。独立音乐人可借助该工具快速将歌词转化为demo作品,相关制作公司能实时生成符合场景氛围的原创配乐,教育机构也可开发基于AI的音乐教学辅助系统。腾讯同时提供了HuggingFace在线演示空间和完整的本地部署方案,开发者可通过简单的Python脚本调用API,实现"输入文本-生成歌曲"的全流程创作。

此次开源标志着腾讯在AIGC领域的战略布局进一步深化。通过将核心技术开放给开发者社区,不仅能够加速音乐生成技术的迭代优化,更能培育基于AI的新型音乐创作生态。对于整个行业而言,SongGeneration的出现可能重塑音乐生产链条——从专业工作室到个人创作者,都能借助AI工具实现创意的快速落地。随着模型能力的持续进化,未来我们或将看到AI生成音乐在短视频配乐、游戏原声、甚至流行音乐榜单中占据一席之地,开启音乐创作的普惠化新纪元。

【免费下载链接】SongGeneration腾讯开源SongGeneration项目,基于LeVo架构实现高品质AI歌曲生成。它采用混合音轨与双轨并行建模技术,既能融合人声与伴奏达到和谐统一,也可分别处理实现更高音质。模型在百万歌曲数据集上训练,支持中英文生成,效果媲美业界顶尖系统,为音乐创作带来突破性AI解决方案项目地址: https://ai.gitcode.com/tencent_hunyuan/SongGeneration

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 13:16:49

PyTorch模型蒸馏入门:Miniconda环境准备

PyTorch模型蒸馏入门:Miniconda环境准备 在深度学习项目中,我们常常面临这样一个现实:一个性能强大的“教师模型”可能拥有数亿参数,在服务器上运行流畅,但一旦试图将其部署到边缘设备、手机或嵌入式系统中&#xff0c…

作者头像 李华
网站建设 2026/6/17 11:29:53

Jupyter Lab安装扩展插件增强代码补全功能

Jupyter Lab 安装扩展插件增强代码补全功能 在数据科学与人工智能项目日益复杂的今天,开发者常常面临一个看似微小却影响深远的问题:写代码时记不清某个库的函数名该怎么拼,或者不确定方法需要哪些参数。于是不得不停下思路,切换标…

作者头像 李华
网站建设 2026/6/13 10:47:56

SSH连接Miniconda容器进行远程开发:适用于大模型Token训练场景

SSH连接Miniconda容器进行远程开发:适用于大模型Token训练场景 在当今的大模型研发实践中,一个常见的挑战是:如何在远离本地工作站的高性能GPU服务器上,安全、高效且可复现地执行长时间运行的Token级预处理与模型训练任务&#xf…

作者头像 李华
网站建设 2026/6/9 19:31:20

Qwen3思维增强版震撼发布:256K上下文推理再突破

Qwen3-30B-A3B-Thinking-2507-FP8模型正式发布,带来思维能力与长上下文理解的双重突破,300亿参数规模实现复杂推理性能跃升。 【免费下载链接】Qwen3-30B-A3B-Thinking-2507-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-30B-A3B-Thi…

作者头像 李华
网站建设 2026/6/21 16:05:08

Windows内核调试符号配置实战:从零到精通的高效调试指南

当我们第一次面对Windows内核调试时,是否也曾经历过这样的场景:在关键时刻WinDbg突然停止响应,屏幕上赫然显示着"SYMBOL_NOT_FOUND"的错误?或者花费数小时手动下载符号文件,却发现版本不匹配导致调试信息错乱…

作者头像 李华
网站建设 2026/6/13 17:29:41

WaveTools游戏性能优化终极指南:一键解锁120帧流畅体验

WaveTools游戏性能优化终极指南:一键解锁120帧流畅体验 【免费下载链接】WaveTools 🧰鸣潮工具箱 项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 在《鸣潮》1.2版本更新后,众多玩家发现原有的帧率设置突然失效,游…

作者头像 李华