news 2026/4/4 14:32:16

LTX-2 GGUF版 - 一键生成音视频,8G显存可用 让创作更轻松 支持50系显卡 ComfyUI工作流 一键整合包

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LTX-2 GGUF版 - 一键生成音视频,8G显存可用 让创作更轻松 支持50系显卡 ComfyUI工作流 一键整合包

LTX-2 是由 Lightricks 推出的开源音视频生成模型,它的最大特点是能在同一个模型里同时生成“画面”和“声音”,让视频和音频自然同步。它支持文本、图片甚至音频作为输入,能快速生成对应的视频或音频内容。

在各路社区大神的不断努力下,GGUF版模型和插件不断更新,今天分享的一键包所有主力模型都更换为更轻的GGUF版模型,自带预留显存插件,可以手动设置预留显存数值,防止显存不足导致OOM报错,甜品卡8G显存即可流畅运行。

下载地址:点此下载


模型特点

音视频一体化:不像传统模型只做视频或音频,LTX-2 可以在一个框架里同时生成两者,保证画面和声音的协调。
多模态输入:支持文字转视频、图片转视频、文字转音频、音频转视频等多种组合方式。
开源可训练:提供完整代码和权重,用户可以在本地训练或微调,甚至用 LoRA 技术快速定制风格。
高效推理:有精简版(distilled)和量化版(fp8、fp4),在不同硬件环境下都能运行。
分辨率与帧率提升:配套的空间和时间“upscaler”可以让视频更清晰、帧率更高。
兼容生态:支持 PyTorch、Diffusers 库,也能在 ComfyUI 里直接调用。



应用领域

创意视频制作:输入文字或图片,快速生成短视频,用于广告、社交媒体或艺术创作。
教育与培训:老师可以用文字提示生成教学视频,配合音频讲解。
游戏与虚拟世界:为角色或场景生成动态视频和音效,提升沉浸感。
多媒体内容创作:播客、短片、音乐视频,都可以用 LTX-2 来自动生成或辅助制作。
个性化定制:通过微调模型,快速生成符合特定风格或品牌需求的内容。



使用教程:(建议N卡,显存8G起,运存32G起,支持50系显卡)

整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。

双击启动ComfyUI,进入页面,点击左侧工作流,加载工作流。
支持文生视频和图生视频,进入对应的工作流,输入提示词/上传图像输入提示词,设置宽高等参数,运行即可。


官方提示词使用技巧:

在撰写写作提示时,应着重于对动作与场景的详细、按时间顺序的描述。需包含具体的动作、外貌特征、镜头角度以及环境细节——所有这些内容都应整合在一段流畅的段落中。直接从动作开始描述,保持描述的客观性与精确性。可以想象自己是一名电影摄影师,在为拍摄清单撰写详细说明。字数控制在200字以内。为获得最佳效果,请按照以下结构来撰写提示:

1. 用一句话概括核心动作;
2. 添加关于动作与姿势的具体细节;
3. 准确描述人物/物体的外貌特征;
4. 描述背景与环境细节;
5. 指明镜头角度与拍摄方式;
6. 描述光影与色彩效果;
7. 注意任何可能发生的变化或突发事件。

更多提示词参考 https://ltx.io/model/model-blog/prompting-guide-for-ltx-2

默认帧率是24/FPS,设置帧数应该是总帧数+1,比如要生成5秒的视频,总帧数应该是 24*5+1=121

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/25 15:03:36

马斯克宣布开源 X 平台的内容推荐算法

马斯克宣布开源 X 平台的内容推荐算法,意味着他会公开“X 是怎么决定推什么内容给用户的”。他想把 X 打造成一个“AI 可信信息源”,甚至成为 AI 回答问题时优先引用的数据来源。马斯克这个决定,被很多人解读为:布局GEO领域。所以…

作者头像 李华
网站建设 2026/4/3 0:26:56

在Spring Boot项目中,Shiro和Spring Security该如何选择?

安全管理是Java应用开发中无法避免的问题,随着Spring Boot和微服务的流行,Spring Security受到越来越多Java开发者的重视,究其原因,还是沾了微服务的光。作为Spring家族中的一员,其在和Spring家族中的其他产品如SpringBoot、Spring Cloud等进…

作者头像 李华
网站建设 2026/4/3 5:10:36

如何翻译图片?图片上的外语一键翻译成中文,教程来了~

工程图纸是扫描图可以翻译吗?手机拍的图纸照片可以翻译吗?图片形式的图纸可以翻译吗?针对以上三类工程图纸翻译常见问题,进行统一答复:PlanForm-AI工程图纸翻译都可以翻译,教程如下:1.如果你遇到…

作者头像 李华
网站建设 2026/4/1 23:30:27

GPU算力革命:突破性能极限

GUP算力概述GUP(General-Purpose Computing on Graphics Processing Units)指利用图形处理器(GPU)进行通用计算的技术。与传统CPU相比,GPU凭借其并行计算架构,在高吞吐量任务(如深度学习、科学计…

作者头像 李华
网站建设 2026/3/27 8:06:54

Martin Fowler:AI带来非确定性计算时代的挑战与机遇

Thoughtworks首席科学家、面向对象编程长期专家Martin Fowler认为,AI是他整个职业生涯中见过的最大编程转变。在由Gergely Orosz主持的Pragmatic Engineer播客采访中,Fowler坦言关于AI,"我们仍在学习如何做到这一点。"对于行业来说…

作者头像 李华
网站建设 2026/4/1 2:31:19

别再迷信 Playwright 了,真正决定成败的不是浏览器

我以前也以为,只要页面是 JS 渲染的,上 Playwright 或 Selenium,问题基本就解决了。 后来在一个真实项目里,我用同一个目标站点做了三组对比实验,结论非常清楚: 浏览器自动化解决的是页面执行问题&#xff…

作者头像 李华