news 2026/4/7 7:22:48

4.8K Star!本地语音转文字神器Vibe:基于Whisper离线转录,支持GPU加速+字幕导出

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
4.8K Star!本地语音转文字神器Vibe:基于Whisper离线转录,支持GPU加速+字幕导出

一直想找个离线的语音转文字工具,网上那些在线服务要么收费,要么担心隐私泄露,最近发现了Vibe这个开源项目,完全离线使用OpenAI Whisper模型转录,支持几乎所有语言,还能导出SRT字幕、翻译成英文、批量处理文件,GPU加速后速度飞快,用了几周感觉太好用了,视频字幕制作必备


Vibe是什么

它是一个基于OpenAI Whisper的桌面应用,能完全离线进行语音转文字,支持音频视频转录、从YouTube等网站直接转录、批量处理、字幕导出等功能,内置GPU加速(支持Nvidia/AMD/Intel),还能用Claude API做摘要或本地Ollama分析,完全免费开源

开源成就

  • • Star数 已经收获4.8K Star,离线转录工具首选

  • • 主开发语言 用Rust+TypeScript开发,基于Tauri框架

核心功能

  • 完全离线转录,所有处理都在本地进行,数据绝不上传,隐私安全有保障

  • 多语言支持,基于Whisper模型支持几乎所有语言的转录,准确率很高

  • 多格式导出,支持SRT、VTT、TXT、HTML、PDF、JSON、DOCX等格式

  • 在线媒体转录,可以直接转录YouTube、Vimeo、Facebook等网站的音视频

  • 批量处理,一次处理多个文件,大幅提高效率

  • GPU加速,支持Nvidia、AMD、Intel显卡(Vulkan/CoreML),速度飞快

  • 实时预览,转录过程中实时查看结果

  • AI摘要功能,用Claude API快速生成多语言摘要,或用本地Ollama批量分析

  • 翻译功能,可以将任何语言翻译成英文

  • 说话人分离,自动识别不同说话人

安装指南

  • 官网下载,支持多平台

# 访问官网下载对应系统版本 https://thewh1teagle.github.io/vibe/ # 支持平台 - macOS - Windows - Linux
  • 基本使用

1. 打开Vibe应用 2. 拖拽音频/视频文件到窗口 3. 选择语言(可选) 4. 点击开始转录 5. 导出字幕文件
  • 在线媒体转录,直接处理网页视频

1. 复制YouTube等网站的视频链接 2. 在Vibe中粘贴链接 3. 应用会自动下载并转录 4. 支持YouTube、Vimeo、Facebook、Twitter等
  • 批量处理,一次搞定多个文件

1. 拖拽多个音视频文件到Vibe 2. 选择统一的输出格式 3. 点击批量转录 4. 自动依次处理所有文件
  • GPU加速设置

# 在设置中启用GPU加速 - Nvidia显卡: 自动使用CUDA/Vulkan - AMD显卡: 使用Vulkan加速 - Intel显卡: 使用Vulkan加速 - macOS: 使用CoreML加速 # GPU加速可以提升3-5倍转录速度
  • 自定义模型

# 在设置中可以选择不同大小的Whisper模型 - tiny: 最快,准确度较低 - base: 平衡速度和准确度 - small: 推荐日常使用 - medium: 高准确度 - large: 最高准确度,速度较慢 # 还可以通过URL集成自定义模型 vibe://download/?url=<model_url>
  • 字幕时长优化,适配不同场景

# 针对视频/短视频优化字幕长度 - 标准视频模式: 适合电影、纪录片 - 短视频模式: 适合抖音、快手等竖屏视频
  • CLI命令行使用,自动化处理

# 通过命令行使用Vibe vibe --help # 批量转录文件夹中的所有音视频 vibe transcribe /path/to/folder/*.mp4 # 启动HTTP API服务器 vibe --server # 访问Swagger文档 http://localhost:3022/docs
  • HTTP API功能

# 启动API服务 vibe --server # 使用API进行转录 curl -X POST http://localhost:3022/transcribe \ -F "file=@audio.mp3" \ -F "language=zh" # 查看API文档 http://localhost:3022/docs
  • 录音转录

# 系统音频录制转录 1. 选择"系统音频"选项 2. 开始录制 3. 停止后自动转录 # 麦克风录音转录 1. 选择"麦克风"选项 2. 开始录音 3. 实时转录显示
  • AI增强功能

# Claude API摘要 1. 在设置中配置Claude API Key 2. 转录完成后点击"摘要" 3. 快速生成多语言摘要 # Ollama本地分析 1. 安装Ollama并运行 2. 在Vibe中连接Ollama 3. 批量分析转录内容

开源地址 https://github.com/thewh1teagle/vibe

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/6 15:18:17

小白从零开始勇闯人工智能:机器学习初级篇(随机森林)

引言如果我们需要判断一封电子邮件是否为垃圾邮件。如果只依赖单个人&#xff08;或单一算法&#xff09;进行判断&#xff0c;可能会因为固有的偏见或知识局限而出错&#xff0c;但如果让一群人&#xff08;多个算法&#xff09;分别独立判断&#xff0c;再通过投票共同决定&a…

作者头像 李华
网站建设 2026/3/23 6:20:36

Markdown嵌入交互式图表,增强AI博客表现力

Markdown嵌入交互式图表&#xff0c;增强AI博客表现力 在深度学习项目开发中&#xff0c;最让人头疼的往往不是模型结构设计或调参优化&#xff0c;而是环境配置——“在我机器上明明能跑”的尴尬场景屡见不鲜。尤其是当涉及PyTorch、CUDA、cuDNN等组件版本错综复杂时&#xff…

作者头像 李华
网站建设 2026/4/6 0:15:25

PyTorch-CUDA-v2.6镜像兼容性测试覆盖主流显卡

PyTorch-CUDA-v2.6镜像兼容性测试覆盖主流显卡 在深度学习项目快速迭代的今天&#xff0c;一个常见的痛点是&#xff1a;为什么代码在一个设备上跑得好好的&#xff0c;换到另一台机器就报 CUDA error 或直接无法加载 GPU&#xff1f; 这背后往往不是模型的问题&#xff0c;而是…

作者头像 李华
网站建设 2026/4/3 9:32:57

GPU算力按Token计费模式适合哪些AI应用场景?

GPU算力按Token计费模式适合哪些AI应用场景&#xff1f; 在生成式AI爆发的今天&#xff0c;企业面对的一大难题是&#xff1a;如何用合理的成本支撑一个随时可能被成千上万用户调用的大模型服务&#xff1f;如果买几块A100自建集群&#xff0c;初期投入动辄数十万元&#xff1b…

作者头像 李华
网站建设 2026/4/5 21:58:04

基于Python爬取学院师资队伍信息的设计与分析爬虫 可视化

目录已开发项目效果实现截图关于博主关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;已开发项目效果实现截图 同行可拿货,招校园代理 ,本人源头供货商 基于Python爬取学院师资队伍…

作者头像 李华