news 2026/5/21 15:10:03

funasr_onnx asr语音转录使用案例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
funasr_onnx asr语音转录使用案例

参考:
https://github.com/modelscope/FunASR/blob/main/examples/industrial_data_pretraining/sense_voice/demo_onnx.py

安装:

pip install funasr_onnx


使用:

from pathlib import Path from funasr_onnx import SenseVoiceSmall from funasr_onnx.utils.postprocess_utils import rich_transcription_postprocess model_dir = "iic/SenseVoiceSmall" model = SenseVoiceSmall(model_dir, batch_size=10, quantize=True) wav_or_scp = [r"C:\Users\loong\Downloads\asr_example.wav"] res = model(wav_or_scp, language="auto", use_itn=True) print([rich_transcription_postprocess(i) for i in res])



版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 22:56:06

GLM-TTS能否支持实时对话?流式推理的应用边界探索

GLM-TTS能否支持实时对话?流式推理的应用边界探索 在智能语音助手越来越频繁地介入日常生活的今天,用户早已不再满足于“能说话”的机器。他们期待的是更自然、更即时的交互体验——就像和真人对话一样,说完问题立刻就能听到回应&#xff0c…

作者头像 李华
网站建设 2026/5/20 9:43:41

基于GLM-TTS的语音验证码系统安全性评估

基于GLM-TTS的语音验证码系统安全性评估 在智能客服、远程银行和身份验证场景中,语音验证码正逐渐取代传统短信或图形验证码,成为用户交互的重要通道。然而,随着像 GLM-TTS 这类支持零样本语音克隆与情感迁移的先进文本到语音(TTS…

作者头像 李华
网站建设 2026/5/21 11:26:32

GLM-TTS在离线环境下的部署挑战与解决方案

GLM-TTS在离线环境下的部署挑战与解决方案 在企业级语音合成系统逐渐从“能说”迈向“说得像人”的今天,如何将具备零样本语音克隆能力的先进模型——如GLM-TTS——稳定运行于无公网访问、资源受限的本地服务器上,已成为智能客服、数字员工、教育播报等…

作者头像 李华
网站建设 2026/5/21 11:13:11

GLM-TTS与Stripe支付集成:实现按量付费语音合成服务

GLM-TTS与Stripe支付集成:实现按量付费语音合成服务 在短视频、播客和在线教育内容爆发式增长的今天,个性化语音生成正从“锦上添花”变为“刚需”。用户不再满足于千篇一律的机械朗读,而是希望听到像真人主播一样富有情感、音色独特的声音—…

作者头像 李华
网站建设 2026/5/20 16:52:57

GLM-TTS能否用于歌曲合成?初步尝试旋律与节奏适配

GLM-TTS能否用于歌曲合成?初步尝试旋律与节奏适配 在虚拟歌手、AI翻唱和语音动画角色日益流行的今天,人们不再满足于让AI“说话”——他们更希望AI能“唱歌”。这种需求推动了从传统文本到语音(TTS)系统向更具表现力的方向演进。G…

作者头像 李华
网站建设 2026/5/21 11:15:34

GLM-TTS能否用于太空站通信模拟?失重环境下语音特征调整

GLM-TTS能否用于太空站通信模拟?失重环境下语音特征调整 在国际空间站中,一次关键的舱外活动(EVA)指令因宇航员声音模糊被误听为“推进器关闭”而非“推进器校准”,险些引发系统异常。这并非虚构场景,而是N…

作者头像 李华