news 2026/3/6 5:51:50

54_Spring AI 干货笔记之 Azure OpenAI 语音转录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
54_Spring AI 干货笔记之 Azure OpenAI 语音转录

一、Azure OpenAI 语音转录

Spring AI 支持 Azure Whisper 模型。

二、前置条件

从 Azure 门户的 Azure OpenAI 服务部分获取您的 Azure OpenAI 端点和 API 密钥。Spring AI 定义了一个名为 spring.ai.azure.openai.api-key 的配置属性,您应将其设置为从 Azure 获取的 API 密钥值。同时还有一个名为 spring.ai.azure.openai.endpoint 的配置属性,应设置为在 Azure 中部署模型时获取的端点 URL。

三、自动配置

Spring AI 的自动配置及其 Starter 模块的构件名称发生了显著变化。更多信息请参阅升级说明。

Spring AI 为 Azure OpenAI 语音转录生成客户端提供了 Spring Boot 自动配置。要启用它,请将以下依赖项添加到项目的 Maven pom.xml 文件中:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-azure-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-starter-model-azure-openai'}

请参考“依赖管理”部分,将 Spring AI BOM 添加到您的构建文件中。

转录属性

现在通过顶级属性 spring.ai.model.audio.transcription 来启用或禁用音频转录的自动配置。

  • 要启用:spring.ai.model.audio.transcription=azure-openai (默认已启用)

  • 要禁用:spring.ai.model.audio.transcription=none (或任何非 azure-openai 的值)

此项变更是为了支持配置多个模型。

前缀 spring.ai.openai.audio.transcription 用作属性前缀,用于配置 OpenAI 图像模型的重试机制。

四、运行时选项

AzureOpenAiAudioTranscriptionOptions 类提供了进行转录时使用的选项。在启动时,会使用 spring.ai.azure.openai.audio.transcription 指定的选项,但您可以在运行时覆盖这些选项。

例如:

AzureOpenAiAudioTranscriptionOptions.TranscriptResponseFormatresponseFormat=AzureOpenAiAudioTranscriptionOptions.TranscriptResponseFormat.VTT;AzureOpenAiAudioTranscriptionOptionstranscriptionOptions=AzureOpenAiAudioTranscriptionOptions.builder().language("en").prompt("Ask not this, but ask that").temperature(0f).responseFormat(this.responseFormat).build();AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=azureOpenAiTranscriptionModel.call(this.transcriptionRequest);

五、手动配置

将 spring-ai-openai 依赖项添加到项目的 Maven pom.xml 文件中:

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-azure-openai</artifactId></dependency>

或者添加到您的 Gradle build.gradle 构建文件中。

dependencies{implementation'org.springframework.ai:spring-ai-azure-openai'}

请参考“依赖管理”部分,将 Spring AI BOM 添加到您的构建文件中。

接下来,创建一个 AzureOpenAiAudioTranscriptionModel

varopenAIClient=newOpenAIClientBuilder().credential(newAzureKeyCredential(System.getenv("AZURE_OPENAI_API_KEY"))).endpoint(System.getenv("AZURE_OPENAI_ENDPOINT")).buildClient();varazureOpenAiAudioTranscriptionModel=newAzureOpenAiAudioTranscriptionModel(this.openAIClient,null);vartranscriptionOptions=AzureOpenAiAudioTranscriptionOptions.builder().responseFormat(TranscriptResponseFormat.TEXT).temperature(0f).build();varaudioFile=newFileSystemResource("/path/to/your/resource/speech/jfk.flac");AudioTranscriptionPrompttranscriptionRequest=newAudioTranscriptionPrompt(this.audioFile,this.transcriptionOptions);AudioTranscriptionResponseresponse=this.azureOpenAiAudioTranscriptionModel.call(this.transcriptionRequest);
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/4 11:52:48

YOLO目标检测模型热更新机制设计:不停机升级

YOLO目标检测模型热更新机制设计&#xff1a;不停机升级 在智能制造工厂的质检线上&#xff0c;摄像头正以每秒30帧的速度扫描着高速移动的电路板。突然&#xff0c;系统需要上线一个新训练的YOLO模型来识别一种新型焊接缺陷——但产线不能停。传统做法意味着至少半小时的停工等…

作者头像 李华
网站建设 2026/3/4 8:04:26

YOLO推理服务部署HTTPS:保护GPU接口安全

YOLO推理服务部署HTTPS&#xff1a;保护GPU接口安全 在智能制造工厂的视觉质检线上&#xff0c;一台边缘服务器正通过摄像头实时分析产品缺陷。每秒上百帧图像被上传至部署在GPU上的YOLO模型进行检测——这本是AI赋能工业自动化的典型场景。但若这些包含核心工艺信息的图像以明…

作者头像 李华
网站建设 2026/3/4 14:00:55

YOLOv10相比YOLOv8有哪些核心改进?一文说清

YOLOv10相比YOLOv8有哪些核心改进&#xff1f;一文说清 在工业质检线上&#xff0c;一台高速摄像头每秒捕捉上百帧图像&#xff0c;系统必须在几毫秒内完成缺陷检测并触发分拣动作。传统目标检测模型在这种场景下面临一个尴尬的瓶颈&#xff1a;即使主干网络推理只需3ms&#x…

作者头像 李华
网站建设 2026/3/5 16:32:33

VTK源码编译时候选qt5路径

Qt 采用 清华源 下载&#xff0c;&#xff08;如果后续用VS编译&#xff0c;VS2017、2019、2022都采用 MSVC编译&#xff0c;如果不是&#xff0c;可以考虑MG&#xff0c;后文采用MSVC&#xff09;VS 2022 (MSVC 2017 64 bit)VTK 8.2 (亲测&#xff0c;9.10版本无法生成QVTK插件…

作者头像 李华
网站建设 2026/3/5 3:48:17

YOLO目标检测模型如何集成OpenCV进行GPU加速处理?

YOLO目标检测模型如何集成OpenCV进行GPU加速处理&#xff1f; 在智能制造车间的质检线上&#xff0c;摄像头以30帧每秒的速度拍摄流水线产品&#xff0c;系统必须在33毫秒内完成每一帧的缺陷识别——这不仅是对算法精度的考验&#xff0c;更是对推理速度的极限挑战。传统基于CP…

作者头像 李华
网站建设 2026/3/5 8:08:53

YOLO模型训练资源池划分:团队间资源共享机制

YOLO模型训练资源池划分&#xff1a;团队间资源共享机制 在AI研发日益规模化、工业化的今天&#xff0c;一个现实问题正困扰着越来越多的技术团队&#xff1a;明明拥有数十张高性能GPU卡&#xff0c;却总是“有人没算力跑模型&#xff0c;有人的显卡空转”。尤其在多个项目并行…

作者头像 李华