news 2026/5/10 1:31:58

qwen 系列模型涉及到的部署、推理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
qwen 系列模型涉及到的部署、推理

来源 https://qwen.readthedocs.io/en/latest/quantization/awq.html

  • 其中关于智能体部分
importos from qwen_agent.agentsimportAssistant# Define LLMllm_cfg={# Use a custom endpoint compatible with OpenAI API by vLLM/SGLang:'model':'Qwen/Qwen3-32B','model_server':'http://localhost:8000/v1',# api_base'api_key':'EMPTY',# 'generate_cfg': {# # When using vLLM/SGLang OAI API, pass the parameter of whether to enable thinking mode in this way# 'extra_body': {# 'chat_template_kwargs': {'enable_thinking': False}# },## # Add: When the content is `<think>this is the thought</think>this is the answer`# # Do not add: When the response has been separated by reasoning_content and content# # This parameter will affect the parsing strategy of tool call# # 'thought_in_content': True,# },}# llm_cfg = {# # Use the model service provided by DashScope:# 'model': 'qwen3-235b-a22b',# 'model_type': 'qwen_dashscope',## # 'generate_cfg': {# # # When using the Dash Scope API, pass the parameter of whether to enable thinking mode in this way# # 'enable_thinking': False,# # },# }# llm_cfg = {# # Use the OpenAI-compatible model service provided by DashScope:# 'model': 'qwen3-235b-a22b',# 'model_server': 'https://dashscope.aliyuncs.com/compatible-mode/v1',# 'api_key': os.getenv('DASHSCOPE_API_KEY'),## # 'generate_cfg': {# # # When using Dash Scope OAI API, pass the parameter of whether to enable thinking mode in this way# # 'extra_body': {# # 'enable_thinking': False# # },# # },# }# Define Toolstools=[{'mcpServers':{# You can specify the MCP configuration file'time':{'command':'uvx','args':['mcp-server-time','--local-timezone=Asia/Shanghai']},"fetch":{"command":"uvx","args":["mcp-server-fetch"]}}},'code_interpreter',# Built-in tools]# Define Agentbot=Assistant(llm=llm_cfg,function_list=tools)# Streaming generationmessages=[{'role':'user','content':'https://qwenlm.github.io/blog/ Introduce the latest developments of Qwen'}]forresponsesinbot.run(messages=messages): pass print(responses)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 0:05:18

【笔记】【图】

目录 第一套&#xff1a;核心趋势与资金监控系统 第二套&#xff1a;牛熊线短线交易系统 第三套 & 第四套&#xff1a;全能型深度分析面板 给您的终极实战建议 这四张图代表了四种由简到繁的股票技术分析“仪表盘”&#xff0c;目的是从不同维度监控市场。作为新手&…

作者头像 李华
网站建设 2026/4/30 13:31:41

创客匠人文化解码:知识传播符号变迁中的人机共生与文化调适

清晨六点&#xff0c;云南白族扎染匠人杨师傅打开手机&#xff0c;AI智能体将他口述的“靛蓝发酵七日诀”转化为带方言注解的动画教程&#xff1b;同一时刻&#xff0c;北京程序员小陈在通勤地铁上&#xff0c;通过智能体推送的“三分钟扎染史”了解这项非遗。两个时空因知识而…

作者头像 李华
网站建设 2026/5/4 22:11:16

AI 时代 人人都可以是开源贡献者

AI 时代 人人都可以是开源贡献者&#xff08;HarmonyOS 开发三方库指南&#xff09; ​ 万少&#xff1a;华为HDE、鸿蒙极客 个人主页&#xff1a;https://blog.zbztb.cn/ 2025年参与孵化了20鸿蒙应用、技术文章300、鸿蒙知识库用户500、鸿蒙免费课程2套。 如果你也喜欢交流AI和…

作者头像 李华
网站建设 2026/5/10 10:34:48

SSM应用框架实现的疫苗接种管理系统u6z9a(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面

系统程序文件列表 系统项目功能&#xff1a;用户,疫苗信息,疫苗预约,接种地点,接种信息 SSM应用框架实现的疫苗接种管理系统开题报告 一、课题研究背景与意义 1.1 研究背景 随着公共卫生体系的不断完善&#xff0c;疫苗接种作为预防和控制传染病最经济、有效的手段&#xff…

作者头像 李华
网站建设 2026/5/3 23:35:03

【程序员必看】5款国产AI大模型全方位对比:DeepSeek、豆包、Kimi、智谱清言和通义千问,谁才是你的最佳选择?(收藏版)

文章对比分析了五款国产AI大模型&#xff1a;DeepSeek(高性价比推理)、豆包(多面手)、Kimi(长文本专家)、智谱清言(知识图谱)和通义千问(行业全能手)。从特点、优势、适用场景和发展前景进行了详细阐述&#xff0c;并给出横向对比&#xff0c;帮助读者根据自身需求(专业、学术、…

作者头像 李华