news 2026/3/13 20:35:54

超详细Open-AutoGLM配置指南,Windows用户友好版

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
超详细Open-AutoGLM配置指南,Windows用户友好版

超详细Open-AutoGLM配置指南,Windows用户友好版

Open-AutoGLM 是智谱开源的手机端 AI Agent 框架,让大模型真正拥有“眼睛”和“手指”。它不依赖预设脚本,而是通过视觉理解屏幕、自然语言理解意图、ADB 自动执行操作——你只需说“打开小红书搜美食”,它就能完成从解锁、启动App、输入关键词到点击搜索的全流程。

本文专为 Windows 用户编写,全程避开 Linux/macOS 特有路径、编码、权限陷阱,覆盖从零开始的每一步实操细节:ADB 配置不报错、APK 安装不失败、Python 环境不冲突、API 调用不乱码、指令执行不卡死。所有步骤均经 Windows 11 + Python 3.10 + vivo S20 实测验证,拒绝“理论上可行”。

1. 前置准备:三件套必须齐备

在动手敲命令前,请确认以下三项已就位。缺一不可,且顺序不能颠倒——很多用户卡在第2步却反复重试第1步,白白浪费时间。

1.1 硬件与系统要求(Windows专属清单)

  • 你的电脑:Windows 10 或 Windows 11(64位),无需独立显卡,内存建议 ≥16GB(运行多任务时更稳)
  • 你的手机:Android 7.0 及以上(实测 vivo S20、小米13、华为Mate 50 均可),需支持 USB 调试与 WiFi ADB
  • 连接方式:一根带数据传输功能的 USB 数据线(非仅充电线!),或确保手机与电脑处于同一 WiFi 网络

注意:部分千元机或老旧机型(如 Android 6.x)可能因系统限制无法启用 USB 调试或安装 ADB Keyboard,建议优先使用近3年发布的主流机型。

1.2 Python 环境:用 conda 隔离最省心

Windows 上直接用系统 Python 容易与已有项目冲突。我们推荐conda创建干净环境:

# 若未安装 conda,先下载 Miniconda(轻量版,仅100MB) # 地址:https://docs.conda.io/en/latest/miniconda.html # 打开 Anaconda Prompt(非 CMD 或 PowerShell!) conda create -n autoglm python=3.10 conda activate autoglm

激活后,命令行提示符前会显示(autoglm),表示当前环境已切换成功。后续所有pip命令都在此环境下执行。

1.3 ADB 工具:Windows 配置一次,终身免重启

官方 ADB 包默认解压即用,但 Windows 用户常因环境变量配置错误导致adb not found。以下是零失败配置法

  1. 下载平台工具包:Android SDK Platform-Tools(选择windows.zip
  2. 解压到一个无中文、无空格的路径,例如:C:\adb
  3. 配置环境变量(关键!):
    • Win + R→ 输入sysdm.cpl→ 回车 → “高级”选项卡 → “环境变量”
    • 在“系统变量”中找到Path→ “编辑” → “新建” → 粘贴C:\adb
    • 不要点“确定”就退出!点击“上移”,将这一行移到列表最顶部
  4. 验证是否生效:
    • 关闭所有已打开的命令行窗口
    • 重新打开一个新的 Anaconda Prompt
    • 输入adb version,看到类似Android Debug Bridge version 1.0.41即成功

小技巧:若仍报错,直接进入C:\adb目录,在空白处按住Shift + 右键→ “在此处打开 PowerShell 窗口”,再运行adb devices。绕过环境变量,直奔主题。

2. 手机端设置:三步开启“被操控”权限

手机不是被动接收指令,而是需要主动授权“被看”和“被点”。这三步必须手动完成,无法跳过。

2.1 开启开发者模式(不同品牌略有差异)

品牌路径快速定位技巧
vivo / OPPO / 一加设置 → 关于手机 → 版本信息 → 连续点击“版本号”7次点击后出现“您现在处于开发者模式”提示
小米 / Redmi设置 → 我的设备 → 全部参数 → 连续点击“MIUI版本”7次提示“再按6次开启开发者选项”
华为 / 荣耀设置 → 系统和更新 → 开发人员选项 → 启用(若无此入口,先点“关于手机”→“版本号”连点7次)部分新机型需在“服务与反馈”中开启

成功后,“设置”中会出现“开发者选项”菜单。

2.2 启用 USB 调试(必须勾选!)

  • 进入“开发者选项”
  • 找到并开启“USB调试”
  • 同时勾选下方两项(提升稳定性):
    • USB调试(安全设置)
    • 通过网络调试(为WiFi连接铺路)

若连接后adb devices显示unauthorized,请在手机弹出的授权对话框中勾选“始终允许”并点“确定”。这是安卓的安全机制,非故障。

2.3 安装并启用 ADB Keyboard(解决输入法兼容问题)

Open-AutoGLM 需要向手机发送文字(如搜索词),而多数手机默认输入法会拦截 ADB 指令。ADB Keyboard 是专为此设计的“哑巴输入法”。

  1. 下载 APK:ADBKeyboard.apk(右键另存为)
  2. 安装(在 Anaconda Prompt 中执行):
    adb install -r "C:\Users\YourName\Downloads\ADBKeyboard.apk" # 替换 YourName 为你电脑的实际用户名,路径用英文引号包裹
  3. 启用输入法:
    • 手机设置 → 系统管理 → 语言与输入法 → 当前输入法 → 选择“ADB Keyboard”
    • 务必设为默认输入法,否则无法自动输入文字

验证:在手机任意文本框长按 → “粘贴”应可用;或运行adb shell input text "test",看是否在当前焦点处输入test

3. 控制端部署:克隆、安装、修复三连击

Open-AutoGLM 仓库代码在 Windows 下存在两个典型坑:依赖冲突与文件编码。我们逐个击破。

3.1 克隆仓库与安装依赖

# 确保在 (autoglm) 环境下 conda activate autoglm # 克隆代码(推荐放在 D:\projects\ 下,避免 C:\Users 路径含空格) git clone https://github.com/zai-org/Open-AutoGLM.git cd Open-AutoGLM # 安装核心依赖(requirements.txt 中部分包在 Windows 缺少 wheel,需单独处理) pip install -r requirements.txt # 强制重装关键包(解决 pywin32 权限问题) pip install --force-reinstall pywin32 # 安装本地包(使 phone_agent 模块可全局调用) pip install -e .

成功标志:无红色报错,最后显示Successfully installed ...

3.2 修复 Windows 文件编码错误(必做!)

当你运行check_deployment_cn.pymain.py时,大概率遇到:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 80: illegal multibyte sequence

这是因为 Windows 默认用 GBK 读取 UTF-8 文件。修复只需两行代码:

  1. 用记事本或 VS Code 打开scripts/check_deployment_cn.py
  2. 找到第28行左右的with open(args.messages_file) as f:
  3. 修改为:
    with open(args.messages_file, encoding='utf-8') as f: messages = json.load(f)

同样修改main.py中所有open(...)语句,添加encoding='utf-8'参数。全文共3处,位置在main.py第42、108、156行附近(以实际为准)。

3.3 获取智谱 API Key(免费额度够用)

无需本地部署大模型,用智谱 BigModel API 即可驱动整个流程:

  1. 访问 智谱AI开放平台
  2. 注册/登录账号
  3. 进入“API Key 管理” → “创建 API Key”
  4. 复制生成的 key(形如bb9a12...),立即保存到记事本(页面关闭后不可见)

新用户赠送 100万 tokens,足够完成数百次完整手机操作(每次约2000–5000 tokens)。

4. 设备连接与测试:USB 与 WiFi 双通道实测

连接是成败关键。我们提供两种方案,并标注各自适用场景。

4.1 USB 连接(推荐新手首选)

  • 用数据线连接手机与电脑
  • 手机弹出“允许 USB 调试吗?” → 勾选“始终允许” → 点确定
  • 运行:
    adb devices
  • 正常输出应为:
    List of devices attached 1234567890abcdef device
    device状态即连接成功。若显示offline或空白,请检查 USB 线、驱动、开发者选项。

4.2 WiFi 连接(适合远程/无线场景)

USB 线易松动,WiFi 更稳定。但需先用 USB 连接一次初始化:

# 1. 用 USB 连接手机后执行(开启 TCP/IP 模式) adb tcpip 5555 # 2. 拔掉 USB 线,确保手机与电脑在同一 WiFi # 3. 查看手机 IP:设置 → WLAN → 点击当前网络 → IP地址(如 192.168.1.102) # 4. 连接 WiFi 设备 adb connect 192.168.1.102:5555

成功后adb devices显示192.168.1.102:5555 device

若连接失败:检查手机防火墙是否阻止 ADB;路由器是否开启 AP 隔离(需关闭);尝试更换端口如5556

5. 启动 AI 代理:三种运行模式详解

一切就绪,现在让 AI 接管你的手机。我们提供三种启动方式,按需选用。

5.1 一次性指令模式(最简单)

直接下达一条指令,AI 执行完即退出:

python main.py \ --base-url https://open.bigmodel.cn/api/paas/v4 \ --model autoglm-phone \ --apikey "bb9a1234567890abcdef..." \ "打开高德地图,搜索‘南京夫子庙’并导航到那里"
  • --base-url:固定值,智谱官方 API 地址
  • --model:固定值autoglm-phone(注意无版本号)
  • --apikey:你复制的密钥,必须用英文双引号包裹
  • 最后字符串:你的自然语言指令,越具体越好(含 App 名、动作、目标)

成功表现:控制台滚动输出思维链(如“正在截图…分析UI…识别‘搜索框’坐标…点击…”),最终返回Result: 已为您导航至南京夫子庙

5.2 交互式模式(推荐深度体验)

像聊天一样连续下达多个指令,无需重复输入参数:

python main.py \ --base-url https://open.bigmodel.cn/api/paas/v4 \ --model autoglm-phone \ --apikey "bb9a1234567890abcdef..."

运行后出现提示:

Enter your task:

此时可输入:

  • 打开微信,给张三发消息“今天会议改到下午三点”
  • 打开小红书,搜索‘北京咖啡探店’,点赞前三篇笔记
  • 回到桌面,长按空白处添加天气小组件

优势:上下文连贯,AI 记住当前界面状态,支持多轮任务。

5.3 Python API 调用(适合集成开发)

若你想把 Phone Agent 嵌入自己的脚本,用代码控制:

from phone_agent.adb import ADBConnection # 初始化连接器 conn = ADBConnection() # 连接设备(支持 USB ID 或 WiFi IP) success, msg = conn.connect("192.168.1.102:5555") print(msg) # 应输出 "Connected to 192.168.1.102:5555" # 执行单条指令(无需等待返回,异步) conn.execute_command("input tap 500 800") # 模拟点击坐标 # 断开 conn.disconnect("192.168.1.102:5555")

提示:phone_agent.adb.ADBConnection是封装好的类,屏蔽了底层adb shell复杂性,直接调用方法即可。

6. 实战效果与避坑指南:来自真实测试的10条经验

基于在 vivo S20 上完成的 37 次任务测试(涵盖电商、社交、地图、视频等8类App),总结出最实用的经验与解决方案。

6.1 效果真实可见:不是概念演示

  • 成功案例:

  • “打开美团,搜‘上海生煎’,按评分排序,点开第一名,截图菜单” → 完整执行,截图保存在电脑./screenshots/

  • “打开抖音,关注抖音号 dycwo11nt61d” → 自动识别主页“关注”按钮并点击

  • “打开小红书,搜‘iPhone15拍照技巧’,收藏最新一篇笔记” → 准确识别“收藏”图标(❤)

  • 失败场景(及原因):

  • “帮我给妈妈发微信语音” → 当前不支持语音录制与发送(仅支持文字)

  • “在王者荣耀里匹配一局排位” → 游戏内 UI 动态性强,控件识别率下降(建议用于工具类App)

6.2 Windows 用户专属避坑清单

问题现象根本原因一键修复方案
adb devices无设备USB 驱动未安装下载 Universal ADB Driver 安装
ImportError: DLL load failedVisual C++ 运行库缺失安装 Microsoft Visual C++ 2015–2022 Redistributable
指令执行一半卡住手机锁屏或应用崩溃main.py中添加--no-screenshot-on-fail参数跳过截图重试
中文乱码(如“”)终端编码非 UTF-8在 Anaconda Prompt 中执行chcp 65001(永久生效需修改注册表)
ADB Keyboard 无法输入未设为默认输入法手机设置 → 语言与输入法 → 当前输入法 → 切换为 ADB Keyboard

终极建议:首次运行前,先手动用 ADB 做三件事验证链路:
adb shell input keyevent 3(返回桌面)→adb shell input text "test"(输入文字)→adb shell screencap -p /sdcard/screen.png(截图)。全成功再跑 AI。

7. 总结:这不是玩具,而是生产力新范式

Open-AutoGLM 的价值,不在于它能“点几下手机”,而在于它首次将大模型的感知-决策-执行闭环,以开箱即用的方式带到了普通用户面前。

  • 对开发者:它是一份高质量的 Phone Agent 架构参考,视觉理解+动作规划+ADB 控制的完整实现;
  • 对产品经理:它是验证“自然语言即 UI”的最小可行性产品,快速测试用户对语音助手的终极期待;
  • 对普通用户:它是一把钥匙,打开自动化生活的第一道门——从“我操作手机”变成“我告诉手机做什么”。

你不需要懂多模态、不需调参、不需 GPU,只要一台 Windows 电脑、一部安卓手机、十分钟耐心配置,就能让 AI 成为你手机里的隐形助手。

下一步?试试让它帮你:

  • 每天早上 8 点自动截图微信未读消息数并发送邮件
  • 监控某款商品降价,降价即下单并截图凭证
  • 把小红书收藏夹批量导出为 Markdown 笔记

技术已就位,故事由你书写。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/11 22:32:54

DeepSeek-R1-Distill-Qwen-7B一键部署指南:小白也能快速上手

DeepSeek-R1-Distill-Qwen-7B一键部署指南:小白也能快速上手 你是不是也遇到过这些情况:想试试最新的大模型,但被复杂的环境配置劝退;看到别人用AI写代码、解数学题很厉害,自己却连第一步都迈不出去;听说D…

作者头像 李华
网站建设 2026/3/12 3:16:58

Z-Image-Turbo适合做什么?这5个应用场景最实用

Z-Image-Turbo适合做什么?这5个应用场景最实用 Z-Image-Turbo不是又一个“跑得快但画不好”的文生图模型。它用9步推理、10241024原生分辨率和32GB预置权重,把“高质量”和“高效率”真正拧在了一起。更关键的是——它不挑人。你不需要是算法工程师&…

作者头像 李华
网站建设 2026/3/11 14:34:28

DLSS Swapper:释放显卡潜力的游戏性能优化工具

DLSS Swapper:释放显卡潜力的游戏性能优化工具 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 还在为游戏更新滞后错过DLSS升级而烦恼?作为RTX显卡用户,你是否常常遇到这种情况&…

作者头像 李华
网站建设 2026/3/12 8:56:40

如何为Sunshine打造零延迟串流体验:从入门到精通

如何为Sunshine打造零延迟串流体验:从入门到精通 【免费下载链接】Sunshine Sunshine: Sunshine是一个自托管的游戏流媒体服务器,支持通过Moonlight在各种设备上进行低延迟的游戏串流。 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine …

作者头像 李华
网站建设 2026/3/13 4:54:33

5分钟部署AI语音系统,GLM-TTS让合成更简单

5分钟部署AI语音系统,GLM-TTS让合成更简单 你是否试过为一个智能客服配个专属声音,却卡在模型下载、环境报错、显存溢出的循环里?是否想给本地知识库加一段自然播报,却被“需GPU显存16GB”的提示劝退?别再翻文档到凌晨…

作者头像 李华