项目分享|Open-AutoGLM：让AI真正“上手”你的手机-平芜编程栈

引言

在智能设备普及的今天，如何让手机更“懂”用户需求，实现自动化任务处理，成为提升效率的重要方向。Open-AutoGLM 作为一款基于 AutoGLM 构建的手机端智能助理框架，通过多模态技术与自动化操作的结合，让用户只需用自然语言描述需求（如“打开小红书搜索美食”），即可让手机自动完成一系列操作。无论是日常应用控制还是复杂任务处理，它都为用户带来了全新的交互体验。

项目简介

Open-AutoGLM 核心是 Phone Agent 框架，其核心能力在于“理解屏幕+自动操作”：通过 ADB（Android Debug Bridge）实现对 Android 设备的控制，借助视觉语言模型感知屏幕内容，再结合智能规划能力生成操作流程。

该框架支持 Android 7.0 及以上设备，用户无需手动操作，仅通过自然语言指令即可完成应用启动、搜索、信息填写等任务。同时，它内置敏感操作确认机制，在涉及登录、验证码等场景时可无缝切换至人工接管，兼顾便捷性与安全性。

项目提供两款预训练模型：AutoGLM-Phone-9B针对中文手机应用优化，AutoGLM-Phone-9B-Multilingual支持英语等多语言场景，用户可通过 Hugging Face 或 ModelScope 平台下载使用。

核心优势与创新点

Open-AutoGLM 的差异化优势体现在技术融合与实用设计的结合：

多模态理解能力：融合视觉与语言模型，精准解析屏幕元素（如按钮、输入框）和文本内容，突破传统基于 UI 结构识别的局限，适配更多应用场景。
全流程自动化：从意图解析到操作执行闭环处理，例如“搜索附近火锅店”任务中，框架会自动启动美团、点击搜索框、输入关键词、筛选结果，无需人工干预。
灵活的部署与扩展：支持第三方模型服务（如智谱 BigModel、ModelScope）和本地部署（基于 vLLM 或 SGLang），满足不同用户的算力需求；同时支持 50+ 主流中文应用（微信、淘宝、抖音等），且易于扩展新应用。
远程控制能力：通过 WiFi 或网络实现 ADB 远程调试，无需 USB 连接即可控制设备，提升开发与使用的灵活性。
安全机制保障：针对支付、密码输入等敏感操作设置确认环节，平衡自动化效率与操作安全性。

技术原理与部署指南

技术架构

Open-AutoGLM 核心流程分为三步：

屏幕感知：通过 ADB 截取手机屏幕，由视觉语言模型解析界面元素与内容；
智能规划：根据用户指令与当前界面信息，生成下一步操作计划（如点击、输入、滑动等）；
操作执行：通过 ADB 将指令转化为手机动作，循环执行直至任务完成。

部署步骤

环境准备：
- 安装 Python 3.10+ 及 ADB 工具，并配置环境变量；
- 安卓设备启用“开发者模式”和“USB 调试”，安装 ADB Keyboard 以支持文本输入。

依赖安装：

pipinstall-r requirements.txt pipinstall-e.

模型服务启动：
- 第三方服务：直接使用智谱 BigModel 或 ModelScope 提供的 API，配置对应base-url、model和apikey；
- 本地部署：通过 vLLM 或 SGLang 启动模型服务，例如使用 vLLM：
```
python3 -m vllm.entrypoints.openai.api_server\--served-model-name autoglm-phone-9b\--model zai-org/AutoGLM-Phone-9B\--port8000
```

运行与使用：
通过命令行或 Python API 调用，例如：

# 命令行执行任务python main.py --base-url http://localhost:8000/v1"打开淘宝搜索无线耳机"

该项目及相关内容已在 AladdinEdu 课题广场同步发布，欢迎前往了解更多技术实现与资源。

项目地址：AladdinEdu 课题广场

Linux系统下最简PyTorch环境搭建：Miniconda-Python3.10实战记录

Linux系统下最简PyTorch环境搭建：Miniconda-Python3.10实战记录在现代AI开发中，一个常见的场景是：你刚拿到一台新的Linux服务器，准备复现一篇论文的实验结果。可当你运行pip install torch时，却卡在了CUDA版本不兼容的…

李华

如何在Miniconda中配置PyTorch GPU版本？Python3.10最佳实践

如何在 Miniconda 中配置 PyTorch GPU 版本？Python 3.10 实战指南在深度学习项目中，一个稳定、可复现的开发环境往往比模型本身更早成为“拦路虎”。你是否曾遇到这样的场景：代码明明在本地跑得好好的，换到服务器上却报错 torch…

李华

Anaconda下载太慢？试试Miniconda+清华镜像极速替代方案

Miniconda 清华镜像：打造极速 Python 开发环境在数据科学和人工智能项目中，搭建一个稳定、高效的开发环境往往是第一步。然而，许多开发者都曾经历过这样的场景：点击下载 Anaconda 安装包后，进度条以“龟速”爬行&…

李华

Miniconda环境下PyTorch GPU版本安装失败常见问题汇总

Miniconda环境下PyTorch GPU版本安装失败常见问题深度解析在深度学习项目启动阶段，最令人沮丧的莫过于环境配置环节——明明硬件齐全、代码清晰，却卡在 torch.cuda.is_available() 返回 False 上。这种“看得见GPU却用不上”的窘境，在使用Mi…

李华

为什么越来越多团队选择Miniconda-Python3.10而非Anaconda？

为什么越来越多团队选择 Miniconda-Python3.10 而非 Anaconda？ 在 AI 模型迭代以天为单位推进的今天，一个看似不起眼的技术决策——开发环境用 Miniconda 还是 Anaconda——正悄然影响着整个团队的研发效率。你有没有遇到过这样的场景：同事说…

李华

UI自动化测试、接口测试等自动化测试详解

今天跟大家介绍UI测试、接口测试、单元测试主要内容，以及每种测试花费时间讨论。一.UI测试【Selenium】UI测试是最接近软件真实用户使用行为的测试类型。通常是模拟真实用户使用软件的行为，即模拟用户在软件界面上的各种操作，并验证这些操作对…

李华