news 2026/5/13 11:41:32

AutoGLM-Phone的介绍

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AutoGLM-Phone的介绍

一、AutoGLM-Phone:到底是什么?

简单来说,AutoGLM-Phone 是一个能“看懂”手机屏幕并帮你操作的智能体框架

  • 核心:它基于一个名为AutoGLM-Phone-9B9B(90亿)参数多模态大模型。这个模型经过专门训练,能同时理解文本指令和手机屏幕截图。
  • 能力:它不只是一个模型,而是一套完整的解决方案。提供训练好的模型、手机操作框架、工具链,以及覆盖50+常用中文App(如微信、美团、小红书)的示例。
  • 工作原理:你通过自然语言下达指令(如“帮我订一张明天去上海的机票”),它会自动解析意图、分析当前手机界面、规划操作步骤(点击、输入、滑动等),并通过ADB(安卓调试桥)自动执行,直到任务完成。系统对敏感操作(如支付)设有确认机制。

二、两种主流部署方案对比

部署的核心是将 AutoGLM-Phone-9B 模型在拥有高性能GPU的服务器上运行起来,并提供API服务。以下是两种主流路径的对比:

特性方案一:使用 PPIO 算力市场(模板化部署,推荐新手)方案二:使用模力方舟等传统云GPU(手动部署)
核心优势一键部署,极大简化流程,无需关心环境配置、命令参数。灵活性高,适合需要深度定制或研究底层过程的开发者。
部署流程1. 在PPIO模板市场选择“AutoGLM-Phone-9B”模板。
2. 选择配置(通常已优化)并部署实例。
3. 等待几分钟,实例自动完成模型下载、服务启动。
1. 租用云GPU服务器(如2*NVIDIA 4090)。
2. 手动通过命令行克隆项目、安装依赖、下载模型。
3. 手动编写并调试复杂的启动命令脚本 (run.sh)。
技术门槛极低,如同使用云服务产品。,需要具备Linux命令行、Python环境、模型部署相关知识。
适合人群希望快速体验、测试或专注于应用开发的用户。希望学习完整部署流程、进行二次开发或研究的开发者。

三、测试与使用流程(两种方案通用)

无论采用上述哪种方案部署好模型服务,后续在本地电脑上连接手机进行测试的步骤是相同的。

准备工作:

  1. 安卓手机:开启“开发者模式”和“USB调试”。
  2. 本地电脑:安装adb工具,并能通过USB正常连接手机(执行adb devices可见设备)。
  3. 获取模型API地址
    • PPIO方案:在实例详情页直接获取访问地址(如http://xxx.ppio.cloud:8000/v1)。
    • 手动方案:需要通过SSH隧道将云服务器的端口(如8000)转发到本地(如localhost:8118),地址为http://localhost:8118/v1

操作步骤:

  1. 准备客户端环境
    # 1. 克隆客户端代码仓库gitclone https://github.com/zai-org/Open-AutoGLM.gitcdOpen-AutoGLM# 2. (建议)创建Python虚拟环境uv venv# 或使用 python -m venv venv# 3. 安装必要的客户端依赖(与服务端依赖不同)# 编辑 requirements.txt,通常只保留 Pillow 和 openaiuv pipinstallPillow openai# 或使用 pip
  2. 连接并运行
    • 用USB连接手机,确认adb devices列出设备。
    • 运行客户端脚本,指向你的模型服务地址:
    # 将 --base-url 参数替换为你实际的API地址python main.py --base-url http://你的模型API地址 --model"autoglm-phone-9b""打开抖音,搜索热门视频"
  3. 开始交互
    • 运行命令后,系统会自动截取手机屏幕,连同你的指令发送给模型。
    • 模型会返回操作规划,并自动通过ADB控制手机执行。
    • 你可以在命令行中直接输入新的指令继续交互。

四、总结与建议

  • 对于绝大多数想尝鲜或快速集成的用户,强烈推荐通过PPIO算力市场的模板进行部署。这是目前最简单、最快速的入门方式,能让你在几分钟内跳过所有复杂步骤,直接进入测试环节。
  • 对于开发者或研究人员,手动部署方案能让你更透彻地理解整个系统的工作机制、依赖关系以及如何调整参数(如使用vLLM进行推理优化),便于后续的定制开发。
  • 核心体验一致:无论选择哪种部署后端,最终获得的Phone Agent核心能力体验是一致的,都能实现通过自然语言控制手机完成复杂任务。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/7 14:47:09

29、脚本杂谈:实用脚本解析与优化

脚本杂谈:实用脚本解析与优化 在技术文档处理和系统运维中,脚本的运用至关重要。下面将为大家介绍几个实用脚本,包括它们的功能、使用方法以及优化建议。 1. readsource:格式化程序源文件用于 troff 在准备技术文档时,我们常常需要打印不同类型的源文件,如 C 程序、aw…

作者头像 李华
网站建设 2026/5/5 11:44:41

2026年外汇实时行情API选型指南

在量化与程序化交易领域,外汇行情数据的及时性、准确性与完整性,直接决定了策略回测的可靠性和实盘交易的胜率。对量化团队而言,一款适配需求的外汇实时行情 API,不仅能降低数据集成成本,更能为高频交易、多货币对策略…

作者头像 李华
网站建设 2026/5/11 20:57:40

9个AI论文工具,助你搞定本科生毕业写作!

9个AI论文工具,助你搞定本科生毕业写作! AI 工具助力论文写作,轻松应对毕业挑战 对于本科生来说,撰写毕业论文是一项既重要又充满挑战的任务。从选题到开题,再到资料收集、大纲搭建、初稿撰写以及最后的查重降重&#…

作者头像 李华
网站建设 2026/5/11 6:28:56

Kotaemon CI/CD 流水线搭建:GitHub Actions 实践

Kotaemon CI/CD 流水线搭建:GitHub Actions 实践 在企业级 AI 应用日益复杂的今天,一个智能对话系统能否快速迭代、稳定上线,往往不取决于模型本身有多强大,而在于背后的工程化能力是否扎实。尤其是在构建基于检索增强生成&#…

作者头像 李华
网站建设 2026/5/12 0:18:40

springboot_vue基于SSM的科研课题征集与发布系统设计与实现_q6g566bf

目录 已开发项目效果实现截图开发技术介绍系统开发工具: 核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式…

作者头像 李华
网站建设 2026/4/27 9:46:53

为什么越来越多企业选择Kotaemon做智能客服?

为什么越来越多企业选择Kotaemon做智能客服? 在客户服务领域,一个老生常谈的问题正在被重新定义:如何用更少的人力,提供更快、更准、更一致的服务体验?传统客服团队虽然可靠,但面对海量重复咨询时&#xff…

作者头像 李华