news 2026/5/11 7:32:38

自动操作浏览器,又一款 Chrome 神器,开源了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
自动操作浏览器,又一款 Chrome 神器,开源了!

大家最近在折腾 AI Agent 时,有没有遇到过这种尴尬的情况:

让 AI 去某个网站查资料、抓数据,它在后台吭哧吭哧跑了半天,最后告诉你:“对不起,报错了”。

大多时候,你会发现这些问题,主要都卡在了验证登录这一环。

我们明明就坐在电脑前,在浏览器上有登录 Cookie,甚至动动手指就能把验证码划过去,但因为 AI 被运行在一个封闭的“黑盒”里,我们什么忙都帮不上。

正好,最近我在 GitHub 发现了一个新项目:Playwriter,它能通过一种非常讨巧的方式,完美解决上述问题。

看到这个名字,你可能会想到微软那个大名鼎鼎的自动化测试工具 Playwright。

没错,这个项目核心基于微软的工具运行,但作者打包封装成了 Chrome 插件,让用户体验更加丝滑,操作更为灵活便捷。

不夸张地说,它可能是目前让 AI 操作浏览器的最佳方式

给浏览器装个 “副驾驶”

Playwriter 最大的创新在于,是它能作为插件,直接 “魂穿” 到 Chrome 上,接替我们,处理一些日常较为繁琐的工作。

原理也不复杂,主要由两部分组成:

  1. 一个Chrome 浏览器插件

  2. 一个MCP Server(作为连接 AI 和浏览器的桥梁)。

当你点击插件图标时,AI 就能通过 Playwright 的 API,接管这个特定的标签页。

这也就是说,AI 不再是远在云端的“云操作”,它直接坐在了你的浏览器里,变成了你的“副驾驶”。

专治“水土不服”,拿捏三大痛点

这个项目,精准地处理了目前浏览器自动化的三个痛点:

1. 具备基本的 “人机协作” 功能

这绝对是最大的卖点。

以前遇到各种登录验证,AI 基本就废了。

但现在,基于这个插件,我们完全可以先自己手动登录,或者提前帮 AI 搞定验证码。

之后,就可以放心地让它去开始帮我们干活了,无需再担心出现卡壳的情况。

能够做到人机交互无缝切换,才算得上是一个合格的 AI 辅助工具。

2. 极度节省 Token

现在很多 AI 工具,包括 Claude 官方插件,为了让 AI 能看懂网页,都会疯狂把截图喂给 AI。

这种操作方式,不仅速度慢且 Token 消耗巨大,稍微跑几个任务,就要开始疯狂爆你金币了。

在这一点,Playwriter 很机智,它借用了 “视觉无障碍标签” 技术,让网页上的一切元素(按钮、输入框、菜单栏)都变成文本描述,再丢给 AI。

对比传统的截图方式,直接减少了上下文窗口的占用,可节省了 80% 左右的 Token。

既快又省钱,还要啥自行车?

3. 拒绝“阉割”,给你完整的 Playwright 战力

现在很多工具为了简化操作,只给 AI 提供了“点击”、“输入”这几个傻瓜指令。

对于开发者来说,如果想要更加复杂的界面操作方式,这显然无法满足我们需求。

因此,Playwriter 将 Playwright 的 API 与 AI 完整对接,让我们可以拥有更多操作空间,比如:

  • 自动拦截与分析网络请求;

  • 在页面中执行复杂的 JS 脚本;

  • 直接调试 React 组件。

上手教程

虽然功能强大,但它的配置却十分简单,稍微有点 AI 工具操作基础的即可使用。

第一步:安装插件

去 Chrome 商店下载 Playwriter MCP Extension(或者直接在 GitHub 下载源码加载)。

第二步:配置 MCP

在你的 Claude Desktop 配置文件(或者其他支持 MCP 的客户端)里加上这段配置:

{ "mcpServers": { "playwriter": { "command": "npx", "args": ["-y", "playwriter@latest"] } }}

第三步:一键起飞

打开你想控制的网页,点击插件图标,图标变绿即连接成功。

此时,你就可以在对话框里发号施令了:“帮我把这个页面的表格数据整理成 Markdown”、“监控这个页面,如果有新票放出来就通知我”。

它就会当着你的面,开始自动操作。

写在最后

如果要用一个词来形容 Playwriter,我觉得是“通透”

它打破了 AI 和我们日常工作环境之间的那堵看不见的墙壁。

以前的 AI,像是被关在小黑屋里远程办公的实习生,除了干着急你什么也做不了。

现在,有了 Playwriter,AI 就仿佛坐在你旁边,和你共用一台显示器、共用一套键鼠。

这种“看得见、摸得着、帮得上”的感觉,可能才是现阶段 AI Agent 在浏览器上该有的最佳形态。

目前该项目在 GitHub 上完全开源,如果你也是一名开发者,或者对浏览器自动化感兴趣,可以去试玩一下。

GitHub 地址:https://github.com/remorses/playwriter

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 22:07:29

MySQL自增id超过int最大值的场景

点击标题下「蓝色微信名」可快速关注 数据库的主键我们有时候会用自增列,但是自增都会有个上限,如果达到怎么办?技术社群的这篇文章《MySQL自增id超过int最大值怎么办?》就给我们讲解了MySQL数据库自增列达到上限该怎么办&#xf…

作者头像 李华
网站建设 2026/4/28 17:13:38

ssm651网上鲜花店网站vue

目录网上鲜花店网站(Vue框架)摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!网上鲜花店网站(Vue框架)摘要 该鲜花店网站基于Vue.js框架开发,结合Spring、SpringM…

作者头像 李华
网站建设 2026/5/1 11:08:13

ssm652校园新闻发布推送交流网站vue

目录项目概述技术架构核心功能创新点应用价值开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!项目概述 SSM652校园新闻发布推送交流网站是基于SSM(SpringSpringMVCMyBatis)框架与Vue.js前端技术构建的校…

作者头像 李华
网站建设 2026/4/29 20:07:59

金融场景下,百度富文本编辑器能否自动上传复制的WORD图片?

企业级富文本编辑器增强方案技术报告 作为广东高新技术企业和软件企业技术负责人,针对当前项目中的富文本编辑器功能增强需求,经过严格技术评估和架构设计,现提交以下技术实施方案。 一、需求分析与技术选型 1.1 核心需求分解 文档导入功能…

作者头像 李华
网站建设 2026/5/9 21:58:13

LLVM后端入门8:Subtarget支持

子目标支持用于告知代码生成过程特定芯片组的指令集差异,若需要子目标支持,你应为目标架构实现一个目标特定的 XXXSubtarget 类。该类需处理命令行选项 -mcpu 和 -mattr。TableGen 会利用 Target.td 和RISCVFeatures.td 文件中的定义,在RISCV…

作者头像 李华
网站建设 2026/5/9 23:01:11

基于Hadoop的岗位推荐系统的设计与实现

一、选题背景与意义 在当今数字化时代,就业市场发生了巨大变化。一方面,求职者面临着海量职位信息,筛选难度极大。据统计,求职者平均需浏览超200条岗位信息,才能找到少数几个适配岗位,耗费大量时间与精力&a…

作者头像 李华