news 2026/2/14 15:21:25

在Trae上使用Bright Data MCP采集数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
在Trae上使用Bright Data MCP采集数据

不知道你发现没,由于现在ChatGPT、DeepSeek、Gemini、豆包等AI大模型的兴起,大家的搜索习惯发生了很大变化,传统的谷歌、百度、必应搜索像是老古董,已经没法满足用户对信息准确性、及时性、高质量的要求了,甚至懒得点开一个个网页去找答案。

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。

最近刚好苹果发布新iPhone,我用Bright Data MCP获取最新的iPhone 17价格信息,能实时采集且不需要我处理任何网站限制的问题,我把采集来的信息写成了一个可视化看板,用来实时监测价格信息。

当然这只是自娱自乐的玩意,且是小批量采集公开数据,要遵守网站规定噢。

在这里插入图片描述

以上做的事情分为三个步骤,第一是在Trae上配置Bright Data MCP服务,第二是搭建智能体,给到数据采集需求,第三是将反馈的数据开发成可视化看板,咱们会详细讲解每个步骤实现过程。

一、在Trae上配置Bright Data MCP服务

首先要介绍下什么是MCP,它的学名是“模型上下文协议”,你可以理解成它是连接AI大模型和外部工具的一个媒介,类似于电脑和互联网的关系,大模型原先只是封闭的大脑,有了MCP后它就连接了无数的信息、工具、数据,可以做更多的事情,比如Bright Data MCP能实现复杂网站的数据采集。

讲到Bright Data MCP,它是亮数据开发的一款专门用于网络数据采集、搜索的MCP服务,可以最大的特点是可以自动处理各种网站的反爬机制,不需要你考虑什么IP识别、人机检测等技术细节,把爬虫所有能遇到的封禁问题都在后台解决了,你只需要专注于提问聊天就行。

亮数据会送新用户3个月免费额度,每个月5000次MCP请求,完全够用了。

https://get.brightdata.com/wmcp

Bright Data MCP能在Trae、Cluade Code、Cursor等Agent中部署,以Trae为例,主要分为3个步骤。

1、注册亮数据账号,获取MCP API key

你可以直接去亮数据网站注册,注册好后在账户设置-用户管理界面生成专用API key。

https://get.brightdata.com/wmcp

2、获取MCP服务信息

同样在亮数据后台,有个MCP功能区,里面提供了本地和远程两种MCP模式,建议用本地MCP,自己搭建也不复杂,而且相对灵活。

复制上面的MCP配置信息,以及之前申请的Key,留着备用。

这里讲下Bright Data MCP的4个核心组件,分别是search_engine用于搜索引擎抓取、web_scraper用于处理反爬机制、search_engine_batch用于批量搜索引擎抓取、scrape_batch用于批量网页抓取,它们相互配合能采集非常复杂的网页数据。

3、在Trae中配置MCP

Trae是近一年比较流行的AI编辑器,字节开发的产品,类似于VsCode,但Trae有更强的AI编程能力,比如搭建智能体、布置MCP等。

在Trae的AI功能管理中选择手工添加MCP,开始配置信息。

接下来,在配置框里粘贴刚刚在亮数据后台复制的MCP配置信息。

补充一点,配置MCP需要电脑安装Node.js,如果没安装Trae会提醒你安装,直接同意即可。

接下来你就会在MCP界面看到配置好的Bright Data MCP。

MCP服务需要在智能体中使用,接下来我在Trae中创建一个名为“EasySearch”的智能体,并勾选Bright Data MCP服务,还要注意设置初始提示词,告诉智能体它是干什么的,需要在提示语里告诉它用Bright Data MCP。

在这里插入图片描述

到这一步,你就可以用Bright Data MCP来采集数据了。

打开Trae AI对话框,选择刚创建的“EasySearch”智能体,直接问它:

请你梳理美国amazon、苹果官网上iphone17全系列最新价格、配置信息、链接、日期, 以列表形式输出,呈现各平台的对比

该智能体就会自动调用Bright Data MCP服务,去采集网站上iPhone17的价格信息。

最后你会得到结构化的Excel数据,清晰明了。

针对该数据,你还可以让Trae开发一个可视化看板,用于展示。

除了Trae,一些Vscode插件也支持部署Bright Data MCP服务,比如Cline,直接设置远程MCP服务,非常简单。

在亮数据后台复制远程MCP配置信息。

在Cline 远程MCP配置界面粘贴Bright Data MCP配置信息。

提问Cline,它会自动调用Bright Data MCP来采集数据。

总的来说,AI爬虫已经成为不可逆的趋势,完全不需要写代码处理网页,几乎零门槛,而且能很好的和一些智能体结合,做出不错的产品,比如手机的价格监测应用,运营的好也能带来不错的效果。

你可以拿Bright Data MCP练练手,刚好亮数据会送新用户3个月免费额度,每个月5000次MCP请求,足够开发一个小应用了。

https://get.brightdata.com/wmcp

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/13 13:37:17

低代码爬虫利器,搭建Youtube视频监测平台,有点强~

最近和前同事聊天,他被裁后意外进了一家AI公司做算法,工资看似涨了很多,但工作时长也比原来每周多了十几个小时,而且公司做的是跨境电商营销增长业务,通过AI去精准获客,业绩压力非常之大。 他说现在出海获…

作者头像 李华
网站建设 2026/2/14 10:01:44

科哥Face Fusion踩坑记录,这些设置千万别忽略

科哥Face Fusion踩坑记录,这些设置千万别忽略 1. 前言:为什么我花了三天才调出自然效果 第一次打开科哥的Face Fusion WebUI时,我满心期待——上传两张照片,滑动几个参数,几秒后就能看到专业级换脸效果。结果呢&…

作者头像 李华
网站建设 2026/2/12 7:20:03

vivado2019.1安装教程详完整示例:成功部署至Xilinx Artix-7开发套件

以下是对您提供的博文内容进行 深度润色与结构重构后的技术文章 。整体风格已全面转向 真实工程师视角下的实战笔记体 :去除了所有AI腔调、模板化表达和空泛总结;强化了逻辑递进、经验沉淀与可操作性;语言更贴近一线开发者在调试现场的思…

作者头像 李华
网站建设 2026/2/13 16:27:36

右键即可下载!UNet融合结果轻松获取

右键即可下载!UNet融合结果轻松获取 你有没有试过这样的人脸融合工具:上传两张照片,拖动一个滑块,几秒钟后就能看到自然又逼真的融合效果,而且结果图右键就能直接保存?不是云端处理、不传服务器、不注册账…

作者头像 李华
网站建设 2026/2/12 6:05:22

UNet人脸融合进阶玩法:自定义分辨率输出设置

UNet人脸融合进阶玩法:自定义分辨率输出设置 1. 为什么分辨率设置是人脸融合的关键突破口 很多人第一次用UNet人脸融合工具时,会发现生成的图片要么糊成一片,要么细节崩坏,或者直接被裁剪掉关键区域。其实问题往往不出在模型本身…

作者头像 李华