news 2026/5/15 7:41:52

【金融项目实战】9_接口测试 _BeautifulSoup基本使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【金融项目实战】9_接口测试 _BeautifulSoup基本使用

文章目录

  • 一、基本介绍
  • 二、使用步骤
    • 2.1 安装
    • 2.2 如何使用
  • 三、示例

一、基本介绍

  • Beautiful Soup是一个可以从HTML或XMIL文计中提取数据的Python库.
  • 它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.
  • Beautiful Soup会帮你节省数小时甚至数天的工作时间.
  • Beautiful Soup 3目前已经停止开发,推荐在项目中使用Beautiful Soup 4,简称BS4.
一个python解析HTML\xml的三方库

二、使用步骤

2.1 安装

pipinstallbeautifulsoup4

注意:包的名称为beautifulsoup4而不是BeautifulSoup,BeautifulSoup是Beautiful Soup3的发布版。

2.2 如何使用

# 导入类frombs4importBeautifulSoup# 实例化soup=BeautifulSoup(open("index.html"),"html.parser")# 方法1soup=BeautifulSoup(内容,"html.parser")# 方法2ele=soup.标签名#根据标签名获取标签对象,如果匹配多个元素,则返回第一个ele_list=soup.find_all(标签名)# 根据标签名获取所有匹配的标签attr_value=ele.get(属性名)# 根据标签的属性名获取对应的属性值text=ele.get_text()# 获取标签的文本内容
说明: - 将一段文档传入BeautifulSoup的构造方法,就能得到一个文档的对象 - "html.parser": Python标准库中的HTML解析器。BeautifulSoup还支持一些第三方的解析器,如:lxml、html5lib等,这些第三方解析器需要额外安装

三、示例

应用步骤:

1、导包

2、实例化(获取文件内容)

3、调用方法

# 1、导包frombs4importBeautifulSoup test=""" <html> <head> <title>程序员</title> </head> <body> <p id="test01">软件测试</p> <p id="test02">2020年</p> <a href="/api.html">接口测试</a> <a href="/web.html">web自动化测试</a> <a href="/app.html">APP自动化测试</a> </body> </html> """#2、获取bs对象 告诉BeautifulSoup类,你要解析的是hmtl格式bs=BeautifulSoup(test,"html.parser")#3、调用方法""" 重点: 1、查找所有标签 bs.find_all("标签名") == 元素的集合 == ["元素1", "元素2"] 2、提取属性值 标签名.get("属性名") """forainbs.find_all("a"):print(a.get("href"))# 4、其它方法print(bs.p.string)# 获取P标签的文本# 5、获取标签名print(bs.p.name)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/15 7:41:52

ops-transformer RoPE位置编码 复数旋转硬件加速实战

摘要 本文将深度解析cann项目中ops-transformer的RoPE位置编码实现&#xff0c;聚焦/operator/ops_transformer/rope/rotary_position_embedding.cpp的关键优化技术。核心内容包括sin/cos表预计算机制、向量指令融合策略&#xff0c;以及如何在NPU上实现复数旋转操作的高效硬件…

作者头像 李华
网站建设 2026/5/7 17:56:25

500M以上视频文件使用PHP如何切片上传?

&#x1f4bb; 文件管理系统开发日记&#xff1a;一个即将秃头的软工大三狗的求救信号 大家好&#xff0c;我是江西某高校软件工程专业的大三狗&#xff0c;现在正处在"毕业设计焦虑期""找工作恐慌期"的双重打击下… &#x1f6a8; 当前困境 我正在开发…

作者头像 李华
网站建设 2026/5/11 18:21:26

ops-nn Upsample插值优化 HBM带宽性能提升实战

摘要 最近在调试SDXL模型的上采样层时&#xff0c;发现NPU的HBM带宽利用率始终上不去。通过深入分析ops-nn仓库中的Upsample算子实现&#xff0c;特别是在/operator/ops_nn/upsample/nearest_neighbor.cpp中的内存访问模式&#xff0c;发现stride参数配置对性能有关键影响。本…

作者头像 李华
网站建设 2026/5/11 18:22:40

蓝易云 :简单shell脚本的编写教程

下面这份内容&#xff0c;站在真实运维与企业自动化的视角&#xff0c;从“为什么要写 → 怎么写 → 写完能干嘛”一步步拆开讲&#xff0c;不堆术语、不玩花活&#xff0c;全部可落地。一、什么是 Shell 脚本&#xff08;先把定位讲清楚&#xff09;&#x1f9e0;Shell 脚本本…

作者头像 李华
网站建设 2026/5/11 6:28:55

蓝易云 :centos用ssh登录连接缓慢处理

下面这份内容&#xff0c;完全站在真实运维与生产环境角度&#xff0c;把 CentOS 使用 SSH 登录缓慢 这个问题 拆因果、给方案、能直接落地 地讲清楚。不玄学、不空谈&#xff0c;每一步都有明确逻辑。一、先给结论&#xff1a;SSH 慢&#xff0c;绝不是“网络玄学”&#x1f9…

作者头像 李华
网站建设 2026/5/13 11:43:18

军工项目文档管理如何适配UEDITOR的跨平台特性?

CMS企业官网项目需求分析与解决方案 大家好&#xff0c;我是安徽的一名.NET程序员&#xff0c;最近接了个CMS企业官网的外包项目。客户提出了一个新需求&#xff0c;要在后台新闻管理系统的文章发布模块编辑器中增加导入Word、Excel、PPT、PDF文档和Word一键粘贴功能。这需求听…

作者头像 李华