一、课程简介
- DrissionPage 概述
- 工具定位:融合 Selenium(浏览器自动化)与 Requests(HTTP 请求)的 Python 库。
- 核心优势:简化代码、无缝切换浏览器与请求模式、支持动态与静态页面抓取。
- 应用场景:网页自动化测试、数据爬取、模拟登录、动态页面渲染等。
- 课程目标
- 掌握 DrissionPage 的安装与配置。
- 熟练使用浏览器模式与请求模式。
- 能够独立完成网页自动化任务与数据抓取项目。
二、课程内容
模块 1:环境搭建与基础入门
- 安装与配置
- Python 环境要求(建议 3.7+)。
- 安装 DrissionPage:
pip install drissionpage
。
- 浏览器驱动配置(Chrome/Edge)。
- 快速上手
- 创建浏览器对象:
ChromiumPage
。
- 访问网页与元素定位:
ele()
、eles()
。
- 示例:打开百度并搜索关键词。
模块 2:浏览器自动化操作
- 元素定位与交互
- 定位方式:ID、Class、XPath、CSS 选择器、文本匹配等。
- 常用操作:点击、输入、提交表单、下拉选择等。
- 示例:模拟登录 GitHub。
- 页面操作与等待
- 页面跳转与刷新。
- 显式等待与隐式等待:
wait
模块。
- 示例:等待页面加载完成后再操作。
- 多标签页与 iframe 处理
- 切换标签页:
tabs
模块。
- iframe 元素操作:
frame
模块。
- 示例:在多标签页中切换并操作。
模块 3:请求模式与数据抓取
- 请求模式基础
- 创建请求对象:
SessionPage
。
- 发送 HTTP 请求:
get()
、post()
。
- 示例:抓取静态网页数据。
- 数据解析与提取
- 使用
lxml
或 BeautifulSoup
解析 HTML。
- 提取链接、文本、属性等。
- 示例:抓取新闻网站标题与链接。
- 浏览器与请求模式切换
- 混合模式:
WebPage
类。
- 场景:需要渲染 JavaScript 的页面抓取。
- 示例:抓取动态加载的商品列表。
模块 4:进阶技巧与实战
- 文件下载与上传
- 下载文件:
download
模块。
- 上传文件:模拟文件选择操作。
- 示例:下载图片或上传附件。
- 代理与反爬处理
- 配置代理:HTTP/HTTPS 代理。
- 处理验证码:结合打码平台或 OCR。
- 示例:使用代理抓取数据。
- 自动化测试框架集成
- 结合
unittest
或 pytest
编写测试用例。
- 生成测试报告。
- 示例:自动化测试登录功能。
模块 5:项目实战
- 项目 1:电商网站数据抓取
- 目标:抓取商品名称、价格、销量。
- 技术点:动态页面渲染、数据解析、分页处理。
- 项目 2:自动化办公
- 目标:自动填写表单并提交。
- 技术点:元素定位、表单操作、异常处理。
- 项目 3:社交媒体模拟登录
- 目标:模拟登录并抓取动态内容。
- 技术点:混合模式、Cookie 处理、JavaScript 渲染。
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击
服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。
专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值