08.06自我总结
python爬虫网页解析之parsel模块
一.parsel模块安装
官网链接https://pypi.org/project/parsel/1.0.2/
pip install parsel==1.0.2
二.模块作用
改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配
三.使用
import requests
import parsel
response = requests.get(url)
sel = parsel.Selector(response.text) #注意这里的S要大写
# re正则
# print(sel.re(\'正则匹配格式\'))
# xpath
# print(sel.xpath(\'xpath\').getall()) #getall获取所有
# css选择器
# print(sel.css(\'css选择器 ::text\').extract_first())#获取第一个