【发布时间】:2016-01-17 04:03:36
【问题描述】:
我正在用 Python 解析一个 url,您可以在下面找到一个示例 url 和代码,我想做的是从 url 中拆分 (74743) 并创建一个 for 循环,该循环将从一个部分中获取它列表。 尝试使用 urlparse 但无法完成它,主要是因为 url 中的部分发生了变化。我只想要最简单、最快捷的方法。
示例网址:
http://example.com/wps/portal/lYuxDoIwGAYf6f9aqKSjMNQ/?PartNo=74743&IntNumberOf=&is=
(http://example.com/wps/portal) 始终固定
(lYuxDoIwGAYf6f9aqKSjMNQ) 一直在变化
(74743) 将从列表名称 Parts 中获取
(IntNumberOf=&is=) 也根据部分而变化 网站
代码如下:
from lxml import html
import requests
import urlparse
Parts = [74743, 85731, 93021]
url = 'http://example.com/wps/portal/lYuxDoIwGAYf6f9aqKSjMNQ/?PartNo=74743&IntNumberOf=&is='
parsing = urlparse.urlsplit(url)
print parsing
【问题讨论】:
-
你有什么办法不能“完成到最后”?
-
只想忽略 url 的变化部分,并从 Parts 中获取 no.(74743) 。
-
是的,但是你为什么不能完成呢?
标签: python parsing url split urlparse