【发布时间】:2021-01-07 15:55:59
【问题描述】:
我正在尝试寻找一种方法来搜索网页的源代码以查看它是否包含关键字。但是,无论我在此页面上搜索什么,我得到的唯一结果是 -1,我认为这告诉我我做错了什么。否则,我认为它应该告诉我单词开始的位置。有人可以告诉我我做错了什么吗?这是代码。
import urllib.request
page = urllib.request.urlopen("http://www.google.com")
print(page.read())
str_page = str(page)
substring = "content"
print(str_page.find("lang"))
【问题讨论】:
-
page是 url 请求对象 -- 它不是页面 content。您可以使用page.read()获取页面内容,但您没有将其保存到变量中。 -
@JohnGordon 足够回答,不是吗?
标签: python html string find httprequest