【发布时间】:2020-06-10 23:00:49
【问题描述】:
我正在测试一个程序,用于将维基百科的内容打印到提示中。我已经得到了一些输出,但它有点乱。所以我想只获取标签<p> 和<b> 的内容,这两个标签是维基百科用来显示内容的。这是我的代码:
import urllib.request
from bs4 import BeautifulSoup
URL = input("Enter the url (only wikipedia supported, default url https://?.wikipedia.org/wiki) : ")
page = urllib.request.urlopen(URL)
html_doc = page.read()
soup = BeautifulSoup(html_doc, 'html.parser')
for x in soup.find_all('p').find_all('b'):
print(x.string)
询问标记是因为维基百科在那里显示了语言,所以它取决于。如您所见,我又添加了一个 .find_all ,因为我不知道如何添加它。对不起我的英语不好和我的代码不好,因为我与这个请求字段不太相关。谢谢
【问题讨论】:
-
那么你想搜索
<p>标签下的所有<b>标签吗?或者对于所有<b>标签和<p>标签? -
用于 b 和 p 标签
-
你应该得到一个错误,因为
find_all不是ResultSet的方法。您能否发布回溯,以便人们了解问题所在?
标签: python python-3.x