【发布时间】:2022-01-17 14:52:06
【问题描述】:
我想使用 beautifulsoup 打开一个 txt 文件(包含多个链接)和剪贴标题。 我的 txt 文件包含这样的链接:
https://www.lipsum.com/7845284869/
https://www.lipsum.com/56677788/
https://www.lipsum.com/01127111236/
我的代码:
import requests as rq
from bs4 import BeautifulSoup as bs
with open('output1.csv', 'w', newline='') as f:
url = open('urls.txt', 'r', encoding='utf8')
request = rq.get(str(url))
soup = bs(request.text, 'html.parser')
title = soup.findAll('title')
pdtitle = {}
for pdtitle in title:
pdtitle.append(pdtitle.text)
f.write(f'{pdtitle}')
我想打开所有 txt 文件链接并从链接中删除标题。主要问题是在 url 变量中打开 txt 文件不起作用。如何打开文件并将数据保存到csv?
【问题讨论】:
标签: python web-scraping beautifulsoup