【发布时间】:2019-03-06 01:22:12
【问题描述】:
总的来说,我对编码很陌生。我知道 excel 和一些 VBA,但我一直坚持把这些部件放在一起。 我有一个 URL 列表,下面给出了我想要的 1 个 URL 的输出,但我有 500 个具有相同数据的 URL。 我想要做的是让它读取 url 文件获取数据并将输出保存到 csv 中。请帮我解决这个问题。我知道这很简单,而且我找到了很多方法来做到这一点,但是把所有的和平放在一起很难。 谢谢 迈克
import bs4 as bs
import urllib.request
import pandas as pd
import csv
with open("tvlocation.csv","r") as file:
file.write('dfs = pd.read_html('tvurl.txt')
for df in dfs:
print(df)
file.close()
【问题讨论】:
-
你应该检查你的代码从第 7 行到第 9 行的缩进。另外,你的目的是什么?读取
csv文件还是写入csv文件?如果要保存到csv文件中,它应该是'w'而不是'r'。第 7 行中的单引号位置和右括号也不正确。愿它有所帮助。 -
嗯,我想从它从中提取数据的表中写入 csv。我怎样才能让它访问我拥有的 url 列表?
-
您是否成功从 URL 中检索数据?如果没有,您能告诉我您要抓取的网址吗?
-
好吧,我可以使用下面的代码抓取表格数据。但是当我试图将它保存到一个文件并让它引用 url 列表时,我卡住了 import bs4 as bs import urllib.request import pandas as pd import csv dfs = pd.read_html('nocable.org/browse-stations/callsign/cadenatres-linares-nl') for df in dfs : 打印(df)
标签: python pandas url beautifulsoup export-to-csv