【发布时间】:2021-03-04 02:24:31
【问题描述】:
我有一个 URL 的 CSV 文件,我正在尝试编写一个代码来循环遍历这些 URL 并将它们附加到字典中的特定变量。不幸的是,每当我尝试使用漂亮的汤时,程序都不会分隔 URL 或只分隔第一个 URL。我知道这可能是一个简单的问题,但我无法使用类似问题的解决方案来解决这个问题。下面我附上了代码的摘录。感谢您的指导。
csv_data:
'https://www.sec.gov/Archives/edgar/data/78003/000007800313000017,https://www.sec.gov/Archives/edgar/data/78003/000115752312004450,https://www.sec.gov/Archives/edgar/data/78003/000115752312002789,https://www.sec.gov/Archives/edgar/data/78003/000007800313000013,https://www.sec.gov/Archives/edgar/data/78003/000007800313000029,https://www.sec.gov/Archives/edgar/data/78003/000007800312000008,https://www.sec.gov/Archives/edgar/data/78003/000007800314000046'
content = requests.get(csv_data[1]).content
soup = BeautifulSoup(content, 'lxml')
reports = soup.find('myreports')
master_reports = []
for report in reports.find_all('report')[:-1]:
report_dict = {}
report_dict['name_short'] = report.shortname.text
report_dict['category'] = report.menucategory.text
report_dict['url'] = base_url + report.htmlfilename.text
master_reports.append(report_dict)
print(base_url + report.htmlfilename.text)
print(report.shortname.text)
print(report.menucategory.text)
【问题讨论】:
-
你的 csv 数据实际上是一个字符串吗?
-
如果你能展示一个有用的数据示例
-
原来是一个列表,后来我用'df = pd.DataFrame(list1)'把它转换成CSV。
-
csv_data[1]未定义。请考虑修复该问题并确保您的代码可重现。
标签: python pandas csv dictionary append