【发布时间】:2017-11-17 21:20:24
【问题描述】:
我得到了包含许多 URL 的 csv 文件。为方便起见,我将其读入熊猫数据框。稍后我需要做一些统计工作——pandas 很方便。它看起来有点像这样:
import pandas as pd
csv = [{"URLs" : "www.mercedes-benz.de", "electric" : 1}, {"URLs" : "www.audi.de", "electric" : 0}]
df = pd.DataFrame(csv)
我的任务是检查网站是否包含某些字符串,如果是,则添加带有1 的额外列,否则添加0。例如:我要检查,www.mercedes-benz.de 是否包含字符串car。
import requests
page_content = requests.get("www.mercedes-benz.de")
if "car" in page_content.text:
print ('1')
else:
print ('0')
如何遍历/循环 pd.URLs 并将信息存储在 pandas 数据框中?
【问题讨论】:
标签: python-3.x pandas dataframe web-scraping iteration