【发布时间】:2017-05-19 13:38:52
【问题描述】:
我想解析这个 url 中的表格并将其导出为 csv:
http://www.bde.es/webbde/es/estadis/fi/ifs_es.html
如果我这样做:
sauce = urlopen(url_bank).read()
soup = bs.BeautifulSoup(sauce, 'html.parser')
然后是这个:
resto = soup.find_all('td')
lista_text = []
for elements in resto:
lista_text = lista_text + [elements.string]
除了最后一列“Códigos Isin”外,我得到了很好的解析 这是因为 html 代码 '.我不知道 怎么办,这部分我试过了,但还是不行:
lista_text = lista_text + [str(elements.string).replace('<br/>','')]
之后,我将列表放入 np.array,然后放入数据框以将其导出为 .csv。那部分已经完成了,我只需要解决这个问题。
提前致谢!
【问题讨论】:
标签: python html url beautifulsoup