【发布时间】:2020-03-19 07:54:33
【问题描述】:
我正在尝试创建一个程序来读取站点中的表格并仅将表格列的一部分转换为浮动。
此站点表如下所示:
Account Responsible Grade
1.0.0 João Da Silva 3,5
1.1.0 Antônio Pereira 2,5
1.2.0 Maria do Céu 4,5
1.2.1 Joana Antunes 5,0
为此,我使用了 BeautifulSoup 和 pandas.read_html,如下所示
import BeautifulSoup as bs
import pandas as pd
############################################################
# This part of the code was voided to simplify my question #
############################################################
soup = bs(page_source,'html.parser')
table = soup.find('table',{'id': 'table_id'})
data = pd.read_html(str(table), encoding = 'utf-8', decimal=",", thousands='.')[0]
当我这样做时,除了“帐户”列之外,表格将按照我的意愿进行转换,返回的 pandas 数据框如下所示:
Index 1 2 3
0 Account Responsible Grade
1 100 João Da Silva 3.5
2 110 Antônio Pereira 2.5
3 120 Maria do Céu 4.5
4 121 Joana Antunes 5.0
我的想法是保持“帐户”列值与原始表中的值保持一致,以避免任何错误转换并将其他表值转换为应有的值(对于此示例,它应该是 [str,str,float]) .
Index 1 2 3
0 Account Responsible Grade
1 1.0.0 João Da Silva 3.5
2 1.1.0 Antônio Pereira 2.5
3 1.2.0 Maria do Céu 4.5
4 1.2.1 Joana Antunes 5.0
有没有可能的方法来执行这种转换?
感谢您从现在开始提供的所有支持和最诚挚的问候。
【问题讨论】:
标签: python pandas type-conversion