【发布时间】:2017-04-26 03:31:43
【问题描述】:
我正在通过 pd.read_html 从 google 财务中抓取表格数据,然后通过df.to_excel() 将该数据保存到 excel 中,如下所示:
dfs = pd.read_html('https://www.google.com/finance?q=NASDAQ%3AGOOGL&fstype=ii&ei=9YBMWIiaLo29e83Rr9AM', flavor='html5lib')
xlWriter = pd.ExcelWriter(output.xlsx, engine='xlsxwriter')
for i, df in enumerate(dfs):
df.to_excel(xlWriter, sheet_name='Sheet{}'.format(i))
xlWriter.save()
但是,保存到 Excel 中的数字以文本形式存储,单元格一角带有绿色小三角形。将这些数据移动到 Excel 时,如何将它们存储为实际值而不是文本?
【问题讨论】:
-
那些列是如何与 pandas 一起出现的:
print(df.dtypes)?可能需要进行转化。 -
看起来它们都被列为“对象”。我需要做什么才能运行到“float”或“int”的转换?在点击 excel 之前,我找不到任何关于转换为值的信息。
-
感谢@gluc7 的支持。重新阅读您的问题,我认为编辑其标题是一个好主意(如果可能,不确定,我对 SO 还是很陌生),因为问题不在于 df.to_excel 方法......而且这些解决方案不处理任何特定于导出到 Excel 的事情。
标签: python html excel pandas dataframe