【发布时间】:2016-05-15 20:05:48
【问题描述】:
我正在尝试从以下 URL 将 excel 文件读入 Pandas:
url1 = 'https://cib.societegenerale.com/fileadmin/indices_feeds/CTA_Historical.xls'
url2 = 'https://cib.societegenerale.com/fileadmin/indices_feeds/STTI_Historical.xls'
使用代码:
pd.read_excel(url1)
但是它不起作用,我收到错误:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '2000/01/'
在 Google 上搜索后,似乎有时通过 URL 提供的 .xls 文件实际上在幕后以不同的文件格式保存,例如 html 或 xml。
当我手动下载 Excel 文件并使用 Excel 打开它时,我收到一条错误消息:文件格式和扩展名不匹配。该文件可能已损坏或不安全。除非你相信它的来源,否则不要打开它”
当我打开它时,它看起来就像一个普通的 excel 文件。
我在网上看到一篇帖子,建议我在文本编辑器中打开文件,看看是否有任何关于正确文件格式的附加信息,但使用 notepad++ 打开时我没有看到任何附加信息。
有人可以帮我把这个“xls”文件正确读入pandas DataFramj吗?
【问题讨论】: