【问题标题】:Problems with creating a CSV file using Excel使用 Excel 创建 CSV 文件的问题
【发布时间】:2018-09-20 12:41:02
【问题描述】:

我在 Excel 文件中有一些数据。我想用 Python 分析它们。我首先使用guide 创建了一个 CSV 文件。

因此,我创建了一个包含以下数据的 CSV(逗号分隔)文件:

我使用 Spyder 在 Python 中编写了几行代码:

import pandas
colnames = ['GDP', 'Unemployment', 'CPI', 'HousePricing']
data = pandas.read_csv('Dane_2.csv', names = colnames)
GDP = data.GDP.tolist()
print(GDP)

输出结果出乎我的意料:

很容易看出,产出与GDP一栏的数字相差很大。我将不胜感激任何有助于解决我的问题的提示或提示。

【问题讨论】:

  • 可能值得包含 CSV 的前几行,因为它出现在文本编辑器中。
  • 这是使用欧洲十进制表示法时的常见问题。除非您默认使用分号等已定义的分隔符导入/导出,否则 CSV 可能会成为问题。因此,请考虑这一点。

标签: python excel export-to-csv


【解决方案1】:

似乎在 GDP 列中有来自 .csv 文件第一列的十进制值和第二列的第一位数字。您创建的 .csv 有问题,但您更可能需要在 pandas.read_csv 行中指定分隔符。另外,添加header=None,以确保您不会丢失文件的第一行(即它将被colnames 替换)。

试试这个:

import pandas
colnames = ['GDP', 'Unemployment', 'CPI', 'HousePricing']
data = pandas.read_csv('Dane_2.csv', names = colnames, header=None, sep=';')
GDP = data.GDP.tolist()
print(GDP)

【讨论】:

  • 谢谢!我认为它奏效了。有没有一种“简单”的方法可以将字符串更改为浮点数?
  • 当然,使用:data['column name'] = data['column name'].astype(float)。另外,如果它对您有帮助,您介意accepting 答案吗?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2011-05-30
  • 1970-01-01
  • 2011-09-24
  • 2015-06-17
  • 1970-01-01
  • 2019-08-01
  • 1970-01-01
相关资源
最近更新 更多