【问题标题】:Extract csv file specific columns to list in Python提取 csv 文件特定列以在 Python 中列出
【发布时间】:2013-10-29 11:08:10
【问题描述】:

我要做的是使用 matplotlib、basemap、python 等在地图上绘制特定风暴的纬度和经度值。我的问题是我试图提取纬度、经度和名称地图上的风暴,但我在尝试将列提取到列表中的第 41-44 行之间不断出现错误。有人可以帮我解决这个问题。提前致谢。

文件如下所示:

1957,AUDREY,HU, 21.6N, 93.3W
1957,AUDREY,HU,22.0N,  93.4W
1957,AUDREY,HU,22.6N,  93.5W
1957,AUDREY,HU,23.2N,  93.6W

我希望列表如下所示:

latitude = [21.6N,22.0N,23.4N]
longitude = [93.3W, 93.5W,93.8W]
name = ["Audrey","Audrey"]

这是我目前所拥有的:

data = np.loadtxt('louisianastormb.csv',dtype=np.str,delimiter=',',skiprows=1)
'''print data'''

data = np.loadtxt('louisianastormb.csv',dtype=np.str,delimiter=',',skiprows=0)

f= open('louisianastormb.csv', 'rb')
reader = csv.reader(f, delimiter=',')
header = reader.next()
zipped = zip(*reader)

latitude = zipped[3]
longitude = zipped[4]
names = zipped[1]
x, y = m(longitude, latitude)

这是我收到的最后一条错误消息/回溯:

回溯(最近一次通话最后一次):
文件“/home/darealmzd/lstorms.py”,第 42 行,在

header = reader.next()
_csv.Error:在未引用的字段中看到换行符 - 您需要以通用换行模式打开文件吗?

【问题讨论】:

  • 我认为问题出在您的 csv 文件而不是您的代码中。您的代码使用提供的示例 csv 输入按预期运行。这篇文章可能会提供一些见解。 stackoverflow.com/questions/6726953/…

标签: python csv numpy matplotlib


【解决方案1】:

这看起来像是代码中的行尾问题。如果您要使用所有这些其他科学软件包,您不妨将Pandas 用于CSV 读取部分,它比csv 模块更强大且更有用:

import pandas
colnames = ['year', 'name', 'city', 'latitude', 'longitude']
data = pandas.read_csv('test.csv', names=colnames)

如果您想要问题中的列表,您现在可以这样做:

names = data.name.tolist()
latitude = data.latitude.tolist()
longitude = data.longitude.tolist()

【讨论】:

  • 这很棒。谢谢,我以前没听说过熊猫。一件小事,如果你在不同长度的列上运行它,较短的列将填充nulls 以匹配最长的列。你知道解决办法吗?
  • 我不确定如何在 CSV 中拥有不同长度的列?但是您可以使用 data.dropna() 摆脱 na 值
  • 是的,我正在为一个小脚本做一些黑客攻击。谢谢=]
  • @chthonicdaemon 我尝试将您的代码用于类似的示例,但是我认为 pands 找不到我的文件,所以它给了我错误“文件 text.csv 不存在”而不是文本有我的文件的名称。我应该添加文件的路径吗?我该怎么做?
  • @Euler_Salter 我认为这是一个新问题,而不是对旧问题的评论。
【解决方案2】:

标准库版本(无 pandas)

这假设 csv 的第一行是标题

import csv

# open the file in universal line ending mode 
with open('test.csv', 'rU') as infile:
  # read the file as a dictionary for each row ({header : value})
  reader = csv.DictReader(infile)
  data = {}
  for row in reader:
    for header, value in row.items():
      try:
        data[header].append(value)
      except KeyError:
        data[header] = [value]

# extract the variables you want
names = data['name']
latitude = data['latitude']
longitude = data['longitude']

【讨论】:

  • 您可以使用data.setdefault(header, list()).append(value),而不是try/except。这将在您第一次访问密钥时创建一个空列表。
  • try/except 更快,但是,以防文件很大。
  • 我得到:对于标题,row.items() 中的值:^ TabError:缩进中制表符和空格的使用不一致
【解决方案3】:
import csv
from sys import argv

d = open("mydata.csv", "r")

db = []

for line in csv.reader(d):
    db.append(line)

# the rest of your code with 'db' filled with your list of lists as rows and columbs of your csv file.

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-01-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-21
    • 1970-01-01
    • 2019-10-14
    • 1970-01-01
    相关资源
    最近更新 更多