【问题标题】:Reading csv header white space and case insensitive读取 csv 标头空白和不区分大小写
【发布时间】:2012-10-07 16:27:52
【问题描述】:

是否有可能读取 CSV 文件的标题空白且不区分大小写?至于现在我这样使用csv.dictreader

import csv
csvDict = csv.DictReader(open('csv-file.csv', 'rU'))

# determine column_A name
if 'column_A' in csvDict.fieldnames:
    column_A = 'column_A'
elif ' column_A' in csvDict.fieldnames:
    # extra space
    column_A = ' column_A'
elif 'Column_A' in csvDict.fieldnames:
    # capital A
    column_A = 'Column_A'

# get column_A data
for lineDict in csvDict:
    print(lineDict[column_A])

从代码中可以看出,我的 csv 文件有时会在额外的空格或大写字母方面有所不同,例如

  • “column_A”
  • “column_A”
  • “Column_A”
  • “Column_A”
  • ...

我想用这样的东西:

    column_A = ' Column_A'.strip().lower()
    print(lineDict[column_A])

有什么想法吗?

【问题讨论】:

标签: python csv python-3.x


【解决方案1】:

你可以重新定义reader.fieldnames

import csv
import io

content = '''column_A " column_B"
1 2'''
reader = csv.DictReader(io.BytesIO(content), delimiter = ' ')
reader.fieldnames = [field.strip().lower() for field in reader.fieldnames]
for line in reader:
    print(line)

产量

{'column_b': '2', 'column_a': '1'}

【讨论】:

  • 感谢您的回答。我认为您的代码对初学者来说更具可读性/可用性。但是,我选择了“Defuz”作为正确答案,因为它更 Python 并且可以更容易地重复使用。
【解决方案2】:

如何覆盖DictReader.fieldnames 属性?

class MyDictReader(DictReader):

    @property
    def fieldnames(self):
        return [field.strip().lower() for field in super(MyDictReader, self).fieldnames]

【讨论】:

猜你喜欢
  • 1970-01-01
  • 2018-07-31
  • 2015-07-06
  • 1970-01-01
  • 2021-08-22
  • 2017-10-20
  • 1970-01-01
  • 2013-03-06
相关资源
最近更新 更多