读取 csv 标头空白和不区分大小写答案

【问题标题】：Reading csv header white space and case insensitive读取 csv 标头空白和不区分大小写
【发布时间】：2012-10-07 16:27:52
【问题描述】：

是否有可能读取 CSV 文件的标题空白且不区分大小写？至于现在我这样使用csv.dictreader：

import csv
csvDict = csv.DictReader(open('csv-file.csv', 'rU'))

# determine column_A name
if 'column_A' in csvDict.fieldnames:
    column_A = 'column_A'
elif ' column_A' in csvDict.fieldnames:
    # extra space
    column_A = ' column_A'
elif 'Column_A' in csvDict.fieldnames:
    # capital A
    column_A = 'Column_A'

# get column_A data
for lineDict in csvDict:
    print(lineDict[column_A])

从代码中可以看出，我的 csv 文件有时会在额外的空格或大写字母方面有所不同，例如

“column_A”
“column_A”
“Column_A”
“Column_A”
...

我想用这样的东西：

    column_A = ' Column_A'.strip().lower()
    print(lineDict[column_A])

有什么想法吗？

【问题讨论】：

如果您还想通过自动 strip() 和 lower() 查询访问字典，请查看我在stackoverflow.com/a/12970460/1251007的完整工作代码示例

标签： python csv python-3.x

【解决方案1】：

你可以重新定义reader.fieldnames：

import csv
import io

content = '''column_A " column_B"
1 2'''
reader = csv.DictReader(io.BytesIO(content), delimiter = ' ')
reader.fieldnames = [field.strip().lower() for field in reader.fieldnames]
for line in reader:
    print(line)

产量

{'column_b': '2', 'column_a': '1'}

【讨论】：

感谢您的回答。我认为您的代码对初学者来说更具可读性/可用性。但是，我选择了“Defuz”作为正确答案，因为它更 Python 并且可以更容易地重复使用。

【解决方案2】：

如何覆盖DictReader.fieldnames 属性？

class MyDictReader(DictReader):

    @property
    def fieldnames(self):
        return [field.strip().lower() for field in super(MyDictReader, self).fieldnames]

【讨论】：

如果你在 Python 2 中尝试这个，它不会工作，因为 csv.DictReader 是一个经典风格的类，你不能在经典风格中使用super，stackoverflow.com/questions/9698614/…