【问题标题】:reading txt file into a data frame, excluding commas and pound将txt文件读入数据框,不包括逗号和井号
【发布时间】:2021-07-26 09:32:28
【问题描述】:

这是我的 txt 文件的简短示例,county-covid-data.txt

#County,Confirmed Cases,Probable Cases,Deaths
Anderson,4595,1137,85
Andrews,1630,0,37
Angelina,4169,2688,208
Aransas,697,245,29
Archer,650,90,10
Armstrong,97,38,6
Atascosa,3267,930,96
Austin,1322,190,22
Bailey,561,200,16
Bandera,710,194,21
Bastrop,3536,1221,59
Baylor,111,172,11
Bee,2798,397,55
Bell,17752,0,238
Bexar,135648,26460,2181
Blanco,279,55,12
Borden,12,6,0
Bosque,836,189,22
Bowie,3653,1478,150

将文本文件读入我的 df 时:

import pandas
import pandas as pd
cov = pandas.read_table('county-covid-data.txt', delim_whitespace=True, names=('County','Confirmed Cases', 'Probable Case', 'Deaths'))

我将所有县、确诊病例和可能病例以及死亡人数放在一列中,在三个不同的单元格中的第一行,这些单元格似乎被空格隔开

如何删除县之前的逗号和井号,同时将每个值分隔到相应的列中? 我以前从未读过 txt 文件,到目前为止我尝试过的所有内容都看起来像这样或一个文本块。

【问题讨论】:

    标签: python pandas txt


    【解决方案1】:

    使用read_csv(),其默认分隔符为,

    import pandas as pd
    
    cov = pd.read_csv('county-covid-data.txt')
    

    或指定read_table 中的sepdelimiter

    cov = pd.read_table('county-covid-data.txt', sep=',', names=('County','Confirmed Cases', 'Probable Case', 'Deaths'), skiprows=1)
    

    要删除列标题中的磅,您可以使用

    cov.columns = cov.columns.str.strip('#')
    

    【讨论】:

      猜你喜欢
      • 2023-02-21
      • 2023-02-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-03-22
      • 2020-08-05
      • 2021-03-22
      • 2018-06-30
      相关资源
      最近更新 更多